add "make help"
[oweals/busybox.git] / coreutils / uniq.c
index aa26e0575862e01115ffda3dd7a93aff18ef43c5..93ae169f4a85b46c2806ea1ed95ffe3151a79fe7 100644 (file)
@@ -2,9 +2,21 @@
 /*
  * uniq implementation for busybox
  *
- * Copyright (C) 2003  Manuel Novoa III  <mjn3@codepoet.org>
+ * Copyright (C) 2005  Manuel Novoa III  <mjn3@codepoet.org>
  *
- * Licensed under GPL v2, see file LICENSE in this tarball for details.
+ * This program is free software; you can redistribute it and/or modify
+ * it under the terms of the GNU General Public License as published by
+ * the Free Software Foundation; either version 2 of the License, or
+ * (at your option) any later version.
+ *
+ * This program is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
+ * General Public License for more details.
+ *
+ * You should have received a copy of the GNU General Public License
+ * along with this program; if not, write to the Free Software
+ * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
  *
  */
 
 #include "busybox.h"
 #include "libcoreutils/coreutils.h"
 
-/* The extra data is flags to make -d and -u switch each other off */
-static const char uniq_opts[] = "cudf:s:\0\7\3\5\1\2\4";
-
-#define SHOW_COUNT             1
-#define SHOW_UNIQUE            2
-#define SHOW_DUPLICATE 4
+static const char uniq_opts[] = "f:s:" "cdu\0\1\2\4";
 
-static FILE *open_arg(char **argv, char *mode)
+static FILE *xgetoptfile_uniq_s(char **argv, int read0write2)
 {
-       char *n=*argv;
+       const char *n;
 
-       return (n && *n != '-' && n[1]) ? bb_xfopen(n, mode) :
-               *mode=='r' ? stdin : stdout;
+       if ((n = *argv) != NULL) {
+               if ((*n != '-') || n[1]) {
+                       return bb_xfopen(n, "r\0w" + read0write2);
+               }
+       }
+       return (read0write2) ? stdout : stdin;
 }
 
-
 int uniq_main(int argc, char **argv)
 {
        FILE *in, *out;
-       unsigned long dups, skip_fields, skip_chars, i;
-       const char *oldline, *oldskipped, *line, *skipped, *input_filename;
+       unsigned long dups, skip_fields, skip_chars, i, uniq_flags;
+       const char *s0, *e0, *s1, *e1, *input_filename;
        int opt;
-       int uniq_flags = SHOW_UNIQUE | SHOW_DUPLICATE;
 
-       skip_fields = skip_chars = 0;
+       uniq_flags = skip_fields = skip_chars = 0;
 
        while ((opt = getopt(argc, argv, uniq_opts)) > 0) {
-               if (opt == 'f') skip_fields = bb_xgetularg10(optarg);
-               else if (opt == 's') skip_chars = bb_xgetularg10(optarg);
-
-               /* This bit uses the extra data at the end of uniq_opts to make
-                * -d and -u switch each other off in a very small amount of space */
-               
-               else if ((line = strchr(uniq_opts, opt)) != NULL) {
-                       uniq_flags &= line[8];
-                       uniq_flags |= line[11];
-               } else bb_show_usage();
+               if ((opt == 'f') || (opt == 's')) {
+                       int t = bb_xgetularg10(optarg);
+                       if (opt == 'f') {
+                               skip_fields = t;
+                       } else {
+                               skip_chars = t;
+                       }
+               } else if ((s0 = strchr(uniq_opts, opt)) != NULL) {
+                       uniq_flags |= s0[4];
+               } else {
+                       bb_show_usage();
+               }
        }
 
        input_filename = *(argv += optind);
 
-       in = open_arg(argv, "r");
-       if (*argv) ++argv;
-       out = open_arg(argv, "w");
-       if (*argv && argv[1]) bb_show_usage();
-
-       line = skipped = NULL;
-
-NOT_DUPLICATE:
-       oldline = line;
-       oldskipped = skipped;
-       dups = 0;
-       
-       /* gnu uniq ignores newlines */
-       while ((line = bb_get_chomped_line_from_file(in)) != NULL) {
-               skipped = line;
-               for (i=skip_fields ; i ; i--) {
-                       skipped = bb_skip_whitespace(skipped);
-                       while (*skipped && !isspace(*skipped)) ++skipped;
-               }
-               for (i = skip_chars ; *skipped && i ; i--) ++skipped;
-               if (oldline) {
-                       if (!strcmp(oldskipped, skipped)) {
-                               ++dups;         /* Note: Testing for overflow seems excessive. */
-                               continue;
+       in = xgetoptfile_uniq_s(argv, 0);
+       if (*argv) {
+               ++argv;
+       }
+       out = xgetoptfile_uniq_s(argv, 2);
+       if (*argv && argv[1]) {
+               bb_show_usage();
+       }
+
+       s1 = e1 = NULL;                         /* prime the pump */
+
+       do {
+               s0 = s1;
+               e0 = e1;
+               dups = 0;
+
+               /* gnu uniq ignores newlines */
+               while ((s1 = bb_get_chomped_line_from_file(in)) != NULL) {
+                       e1 = s1;
+                       for (i=skip_fields ; i ; i--) {
+                               e1 = bb_skip_whitespace(e1);
+                               while (*e1 && !isspace(*e1)) {
+                                       ++e1;
+                               }
                        }
-DO_LAST:
-                       if (uniq_flags & (dups ? SHOW_DUPLICATE : SHOW_UNIQUE)) {
-                               bb_fprintf(out, "\0%7d " + (uniq_flags & SHOW_COUNT), dups + 1);
-                               bb_fprintf(out, "%s\n", oldline);
+                       for (i = skip_chars ; *e1 && i ; i--) {
+                               ++e1;
+                       }
+
+                       if (!s0 || strcmp(e0, e1)) {
+                               break;
                        }
-                       free((void *)oldline);
+
+                       ++dups;          /* Note: Testing for overflow seems excessive. */
                }
-               goto NOT_DUPLICATE;
-       }
 
-       if (oldline) goto DO_LAST;
+               if (s0) {
+                       if (!(uniq_flags & (2 << !!dups))) {
+                               bb_fprintf(out, "\0%d " + (uniq_flags & 1), dups + 1);
+                               bb_fprintf(out, "%s\n", s0);
+                       }
+                       free((void *)s0);
+               }
+       } while (s1);
 
        bb_xferror(in, input_filename);