ash: fix bug 585 (>"$VAR_WITH_UNICODE_CHARS" problem)
[oweals/busybox.git] / editors / diff.c
index 4886f63062c0d2b6e9d87712f8435bf5a416dc23..e3933e72424cc22ada27a9a76227e10e0431ac60 100644 (file)
 /*
  * Output flags
  */
-#define D_HEADER        1       /* Print a header/footer between files */
-#define D_EMPTY1        2       /* Treat first file as empty (/dev/null) */
-#define D_EMPTY2        4       /* Treat second file as empty (/dev/null) */
+enum {
+       /* Print a header/footer between files */
+       /* D_HEADER = 1, - unused */
+       /* Treat file as empty (/dev/null) */
+       D_EMPTY1 = 2 * ENABLE_FEATURE_DIFF_DIR,
+       D_EMPTY2 = 4 * ENABLE_FEATURE_DIFF_DIR,
+};
 
 /*
  * Status values for print_status() and diffreg() return values
@@ -95,54 +99,53 @@ struct context_vec {
 #define g_read_buf bb_common_bufsiz1
 
 struct globals {
-       USE_FEATURE_DIFF_DIR(char **dl;)
-       USE_FEATURE_DIFF_DIR(int dl_count;)
-       int status;
-       /* This is the default number of lines of context. */
-       int context;
-       size_t max_context;
-       char *start;
+       bool anychange;
+       smallint exit_status;
+       int opt_U_context;
+       size_t max_context;     /* size of context_vec_start */
+       IF_FEATURE_DIFF_DIR(int dl_count;)
+       IF_FEATURE_DIFF_DIR(char **dl;)
+       char *opt_S_start;
        const char *label1;
        const char *label2;
-       struct line *file[2];
-       int *J;          /* will be overlaid on class */
+       int *J;                 /* will be overlaid on class */
        int clen;
-       int len[2];
-       int pref, suff;  /* length of prefix and suffix */
+       int pref, suff;         /* length of prefix and suffix */
+       int nlen[2];
        int slen[2];
-       bool anychange;
-       long *ixnew;     /* will be overlaid on file[1] */
-       long *ixold;     /* will be overlaid on klist */
-       struct cand *clist;  /* merely a free storage pot for candidates */
-       int clistlen;    /* the length of clist */
-       struct line *sfile[2];   /* shortened by pruning common prefix/suffix */
+       int clistlen;           /* the length of clist */
+       struct cand *clist;     /* merely a free storage pot for candidates */
+       long *ixnew;            /* will be overlaid on nfile[1] */
+       long *ixold;            /* will be overlaid on klist */
+       struct line *nfile[2];
+       struct line *sfile[2];  /* shortened by pruning common prefix/suffix */
        struct context_vec *context_vec_start;
        struct context_vec *context_vec_end;
        struct context_vec *context_vec_ptr;
-       struct stat stb1, stb2;
        char *tempname1, *tempname2;
+       struct stat stb1, stb2;
 };
 #define G (*ptr_to_globals)
-#define dl                 (G.dl                )
-#define dl_count           (G.dl_count          )
-#define context            (G.context           )
+#define anychange          (G.anychange         )
+#define exit_status        (G.exit_status       )
+#define opt_U_context      (G.opt_U_context     )
 #define max_context        (G.max_context       )
-#define status             (G.status            )
-#define start              (G.start             )
+#define dl_count           (G.dl_count          )
+#define dl                 (G.dl                )
+#define opt_S_start        (G.opt_S_start       )
 #define label1             (G.label1            )
 #define label2             (G.label2            )
-#define file               (G.file              )
 #define J                  (G.J                 )
 #define clen               (G.clen              )
-#define len                (G.len               )
 #define pref               (G.pref              )
 #define suff               (G.suff              )
+#define nlen               (G.nlen              )
 #define slen               (G.slen              )
-#define anychange          (G.anychange         )
+#define clistlen           (G.clistlen          )
+#define clist              (G.clist             )
 #define ixnew              (G.ixnew             )
 #define ixold              (G.ixold             )
-#define clist              (G.clist             )
-#define clistlen           (G.clistlen          )
+#define nfile              (G.nfile             )
 #define sfile              (G.sfile             )
 #define context_vec_start  (G.context_vec_start )
 #define context_vec_end    (G.context_vec_end   )
@@ -153,19 +156,19 @@ struct globals {
 #define tempname2          (G.tempname2         )
 #define INIT_G() do { \
        SET_PTR_TO_GLOBALS(xzalloc(sizeof(G))); \
-       context = 3; \
+       opt_U_context = 3; \
        max_context = 64; \
 } while (0)
 
 
-/*static void print_only(const char *path, size_t dirlen, const char *entry)*/
+#if ENABLE_FEATURE_DIFF_DIR
 static void print_only(const char *path, const char *entry)
 {
        printf("Only in %s: %s\n", path, entry);
 }
+#endif
 
 
-/*static void print_status(int val, char *path1, char *path2, char *entry)*/
 static void print_status(int val, char *_path1, char *_path2)
 {
        /*const char *const _entry = entry ? entry : "";*/
@@ -279,12 +282,15 @@ static int readhash(FILE *fp)
 }
 
 
+/* Our diff implementation is using seek.
+ * When we meet non-seekable file, we must make a temp copy.
+ */
 static char *make_temp(FILE *f, struct stat *sb)
 {
        char *name;
        int fd;
 
-       if (S_ISREG(sb->st_mode))
+       if (S_ISREG(sb->st_mode) || S_ISBLK(sb->st_mode))
                return NULL;
        name = xstrdup("/tmp/difXXXXXX");
        fd = mkstemp(name);
@@ -309,13 +315,15 @@ static char *make_temp(FILE *f, struct stat *sb)
  * Check to see if the given files differ.
  * Returns 0 if they are the same, 1 if different, and -1 on error.
  */
-static NOINLINE int files_differ(FILE *f1, FILE *f2, int flags)
+static NOINLINE int files_differ(FILE *f1, FILE *f2)
 {
        size_t i, j;
 
+       /* Prevent making copies for "/dev/null" (too common) */
+       /* Deal with input from pipes etc */
        tempname1 = make_temp(f1, &stb1);
        tempname2 = make_temp(f2, &stb2);
-       if ((flags & (D_EMPTY1 | D_EMPTY2)) || stb1.st_size != stb2.st_size) {
+       if (stb1.st_size != stb2.st_size) {
                return 1;
        }
        while (1) {
@@ -353,8 +361,8 @@ static void prepare(int i, FILE *fp /*, off_t filesize*/)
                }
                p[++j].value = h;
        }
-       len[i] = j;
-       file[i] = p;
+       nlen[i] = j;
+       nfile[i] = p;
 }
 
 
@@ -362,16 +370,16 @@ static void prune(void)
 {
        int i, j;
 
-       for (pref = 0; pref < len[0] && pref < len[1] &&
-                file[0][pref + 1].value == file[1][pref + 1].value; pref++)
+       for (pref = 0; pref < nlen[0] && pref < nlen[1] &&
+               nfile[0][pref + 1].value == nfile[1][pref + 1].value; pref++)
                continue;
-       for (suff = 0; suff < len[0] - pref && suff < len[1] - pref &&
-                file[0][len[0] - suff].value == file[1][len[1] - suff].value;
-                suff++)
+       for (suff = 0; suff < nlen[0] - pref && suff < nlen[1] - pref &&
+               nfile[0][nlen[0] - suff].value == nfile[1][nlen[1] - suff].value;
+               suff++)
                continue;
        for (j = 0; j < 2; j++) {
-               sfile[j] = file[j] + pref;
-               slen[j] = len[j] - pref - suff;
+               sfile[j] = nfile[j] + pref;
+               slen[j] = nlen[j] - pref - suff;
                for (i = 0; i <= slen[j]; i++)
                        sfile[j][i].serial = i;
        }
@@ -516,8 +524,8 @@ static void unravel(int p)
        struct cand *q;
        int i;
 
-       for (i = 0; i <= len[0]; i++)
-               J[i] = i <= pref ? i : i > len[0] - suff ? i + len[1] - len[0] : 0;
+       for (i = 0; i <= nlen[0]; i++)
+               J[i] = i <= pref ? i : i > nlen[0] - suff ? i + nlen[1] - nlen[0] : 0;
        for (q = clist + p; q->y != 0; q = clist + q->pred)
                J[q->x + pref] = q->y + pref;
 }
@@ -563,7 +571,7 @@ static NOINLINE void check(FILE *f1, FILE *f2)
        ixold[0] = ixnew[0] = 0;
        jackpot = 0;
        ctold = ctnew = 0;
-       for (i = 1; i <= len[0]; i++) {
+       for (i = 1; i <= nlen[0]; i++) {
                if (J[i] == 0) {
                        ixold[i] = ctold += skipline(f1);
                        continue;
@@ -632,8 +640,8 @@ static NOINLINE void check(FILE *f1, FILE *f2)
                                        J[i] = 0;
                                        if (c != '\n' && c != EOF)
                                                ctold += skipline(f1);
-// BUG? Should be "if (d != '\n' && d != EOF)" ?
-                                       if (d != '\n' && c != EOF)
+/* was buggy? "if (d != '\n' && c != EOF)" */
+                                       if (d != '\n' && d != EOF)
                                                ctnew += skipline(f2);
                                        break;
                                }
@@ -645,7 +653,7 @@ static NOINLINE void check(FILE *f1, FILE *f2)
                ixnew[j] = ctnew;
                j++;
        }
-       for (; j <= len[1]; j++)
+       for (; j <= nlen[1]; j++)
                ixnew[j] = ctnew += skipline(f2);
 }
 
@@ -764,10 +772,10 @@ static void dump_unified_vec(FILE *f1, FILE *f2)
                return;
 
        b = d = 0;                      /* gcc */
-       lowa = MAX(1, cvp->a - context);
-       upb = MIN(len[0], context_vec_ptr->b + context);
-       lowc = MAX(1, cvp->c - context);
-       upd = MIN(len[1], context_vec_ptr->d + context);
+       lowa = MAX(1, cvp->a - opt_U_context);
+       upb = MIN(nlen[0], context_vec_ptr->b + opt_U_context);
+       lowc = MAX(1, cvp->c - opt_U_context);
+       upd = MIN(nlen[1], context_vec_ptr->d + opt_U_context);
 
        printf("@@ -");
        uni_range(lowa, upb);
@@ -850,7 +858,7 @@ static void print_header(const char *file1, const char *file2)
  * lines appended (beginning at b).  If c is greater than d then there are
  * lines missing from the to file.
  */
-static void change(char *file1, FILE *f1, char *file2, FILE *f2,
+static void change(const char *file1, FILE *f1, const char *file2, FILE *f2,
                        int a, int b, int c, int d)
 {
        if ((a > b && c > d) || (option_mask32 & FLAG_q)) {
@@ -875,8 +883,8 @@ static void change(char *file1, FILE *f1, char *file2, FILE *f2,
                 * Print the context/unidiff header first time through.
                 */
                print_header(file1, file2);
-       } else if (a > context_vec_ptr->b + (2 * context) + 1
-               && c > context_vec_ptr->d + (2 * context) + 1
+       } else if (a > context_vec_ptr->b + (2 * opt_U_context) + 1
+               && c > context_vec_ptr->d + (2 * opt_U_context) + 1
        ) {
                /*
                 * If this change is more than 'context' lines from the
@@ -894,7 +902,7 @@ static void change(char *file1, FILE *f1, char *file2, FILE *f2,
 }
 
 
-static void output(char *file1, FILE *f1, char *file2, FILE *f2)
+static void output(const char *file1, FILE *f1, const char *file2, FILE *f2)
 {
        /* Note that j0 and j1 can't be used as they are defined in math.h.
         * This also allows the rather amusing variable 'j00'... */
@@ -902,9 +910,9 @@ static void output(char *file1, FILE *f1, char *file2, FILE *f2)
 
        rewind(f1);
        rewind(f2);
-       m = len[0];
+       m = nlen[0];
        J[0] = 0;
-       J[m + 1] = len[1] + 1;
+       J[m + 1] = nlen[1] + 1;
        for (i0 = 1; i0 <= m; i0 = i1 + 1) {
                while (i0 <= m && J[i0] == J[i0 - 1] + 1)
                        i0++;
@@ -919,7 +927,7 @@ static void output(char *file1, FILE *f1, char *file2, FILE *f2)
        }
        if (m == 0) {
 // change() seeks!
-               change(file1, f1, file2, f2, 1, 0, 1, len[1]);
+               change(file1, f1, file2, f2, 1, 0, 1, nlen[1]);
        }
        if (anychange != 0 && !(option_mask32 & FLAG_q)) {
 // dump_unified_vec() seeks!
@@ -991,11 +999,11 @@ static void output(char *file1, FILE *f1, char *file2, FILE *f2)
  */
 /* NB: files can be not REGular. The only sure thing that they
  * are not both DIRectories. */
-static unsigned diffreg(char *file1, char *file2, int flags)
+static unsigned diffreg(const char *file1, const char *file2, int flags)
 {
-       int *member;     /* will be overlaid on file[1] */
-       int *class;      /* will be overlaid on file[0] */
-       int *klist;      /* will be overlaid on file[0] after class */
+       int *member;     /* will be overlaid on nfile[1] */
+       int *class;      /* will be overlaid on nfile[0] */
+       int *klist;      /* will be overlaid on nfile[0] after class */
        FILE *f1;
        FILE *f2;
        unsigned rval;
@@ -1003,6 +1011,7 @@ static unsigned diffreg(char *file1, char *file2, int flags)
 
        anychange = 0;
        context_vec_ptr = context_vec_start - 1;
+       tempname1 = tempname2 = NULL;
 
        /* Is any of them a directory? Then it's simple */
        if (S_ISDIR(stb1.st_mode) != S_ISDIR(stb2.st_mode))
@@ -1012,26 +1021,30 @@ static unsigned diffreg(char *file1, char *file2, int flags)
        rval = D_SAME;
 
        if (flags & D_EMPTY1)
-               f1 = xfopen(bb_dev_null, "r");
-       else
-               f1 = xfopen_stdin(file1);
+               /* can't be stdin, but xfopen_stdin() is smaller code */
+               file1 = bb_dev_null;
+       f1 = xfopen_stdin(file1);
        if (flags & D_EMPTY2)
-               f2 = xfopen(bb_dev_null, "r");
-       else
-               f2 = xfopen_stdin(file2);
-
-       /* Quick check whether they are different */
-       /* NB: copies non-REG files to tempfiles and fills tempname1/2 */
-       i = files_differ(f1, f2, flags);
-       if (i != 1) { /* not different? */
-               if (i != 0) /* error? */
-                       status |= 2;
-               goto closem;
+               file2 = bb_dev_null;
+       f2 = xfopen_stdin(file2);
+
+       /* NB: if D_EMPTY1/2 is set, other file is always a regular file,
+        * not pipe/fifo/chardev/etc - D_EMPTY is used by "diff -r" only,
+        * and it never diffs non-ordinary files in subdirs. */
+       if (!(flags & (D_EMPTY1 | D_EMPTY2))) {
+               /* Quick check whether they are different */
+               /* NB: copies non-REG files to tempfiles and fills tempname1/2 */
+               i = files_differ(f1, f2);
+               if (i != 1) { /* not different? */
+                       if (i != 0) /* error? */
+                               exit_status |= 2;
+                       goto closem;
+               }
        }
 
        if (!asciifile(f1) || !asciifile(f2)) {
                rval = D_BINARY;
-               status |= 1;
+               exit_status |= 1;
                goto closem;
        }
 
@@ -1042,11 +1055,12 @@ static unsigned diffreg(char *file1, char *file2, int flags)
        sort(sfile[0], slen[0]);
        sort(sfile[1], slen[1]);
 
-       member = (int *) file[1];
+       member = (int *) nfile[1];
        equiv(sfile[0], slen[0], sfile[1], slen[1], member);
+//TODO: xrealloc_vector?
        member = xrealloc(member, (slen[1] + 2) * sizeof(int));
 
-       class = (int *) file[0];
+       class = (int *) nfile[0];
        unsort(sfile[0], slen[0], class);
        class = xrealloc(class, (slen[0] + 2) * sizeof(int));
 
@@ -1058,13 +1072,13 @@ static unsigned diffreg(char *file1, char *file2, int flags)
        free(member);
        free(class);
 
-       J = xrealloc(J, (len[0] + 2) * sizeof(int));
+       J = xrealloc(J, (nlen[0] + 2) * sizeof(int));
        unravel(klist[i]);
        free(clist);
        free(klist);
 
-       ixold = xrealloc(ixold, (len[0] + 2) * sizeof(long));
-       ixnew = xrealloc(ixnew, (len[1] + 2) * sizeof(long));
+       ixold = xrealloc(ixold, (nlen[0] + 2) * sizeof(long));
+       ixnew = xrealloc(ixnew, (nlen[1] + 2) * sizeof(long));
 // Rewind inside!
        check(f1, f2);
 // Rewind inside!
@@ -1072,7 +1086,7 @@ static unsigned diffreg(char *file1, char *file2, int flags)
 
  closem:
        if (anychange) {
-               status |= 1;
+               exit_status |= 1;
                if (rval == D_SAME)
                        rval = D_DIFFER;
        }
@@ -1093,7 +1107,7 @@ static unsigned diffreg(char *file1, char *file2, int flags)
 #if ENABLE_FEATURE_DIFF_DIR
 static void do_diff(char *dir1, char *path1, char *dir2, char *path2)
 {
-       int flags = D_HEADER;
+       int flags = 0; /*D_HEADER;*/
        int val;
        char *fullpath1 = NULL; /* if -N */
        char *fullpath2 = NULL;
@@ -1148,13 +1162,12 @@ static void do_diff(char *dir1, char *path1, char *dir2, char *path2)
 
 #if ENABLE_FEATURE_DIFF_DIR
 /* This function adds a filename to dl, the directory listing. */
-static int add_to_dirlist(const char *filename,
-               struct stat ATTRIBUTE_UNUSED *sb,
+static int FAST_FUNC add_to_dirlist(const char *filename,
+               struct stat *sb UNUSED_PARAM,
                void *userdata,
-               int depth ATTRIBUTE_UNUSED)
+               int depth UNUSED_PARAM)
 {
-       /* +2: with space for eventual trailing NULL */
-       dl = xrealloc(dl, (dl_count+2) * sizeof(dl[0]));
+       dl = xrealloc_vector(dl, 5, dl_count);
        dl[dl_count] = xstrdup(filename + (int)(ptrdiff_t)userdata);
        dl_count++;
        return TRUE;
@@ -1167,15 +1180,15 @@ static char **get_recursive_dirlist(char *path)
        dl_count = 0;
        dl = xzalloc(sizeof(dl[0]));
 
-       /* If -r has been set, then the recursive_action function will be
-        * used. Unfortunately, this outputs the root directory along with
-        * the recursed paths, so use void *userdata to specify the string
-        * length of the root directory - '(void*)(strlen(path)+)'.
-        * add_to_dirlist then removes root dir prefix. */
+       /* We need to trim root directory prefix.
+        * Using void *userdata to specify its length,
+        * add_to_dirlist will remove it. */
        if (option_mask32 & FLAG_r) {
                recursive_action(path, ACTION_RECURSE|ACTION_FOLLOWLINKS,
-                                       add_to_dirlist, NULL,
-                                       (void*)(strlen(path)+1), 0);
+                                       add_to_dirlist, /* file_action */
+                                       NULL, /* dir_action */
+                                       (void*)(ptrdiff_t)(strlen(path) + 1),
+                                       0);
        } else {
                DIR *dp;
                struct dirent *ep;
@@ -1216,10 +1229,10 @@ static void diffdir(char *p1, char *p2)
        dirlist2 = get_recursive_dirlist(p2);
 
        /* If -S was set, find the starting point. */
-       if (start) {
-               while (*dirlist1 != NULL && strcmp(*dirlist1, start) < 0)
+       if (opt_S_start) {
+               while (*dirlist1 != NULL && strcmp(*dirlist1, opt_S_start) < 0)
                        dirlist1++;
-               while (*dirlist2 != NULL && strcmp(*dirlist2, start) < 0)
+               while (*dirlist2 != NULL && strcmp(*dirlist2, opt_S_start) < 0)
                        dirlist2++;
                if ((*dirlist1 == NULL) || (*dirlist2 == NULL))
                        bb_error_msg(bb_msg_invalid_arg, "NULL", "-S");
@@ -1256,7 +1269,7 @@ static void diffdir(char *p1, char *p2)
 
 
 int diff_main(int argc, char **argv) MAIN_EXTERNALLY_VISIBLE;
-int diff_main(int argc ATTRIBUTE_UNUSED, char **argv)
+int diff_main(int argc UNUSED_PARAM, char **argv)
 {
        int gotstdin = 0;
        char *f1, *f2;
@@ -1268,20 +1281,15 @@ int diff_main(int argc ATTRIBUTE_UNUSED, char **argv)
        opt_complementary = "=2:L::U+";
        getopt32(argv, "abdiL:NqrsS:tTU:wu"
                        "p" /* ignored (for compatibility) */,
-                       &L_arg, &start, &context);
+                       &L_arg, &opt_S_start, &opt_U_context);
        /*argc -= optind;*/
        argv += optind;
        while (L_arg) {
                if (label1 && label2)
                        bb_show_usage();
-               if (!label1)
-                       label1 = L_arg->data;
-               else { /* then label2 is NULL */
+               if (label1) /* then label2 is NULL */
                        label2 = label1;
-                       label1 = L_arg->data;
-               }
-               /* we leak L_arg here... */
-               L_arg = L_arg->link;
+               label1 = llist_pop(&L_arg);
        }
 
        /*
@@ -1290,6 +1298,8 @@ int diff_main(int argc ATTRIBUTE_UNUSED, char **argv)
         */
        f1 = argv[0];
        f2 = argv[1];
+       /* Compat: "diff file name_which_doesnt_exist" exits with 2 */
+       xfunc_error_retval = 2;
        if (LONE_DASH(f1)) {
                fstat(STDIN_FILENO, &stb1);
                gotstdin++;
@@ -1300,6 +1310,7 @@ int diff_main(int argc ATTRIBUTE_UNUSED, char **argv)
                gotstdin++;
        } else
                xstat(f2, &stb2);
+       xfunc_error_retval = 1;
 
        if (gotstdin && (S_ISDIR(stb1.st_mode) || S_ISDIR(stb2.st_mode)))
                bb_error_msg_and_die("can't compare stdin to a directory");
@@ -1307,7 +1318,7 @@ int diff_main(int argc ATTRIBUTE_UNUSED, char **argv)
        if (S_ISDIR(stb1.st_mode) && S_ISDIR(stb2.st_mode)) {
 #if ENABLE_FEATURE_DIFF_DIR
                diffdir(f1, f2);
-               return status;
+               return exit_status;
 #else
                bb_error_msg_and_die("no support for directory comparison");
 #endif
@@ -1317,12 +1328,12 @@ int diff_main(int argc ATTRIBUTE_UNUSED, char **argv)
                /* NB: "diff dir      dir2/dir3/file" must become
                 *     "diff dir/file dir2/dir3/file" */
                char *slash = strrchr(f2, '/');
-               f1 = concat_path_file(f1, slash ? slash+1 : f2);
+               f1 = concat_path_file(f1, slash ? slash + 1 : f2);
                xstat(f1, &stb1);
        }
        if (S_ISDIR(stb2.st_mode)) {
                char *slash = strrchr(f1, '/');
-               f2 = concat_path_file(f2, slash ? slash+1 : f1);
+               f2 = concat_path_file(f2, slash ? slash + 1 : f1);
                xstat(f2, &stb2);
        }
 
@@ -1330,5 +1341,5 @@ int diff_main(int argc ATTRIBUTE_UNUSED, char **argv)
         * they are not both DIRestories */
        print_status((gotstdin > 1 ? D_SAME : diffreg(f1, f2, 0)),
                        f1, f2 /*, NULL*/);
-       return status;
+       return exit_status;
 }