Patch from Jason Schoon to add optional SIGUSR1 support to dd.
[oweals/busybox.git] / editors / awk.c
index 6ef4c0f9dfc3529f823ddb76251c0c5faecafb26..e11c8350f77c94eb3007b22be809fce2cfdfd8c5 100644 (file)
@@ -4,20 +4,7 @@
  *
  * Copyright (C) 2002 by Dmitry Zakharov <dmit@crp.bank.gov.ua>
  *
- * This program is free software; you can redistribute it and/or modify
- * it under the terms of the GNU General Public License as published by
- * the Free Software Foundation; either version 2 of the License, or
- * (at your option) any later version.
- *
- * This program is distributed in the hope that it will be useful,
- * but WITHOUT ANY WARRANTY; without even the implied warranty of
- * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
- * General Public License for more details.
- *
- * You should have received a copy of the GNU General Public License
- * along with this program; if not, write to the Free Software
- * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
- *
+ * Licensed under the GPL v2 or later, see the file LICENSE in this tarball.
  */
 
 #include <stdio.h>
@@ -58,7 +45,7 @@ typedef struct var_s {
        double number;
        char *string;
        union {
-               int aidx;                               /* func arg index (on compilation stage) */
+               int aidx;                               /* func arg idx (for compilation stage) */
                struct xhash_s *array;  /* array ptr */
                struct var_s *parent;   /* for func args, ptr to actual parameter */
                char **walker;                  /* list of array elements (for..in) */
@@ -108,7 +95,7 @@ typedef struct xhash_s {
 
 /* Tree node */
 typedef struct node_s {
-       unsigned long info;
+       uint32_t info;
        unsigned short lineno;
        union {
                struct node_s *n;
@@ -324,7 +311,7 @@ static char * const tokenlist =
        "\3END"         "\0"
        ;
 
-static unsigned long tokeninfo[] = {
+static const uint32_t tokeninfo[] = {
 
        0,
        0,
@@ -405,7 +392,7 @@ static char * vValues =
 /* hash size may grow to these values */
 #define FIRST_PRIME 61;
 static const unsigned int PRIMES[] = { 251, 1021, 4093, 16381, 65521 };
-static const unsigned int NPRIMES = sizeof(PRIMES) / sizeof(unsigned int);
+enum { NPRIMES = sizeof(PRIMES) / sizeof(unsigned int) };
 
 /* globals */
 
@@ -420,18 +407,18 @@ static xhash *vhash, *ahash, *fdhash, *fnhash;
 static char *programname;
 static short lineno;
 static int is_f0_split;
-static int nfields = 0;
-static var *Fields = NULL;
+static int nfields;
+static var *Fields;
 static tsplitter fsplitter, rsplitter;
-static nvblock *cb = NULL;
+static nvblock *cb;
 static char *pos;
 static char *buf;
-static int icase = FALSE;
-static int exiting = FALSE;
+static int icase;
+static int exiting;
 
 static struct {
-       unsigned long tclass;
-       unsigned long info;
+       uint32_t tclass;
+       uint32_t info;
        char *string;
        double number;
        short lineno;
@@ -440,12 +427,12 @@ static struct {
 
 /* function prototypes */
 static void handle_special(var *);
-static node *parse_expr(unsigned long);
+static node *parse_expr(uint32_t);
 static void chain_group(void);
 static var *evaluate(node *, var *);
 static rstream *next_input_file(void);
-static int fmt_num(char *, int, char *, double, int);
-static int awk_exit(int);
+static int fmt_num(char *, int, const char *, double, int);
+static int awk_exit(int) ATTRIBUTE_NORETURN;
 
 /* ---- error handling ---- */
 
@@ -462,10 +449,10 @@ static const char EMSG_UNDEF_FUNC[] = "Call to undefined function";
 static const char EMSG_NO_MATH[] = "Math support is not compiled in";
 #endif
 
+static void syntax_error(const char * const message) ATTRIBUTE_NORETURN;
 static void syntax_error(const char * const message)
 {
-       bb_error_msg("%s:%i: %s", programname, lineno, message);
-       exit(1);
+       bb_error_msg_and_die("%s:%i: %s", programname, lineno, message);
 }
 
 #define runtime_error(x) syntax_error(x)
@@ -473,7 +460,7 @@ static void syntax_error(const char * const message)
 
 /* ---- hash stuff ---- */
 
-static unsigned int hashidx(char *name)
+static unsigned int hashidx(const char *name)
 {
        register unsigned int idx=0;
 
@@ -494,7 +481,7 @@ static xhash *hash_init(void)
 }
 
 /* find item in hash, return ptr to data, NULL if not found */
-static void *hash_search(xhash *hash, char *name)
+static void *hash_search(xhash *hash, const char *name)
 {
        hash_item *hi;
 
@@ -536,7 +523,7 @@ static void hash_rebuild(xhash *hash)
 }
 
 /* find item in hash, add it if necessary. Return ptr to data */
-static void *hash_find(xhash *hash, char *name)
+static void *hash_find(xhash *hash, const char *name)
 {
        hash_item *hi;
        unsigned int idx;
@@ -564,7 +551,7 @@ static void *hash_find(xhash *hash, char *name)
 #define newfile(name) (rstream *) hash_find ( fdhash , (name) )
 #define newfunc(name) (func *) hash_find ( fnhash , (name) )
 
-static void hash_remove(xhash *hash, char *name)
+static void hash_remove(xhash *hash, const char *name)
 {
        hash_item *hi, **phi;
 
@@ -589,7 +576,7 @@ static void skip_spaces(char **s)
        register char *p = *s;
 
        while(*p == ' ' || *p == '\t' ||
-                                       (*p == '\\' && *(p+1) == '\n' && (++p, ++t.lineno))) {
+                       (*p == '\\' && *(p+1) == '\n' && (++p, ++t.lineno))) {
                p++;
        }
        *s = p;
@@ -682,13 +669,13 @@ static var *setvar_p(var *v, char *value)
 }
 
 /* same as setvar_p but make a copy of string */
-static var *setvar_s(var *v, char *value)
+static var *setvar_s(var *v, const char *value)
 {
        return setvar_p(v, (value && *value) ? bb_xstrdup(value) : NULL);
 }
 
 /* same as setvar_s but set USER flag */
-static var *setvar_u(var *v, char *value)
+static var *setvar_u(var *v, const char *value)
 {
        setvar_s(v, value);
        v->type |= VF_USER;
@@ -696,7 +683,7 @@ static var *setvar_u(var *v, char *value)
 }
 
 /* set array element to user string */
-static void setari_u(var *a, int idx, char *s)
+static void setari_u(var *a, int idx, const char *s)
 {
        register var *v;
        static char sidx[12];
@@ -749,7 +736,7 @@ static double getvar_i(var *v)
        return v->number;
 }
 
-static var *copyvar(var *dest, var *src)
+static var *copyvar(var *dest, const var *src)
 {
        if (dest != src) {
                clrvar(dest);
@@ -848,15 +835,16 @@ static void nvfree(var *v)
 /* Parse next token pointed by global pos, place results into global t.
  * If token isn't expected, give away. Return token class
  */
-static unsigned long next_token(unsigned long expected)
+static uint32_t next_token(uint32_t expected)
 {
        char *p, *pp, *s;
        char *tl;
-       unsigned long tc, *ti;
+       uint32_t tc;
+       const uint32_t *ti;
        int l;
-       static int concat_inserted = FALSE;
-       static unsigned long save_tclass, save_info;
-       static unsigned long ltclass = TC_OPTERM;
+       static int concat_inserted;
+       static uint32_t save_tclass, save_info;
+       static uint32_t ltclass = TC_OPTERM;
 
        if (t.rollback) {
 
@@ -959,10 +947,11 @@ static unsigned long next_token(unsigned long expected)
                                }
                                *(p-1) = '\0';
                                tc = TC_VARIABLE;
+                               /* also consume whitespace between functionname and bracket */
+                               if (! (expected & TC_VARIABLE)) skip_spaces(&p);
                                if (*p == '(') {
                                        tc = TC_FUNCTION;
                                } else {
-                                       skip_spaces(&p);
                                        if (*p == '[') {
                                                p++;
                                                tc = TC_ARRAY;
@@ -999,7 +988,7 @@ static unsigned long next_token(unsigned long expected)
 
 static void rollback_token(void) { t.rollback = TRUE; }
 
-static node *new_node(unsigned long info)
+static node *new_node(uint32_t info)
 {
        register node *n;
 
@@ -1028,12 +1017,12 @@ static node *condition(void)
 
 /* parse expression terminated by given argument, return ptr
  * to built subtree. Terminator is eaten by parse_expr */
-static node *parse_expr(unsigned long iexp)
+static node *parse_expr(uint32_t iexp)
 {
        node sn;
        node *cn = &sn;
        node *vn, *glptr;
-       unsigned long tc, xtc;
+       uint32_t tc, xtc;
        var *v;
 
        sn.info = PRIMASK;
@@ -1144,7 +1133,7 @@ static node *parse_expr(unsigned long iexp)
 }
 
 /* add node to chain. Return ptr to alloc'd node */
-static node *chain_node(unsigned long info)
+static node *chain_node(uint32_t info)
 {
        register node *n;
 
@@ -1164,7 +1153,7 @@ static node *chain_node(unsigned long info)
        return n;
 }
 
-static void chain_expr(unsigned long info)
+static void chain_expr(uint32_t info)
 {
        node *n;
 
@@ -1200,7 +1189,7 @@ static node *chain_loop(node *nn)
 /* parse group and attach it to chain */
 static void chain_group(void)
 {
-       unsigned long c;
+       uint32_t c;
        node *n, *n2, *n3;
 
        do {
@@ -1302,7 +1291,7 @@ static void chain_group(void)
 
 static void parse_program(char *p)
 {
-       unsigned long tclass;
+       uint32_t tclass;
        node *cn;
        func *f;
        var *v;
@@ -1378,7 +1367,7 @@ static node *mk_splitter(char *s, tsplitter *spl)
        if (bb_strlen(s) > 1) {
                mk_re_node(s, n, re);
        } else {
-               n->info = (unsigned long) *s;
+               n->info = (uint32_t) *s;
        }
 
        return n;
@@ -1667,6 +1656,7 @@ static int awk_getline(rstream *rsm, var *v)
                                }
                        } else if (c != '\0') {
                                s = strchr(b+pp, c);
+                               if (! s) s = memchr(b+pp, '\0', p - pp);
                                if (s) {
                                        so = eo = s-b;
                                        eo++;
@@ -1724,10 +1714,11 @@ static int awk_getline(rstream *rsm, var *v)
        return r;
 }
 
-static int fmt_num(char *b, int size, char *format, double n, int int_as_int)
+static int fmt_num(char *b, int size, const char *format, double n, int int_as_int)
 {
        int r=0;
-       char c, *s=format;
+       char c;
+       const char *s=format;
 
        if (int_as_int && n == (int)n) {
                r = snprintf(b, size, "%d", (int)n);
@@ -1881,7 +1872,7 @@ static var *exec_builtin(node *op, var *res)
        regex_t sreg, *re;
        static tsplitter tspl;
        node *spl;
-       unsigned long isr, info;
+       uint32_t isr, info;
        int nargs;
        time_t tt;
        char *s, *s1;
@@ -2044,7 +2035,7 @@ static var *evaluate(node *op, var *res)
                double d;
                int i;
        } L, R;
-       unsigned long opinfo;
+       uint32_t opinfo;
        short opn;
        union {
                char *s;
@@ -2052,7 +2043,7 @@ static var *evaluate(node *op, var *res)
                FILE *F;
                var *v;
                regex_t *re;
-               unsigned long info;
+               uint32_t info;
        } X;
 
        if (! op)
@@ -2367,7 +2358,7 @@ re_cont:
 
                          case F_sy:
                                fflush(NULL);
-                               R.d = (L.s && *L.s) ? system(L.s) : 0;
+                               R.d = (L.s && *L.s) ? (system(L.s) >> 8) : 0;
                                break;
 
                          case F_ff:
@@ -2568,7 +2559,7 @@ static int awk_exit(int r)
 
 /* if expr looks like "var=value", perform assignment and return 1,
  * otherwise return 0 */
-static int is_assignment(char *expr)
+static int is_assignment(const char *expr)
 {
        char *exprc, *s, *s0, *s1;
 
@@ -2621,10 +2612,10 @@ static rstream *next_input_file(void)
        return &rsm;
 }
 
-extern int awk_main(int argc, char **argv)
+int awk_main(int argc, char **argv)
 {
        char *s, *s1;
-       int i, j, c;
+       int i, j, c, flen;
        var *v;
        static var tv;
        char **envp;
@@ -2692,9 +2683,16 @@ keep_going:
                                F = afopen(programname = optarg, "r");
                                s = NULL;
                                /* one byte is reserved for some trick in next_token */
-                               for (i=j=1; j>0; i+=j) {
-                                       s = (char *)xrealloc(s, i+4096);
-                                       j = fread(s+i, 1, 4094, F);
+                               if (fseek(F, 0, SEEK_END) == 0) {
+                                       flen = ftell(F);
+                                       s = (char *)xmalloc(flen+4);
+                                       fseek(F, 0, SEEK_SET);
+                                       i = 1 + fread(s+1, 1, flen, F);
+                               } else {
+                                       for (i=j=1; j>0; i+=j) {
+                                               s = (char *)xrealloc(s, i+4096);
+                                               j = fread(s+i, 1, 4094, F);
+                                       }
                                }
                                s[i] = '\0';
                                fclose(F);