libbb: experimental faster string reading routines.
[oweals/busybox.git] / libbb / get_line_from_file.c
1 /* vi: set sw=4 ts=4: */
2 /*
3  * Utility routines.
4  *
5  * Copyright (C) 2005, 2006 Rob Landley <rob@landley.net>
6  * Copyright (C) 2004 Erik Andersen <andersen@codepoet.org>
7  * Copyright (C) 2001 Matt Krai
8  *
9  * Licensed under GPLv2 or later, see file LICENSE in this tarball for details.
10  */
11
12 #include "libbb.h"
13
14 /* This function reads an entire line from a text file, up to a newline
15  * or NUL byte, inclusive.  It returns a malloc'ed char * which
16  * must be free'ed by the caller.  If end is NULL '\n' isn't considered
17  * end of line.  If end isn't NULL, length of the chunk read is stored in it.
18  * Return NULL if EOF/error */
19 char* FAST_FUNC bb_get_chunk_from_file(FILE *file, int *end)
20 {
21         int ch;
22         int idx = 0;
23         char *linebuf = NULL;
24         int linebufsz = 0;
25
26         while ((ch = getc(file)) != EOF) {
27                 /* grow the line buffer as necessary */
28                 if (idx >= linebufsz) {
29                         linebufsz += 80;
30                         linebuf = xrealloc(linebuf, linebufsz);
31                 }
32                 linebuf[idx++] = (char) ch;
33                 if (!ch || (end && ch == '\n'))
34                         break;
35         }
36         if (end)
37                 *end = idx;
38         if (linebuf) {
39                 // huh, does fgets discard prior data on error like this?
40                 // I don't think so....
41                 //if (ferror(file)) {
42                 //      free(linebuf);
43                 //      return NULL;
44                 //}
45                 linebuf = xrealloc(linebuf, idx + 1);
46                 linebuf[idx] = '\0';
47         }
48         return linebuf;
49 }
50
51 /* Get line, including trailing \n if any */
52 char* FAST_FUNC xmalloc_fgets(FILE *file)
53 {
54         int i;
55
56         return bb_get_chunk_from_file(file, &i);
57 }
58
59 /* Get line.  Remove trailing \n */
60 char* FAST_FUNC xmalloc_fgetline(FILE *file)
61 {
62         int i;
63         char *c = bb_get_chunk_from_file(file, &i);
64
65         if (i && c[--i] == '\n')
66                 c[i] = '\0';
67
68         return c;
69 }
70
71 /* Faster routines (~twice as fast). +170 bytes. Unused as of 2008-07.
72  *
73  * NB: they stop at NUL byte too.
74  * Performance is important here. Think "grep 50gigabyte_file"...
75  * Iironically, grep can't use it because of NUL issue.
76  * We sorely need C lib to provide fgets which reports size!
77  */
78
79 static char* xmalloc_fgets_internal(FILE *file, int *sizep)
80 {
81         int len;
82         int idx = 0;
83         char *linebuf = NULL;
84
85         while (1) {
86                 char *r;
87
88                 linebuf = xrealloc(linebuf, idx + 0x100);
89                 r = fgets(&linebuf[idx], 0x100, file);
90                 if (!r) {
91                         /* need to terminate in case this is error
92                          * (EOF puts NUL itself) */
93                         linebuf[idx] = '\0';
94                         break;
95                 }
96                 /* stupid. fgets knows the len, it should report it somehow */
97                 len = strlen(&linebuf[idx]);
98                 idx += len;
99                 if (len != 0xff || linebuf[idx - 1] == '\n')
100                         break;
101         }
102         *sizep = idx;
103         if (idx) {
104                 /* xrealloc(linebuf, idx + 1) is up to caller */
105                 return linebuf;
106         }
107         free(linebuf);
108         return NULL;
109 }
110
111 /* Get line, remove trailing \n */
112 char* FAST_FUNC xmalloc_fgetline_fast(FILE *file)
113 {
114         int sz;
115         char *r = xmalloc_fgets_internal(file, &sz);
116         if (r && r[sz - 1] == '\n')
117                 r[--sz] = '\0';
118         return r; /* not xrealloc(r, sz + 1)! */
119 }
120
121 #if 0
122 char* FAST_FUNC xmalloc_fgets(FILE *file)
123 {
124         int sz;
125         return xmalloc_fgets_internal(file, &sz);
126 }
127
128 /* Get line, remove trailing \n */
129 char* FAST_FUNC xmalloc_fgetline(FILE *file)
130 {
131         int sz;
132         char *r = xmalloc_fgets_internal(file, &sz);
133         if (!r)
134                 return r;
135         if (r[sz - 1] == '\n')
136                 r[--sz] = '\0';
137         return xrealloc(r, sz + 1);
138 }
139 #endif