sendmail: support long header fields for recipients
[oweals/busybox.git] / mailutils / sendmail.c
1 /* vi: set sw=4 ts=4: */
2 /*
3  * bare bones sendmail
4  *
5  * Copyright (C) 2008 by Vladimir Dronnikov <dronnikov@gmail.com>
6  *
7  * Licensed under GPLv2, see file LICENSE in this source tree.
8  */
9
10 //kbuild:lib-$(CONFIG_SENDMAIL) += sendmail.o mail.o
11
12 //usage:#define sendmail_trivial_usage
13 //usage:       "[OPTIONS] [RECIPIENT_EMAIL]..."
14 //usage:#define sendmail_full_usage "\n\n"
15 //usage:       "Read email from stdin and send it\n"
16 //usage:     "\nStandard options:"
17 //usage:     "\n        -t              Read additional recipients from message body"
18 //usage:     "\n        -f SENDER       Sender (required)"
19 //usage:     "\n        -o OPTIONS      Various options. -oi implied, others are ignored"
20 //usage:     "\n        -i              -oi synonym. implied and ignored"
21 //usage:     "\n"
22 //usage:     "\nBusybox specific options:"
23 //usage:     "\n        -v              Verbose"
24 //usage:     "\n        -w SECS         Network timeout"
25 //usage:     "\n        -H 'PROG ARGS'  Run connection helper"
26 //usage:     "\n                        Examples:"
27 //usage:     "\n                        -H 'exec openssl s_client -quiet -tls1 -starttls smtp"
28 //usage:     "\n                                -connect smtp.gmail.com:25' <email.txt"
29 //usage:     "\n                                [4<username_and_passwd.txt | -auUSER -apPASS]"
30 //usage:     "\n                        -H 'exec openssl s_client -quiet -tls1"
31 //usage:     "\n                                -connect smtp.gmail.com:465' <email.txt"
32 //usage:     "\n                                [4<username_and_passwd.txt | -auUSER -apPASS]"
33 //usage:     "\n        -S HOST[:PORT]  Server"
34 //usage:     "\n        -auUSER         Username for AUTH LOGIN"
35 //usage:     "\n        -apPASS         Password for AUTH LOGIN"
36 ////usage:     "\n      -amMETHOD       Authentication method. Ignored. LOGIN is implied"
37 //usage:     "\n"
38 //usage:     "\nOther options are silently ignored; -oi -t is implied"
39 //usage:        IF_MAKEMIME(
40 //usage:     "\nUse makemime to create emails with attachments"
41 //usage:        )
42
43 #include "libbb.h"
44 #include "mail.h"
45
46 // limit maximum allowed number of headers to prevent overflows.
47 // set to 0 to not limit
48 #define MAX_HEADERS 256
49
50 static void send_r_n(const char *s)
51 {
52         if (verbose)
53                 bb_error_msg("send:'%s'", s);
54         printf("%s\r\n", s);
55 }
56
57 static int smtp_checkp(const char *fmt, const char *param, int code)
58 {
59         char *answer;
60         char *msg = send_mail_command(fmt, param);
61         // read stdin
62         // if the string has a form NNN- -- read next string. E.g. EHLO response
63         // parse first bytes to a number
64         // if code = -1 then just return this number
65         // if code != -1 then checks whether the number equals the code
66         // if not equal -> die saying msg
67         while ((answer = xmalloc_fgetline(stdin)) != NULL) {
68                 if (verbose)
69                         bb_error_msg("recv:'%.*s'", (int)(strchrnul(answer, '\r') - answer), answer);
70                 if (strlen(answer) <= 3 || '-' != answer[3])
71                         break;
72                 free(answer);
73         }
74         if (answer) {
75                 int n = atoi(answer);
76                 if (timeout)
77                         alarm(0);
78                 free(answer);
79                 if (-1 == code || n == code) {
80                         free(msg);
81                         return n;
82                 }
83         }
84         bb_error_msg_and_die("%s failed", msg);
85 }
86
87 static int smtp_check(const char *fmt, int code)
88 {
89         return smtp_checkp(fmt, NULL, code);
90 }
91
92 // strip argument of bad chars
93 static char *sane_address(char *str)
94 {
95         char *s = str;
96         char *p = s;
97         int leading_space = 1;
98         int trailing_space = 0;
99
100         while (*s) {
101                 if (isspace(*s)) {
102                         trailing_space = !leading_space;
103                 } else {
104                         *p++ = *s;
105                         if ((!isalnum(*s) && !strchr("_-.@", *s)) ||
106                             trailing_space) {
107                                 *p = '\0';
108                                 bb_error_msg("Bad address: %s", str);
109                                 *str = '\0';
110                                 return str;
111                         }
112                         leading_space = 0;
113                 }
114                 s++;
115         }
116         *p = '\0';
117         return str;
118 }
119
120 // check for an address inside angle brackets, if not found fall back to normal
121 static char *angle_address(char *str)
122 {
123         char *s = str;
124         char *e = str + strlen(str);
125
126         while (e != str && (isspace(*e) || *e == '\0'))
127                 e--;
128         if (*e != '>')
129                 goto done;
130         *e = '\0';
131         e = strrchr(s, '<');
132         if (e != NULL)
133                 s = e + 1;
134 done:
135         return sane_address(s);
136 }
137
138 static void rcptto(const char *s)
139 {
140         if (!*s)
141                 return;
142         // N.B. we don't die if recipient is rejected, for the other recipients may be accepted
143         if (250 != smtp_checkp("RCPT TO:<%s>", s, -1))
144                 bb_error_msg("Bad recipient: <%s>", s);
145 }
146
147 // send to a list of comma separated addresses
148 static void rcptto_list(const char *_str)
149 {
150         char *str = xstrdup(_str);
151         int len = strlen(str);
152         int in_quote = 0;
153         char *s = str;
154         char prev = 0;
155         int pos;
156
157         for (pos = 0; pos < len; pos++) {
158                 char ch = str[pos];
159
160                 if (ch == '"' && prev != '\\') {
161                         in_quote = !in_quote;
162                 } else if (!in_quote && ch == ',') {
163                         str[pos] = '\0';
164                         rcptto(angle_address(s));
165                         s = str + pos + 1;
166                 }
167                 prev = ch;
168         }
169         if (prev != ',')
170                 rcptto(angle_address(s));
171         free(str);
172 }
173
174 int sendmail_main(int argc, char **argv) MAIN_EXTERNALLY_VISIBLE;
175 int sendmail_main(int argc UNUSED_PARAM, char **argv)
176 {
177         char *opt_connect = opt_connect;
178         char *opt_from;
179         char *s;
180         llist_t *list = NULL;
181         char *host = sane_address(safe_gethostname());
182         unsigned nheaders = 0;
183         int code;
184         enum {
185                 HDR_OTHER = 0,
186                 HDR_TOCC,
187                 HDR_BCC,
188         } last_hdr = 0;
189         int check_hdr;
190
191         enum {
192         //--- standard options
193                 OPT_t = 1 << 0,         // read message for recipients, append them to those on cmdline
194                 OPT_f = 1 << 1,         // sender address
195                 OPT_o = 1 << 2,         // various options. -oi IMPLIED! others are IGNORED!
196                 OPT_i = 1 << 3,         // IMPLIED!
197         //--- BB specific options
198                 OPT_w = 1 << 4,         // network timeout
199                 OPT_H = 1 << 5,         // use external connection helper
200                 OPT_S = 1 << 6,         // specify connection string
201                 OPT_a = 1 << 7,         // authentication tokens
202                 OPT_v = 1 << 8,         // verbosity
203         };
204
205         // init global variables
206         INIT_G();
207
208         // save initial stdin since body is piped!
209         xdup2(STDIN_FILENO, 3);
210         G.fp0 = xfdopen_for_read(3);
211
212         // parse options
213         // -v is a counter, -f is required. -H and -S are mutually exclusive, -a is a list
214         opt_complementary = "vv:f:w+:H--S:S--H:a::";
215         // N.B. since -H and -S are mutually exclusive they do not interfere in opt_connect
216         // -a is for ssmtp (http://downloads.openwrt.org/people/nico/man/man8/ssmtp.8.html) compatibility,
217         // it is still under development.
218         opts = getopt32(argv, "tf:o:iw:H:S:a::v", &opt_from, NULL,
219                         &timeout, &opt_connect, &opt_connect, &list, &verbose);
220         //argc -= optind;
221         argv += optind;
222
223         // process -a[upm]<token> options
224         if ((opts & OPT_a) && !list)
225                 bb_show_usage();
226         while (list) {
227                 char *a = (char *) llist_pop(&list);
228                 if ('u' == a[0])
229                         G.user = xstrdup(a+1);
230                 if ('p' == a[0])
231                         G.pass = xstrdup(a+1);
232                 // N.B. we support only AUTH LOGIN so far
233                 //if ('m' == a[0])
234                 //      G.method = xstrdup(a+1);
235         }
236         // N.B. list == NULL here
237         //bb_info_msg("OPT[%x] AU[%s], AP[%s], AM[%s], ARGV[%s]", opts, au, ap, am, *argv);
238
239         // connect to server
240
241         // connection helper ordered? ->
242         if (opts & OPT_H) {
243                 const char *args[] = { "sh", "-c", opt_connect, NULL };
244                 // plug it in
245                 launch_helper(args);
246                 // Now:
247                 // our stdout will go to helper's stdin,
248                 // helper's stdout will be available on our stdin.
249
250                 // Wait for initial server message.
251                 // If helper (such as openssl) invokes STARTTLS, the initial 220
252                 // is swallowed by helper (and not repeated after TLS is initiated).
253                 // We will send NOOP cmd to server and check the response.
254                 // We should get 220+250 on plain connection, 250 on STARTTLSed session.
255                 //
256                 // The problem here is some servers delay initial 220 message,
257                 // and consider client to be a spammer if it starts sending cmds
258                 // before 220 reached it. The code below is unsafe in this regard:
259                 // in non-STARTTLSed case, we potentially send NOOP before 220
260                 // is sent by server.
261                 // Ideas? (--delay SECS opt? --assume-starttls-helper opt?)
262                 code = smtp_check("NOOP", -1);
263                 if (code == 220)
264                         // we got 220 - this is not STARTTLSed connection,
265                         // eat 250 response to our NOOP
266                         smtp_check(NULL, 250);
267                 else
268                 if (code != 250)
269                         bb_error_msg_and_die("SMTP init failed");
270         } else {
271                 // vanilla connection
272                 int fd;
273                 // host[:port] not explicitly specified? -> use $SMTPHOST
274                 // no $SMTPHOST? -> use localhost
275                 if (!(opts & OPT_S)) {
276                         opt_connect = getenv("SMTPHOST");
277                         if (!opt_connect)
278                                 opt_connect = (char *)"127.0.0.1";
279                 }
280                 // do connect
281                 fd = create_and_connect_stream_or_die(opt_connect, 25);
282                 // and make ourselves a simple IO filter
283                 xmove_fd(fd, STDIN_FILENO);
284                 xdup2(STDIN_FILENO, STDOUT_FILENO);
285
286                 // Wait for initial server 220 message
287                 smtp_check(NULL, 220);
288         }
289
290         // we should start with modern EHLO
291         if (250 != smtp_checkp("EHLO %s", host, -1))
292                 smtp_checkp("HELO %s", host, 250);
293         free(host);
294
295         // perform authentication
296         if (opts & OPT_a) {
297                 smtp_check("AUTH LOGIN", 334);
298                 // we must read credentials unless they are given via -a[up] options
299                 if (!G.user || !G.pass)
300                         get_cred_or_die(4);
301                 encode_base64(NULL, G.user, NULL);
302                 smtp_check("", 334);
303                 encode_base64(NULL, G.pass, NULL);
304                 smtp_check("", 235);
305         }
306
307         // set sender
308         // N.B. we have here a very loosely defined algorythm
309         // since sendmail historically offers no means to specify secrets on cmdline.
310         // 1) server can require no authentication ->
311         //      we must just provide a (possibly fake) reply address.
312         // 2) server can require AUTH ->
313         //      we must provide valid username and password along with a (possibly fake) reply address.
314         //      For the sake of security username and password are to be read either from console or from a secured file.
315         //      Since reading from console may defeat usability, the solution is either to read from a predefined
316         //      file descriptor (e.g. 4), or again from a secured file.
317
318         // got no sender address? -> use system username as a resort
319         // N.B. we marked -f as required option!
320         //if (!G.user) {
321         //      // N.B. IMHO getenv("USER") can be way easily spoofed!
322         //      G.user = xuid2uname(getuid());
323         //      opt_from = xasprintf("%s@%s", G.user, domain);
324         //}
325         smtp_checkp("MAIL FROM:<%s>", opt_from, 250);
326
327         // process message
328
329         // read recipients from message and add them to those given on cmdline.
330         // this means we scan stdin for To:, Cc:, Bcc: lines until an empty line
331         // and then use the rest of stdin as message body
332         code = 0; // set "analyze headers" mode
333         while ((s = xmalloc_fgetline(G.fp0)) != NULL) {
334  dump:
335                 // put message lines doubling leading dots
336                 if (code) {
337                         // escape leading dots
338                         // N.B. this feature is implied even if no -i (-oi) switch given
339                         // N.B. we need to escape the leading dot regardless of
340                         // whether it is single or not character on the line
341                         if ('.' == s[0] /*&& '\0' == s[1] */)
342                                 printf(".");
343                         // dump read line
344                         send_r_n(s);
345                         free(s);
346                         continue;
347                 }
348
349                 // analyze headers
350                 // To: or Cc: headers add recipients
351                 if (opts & OPT_t) {
352                         if (0 == strncasecmp("To:", s, 3) || 0 == strncasecmp("Bcc:" + 1, s, 3)) {
353                                 rcptto_list(s+3);
354                                 last_hdr = HDR_TOCC;
355                                 goto addheader;
356                         }
357                         // Bcc: header adds blind copy (hidden) recipient
358                         if (0 == strncasecmp("Bcc:", s, 4)) {
359                                 rcptto_list(s+4);
360                                 free(s);
361                                 last_hdr = HDR_BCC;
362                                 continue; // N.B. Bcc: vanishes from headers!
363                         }
364                 }
365                 check_hdr = list && isspace(s[0]);
366                 if (strchr(s, ':') || check_hdr) {
367                         // other headers go verbatim
368                         // N.B. RFC2822 2.2.3 "Long Header Fields" allows for headers to occupy several lines.
369                         // Continuation is denoted by prefixing additional lines with whitespace(s).
370                         // Thanks (stefan.seyfried at googlemail.com) for pointing this out.
371                         if (check_hdr && last_hdr != HDR_OTHER) {
372                                 rcptto_list(s+1);
373                                 if (last_hdr == HDR_BCC)
374                                         continue;
375                                         // N.B. Bcc: vanishes from headers!
376                         } else {
377                                 last_hdr = HDR_OTHER;
378                         }
379  addheader:
380                         // N.B. we allow MAX_HEADERS generic headers at most to prevent attacks
381                         if (MAX_HEADERS && ++nheaders >= MAX_HEADERS)
382                                 goto bail;
383                         llist_add_to_end(&list, s);
384                 } else {
385                         // a line without ":" (an empty line too, by definition) doesn't look like a valid header
386                         // so stop "analyze headers" mode
387  reenter:
388                         // put recipients specified on cmdline
389                         while (*argv) {
390                                 char *t = sane_address(*argv);
391                                 rcptto(t);
392                                 //if (MAX_HEADERS && ++nheaders >= MAX_HEADERS)
393                                 //      goto bail;
394                                 llist_add_to_end(&list, xasprintf("To: %s", t));
395                                 argv++;
396                         }
397                         // enter "put message" mode
398                         // N.B. DATA fails iff no recipients were accepted (or even provided)
399                         // in this case just bail out gracefully
400                         if (354 != smtp_check("DATA", -1))
401                                 goto bail;
402                         // dump the headers
403                         while (list) {
404                                 send_r_n((char *) llist_pop(&list));
405                         }
406                         // stop analyzing headers
407                         code++;
408                         // N.B. !s means: we read nothing, and nothing to be read in the future.
409                         // just dump empty line and break the loop
410                         if (!s) {
411                                 send_r_n("");
412                                 break;
413                         }
414                         // go dump message body
415                         // N.B. "s" already contains the first non-header line, so pretend we read it from input
416                         goto dump;
417                 }
418         }
419         // odd case: we didn't stop "analyze headers" mode -> message body is empty. Reenter the loop
420         // N.B. after reenter code will be > 0
421         if (!code)
422                 goto reenter;
423
424         // finalize the message
425         smtp_check(".", 250);
426  bail:
427         // ... and say goodbye
428         smtp_check("QUIT", 221);
429         // cleanup
430         if (ENABLE_FEATURE_CLEAN_UP)
431                 fclose(G.fp0);
432
433         return EXIT_SUCCESS;
434 }