sendmail: support addresses inside angle brackets
[oweals/busybox.git] / mailutils / sendmail.c
1 /* vi: set sw=4 ts=4: */
2 /*
3  * bare bones sendmail
4  *
5  * Copyright (C) 2008 by Vladimir Dronnikov <dronnikov@gmail.com>
6  *
7  * Licensed under GPLv2, see file LICENSE in this source tree.
8  */
9
10 //kbuild:lib-$(CONFIG_SENDMAIL) += sendmail.o mail.o
11
12 //usage:#define sendmail_trivial_usage
13 //usage:       "[OPTIONS] [RECIPIENT_EMAIL]..."
14 //usage:#define sendmail_full_usage "\n\n"
15 //usage:       "Read email from stdin and send it\n"
16 //usage:     "\nStandard options:"
17 //usage:     "\n        -t              Read additional recipients from message body"
18 //usage:     "\n        -f SENDER       Sender (required)"
19 //usage:     "\n        -o OPTIONS      Various options. -oi implied, others are ignored"
20 //usage:     "\n        -i              -oi synonym. implied and ignored"
21 //usage:     "\n"
22 //usage:     "\nBusybox specific options:"
23 //usage:     "\n        -v              Verbose"
24 //usage:     "\n        -w SECS         Network timeout"
25 //usage:     "\n        -H 'PROG ARGS'  Run connection helper"
26 //usage:     "\n                        Examples:"
27 //usage:     "\n                        -H 'exec openssl s_client -quiet -tls1 -starttls smtp"
28 //usage:     "\n                                -connect smtp.gmail.com:25' <email.txt"
29 //usage:     "\n                                [4<username_and_passwd.txt | -auUSER -apPASS]"
30 //usage:     "\n                        -H 'exec openssl s_client -quiet -tls1"
31 //usage:     "\n                                -connect smtp.gmail.com:465' <email.txt"
32 //usage:     "\n                                [4<username_and_passwd.txt | -auUSER -apPASS]"
33 //usage:     "\n        -S HOST[:PORT]  Server"
34 //usage:     "\n        -auUSER         Username for AUTH LOGIN"
35 //usage:     "\n        -apPASS         Password for AUTH LOGIN"
36 ////usage:     "\n      -amMETHOD       Authentication method. Ignored. LOGIN is implied"
37 //usage:     "\n"
38 //usage:     "\nOther options are silently ignored; -oi -t is implied"
39 //usage:        IF_MAKEMIME(
40 //usage:     "\nUse makemime to create emails with attachments"
41 //usage:        )
42
43 #include "libbb.h"
44 #include "mail.h"
45
46 // limit maximum allowed number of headers to prevent overflows.
47 // set to 0 to not limit
48 #define MAX_HEADERS 256
49
50 static void send_r_n(const char *s)
51 {
52         if (verbose)
53                 bb_error_msg("send:'%s'", s);
54         printf("%s\r\n", s);
55 }
56
57 static int smtp_checkp(const char *fmt, const char *param, int code)
58 {
59         char *answer;
60         char *msg = send_mail_command(fmt, param);
61         // read stdin
62         // if the string has a form NNN- -- read next string. E.g. EHLO response
63         // parse first bytes to a number
64         // if code = -1 then just return this number
65         // if code != -1 then checks whether the number equals the code
66         // if not equal -> die saying msg
67         while ((answer = xmalloc_fgetline(stdin)) != NULL) {
68                 if (verbose)
69                         bb_error_msg("recv:'%.*s'", (int)(strchrnul(answer, '\r') - answer), answer);
70                 if (strlen(answer) <= 3 || '-' != answer[3])
71                         break;
72                 free(answer);
73         }
74         if (answer) {
75                 int n = atoi(answer);
76                 if (timeout)
77                         alarm(0);
78                 free(answer);
79                 if (-1 == code || n == code) {
80                         free(msg);
81                         return n;
82                 }
83         }
84         bb_error_msg_and_die("%s failed", msg);
85 }
86
87 static int smtp_check(const char *fmt, int code)
88 {
89         return smtp_checkp(fmt, NULL, code);
90 }
91
92 // strip argument of bad chars
93 static char *sane_address(char *str)
94 {
95         char *s = str;
96         char *p = s;
97         int leading_space = 1;
98         int trailing_space = 0;
99
100         while (*s) {
101                 if (isspace(*s)) {
102                         trailing_space = !leading_space;
103                 } else {
104                         *p++ = *s;
105                         if ((!isalnum(*s) && !strchr("_-.@", *s)) ||
106                             trailing_space) {
107                                 *p = '\0';
108                                 bb_error_msg("Bad address: %s", str);
109                                 *str = '\0';
110                                 return str;
111                         }
112                         leading_space = 0;
113                 }
114                 s++;
115         }
116         *p = '\0';
117         return str;
118 }
119
120 // check for an address inside angle brackets, if not found fall back to normal
121 static char *angle_address(char *str)
122 {
123         char *s = str;
124         char *e = str + strlen(str);
125
126         while (e != str && (isspace(*e) || *e == '\0'))
127                 e--;
128         if (*e != '>')
129                 goto done;
130         *e = '\0';
131         e = strrchr(s, '<');
132         if (e != NULL)
133                 s = e + 1;
134 done:
135         return sane_address(s);
136 }
137
138 static void rcptto(const char *s)
139 {
140         if (!*s)
141                 return;
142         // N.B. we don't die if recipient is rejected, for the other recipients may be accepted
143         if (250 != smtp_checkp("RCPT TO:<%s>", s, -1))
144                 bb_error_msg("Bad recipient: <%s>", s);
145 }
146
147 int sendmail_main(int argc, char **argv) MAIN_EXTERNALLY_VISIBLE;
148 int sendmail_main(int argc UNUSED_PARAM, char **argv)
149 {
150         char *opt_connect = opt_connect;
151         char *opt_from;
152         char *s;
153         llist_t *list = NULL;
154         char *host = sane_address(safe_gethostname());
155         unsigned nheaders = 0;
156         int code;
157
158         enum {
159         //--- standard options
160                 OPT_t = 1 << 0,         // read message for recipients, append them to those on cmdline
161                 OPT_f = 1 << 1,         // sender address
162                 OPT_o = 1 << 2,         // various options. -oi IMPLIED! others are IGNORED!
163                 OPT_i = 1 << 3,         // IMPLIED!
164         //--- BB specific options
165                 OPT_w = 1 << 4,         // network timeout
166                 OPT_H = 1 << 5,         // use external connection helper
167                 OPT_S = 1 << 6,         // specify connection string
168                 OPT_a = 1 << 7,         // authentication tokens
169                 OPT_v = 1 << 8,         // verbosity
170         };
171
172         // init global variables
173         INIT_G();
174
175         // save initial stdin since body is piped!
176         xdup2(STDIN_FILENO, 3);
177         G.fp0 = xfdopen_for_read(3);
178
179         // parse options
180         // -v is a counter, -f is required. -H and -S are mutually exclusive, -a is a list
181         opt_complementary = "vv:f:w+:H--S:S--H:a::";
182         // N.B. since -H and -S are mutually exclusive they do not interfere in opt_connect
183         // -a is for ssmtp (http://downloads.openwrt.org/people/nico/man/man8/ssmtp.8.html) compatibility,
184         // it is still under development.
185         opts = getopt32(argv, "tf:o:iw:H:S:a::v", &opt_from, NULL,
186                         &timeout, &opt_connect, &opt_connect, &list, &verbose);
187         //argc -= optind;
188         argv += optind;
189
190         // process -a[upm]<token> options
191         if ((opts & OPT_a) && !list)
192                 bb_show_usage();
193         while (list) {
194                 char *a = (char *) llist_pop(&list);
195                 if ('u' == a[0])
196                         G.user = xstrdup(a+1);
197                 if ('p' == a[0])
198                         G.pass = xstrdup(a+1);
199                 // N.B. we support only AUTH LOGIN so far
200                 //if ('m' == a[0])
201                 //      G.method = xstrdup(a+1);
202         }
203         // N.B. list == NULL here
204         //bb_info_msg("OPT[%x] AU[%s], AP[%s], AM[%s], ARGV[%s]", opts, au, ap, am, *argv);
205
206         // connect to server
207
208         // connection helper ordered? ->
209         if (opts & OPT_H) {
210                 const char *args[] = { "sh", "-c", opt_connect, NULL };
211                 // plug it in
212                 launch_helper(args);
213                 // Now:
214                 // our stdout will go to helper's stdin,
215                 // helper's stdout will be available on our stdin.
216
217                 // Wait for initial server message.
218                 // If helper (such as openssl) invokes STARTTLS, the initial 220
219                 // is swallowed by helper (and not repeated after TLS is initiated).
220                 // We will send NOOP cmd to server and check the response.
221                 // We should get 220+250 on plain connection, 250 on STARTTLSed session.
222                 //
223                 // The problem here is some servers delay initial 220 message,
224                 // and consider client to be a spammer if it starts sending cmds
225                 // before 220 reached it. The code below is unsafe in this regard:
226                 // in non-STARTTLSed case, we potentially send NOOP before 220
227                 // is sent by server.
228                 // Ideas? (--delay SECS opt? --assume-starttls-helper opt?)
229                 code = smtp_check("NOOP", -1);
230                 if (code == 220)
231                         // we got 220 - this is not STARTTLSed connection,
232                         // eat 250 response to our NOOP
233                         smtp_check(NULL, 250);
234                 else
235                 if (code != 250)
236                         bb_error_msg_and_die("SMTP init failed");
237         } else {
238                 // vanilla connection
239                 int fd;
240                 // host[:port] not explicitly specified? -> use $SMTPHOST
241                 // no $SMTPHOST? -> use localhost
242                 if (!(opts & OPT_S)) {
243                         opt_connect = getenv("SMTPHOST");
244                         if (!opt_connect)
245                                 opt_connect = (char *)"127.0.0.1";
246                 }
247                 // do connect
248                 fd = create_and_connect_stream_or_die(opt_connect, 25);
249                 // and make ourselves a simple IO filter
250                 xmove_fd(fd, STDIN_FILENO);
251                 xdup2(STDIN_FILENO, STDOUT_FILENO);
252
253                 // Wait for initial server 220 message
254                 smtp_check(NULL, 220);
255         }
256
257         // we should start with modern EHLO
258         if (250 != smtp_checkp("EHLO %s", host, -1))
259                 smtp_checkp("HELO %s", host, 250);
260         free(host);
261
262         // perform authentication
263         if (opts & OPT_a) {
264                 smtp_check("AUTH LOGIN", 334);
265                 // we must read credentials unless they are given via -a[up] options
266                 if (!G.user || !G.pass)
267                         get_cred_or_die(4);
268                 encode_base64(NULL, G.user, NULL);
269                 smtp_check("", 334);
270                 encode_base64(NULL, G.pass, NULL);
271                 smtp_check("", 235);
272         }
273
274         // set sender
275         // N.B. we have here a very loosely defined algorythm
276         // since sendmail historically offers no means to specify secrets on cmdline.
277         // 1) server can require no authentication ->
278         //      we must just provide a (possibly fake) reply address.
279         // 2) server can require AUTH ->
280         //      we must provide valid username and password along with a (possibly fake) reply address.
281         //      For the sake of security username and password are to be read either from console or from a secured file.
282         //      Since reading from console may defeat usability, the solution is either to read from a predefined
283         //      file descriptor (e.g. 4), or again from a secured file.
284
285         // got no sender address? -> use system username as a resort
286         // N.B. we marked -f as required option!
287         //if (!G.user) {
288         //      // N.B. IMHO getenv("USER") can be way easily spoofed!
289         //      G.user = xuid2uname(getuid());
290         //      opt_from = xasprintf("%s@%s", G.user, domain);
291         //}
292         smtp_checkp("MAIL FROM:<%s>", opt_from, 250);
293
294         // process message
295
296         // read recipients from message and add them to those given on cmdline.
297         // this means we scan stdin for To:, Cc:, Bcc: lines until an empty line
298         // and then use the rest of stdin as message body
299         code = 0; // set "analyze headers" mode
300         while ((s = xmalloc_fgetline(G.fp0)) != NULL) {
301  dump:
302                 // put message lines doubling leading dots
303                 if (code) {
304                         // escape leading dots
305                         // N.B. this feature is implied even if no -i (-oi) switch given
306                         // N.B. we need to escape the leading dot regardless of
307                         // whether it is single or not character on the line
308                         if ('.' == s[0] /*&& '\0' == s[1] */)
309                                 printf(".");
310                         // dump read line
311                         send_r_n(s);
312                         free(s);
313                         continue;
314                 }
315
316                 // analyze headers
317                 // To: or Cc: headers add recipients
318                 if (opts & OPT_t) {
319                         if (0 == strncasecmp("To:", s, 3) || 0 == strncasecmp("Bcc:" + 1, s, 3)) {
320                                 char *r = xstrdup(s+3);
321                                 rcptto(angle_address(r));
322                                 free(r);
323                                 goto addheader;
324                         }
325                         // Bcc: header adds blind copy (hidden) recipient
326                         if (0 == strncasecmp("Bcc:", s, 4)) {
327                                 rcptto(angle_address(s+4));
328                                 free(s);
329                                 continue; // N.B. Bcc: vanishes from headers!
330                         }
331                 }
332                 if (strchr(s, ':') || (list && isspace(s[0]))) {
333                         // other headers go verbatim
334                         // N.B. RFC2822 2.2.3 "Long Header Fields" allows for headers to occupy several lines.
335                         // Continuation is denoted by prefixing additional lines with whitespace(s).
336                         // Thanks (stefan.seyfried at googlemail.com) for pointing this out.
337  addheader:
338                         // N.B. we allow MAX_HEADERS generic headers at most to prevent attacks
339                         if (MAX_HEADERS && ++nheaders >= MAX_HEADERS)
340                                 goto bail;
341                         llist_add_to_end(&list, s);
342                 } else {
343                         // a line without ":" (an empty line too, by definition) doesn't look like a valid header
344                         // so stop "analyze headers" mode
345  reenter:
346                         // put recipients specified on cmdline
347                         while (*argv) {
348                                 char *t = sane_address(*argv);
349                                 rcptto(t);
350                                 //if (MAX_HEADERS && ++nheaders >= MAX_HEADERS)
351                                 //      goto bail;
352                                 llist_add_to_end(&list, xasprintf("To: %s", t));
353                                 argv++;
354                         }
355                         // enter "put message" mode
356                         // N.B. DATA fails iff no recipients were accepted (or even provided)
357                         // in this case just bail out gracefully
358                         if (354 != smtp_check("DATA", -1))
359                                 goto bail;
360                         // dump the headers
361                         while (list) {
362                                 send_r_n((char *) llist_pop(&list));
363                         }
364                         // stop analyzing headers
365                         code++;
366                         // N.B. !s means: we read nothing, and nothing to be read in the future.
367                         // just dump empty line and break the loop
368                         if (!s) {
369                                 send_r_n("");
370                                 break;
371                         }
372                         // go dump message body
373                         // N.B. "s" already contains the first non-header line, so pretend we read it from input
374                         goto dump;
375                 }
376         }
377         // odd case: we didn't stop "analyze headers" mode -> message body is empty. Reenter the loop
378         // N.B. after reenter code will be > 0
379         if (!code)
380                 goto reenter;
381
382         // finalize the message
383         smtp_check(".", 250);
384  bail:
385         // ... and say goodbye
386         smtp_check("QUIT", 221);
387         // cleanup
388         if (ENABLE_FEATURE_CLEAN_UP)
389                 fclose(G.fp0);
390
391         return EXIT_SUCCESS;
392 }