init,halt: portability improvements
[oweals/busybox.git] / init / init.c
1 /* vi: set sw=4 ts=4: */
2 /*
3  * Mini init implementation for busybox
4  *
5  * Copyright (C) 1995, 1996 by Bruce Perens <bruce@pixar.com>.
6  * Copyright (C) 1999-2004 by Erik Andersen <andersen@codepoet.org>
7  * Adjusted by so many folks, it's impossible to keep track.
8  *
9  * Licensed under GPLv2 or later, see file LICENSE in this tarball for details.
10  */
11
12 #include "libbb.h"
13 #include <syslog.h>
14 #include <paths.h>
15 #include <sys/resource.h>
16 #ifdef __linux__
17 #include <linux/vt.h>
18 #endif
19 #if ENABLE_FEATURE_UTMP
20 # include <utmp.h> /* DEAD_PROCESS */
21 #endif
22 #include "reboot.h" /* reboot() constants */
23
24 /* Used only for sanitizing purposes in set_sane_term() below. On systems where
25  * the baud rate is stored in a separate field, we can safely disable them. */
26 #ifndef CBAUD
27 # define CBAUD 0
28 # define CBAUDEX 0
29 #endif
30
31 /* Was a CONFIG_xxx option. A lot of people were building
32  * not fully functional init by switching it on! */
33 #define DEBUG_INIT 0
34
35 #define COMMAND_SIZE      256
36 #define CONSOLE_NAME_SIZE 32
37
38 /* Default sysinit script. */
39 #ifndef INIT_SCRIPT
40 #define INIT_SCRIPT  "/etc/init.d/rcS"
41 #endif
42
43 /* Each type of actions can appear many times. They will be
44  * handled in order. RESTART is an exception, only 1st is used.
45  */
46 /* Start these actions first and wait for completion */
47 #define SYSINIT     0x01
48 /* Start these after SYSINIT and wait for completion */
49 #define WAIT        0x02
50 /* Start these after WAIT and *dont* wait for completion */
51 #define ONCE        0x04
52 /*
53  * NB: while SYSINIT/WAIT/ONCE are being processed,
54  * SIGHUP ("reread /etc/inittab") will be processed only after
55  * each group of actions. If new inittab adds, say, a SYSINIT action,
56  * it will not be run, since init is already "past SYSINIT stage".
57  */
58 /* Start these after ONCE are started, restart on exit */
59 #define RESPAWN     0x08
60 /* Like RESPAWN, but wait for <Enter> to be pressed on tty */
61 #define ASKFIRST    0x10
62 /*
63  * Start these on SIGINT, and wait for completion.
64  * Then go back to respawning RESPAWN and ASKFIRST actions.
65  * NB: kernel sends SIGINT to us if Ctrl-Alt-Del was pressed.
66  */
67 #define CTRLALTDEL  0x20
68 /*
69  * Start these before killing all processes in preparation for
70  * running RESTART actions or doing low-level halt/reboot/poweroff
71  * (initiated by SIGUSR1/SIGTERM/SIGUSR2).
72  * Wait for completion before proceeding.
73  */
74 #define SHUTDOWN    0x40
75 /*
76  * exec() on SIGQUIT. SHUTDOWN actions are started and waited for,
77  * then all processes are killed, then init exec's 1st RESTART action,
78  * replacing itself by it. If no RESTART action specified,
79  * SIGQUIT has no effect.
80  */
81 #define RESTART     0x80
82
83
84 /* A linked list of init_actions, to be read from inittab */
85 struct init_action {
86         struct init_action *next;
87         pid_t pid;
88         uint8_t action_type;
89         char terminal[CONSOLE_NAME_SIZE];
90         char command[COMMAND_SIZE];
91 };
92
93 static struct init_action *init_action_list = NULL;
94
95 static const char *log_console = VC_5;
96
97 enum {
98         L_LOG = 0x1,
99         L_CONSOLE = 0x2,
100 };
101
102 /* Print a message to the specified device.
103  * "where" may be bitwise-or'd from L_LOG | L_CONSOLE
104  * NB: careful, we can be called after vfork!
105  */
106 #define dbg_message(...) do { if (DEBUG_INIT) message(__VA_ARGS__); } while (0)
107 static void message(int where, const char *fmt, ...)
108         __attribute__ ((format(printf, 2, 3)));
109 static void message(int where, const char *fmt, ...)
110 {
111         va_list arguments;
112         unsigned l;
113         char msg[128];
114
115         msg[0] = '\r';
116         va_start(arguments, fmt);
117         l = 1 + vsnprintf(msg + 1, sizeof(msg) - 2, fmt, arguments);
118         if (l > sizeof(msg) - 1)
119                 l = sizeof(msg) - 1;
120         va_end(arguments);
121
122 #if ENABLE_FEATURE_INIT_SYSLOG
123         msg[l] = '\0';
124         if (where & L_LOG) {
125                 /* Log the message to syslogd */
126                 openlog(applet_name, 0, LOG_DAEMON);
127                 /* don't print "\r" */
128                 syslog(LOG_INFO, "%s", msg + 1);
129                 closelog();
130         }
131         msg[l++] = '\n';
132         msg[l] = '\0';
133 #else
134         {
135                 static int log_fd = -1;
136
137                 msg[l++] = '\n';
138                 msg[l] = '\0';
139                 /* Take full control of the log tty, and never close it.
140                  * It's mine, all mine!  Muhahahaha! */
141                 if (log_fd < 0) {
142                         if (!log_console) {
143                                 log_fd = STDERR_FILENO;
144                         } else {
145                                 log_fd = device_open(log_console, O_WRONLY | O_NONBLOCK | O_NOCTTY);
146                                 if (log_fd < 0) {
147                                         bb_error_msg("can't log to %s", log_console);
148                                         where = L_CONSOLE;
149                                 } else {
150                                         close_on_exec_on(log_fd);
151                                 }
152                         }
153                 }
154                 if (where & L_LOG) {
155                         full_write(log_fd, msg, l);
156                         if (log_fd == STDERR_FILENO)
157                                 return; /* don't print dup messages */
158                 }
159         }
160 #endif
161
162         if (where & L_CONSOLE) {
163                 /* Send console messages to console so people will see them. */
164                 full_write(STDERR_FILENO, msg, l);
165         }
166 }
167
168 static void console_init(void)
169 {
170 #ifdef VT_OPENQRY
171         int vtno;
172 #endif
173         char *s;
174
175         s = getenv("CONSOLE");
176         if (!s)
177                 s = getenv("console");
178         if (s) {
179                 int fd = open(s, O_RDWR | O_NONBLOCK | O_NOCTTY);
180                 if (fd >= 0) {
181                         dup2(fd, STDIN_FILENO);
182                         dup2(fd, STDOUT_FILENO);
183                         xmove_fd(fd, STDERR_FILENO);
184                 }
185                 dbg_message(L_LOG, "console='%s'", s);
186         } else {
187                 /* Make sure fd 0,1,2 are not closed
188                  * (so that they won't be used by future opens) */
189                 bb_sanitize_stdio();
190 // Users report problems
191 //              /* Make sure init can't be blocked by writing to stderr */
192 //              fcntl(STDERR_FILENO, F_SETFL, fcntl(STDERR_FILENO, F_GETFL) | O_NONBLOCK);
193         }
194
195         s = getenv("TERM");
196 #ifdef VT_OPENQRY
197         if (ioctl(STDIN_FILENO, VT_OPENQRY, &vtno) != 0) {
198                 /* Not a linux terminal, probably serial console.
199                  * Force the TERM setting to vt102
200                  * if TERM is set to linux (the default) */
201                 if (!s || strcmp(s, "linux") == 0)
202                         putenv((char*)"TERM=vt102");
203                 if (!ENABLE_FEATURE_INIT_SYSLOG)
204                         log_console = NULL;
205         } else
206 #endif
207         if (!s)
208                 putenv((char*)"TERM=linux");
209 }
210
211 /* Set terminal settings to reasonable defaults.
212  * NB: careful, we can be called after vfork! */
213 static void set_sane_term(void)
214 {
215         struct termios tty;
216
217         tcgetattr(STDIN_FILENO, &tty);
218
219         /* set control chars */
220         tty.c_cc[VINTR] = 3;    /* C-c */
221         tty.c_cc[VQUIT] = 28;   /* C-\ */
222         tty.c_cc[VERASE] = 127; /* C-? */
223         tty.c_cc[VKILL] = 21;   /* C-u */
224         tty.c_cc[VEOF] = 4;     /* C-d */
225         tty.c_cc[VSTART] = 17;  /* C-q */
226         tty.c_cc[VSTOP] = 19;   /* C-s */
227         tty.c_cc[VSUSP] = 26;   /* C-z */
228
229 #ifdef __linux__
230         /* use line discipline 0 */
231         tty.c_line = 0;
232 #endif
233
234         /* Make it be sane */
235         tty.c_cflag &= CBAUD | CBAUDEX | CSIZE | CSTOPB | PARENB | PARODD;
236         tty.c_cflag |= CREAD | HUPCL | CLOCAL;
237
238         /* input modes */
239         tty.c_iflag = ICRNL | IXON | IXOFF;
240
241         /* output modes */
242         tty.c_oflag = OPOST | ONLCR;
243
244         /* local modes */
245         tty.c_lflag =
246                 ISIG | ICANON | ECHO | ECHOE | ECHOK | ECHOCTL | ECHOKE | IEXTEN;
247
248         tcsetattr_stdin_TCSANOW(&tty);
249 }
250
251 /* Open the new terminal device.
252  * NB: careful, we can be called after vfork! */
253 static int open_stdio_to_tty(const char* tty_name)
254 {
255         /* empty tty_name means "use init's tty", else... */
256         if (tty_name[0]) {
257                 int fd;
258
259                 close(STDIN_FILENO);
260                 /* fd can be only < 0 or 0: */
261                 fd = device_open(tty_name, O_RDWR);
262                 if (fd) {
263                         message(L_LOG | L_CONSOLE, "can't open %s: %s",
264                                 tty_name, strerror(errno));
265                         return 0; /* failure */
266                 }
267                 dup2(STDIN_FILENO, STDOUT_FILENO);
268                 dup2(STDIN_FILENO, STDERR_FILENO);
269         }
270         set_sane_term();
271         return 1; /* success */
272 }
273
274 static void reset_sighandlers_and_unblock_sigs(void)
275 {
276         bb_signals(0
277                 + (1 << SIGUSR1)
278                 + (1 << SIGUSR2)
279                 + (1 << SIGTERM)
280                 + (1 << SIGQUIT)
281                 + (1 << SIGINT)
282                 + (1 << SIGHUP)
283                 + (1 << SIGTSTP)
284                 + (1 << SIGSTOP)
285                 , SIG_DFL);
286         sigprocmask_allsigs(SIG_UNBLOCK);
287 }
288
289 /* Wrapper around exec:
290  * Takes string (max COMMAND_SIZE chars).
291  * If chars like '>' detected, execs '[-]/bin/sh -c "exec ......."'.
292  * Otherwise splits words on whitespace, deals with leading dash,
293  * and uses plain exec().
294  * NB: careful, we can be called after vfork!
295  */
296 static void init_exec(const char *command)
297 {
298         char *cmd[COMMAND_SIZE / 2];
299         char buf[COMMAND_SIZE + 6];  /* COMMAND_SIZE+strlen("exec ")+1 */
300         int dash = (command[0] == '-' /* maybe? && command[1] == '/' */);
301
302         /* See if any special /bin/sh requiring characters are present */
303         if (strpbrk(command, "~`!$^&*()=|\\{}[];\"'<>?") != NULL) {
304                 strcpy(buf, "exec ");
305                 strcpy(buf + 5, command + dash); /* excluding "-" */
306                 /* NB: LIBBB_DEFAULT_LOGIN_SHELL define has leading dash */
307                 cmd[0] = (char*)(LIBBB_DEFAULT_LOGIN_SHELL + !dash);
308                 cmd[1] = (char*)"-c";
309                 cmd[2] = buf;
310                 cmd[3] = NULL;
311         } else {
312                 /* Convert command (char*) into cmd (char**, one word per string) */
313                 char *word, *next;
314                 int i = 0;
315                 next = strcpy(buf, command); /* including "-" */
316                 while ((word = strsep(&next, " \t")) != NULL) {
317                         if (*word != '\0') { /* not two spaces/tabs together? */
318                                 cmd[i] = word;
319                                 i++;
320                         }
321                 }
322                 cmd[i] = NULL;
323         }
324         /* If we saw leading "-", it is interactive shell.
325          * Try harder to give it a controlling tty.
326          * And skip "-" in actual exec call. */
327         if (dash) {
328                 /* _Attempt_ to make stdin a controlling tty. */
329                 if (ENABLE_FEATURE_INIT_SCTTY)
330                         ioctl(STDIN_FILENO, TIOCSCTTY, 0 /*only try, don't steal*/);
331         }
332         BB_EXECVP(cmd[0] + dash, cmd);
333         message(L_LOG | L_CONSOLE, "can't run '%s': %s", cmd[0], strerror(errno));
334         /* returns if execvp fails */
335 }
336
337 /* Used only by run_actions */
338 static pid_t run(const struct init_action *a)
339 {
340         pid_t pid;
341
342         /* Careful: don't be affected by a signal in vforked child */
343         sigprocmask_allsigs(SIG_BLOCK);
344         if (BB_MMU && (a->action_type & ASKFIRST))
345                 pid = fork();
346         else
347                 pid = vfork();
348         if (pid < 0)
349                 message(L_LOG | L_CONSOLE, "can't fork");
350         if (pid) {
351                 sigprocmask_allsigs(SIG_UNBLOCK);
352                 return pid; /* Parent or error */
353         }
354
355         /* Child */
356
357         /* Reset signal handlers that were set by the parent process */
358         reset_sighandlers_and_unblock_sigs();
359
360         /* Create a new session and make ourself the process group leader */
361         setsid();
362
363         /* Open the new terminal device */
364         if (!open_stdio_to_tty(a->terminal))
365                 _exit(EXIT_FAILURE);
366
367         /* NB: on NOMMU we can't wait for input in child, so
368          * "askfirst" will work the same as "respawn". */
369         if (BB_MMU && (a->action_type & ASKFIRST)) {
370                 static const char press_enter[] ALIGN1 =
371 #ifdef CUSTOMIZED_BANNER
372 #include CUSTOMIZED_BANNER
373 #endif
374                         "\nPlease press Enter to activate this console. ";
375                 char c;
376                 /*
377                  * Save memory by not exec-ing anything large (like a shell)
378                  * before the user wants it. This is critical if swap is not
379                  * enabled and the system has low memory. Generally this will
380                  * be run on the second virtual console, and the first will
381                  * be allowed to start a shell or whatever an init script
382                  * specifies.
383                  */
384                 dbg_message(L_LOG, "waiting for enter to start '%s'"
385                                         "(pid %d, tty '%s')\n",
386                                 a->command, getpid(), a->terminal);
387                 full_write(STDOUT_FILENO, press_enter, sizeof(press_enter) - 1);
388                 while (safe_read(STDIN_FILENO, &c, 1) == 1 && c != '\n')
389                         continue;
390         }
391
392         /*
393          * When a file named /.init_enable_core exists, setrlimit is called
394          * before processes are spawned to set core file size as unlimited.
395          * This is for debugging only.  Don't use this is production, unless
396          * you want core dumps lying about....
397          */
398         if (ENABLE_FEATURE_INIT_COREDUMPS) {
399                 if (access("/.init_enable_core", F_OK) == 0) {
400                         struct rlimit limit;
401                         limit.rlim_cur = RLIM_INFINITY;
402                         limit.rlim_max = RLIM_INFINITY;
403                         setrlimit(RLIMIT_CORE, &limit);
404                 }
405         }
406
407         /* Log the process name and args */
408         message(L_LOG, "starting pid %d, tty '%s': '%s'",
409                           getpid(), a->terminal, a->command);
410
411         /* Now run it.  The new program will take over this PID,
412          * so nothing further in init.c should be run. */
413         init_exec(a->command);
414         /* We're still here?  Some error happened. */
415         _exit(-1);
416 }
417
418 static struct init_action *mark_terminated(pid_t pid)
419 {
420         struct init_action *a;
421
422         if (pid > 0) {
423                 for (a = init_action_list; a; a = a->next) {
424                         if (a->pid == pid) {
425                                 a->pid = 0;
426                                 return a;
427                         }
428                 }
429                 update_utmp(pid, DEAD_PROCESS, /*tty_name:*/ NULL, /*username:*/ NULL, /*hostname:*/ NULL);
430         }
431         return NULL;
432 }
433
434 static void waitfor(pid_t pid)
435 {
436         /* waitfor(run(x)): protect against failed fork inside run() */
437         if (pid <= 0)
438                 return;
439
440         /* Wait for any child (prevent zombies from exiting orphaned processes)
441          * but exit the loop only when specified one has exited. */
442         while (1) {
443                 pid_t wpid = wait(NULL);
444                 mark_terminated(wpid);
445                 /* Unsafe. SIGTSTP handler might have wait'ed it already */
446                 /*if (wpid == pid) break;*/
447                 /* More reliable: */
448                 if (kill(pid, 0))
449                         break;
450         }
451 }
452
453 /* Run all commands of a particular type */
454 static void run_actions(int action_type)
455 {
456         struct init_action *a;
457
458         for (a = init_action_list; a; a = a->next) {
459                 if (!(a->action_type & action_type))
460                         continue;
461
462                 if (a->action_type & (SYSINIT | WAIT | ONCE | CTRLALTDEL | SHUTDOWN)) {
463                         pid_t pid = run(a);
464                         if (a->action_type & (SYSINIT | WAIT | CTRLALTDEL | SHUTDOWN))
465                                 waitfor(pid);
466                 }
467                 if (a->action_type & (RESPAWN | ASKFIRST)) {
468                         /* Only run stuff with pid == 0. If pid != 0,
469                          * it is already running
470                          */
471                         if (a->pid == 0)
472                                 a->pid = run(a);
473                 }
474         }
475 }
476
477 static void new_init_action(uint8_t action_type, const char *command, const char *cons)
478 {
479         struct init_action *a, **nextp;
480
481         /* Scenario:
482          * old inittab:
483          * ::shutdown:umount -a -r
484          * ::shutdown:swapoff -a
485          * new inittab:
486          * ::shutdown:swapoff -a
487          * ::shutdown:umount -a -r
488          * On reload, we must ensure entries end up in correct order.
489          * To achieve that, if we find a matching entry, we move it
490          * to the end.
491          */
492         nextp = &init_action_list;
493         while ((a = *nextp) != NULL) {
494                 /* Don't enter action if it's already in the list,
495                  * This prevents losing running RESPAWNs.
496                  */
497                 if (strcmp(a->command, command) == 0
498                  && strcmp(a->terminal, cons) == 0
499                 ) {
500                         /* Remove from list */
501                         *nextp = a->next;
502                         /* Find the end of the list */
503                         while (*nextp != NULL)
504                                 nextp = &(*nextp)->next;
505                         a->next = NULL;
506                         break;
507                 }
508                 nextp = &a->next;
509         }
510
511         if (!a)
512                 a = xzalloc(sizeof(*a));
513         /* Append to the end of the list */
514         *nextp = a;
515         a->action_type = action_type;
516         safe_strncpy(a->command, command, sizeof(a->command));
517         safe_strncpy(a->terminal, cons, sizeof(a->terminal));
518         dbg_message(L_LOG | L_CONSOLE, "command='%s' action=%d tty='%s'\n",
519                 a->command, a->action_type, a->terminal);
520 }
521
522 /* NOTE that if CONFIG_FEATURE_USE_INITTAB is NOT defined,
523  * then parse_inittab() simply adds in some default
524  * actions(i.e., runs INIT_SCRIPT and then starts a pair
525  * of "askfirst" shells).  If CONFIG_FEATURE_USE_INITTAB
526  * _is_ defined, but /etc/inittab is missing, this
527  * results in the same set of default behaviors.
528  */
529 static void parse_inittab(void)
530 {
531 #if ENABLE_FEATURE_USE_INITTAB
532         char *token[4];
533         parser_t *parser = config_open2("/etc/inittab", fopen_for_read);
534
535         if (parser == NULL)
536 #endif
537         {
538                 /* No inittab file - set up some default behavior */
539                 /* Reboot on Ctrl-Alt-Del */
540                 new_init_action(CTRLALTDEL, "reboot", "");
541                 /* Umount all filesystems on halt/reboot */
542                 new_init_action(SHUTDOWN, "umount -a -r", "");
543                 /* Swapoff on halt/reboot */
544                 if (ENABLE_SWAPONOFF)
545                         new_init_action(SHUTDOWN, "swapoff -a", "");
546                 /* Prepare to restart init when a QUIT is received */
547                 new_init_action(RESTART, "init", "");
548                 /* Askfirst shell on tty1-4 */
549                 new_init_action(ASKFIRST, bb_default_login_shell, "");
550 //TODO: VC_1 instead of ""? "" is console -> ctty problems -> angry users
551                 new_init_action(ASKFIRST, bb_default_login_shell, VC_2);
552                 new_init_action(ASKFIRST, bb_default_login_shell, VC_3);
553                 new_init_action(ASKFIRST, bb_default_login_shell, VC_4);
554                 /* sysinit */
555                 new_init_action(SYSINIT, INIT_SCRIPT, "");
556                 return;
557         }
558
559 #if ENABLE_FEATURE_USE_INITTAB
560         /* optional_tty:ignored_runlevel:action:command
561          * Delims are not to be collapsed and need exactly 4 tokens
562          */
563         while (config_read(parser, token, 4, 0, "#:",
564                                 PARSE_NORMAL & ~(PARSE_TRIM | PARSE_COLLAPSE))) {
565                 /* order must correspond to SYSINIT..RESTART constants */
566                 static const char actions[] ALIGN1 =
567                         "sysinit\0""wait\0""once\0""respawn\0""askfirst\0"
568                         "ctrlaltdel\0""shutdown\0""restart\0";
569                 int action;
570                 char *tty = token[0];
571
572                 if (!token[3]) /* less than 4 tokens */
573                         goto bad_entry;
574                 action = index_in_strings(actions, token[2]);
575                 if (action < 0 || !token[3][0]) /* token[3]: command */
576                         goto bad_entry;
577                 /* turn .*TTY -> /dev/TTY */
578                 if (tty[0]) {
579                         tty = concat_path_file("/dev/", skip_dev_pfx(tty));
580                 }
581                 new_init_action(1 << action, token[3], tty);
582                 if (tty[0])
583                         free(tty);
584                 continue;
585  bad_entry:
586                 message(L_LOG | L_CONSOLE, "Bad inittab entry at line %d",
587                                 parser->lineno);
588         }
589         config_close(parser);
590 #endif
591 }
592
593 static void pause_and_low_level_reboot(unsigned magic) NORETURN;
594 static void pause_and_low_level_reboot(unsigned magic)
595 {
596         pid_t pid;
597
598         /* Allow time for last message to reach serial console, etc */
599         sleep(1);
600
601         /* We have to fork here, since the kernel calls do_exit(EXIT_SUCCESS)
602          * in linux/kernel/sys.c, which can cause the machine to panic when
603          * the init process exits... */
604         pid = vfork();
605         if (pid == 0) { /* child */
606                 reboot(magic);
607                 _exit(EXIT_SUCCESS);
608         }
609         while (1)
610                 sleep(1);
611 }
612
613 static void run_shutdown_and_kill_processes(void)
614 {
615         /* Run everything to be run at "shutdown".  This is done _prior_
616          * to killing everything, in case people wish to use scripts to
617          * shut things down gracefully... */
618         run_actions(SHUTDOWN);
619
620         message(L_CONSOLE | L_LOG, "The system is going down NOW!");
621
622         /* Send signals to every process _except_ pid 1 */
623         kill(-1, SIGTERM);
624         message(L_CONSOLE | L_LOG, "Sent SIG%s to all processes", "TERM");
625         sync();
626         sleep(1);
627
628         kill(-1, SIGKILL);
629         message(L_CONSOLE, "Sent SIG%s to all processes", "KILL");
630         sync();
631         /*sleep(1); - callers take care about making a pause */
632 }
633
634 /* Signal handling by init:
635  *
636  * For process with PID==1, on entry kernel sets all signals to SIG_DFL
637  * and unmasks all signals. However, for process with PID==1,
638  * default action (SIG_DFL) on any signal is to ignore it,
639  * even for special signals SIGKILL and SIGCONT.
640  * Also, any signal can be caught or blocked.
641  * (but SIGSTOP is still handled specially, at least in 2.6.20)
642  *
643  * We install two kinds of handlers, "immediate" and "delayed".
644  *
645  * Immediate handlers execute at any time, even while, say, sysinit
646  * is running.
647  *
648  * Delayed handlers just set a flag variable. The variable is checked
649  * in the main loop and acted upon.
650  *
651  * halt/poweroff/reboot and restart have immediate handlers.
652  * They only traverse linked list of struct action's, never modify it,
653  * this should be safe to do even in signal handler. Also they
654  * never return.
655  *
656  * SIGSTOP and SIGTSTP have immediate handlers. They just wait
657  * for SIGCONT to happen.
658  *
659  * SIGHUP has a delayed handler, because modifying linked list
660  * of struct action's from a signal handler while it is manipulated
661  * by the program may be disastrous.
662  *
663  * Ctrl-Alt-Del has a delayed handler. Not a must, but allowing
664  * it to happen even somewhere inside "sysinit" would be a bit awkward.
665  *
666  * There is a tiny probability that SIGHUP and Ctrl-Alt-Del will collide
667  * and only one will be remembered and acted upon.
668  */
669
670 /* The SIGUSR[12]/SIGTERM handler */
671 static void halt_reboot_pwoff(int sig) NORETURN;
672 static void halt_reboot_pwoff(int sig)
673 {
674         const char *m;
675         unsigned rb;
676
677         /* We may call run() and it unmasks signals,
678          * including the one masked inside this signal handler.
679          * Testcase which would start multiple reboot scripts:
680          *  while true; do reboot; done
681          * Preventing it:
682          */
683         reset_sighandlers_and_unblock_sigs();
684
685         run_shutdown_and_kill_processes();
686
687         m = "halt";
688         rb = RB_HALT_SYSTEM;
689         if (sig == SIGTERM) {
690                 m = "reboot";
691                 rb = RB_AUTOBOOT;
692         } else if (sig == SIGUSR2) {
693                 m = "poweroff";
694                 rb = RB_POWER_OFF;
695         }
696         message(L_CONSOLE, "Requesting system %s", m);
697         pause_and_low_level_reboot(rb);
698         /* not reached */
699 }
700
701 /* Handler for QUIT - exec "restart" action,
702  * else (no such action defined) do nothing */
703 static void restart_handler(int sig UNUSED_PARAM)
704 {
705         struct init_action *a;
706
707         for (a = init_action_list; a; a = a->next) {
708                 if (!(a->action_type & RESTART))
709                         continue;
710
711                 /* Starting from here, we won't return.
712                  * Thus don't need to worry about preserving errno
713                  * and such.
714                  */
715
716                 reset_sighandlers_and_unblock_sigs();
717
718                 run_shutdown_and_kill_processes();
719
720 #ifdef RB_ENABLE_CAD
721                 /* Allow Ctrl-Alt-Del to reboot the system.
722                  * This is how kernel sets it up for init, we follow suit.
723                  */
724                 reboot(RB_ENABLE_CAD); /* misnomer */
725 #endif
726
727                 if (open_stdio_to_tty(a->terminal)) {
728                         dbg_message(L_CONSOLE, "Trying to re-exec %s", a->command);
729                         /* Theoretically should be safe.
730                          * But in practice, kernel bugs may leave
731                          * unkillable processes, and wait() may block forever.
732                          * Oh well. Hoping "new" init won't be too surprised
733                          * by having children it didn't create.
734                          */
735                         //while (wait(NULL) > 0)
736                         //      continue;
737                         init_exec(a->command);
738                 }
739                 /* Open or exec failed */
740                 pause_and_low_level_reboot(RB_HALT_SYSTEM);
741                 /* not reached */
742         }
743 }
744
745 /* The SIGSTOP/SIGTSTP handler
746  * NB: inside it, all signals except SIGCONT are masked
747  * via appropriate setup in sigaction().
748  */
749 static void stop_handler(int sig UNUSED_PARAM)
750 {
751         smallint saved_bb_got_signal;
752         int saved_errno;
753
754         saved_bb_got_signal = bb_got_signal;
755         saved_errno = errno;
756         signal(SIGCONT, record_signo);
757
758         while (1) {
759                 pid_t wpid;
760
761                 if (bb_got_signal == SIGCONT)
762                         break;
763                 /* NB: this can accidentally wait() for a process
764                  * which we waitfor() elsewhere! waitfor() must have
765                  * code which is resilient against this.
766                  */
767                 wpid = wait_any_nohang(NULL);
768                 mark_terminated(wpid);
769                 sleep(1);
770         }
771
772         signal(SIGCONT, SIG_DFL);
773         errno = saved_errno;
774         bb_got_signal = saved_bb_got_signal;
775 }
776
777 #if ENABLE_FEATURE_USE_INITTAB
778 static void reload_inittab(void)
779 {
780         struct init_action *a, **nextp;
781
782         message(L_LOG, "reloading /etc/inittab");
783
784         /* Disable old entries */
785         for (a = init_action_list; a; a = a->next)
786                 a->action_type = 0;
787
788         /* Append new entries, or modify existing entries
789          * (incl. setting a->action_type) if cmd and device name
790          * match new ones. End result: only entries with
791          * a->action_type == 0 are stale.
792          */
793         parse_inittab();
794
795 #if ENABLE_FEATURE_KILL_REMOVED
796         /* Kill stale entries */
797         /* Be nice and send SIGTERM first */
798         for (a = init_action_list; a; a = a->next)
799                 if (a->action_type == 0 && a->pid != 0)
800                         kill(a->pid, SIGTERM);
801         if (CONFIG_FEATURE_KILL_DELAY) {
802                 /* NB: parent will wait in NOMMU case */
803                 if ((BB_MMU ? fork() : vfork()) == 0) { /* child */
804                         sleep(CONFIG_FEATURE_KILL_DELAY);
805                         for (a = init_action_list; a; a = a->next)
806                                 if (a->action_type == 0 && a->pid != 0)
807                                         kill(a->pid, SIGKILL);
808                         _exit(EXIT_SUCCESS);
809                 }
810         }
811 #endif
812
813         /* Remove stale entries and SYSINIT entries.
814          * We never rerun SYSINIT entries anyway,
815          * removing them too saves a few bytes */
816         nextp = &init_action_list;
817         while ((a = *nextp) != NULL) {
818                 if ((a->action_type & ~SYSINIT) == 0) {
819                         *nextp = a->next;
820                         free(a);
821                 } else {
822                         nextp = &a->next;
823                 }
824         }
825
826         /* Not needed: */
827         /* run_actions(RESPAWN | ASKFIRST); */
828         /* - we return to main loop, which does this automagically */
829 }
830 #endif
831
832 static int check_delayed_sigs(void)
833 {
834         int sigs_seen = 0;
835
836         while (1) {
837                 smallint sig = bb_got_signal;
838
839                 if (!sig)
840                         return sigs_seen;
841                 bb_got_signal = 0;
842                 sigs_seen = 1;
843 #if ENABLE_FEATURE_USE_INITTAB
844                 if (sig == SIGHUP)
845                         reload_inittab();
846 #endif
847                 if (sig == SIGINT)
848                         run_actions(CTRLALTDEL);
849         }
850 }
851
852 int init_main(int argc, char **argv) MAIN_EXTERNALLY_VISIBLE;
853 int init_main(int argc UNUSED_PARAM, char **argv)
854 {
855         die_sleep = 30 * 24*60*60; /* if xmalloc would ever die... */
856
857         if (argv[1] && strcmp(argv[1], "-q") == 0) {
858                 return kill(1, SIGHUP);
859         }
860
861         if (!DEBUG_INIT) {
862                 /* Expect to be invoked as init with PID=1 or be invoked as linuxrc */
863                 if (getpid() != 1
864                  && (!ENABLE_FEATURE_INITRD || !strstr(applet_name, "linuxrc"))
865                 ) {
866                         bb_show_usage();
867                 }
868 #ifdef RB_DISABLE_CAD
869                 /* Turn off rebooting via CTL-ALT-DEL - we get a
870                  * SIGINT on CAD so we can shut things down gracefully... */
871                 reboot(RB_DISABLE_CAD); /* misnomer */
872 #endif
873         }
874
875         /* Figure out where the default console should be */
876         console_init();
877         set_sane_term();
878         xchdir("/");
879         setsid();
880
881         /* Make sure environs is set to something sane */
882         putenv((char *) "HOME=/");
883         putenv((char *) bb_PATH_root_path);
884         putenv((char *) "SHELL=/bin/sh");
885         putenv((char *) "USER=root"); /* needed? why? */
886
887         if (argv[1])
888                 xsetenv("RUNLEVEL", argv[1]);
889
890 #if !ENABLE_FEATURE_EXTRA_QUIET
891         /* Hello world */
892         message(L_CONSOLE | L_LOG, "init started: %s", bb_banner);
893 #endif
894
895 /* struct sysinfo is linux-specific */
896 #ifdef __linux__
897         /* Make sure there is enough memory to do something useful. */
898         if (ENABLE_SWAPONOFF) {
899                 struct sysinfo info;
900
901                 if (sysinfo(&info) == 0
902                  && (info.mem_unit ? info.mem_unit : 1) * (long long)info.totalram < 1024*1024
903                 ) {
904                         message(L_CONSOLE, "Low memory, forcing swapon");
905                         /* swapon -a requires /proc typically */
906                         new_init_action(SYSINIT, "mount -t proc proc /proc", "");
907                         /* Try to turn on swap */
908                         new_init_action(SYSINIT, "swapon -a", "");
909                         run_actions(SYSINIT);   /* wait and removing */
910                 }
911         }
912 #endif
913
914         /* Check if we are supposed to be in single user mode */
915         if (argv[1]
916          && (strcmp(argv[1], "single") == 0 || strcmp(argv[1], "-s") == 0 || LONE_CHAR(argv[1], '1'))
917         ) {
918                 /* ??? shouldn't we set RUNLEVEL="b" here? */
919                 /* Start a shell on console */
920                 new_init_action(RESPAWN, bb_default_login_shell, "");
921         } else {
922                 /* Not in single user mode - see what inittab says */
923
924                 /* NOTE that if CONFIG_FEATURE_USE_INITTAB is NOT defined,
925                  * then parse_inittab() simply adds in some default
926                  * actions(i.e., INIT_SCRIPT and a pair
927                  * of "askfirst" shells */
928                 parse_inittab();
929         }
930
931 #if ENABLE_SELINUX
932         if (getenv("SELINUX_INIT") == NULL) {
933                 int enforce = 0;
934
935                 putenv((char*)"SELINUX_INIT=YES");
936                 if (selinux_init_load_policy(&enforce) == 0) {
937                         BB_EXECVP(argv[0], argv);
938                 } else if (enforce > 0) {
939                         /* SELinux in enforcing mode but load_policy failed */
940                         message(L_CONSOLE, "can't load SELinux Policy. "
941                                 "Machine is in enforcing mode. Halting now.");
942                         exit(EXIT_FAILURE);
943                 }
944         }
945 #endif
946
947         /* Make the command line just say "init"  - thats all, nothing else */
948         strncpy(argv[0], "init", strlen(argv[0]));
949         /* Wipe argv[1]-argv[N] so they don't clutter the ps listing */
950         while (*++argv)
951                 memset(*argv, 0, strlen(*argv));
952
953         /* Set up signal handlers */
954         if (!DEBUG_INIT) {
955                 struct sigaction sa;
956
957                 bb_signals(0
958                         + (1 << SIGUSR1) /* halt */
959                         + (1 << SIGTERM) /* reboot */
960                         + (1 << SIGUSR2) /* poweroff */
961                         , halt_reboot_pwoff);
962                 signal(SIGQUIT, restart_handler); /* re-exec another init */
963
964                 /* Stop handler must allow only SIGCONT inside itself */
965                 memset(&sa, 0, sizeof(sa));
966                 sigfillset(&sa.sa_mask);
967                 sigdelset(&sa.sa_mask, SIGCONT);
968                 sa.sa_handler = stop_handler;
969                 /* NB: sa_flags doesn't have SA_RESTART.
970                  * It must be able to interrupt wait().
971                  */
972                 sigaction_set(SIGTSTP, &sa); /* pause */
973                 /* Does not work as intended, at least in 2.6.20.
974                  * SIGSTOP is simply ignored by init:
975                  */
976                 sigaction_set(SIGSTOP, &sa); /* pause */
977
978                 /* SIGINT (Ctrl-Alt-Del) must interrupt wait(),
979                  * setting handler without SA_RESTART flag.
980                  */
981                 bb_signals_recursive_norestart((1 << SIGINT), record_signo);
982         }
983
984         /* Set up "reread /etc/inittab" handler.
985          * Handler is set up without SA_RESTART, it will interrupt syscalls.
986          */
987         if (!DEBUG_INIT && ENABLE_FEATURE_USE_INITTAB)
988                 bb_signals_recursive_norestart((1 << SIGHUP), record_signo);
989
990         /* Now run everything that needs to be run */
991         /* First run the sysinit command */
992         run_actions(SYSINIT);
993         check_delayed_sigs();
994         /* Next run anything that wants to block */
995         run_actions(WAIT);
996         check_delayed_sigs();
997         /* Next run anything to be run only once */
998         run_actions(ONCE);
999
1000         /* Now run the looping stuff for the rest of forever.
1001          */
1002         while (1) {
1003                 int maybe_WNOHANG;
1004
1005                 maybe_WNOHANG = check_delayed_sigs();
1006
1007                 /* (Re)run the respawn/askfirst stuff */
1008                 run_actions(RESPAWN | ASKFIRST);
1009                 maybe_WNOHANG |= check_delayed_sigs();
1010
1011                 /* Don't consume all CPU time - sleep a bit */
1012                 sleep(1);
1013                 maybe_WNOHANG |= check_delayed_sigs();
1014
1015                 /* Wait for any child process(es) to exit.
1016                  *
1017                  * If check_delayed_sigs above reported that a signal
1018                  * was caught, wait will be nonblocking. This ensures
1019                  * that if SIGHUP has reloaded inittab, respawn and askfirst
1020                  * actions will not be delayed until next child death.
1021                  */
1022                 if (maybe_WNOHANG)
1023                         maybe_WNOHANG = WNOHANG;
1024                 while (1) {
1025                         pid_t wpid;
1026                         struct init_action *a;
1027
1028                         /* If signals happen _in_ the wait, they interrupt it,
1029                          * bb_signals_recursive_norestart set them up that way
1030                          */
1031                         wpid = waitpid(-1, NULL, maybe_WNOHANG);
1032                         if (wpid <= 0)
1033                                 break;
1034
1035                         a = mark_terminated(wpid);
1036                         if (a) {
1037                                 message(L_LOG, "process '%s' (pid %d) exited. "
1038                                                 "Scheduling for restart.",
1039                                                 a->command, wpid);
1040                         }
1041                         /* See if anyone else is waiting to be reaped */
1042                         maybe_WNOHANG = WNOHANG;
1043                 }
1044         } /* while (1) */
1045 }