Woops!
[oweals/tinc.git] / src / process.c
index 7808a866f4d4e3fc92a34a17b4a708f88e8d624d..44ecf308ca4201eb3801832b5c1eb505b722f86b 100644 (file)
@@ -1,7 +1,7 @@
 /*
     process.c -- process management functions
-    Copyright (C) 1999,2000 Ivo Timmermans <itimmermans@bigfoot.com>,
-                       2000 Guus Sliepen <guus@sliepen.warande.net>
+    Copyright (C) 1999-2003 Ivo Timmermans <ivo@o2w.nl>,
+                  2000-2003 Guus Sliepen <guus@sliepen.eu.org>
 
     This program is free software; you can redistribute it and/or modify
     it under the terms of the GNU General Public License as published by
     along with this program; if not, write to the Free Software
     Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
 
-    $Id: process.c,v 1.1.2.3 2000/11/17 00:56:49 guus Exp $
+    $Id: process.c,v 1.1.2.60 2003/07/31 14:24:19 guus Exp $
 */
 
-#include "config.h"
-
-#include <errno.h>
-#include <fcntl.h>
-#include <signal.h>
-#include <stdio.h>
-#include <string.h>
-#include <syslog.h>
-#include <sys/ioctl.h>
-#include <sys/types.h>
-#include <sys/wait.h>
-#include <unistd.h>
-
-#include <list.h>
-#include <pidfile.h>
-#include <utils.h>
-#include <xalloc.h>
+#include "system.h"
 
 #include "conf.h"
+#include "connection.h"
+#include "device.h"
+#include "edge.h"
+#include "logger.h"
+#include "node.h"
+#include "pidfile.h"
 #include "process.h"
-
-#include "system.h"
-
-/* A list containing all our children */
-list_t *child_pids;
+#include "subnet.h"
+#include "utils.h"
+#include "xalloc.h"
 
 /* If zero, don't detach from the terminal. */
-int do_detach = 1;
-
-static pid_t ppid;
+bool do_detach = true;
+bool sighup = false;
+bool sigalrm = false;
 
 extern char *identname;
 extern char *pidfilename;
 extern char **g_argv;
+extern bool use_logfile;
+
+sigset_t emptysigset;
+
+static int saved_debug_level = -1;
+
+static void memory_full(int size)
+{
+       logger(LOG_ERR, _("Memory exhausted (couldn't allocate %d bytes), exitting."), size);
+       cp_trace();
+       exit(1);
+}
+
+/* Some functions the less gifted operating systems might lack... */
 
-void memory_full(int size)
+#ifndef HAVE_FCLOSEALL
+static int fcloseall(void)
 {
-  syslog(LOG_ERR, _("Memory exhausted (couldn't allocate %d bytes), exiting."), size);
-  cp_trace();
-  exit(1);
+       fflush(stdin);
+       fflush(stdout);
+       fflush(stderr);
+       fclose(stdin);
+       fclose(stdout);
+       fclose(stderr);
+       return 0;
 }
+#endif
 
 /*
   Close network connections, and terminate neatly
 */
 void cleanup_and_exit(int c)
 {
-  close_network_connections();
+       cp();
+
+       close_network_connections();
 
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_INFO, _("Total bytes written: tap %d, socket %d; bytes read: tap %d, socket %d"),
-          total_tap_out, total_socket_out, total_tap_in, total_socket_in);
+       ifdebug(CONNECTIONS)
+               dump_device_stats();
 
-  closelog();
-  kill(ppid, SIGTERM);
-  exit(c);
+       logger(LOG_NOTICE, _("Terminating"));
+
+       closelogger();
+       exit(c);
 }
 
+#ifndef HAVE_MINGW
 /*
   check for an existing tinc for this net, and write pid to pidfile
 */
-int write_pidfile(void)
+static bool write_pidfile(void)
 {
-  int pid;
-
-  if((pid = check_pid(pidfilename)))
-    {
-      if(netname)
-       fprintf(stderr, _("A tincd is already running for net `%s' with pid %d.\n"),
-               netname, pid);
-      else
-       fprintf(stderr, _("A tincd is already running with pid %d.\n"), pid);
-      return 1;
-    }
-
-  /* if it's locked, write-protected, or whatever */
-  if(!write_pid(pidfilename))
-    return 1;
-
-  return 0;
+       int pid;
+
+       cp();
+
+       pid = check_pid(pidfilename);
+
+       if(pid) {
+               if(netname)
+                       fprintf(stderr, _("A tincd is already running for net `%s' with pid %d.\n"),
+                                       netname, pid);
+               else
+                       fprintf(stderr, _("A tincd is already running with pid %d.\n"), pid);
+               return false;
+       }
+
+       /* if it's locked, write-protected, or whatever */
+       if(!write_pid(pidfilename))
+               return false;
+
+       return true;
 }
+#endif
 
 /*
   kill older tincd for this net
 */
-int kill_other(void)
+bool kill_other(int signal)
 {
-  int pid;
-
-  if(!(pid = read_pid(pidfilename)))
-    {
-      if(netname)
-       fprintf(stderr, _("No other tincd is running for net `%s'.\n"), netname);
-      else
-       fprintf(stderr, _("No other tincd is running.\n"));
-      return 1;
-    }
-
-  errno = 0;    /* No error, sometimes errno is only changed on error */
-  /* ESRCH is returned when no process with that pid is found */
-  if(kill(pid, SIGTERM) && errno == ESRCH)
-    fprintf(stderr, _("Removing stale lock file.\n"));
-  remove_pid(pidfilename);
-
-  return 0;
+#ifndef HAVE_MINGW
+       int pid;
+
+       cp();
+
+       pid = read_pid(pidfilename);
+
+       if(!pid) {
+               if(netname)
+                       fprintf(stderr, _("No other tincd is running for net `%s'.\n"),
+                                       netname);
+               else
+                       fprintf(stderr, _("No other tincd is running.\n"));
+               return false;
+       }
+
+       errno = 0;                                      /* No error, sometimes errno is only changed on error */
+
+       /* ESRCH is returned when no process with that pid is found */
+       if(kill(pid, signal) && errno == ESRCH) {
+               if(netname)
+                       fprintf(stderr, _("The tincd for net `%s' is no longer running. "),
+                                       netname);
+               else
+                       fprintf(stderr, _("The tincd is no longer running. "));
+
+               fprintf(stderr, _("Removing stale lock file.\n"));
+               remove_pid(pidfilename);
+       }
+#endif
+
+       return true;
 }
 
 /*
   Detach from current terminal, write pidfile, kill parent
 */
-int detach(void)
+bool detach(void)
 {
-  int fd;
-  pid_t pid;
+       cp();
 
-  setup_signals();
+       setup_signals();
 
-  if(write_pidfile())
-    return -1;
+       /* First check if we can open a fresh new pidfile */
 
-  if(do_detach)
-    daemon(FALSE, FALSE);
+#ifndef HAVE_MINGW
+       if(!write_pidfile())
+               return false;
+#endif
 
-  openlog(identname, LOG_CONS | LOG_PID, LOG_DAEMON);
+       /* If we succeeded in doing that, detach */
 
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_NOTICE, _("tincd %s (%s %s) starting, debug level %d"),
-          VERSION, __DATE__, __TIME__, debug_lvl);
-  else
-    syslog(LOG_NOTICE, _("tincd %s starting"), VERSION);
+       closelogger();
 
-  xalloc_fail_func = memory_full;
+#ifdef HAVE_FORK
+       if(do_detach) {
+               if(daemon(0, 0)) {
+                       fprintf(stderr, _("Couldn't detach from terminal: %s"),
+                                       strerror(errno));
+                       return false;
+               }
 
-  return 0;
-}
+               /* Now UPDATE the pid in the pidfile, because we changed it... */
 
-/*
-  Execute the program name, with sane environment.  All output will be
-  redirected to syslog.
-*/
-void _execute_script(const char *name)  __attribute__ ((noreturn));
-void _execute_script(const char *name)
-{
-  int error = 0;
-  char *scriptname;
-  char *s;
-
-  if(netname)
-    {
-      asprintf(&s, "NETNAME=%s", netname);
-      putenv(s);       /* Don't free s! see man 3 putenv */
-    }
-#ifdef HAVE_UNSETENV
-  else
-    {
-      unsetenv("NETNAME");
-    }
+               if(!write_pid(pidfilename))
+                       return false;
+       }
 #endif
 
-  if(chdir(confbase) < 0)
-    /* This cannot fail since we already read config files from this
-       directory. - Guus */
-    /* Yes this can fail, somebody could have removed this directory
-       when we didn't pay attention. - Ivo */
-    {
-      if(chdir("/") < 0)
-       /* Now if THIS fails, something wicked is going on. - Ivo */
-       syslog(LOG_ERR, _("Couldn't chdir to `/': %m"));
-
-      /* Continue anyway. */
-    }
-  
-  asprintf(&scriptname, "%s/%s", confbase, name);
-
-  /* Close all file descriptors */
-  closelog();
-  fcloseall();
-
-  /* Open standard input */
-  if(open("/dev/null", O_RDONLY) < 0)
-    {
-      syslog(LOG_ERR, _("Opening `/dev/null' failed: %m"));
-      error = 1;
-    }
-
-  if(!error)
-    {
-      /* Standard output directly goes to syslog */
-      openlog(name, LOG_CONS | LOG_PID, LOG_DAEMON);
-      /* Standard error as well */
-      if(dup2(1, 2) < 0)
-       {
-         syslog(LOG_ERR, _("System call `%s' failed: %m"),
-                "dup2");
-         error = 1;
-       }
-    }
-  
-  if(error && debug_lvl > 1)
-    syslog(LOG_INFO, _("This means that any output the script generates will not be shown in syslog."));
-  
-  execl(scriptname, NULL);
-  /* No return on success */
-  
-  if(errno != ENOENT)  /* Ignore if the file does not exist */
-    syslog(LOG_WARNING, _("Error executing `%s': %m"), scriptname);
-
-  /* No need to free things */
-  exit(0);
+       openlogger(identname, use_logfile?LOGMODE_FILE:(do_detach?LOGMODE_SYSLOG:LOGMODE_STDERR));
+
+       logger(LOG_NOTICE, _("tincd %s (%s %s) starting, debug level %d"),
+                          VERSION, __DATE__, __TIME__, debug_level);
+
+       xalloc_fail_func = memory_full;
+
+       return true;
 }
 
+#ifdef HAVE_FORK
 /*
-  Fork and execute the program pointed to by name.
+  Execute the program name, with sane environment.
 */
-int execute_script(const char *name)
+static void _execute_script(const char *scriptname, char **envp)
+       __attribute__ ((__noreturn__));
+static void _execute_script(const char *scriptname, char **envp)
 {
-  pid_t pid;
-
-  if((pid = fork()) < 0)
-    {
-      syslog(LOG_ERR, _("System call `%s' failed: %m"),
-            "fork");
-      return -1;
-    }
-
-  if(pid)
-    {
-      list_append(child_pids, (void*)(int)pid);
-      return 0;
-    }
-
-  /* Child here */
-  _execute_script(name);
+       int save_errno;
+
+       cp();
+
+       while(*envp)
+               putenv(*envp++);
+
+       chdir("/");
+
+       closelogger();
+
+       /* Close all file descriptors */
+       fcloseall();
+
+       execl(scriptname, scriptname, NULL);
+       /* No return on success */
+
+       save_errno = errno;
+
+       openlogger(identname, use_logfile?LOGMODE_FILE:(do_detach?LOGMODE_SYSLOG:LOGMODE_STDERR));
+       logger(LOG_ERR, _("Could not execute `%s': %s"), scriptname,
+                  strerror(save_errno));
+       exit(save_errno);
 }
+#endif
 
 /*
-  Check a child (the pointer data is actually an integer, the PID of
-  that child.  A non-zero return value means that the child has exited
-  and can be removed from our list.
+  Fork and execute the program pointed to by name.
 */
-int check_child(void *data)
+bool execute_script(const char *name, char **envp)
 {
-  pid_t pid;
-  int status;
-
-  pid = (pid_t) data;
-  pid = waitpid(pid, &status, WNOHANG);
-  if(WIFEXITED(status))
-    {
-      if(WIFSIGNALED(status)) /* Child was killed by a signal */
-       {
-         syslog(LOG_ERR, _("Child with PID %d was killed by signal %d (%s)"),
-                pid, WTERMSIG(status), strsignal(WTERMSIG(status)));
-         return -1;
+#ifdef HAVE_FORK
+       pid_t pid;
+       int status;
+       struct stat s;
+       char *scriptname;
+
+       cp();
+
+       asprintf(&scriptname, "%s/%s", confbase, name);
+
+       /* First check if there is a script */
+
+       if(stat(scriptname, &s))
+               return true;
+
+       pid = fork();
+
+       if(pid < 0) {
+               logger(LOG_ERR, _("System call `%s' failed: %s"), "fork",
+                          strerror(errno));
+               return false;
        }
-      if(WEXITSTATUS(status) != 0)
-       {
-         syslog(LOG_INFO, _("Child with PID %d exited with code %d"),
-                WEXITSTATUS(status));
+
+       if(pid) {
+               ifdebug(STATUS) logger(LOG_INFO, _("Executing script %s"), name);
+
+               free(scriptname);
+
+               if(waitpid(pid, &status, 0) == pid) {
+                       if(WIFEXITED(status)) { /* Child exited by itself */
+                               if(WEXITSTATUS(status)) {
+                                       logger(LOG_ERR, _("Process %d (%s) exited with non-zero status %d"),
+                                                  pid, name, WEXITSTATUS(status));
+                                       return false;
+                               } else
+                                       return true;
+                       } else if(WIFSIGNALED(status)) {        /* Child was killed by a signal */
+                               logger(LOG_ERR, _("Process %d (%s) was killed by signal %d (%s)"), pid,
+                                          name, WTERMSIG(status), strsignal(WTERMSIG(status)));
+                               return false;
+                       } else {                        /* Something strange happened */
+                               logger(LOG_ERR, _("Process %d (%s) terminated abnormally"), pid,
+                                          name);
+                               return false;
+                       }
+               } else if (errno != EINTR) {
+                       logger(LOG_ERR, _("System call `%s' failed: %s"), "waitpid",
+                                  strerror(errno));
+                       return false;
+               }
+
+               /* Why do we get EINTR? */
+               return true;
        }
-      return -1;
-    }
 
-  /* Child is still running */
-  return 0;
-}
+       /* Child here */
 
-/*
-  Check the status of all our children.
-*/
-void check_children(void)
-{
-  list_forall_nodes(child_pids, check_child);
+       _execute_script(scriptname, envp);
+#else
+       return true;
+#endif
 }
 
 
@@ -300,112 +308,163 @@ void check_children(void)
   Signal handlers.
 */
 
-RETSIGTYPE
-sigterm_handler(int a)
+#ifndef HAVE_MINGW
+static RETSIGTYPE sigterm_handler(int a)
+{
+       logger(LOG_NOTICE, _("Got TERM signal"));
+
+       cleanup_and_exit(0);
+}
+
+static RETSIGTYPE sigquit_handler(int a)
 {
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_NOTICE, _("Got TERM signal"));
+       logger(LOG_NOTICE, _("Got QUIT signal"));
+       cleanup_and_exit(0);
+}
 
-  cleanup_and_exit(0);
+static RETSIGTYPE fatal_signal_square(int a)
+{
+       logger(LOG_ERR, _("Got another fatal signal %d (%s): not restarting."), a,
+                  strsignal(a));
+       cp_trace();
+       exit(1);
 }
 
-RETSIGTYPE
-sigquit_handler(int a)
+static RETSIGTYPE fatal_signal_handler(int a)
 {
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_NOTICE, _("Got QUIT signal"));
-  cleanup_and_exit(0);
+       struct sigaction act;
+       logger(LOG_ERR, _("Got fatal signal %d (%s)"), a, strsignal(a));
+       cp_trace();
+
+       if(do_detach) {
+               logger(LOG_NOTICE, _("Trying to re-execute in 5 seconds..."));
+
+               act.sa_handler = fatal_signal_square;
+               act.sa_mask = emptysigset;
+               act.sa_flags = 0;
+               sigaction(SIGSEGV, &act, NULL);
+
+               close_network_connections();
+               sleep(5);
+               remove_pid(pidfilename);
+               execvp(g_argv[0], g_argv);
+       } else {
+               logger(LOG_NOTICE, _("Not restarting."));
+               exit(1);
+       }
 }
 
-RETSIGTYPE
-sigsegv_square(int a)
+static RETSIGTYPE sighup_handler(int a)
 {
-  syslog(LOG_ERR, _("Got another SEGV signal: not restarting"));
-  exit(0);
+       logger(LOG_NOTICE, _("Got HUP signal"));
+       sighup = true;
 }
 
-RETSIGTYPE
-sigsegv_handler(int a)
+static RETSIGTYPE sigint_handler(int a)
 {
-  syslog(LOG_ERR, _("Got SEGV signal"));
-  cp_trace();
-
-  if(do_detach)
-    {
-      syslog(LOG_NOTICE, _("Trying to re-execute in 5 seconds..."));
-      signal(SIGSEGV, sigsegv_square);
-      close_network_connections();
-      sleep(5);
-      remove_pid(pidfilename);
-      execvp(g_argv[0], g_argv);
-    }
-  else
-    {
-      syslog(LOG_NOTICE, _("Not restarting."));
-      exit(0);
-    }
+       if(saved_debug_level != -1) {
+               logger(LOG_NOTICE, _("Reverting to old debug level (%d)"),
+                       saved_debug_level);
+               debug_level = saved_debug_level;
+               saved_debug_level = -1;
+       } else {
+               logger(LOG_NOTICE,
+                       _("Temporarily setting debug level to 5.  Kill me with SIGINT again to go back to level %d."),
+                       debug_level);
+               saved_debug_level = debug_level;
+               debug_level = 5;
+       }
 }
 
-RETSIGTYPE
-sighup_handler(int a)
+static RETSIGTYPE sigalrm_handler(int a)
 {
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_NOTICE, _("Got HUP signal"));
-  sighup = 1;
+       logger(LOG_NOTICE, _("Got ALRM signal"));
+       sigalrm = true;
 }
 
-RETSIGTYPE
-sigint_handler(int a)
+static RETSIGTYPE sigusr1_handler(int a)
 {
-  if(debug_lvl > DEBUG_NOTHING)
-    syslog(LOG_NOTICE, _("Got INT signal, exiting"));
-  cleanup_and_exit(0);
+       dump_connections();
 }
 
-RETSIGTYPE
-sigusr1_handler(int a)
+static RETSIGTYPE sigusr2_handler(int a)
 {
-  dump_conn_list();
+       dump_device_stats();
+       dump_nodes();
+       dump_edges();
+       dump_subnets();
 }
 
-RETSIGTYPE
-sigusr2_handler(int a)
+static RETSIGTYPE sigwinch_handler(int a)
 {
-  dump_subnet_list();
+       do_purge = true;
 }
 
-RETSIGTYPE
-sighuh(int a)
+static RETSIGTYPE unexpected_signal_handler(int a)
 {
-  syslog(LOG_WARNING, _("Got unexpected signal %d (%s)"), a, strsignal(a));
-  cp_trace();
+       logger(LOG_WARNING, _("Got unexpected signal %d (%s)"), a, strsignal(a));
+       cp_trace();
 }
 
-void
-setup_signals(void)
+static RETSIGTYPE ignore_signal_handler(int a)
 {
-  int i;
-
-  for(i=0;i<32;i++)
-    signal(i,sighuh);
-
-  if(signal(SIGTERM, SIG_IGN) != SIG_ERR)
-    signal(SIGTERM, sigterm_handler);
-  if(signal(SIGQUIT, SIG_IGN) != SIG_ERR)
-    signal(SIGQUIT, sigquit_handler);
-  if(signal(SIGSEGV, SIG_IGN) != SIG_ERR)
-    signal(SIGSEGV, sigsegv_handler);
-  if(signal(SIGHUP, SIG_IGN) != SIG_ERR)
-    signal(SIGHUP, sighup_handler);
-  signal(SIGPIPE, SIG_IGN);
-  if(signal(SIGINT, SIG_IGN) != SIG_ERR)
-    signal(SIGINT, sigint_handler);
-  signal(SIGUSR1, sigusr1_handler);
-  signal(SIGUSR2, sigusr2_handler);
-  signal(SIGCHLD, SIG_IGN);
+       ifdebug(SCARY_THINGS) logger(LOG_DEBUG, _("Ignored signal %d (%s)"), a, strsignal(a));
 }
 
-RETSIGTYPE parent_exit(int a)
+static struct {
+       int signal;
+       void (*handler)(int);
+} sighandlers[] = {
+       {SIGHUP, sighup_handler},
+       {SIGTERM, sigterm_handler},
+       {SIGQUIT, sigquit_handler},
+       {SIGSEGV, fatal_signal_handler},
+       {SIGBUS, fatal_signal_handler},
+       {SIGILL, fatal_signal_handler},
+       {SIGPIPE, ignore_signal_handler},
+       {SIGINT, sigint_handler},
+       {SIGUSR1, sigusr1_handler},
+       {SIGUSR2, sigusr2_handler},
+       {SIGCHLD, ignore_signal_handler},
+       {SIGALRM, sigalrm_handler},
+       {SIGWINCH, sigwinch_handler},
+       {0, NULL}
+};
+#endif
+
+void setup_signals(void)
 {
-  exit(0);
+#ifndef HAVE_MINGW
+       int i;
+       struct sigaction act;
+
+       sigemptyset(&emptysigset);
+       act.sa_handler = NULL;
+       act.sa_mask = emptysigset;
+       act.sa_flags = 0;
+
+       /* Set a default signal handler for every signal, errors will be
+          ignored. */
+       for(i = 0; i < NSIG; i++) {
+               if(!do_detach)
+                       act.sa_handler = SIG_DFL;
+               else
+                       act.sa_handler = unexpected_signal_handler;
+               sigaction(i, &act, NULL);
+       }
+
+       /* If we didn't detach, allow coredumps */
+       if(!do_detach)
+               sighandlers[3].handler = SIG_DFL;
+
+       /* Then, for each known signal that we want to catch, assign a
+          handler to the signal, with error checking this time. */
+       for(i = 0; sighandlers[i].signal; i++) {
+               act.sa_handler = sighandlers[i].handler;
+               if(sigaction(sighandlers[i].signal, &act, NULL) < 0)
+                       fprintf(stderr, _("Installing signal handler for signal %d (%s) failed: %s\n"),
+                                       sighandlers[i].signal, strsignal(sighandlers[i].signal),
+                                       strerror(errno));
+       }
+#endif
 }