- complement HELPER API with functions to kill and wait on the helper process
[oweals/gnunet.git] / src / testbed / testbed_api_hosts.c
1 /*
2       This file is part of GNUnet
3       (C) 2008--2013 Christian Grothoff (and other contributing authors)
4
5       GNUnet is free software; you can redistribute it and/or modify
6       it under the terms of the GNU General Public License as published
7       by the Free Software Foundation; either version 3, or (at your
8       option) any later version.
9
10       GNUnet is distributed in the hope that it will be useful, but
11       WITHOUT ANY WARRANTY; without even the implied warranty of
12       MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13       General Public License for more details.
14
15       You should have received a copy of the GNU General Public License
16       along with GNUnet; see the file COPYING.  If not, write to the
17       Free Software Foundation, Inc., 59 Temple Place - Suite 330,
18       Boston, MA 02111-1307, USA.
19  */
20
21 /**
22  * @file testbed/testbed_api_hosts.c
23  * @brief API for manipulating 'hosts' controlled by the GNUnet testing service;
24  *        allows parsing hosts files, starting, stopping and communicating (via
25  *        SSH/stdin/stdout) with the remote (or local) processes
26  * @author Christian Grothoff
27  */
28 #include "platform.h"
29 #include "gnunet_util_lib.h"
30 #include "gnunet_testbed_service.h"
31 #include "gnunet_core_service.h"
32 #include "gnunet_transport_service.h"
33
34 #include "testbed_api.h"
35 #include "testbed_api_hosts.h"
36 #include "testbed_helper.h"
37 #include "testbed_api_operations.h"
38 #include "testbed_api_sd.h"
39
40 #include <zlib.h>
41
42 /**
43  * Generic logging shorthand
44  */
45 #define LOG(kind, ...)                          \
46   GNUNET_log_from (kind, "testbed-api-hosts", __VA_ARGS__);
47
48 /**
49  * Debug logging shorthand
50  */
51 #define LOG_DEBUG(...)                          \
52   LOG (GNUNET_ERROR_TYPE_DEBUG, __VA_ARGS__);
53
54 /**
55  * Prints API violation message
56  */
57 #define API_VIOLATION(cond,errstr)              \
58   do {                                          \
59     if (cond)                                   \
60       break;                                    \
61     LOG (GNUNET_ERROR_TYPE_ERROR, "API violation detected: %s\n", errstr); \
62     GNUNET_assert (0);                                                  \
63   } while (0)
64
65 /**
66  * Log an error message at log-level 'level' that indicates a failure of the
67  * command 'cmd' with the message given by gai_strerror(rc).
68  */
69 #define LOG_GAI(level, cmd, rc) do { LOG(level, _("`%s' failed at %s:%d with error: %s\n"), cmd, __FILE__, __LINE__, gai_strerror(rc)); } while(0)
70
71 /**
72  * Number of extra elements we create space for when we grow host list
73  */
74 #define HOST_LIST_GROW_STEP 10
75
76
77 /**
78  * A list entry for registered controllers list
79  */
80 struct RegisteredController
81 {
82   /**
83    * The controller at which this host is registered
84    */
85   const struct GNUNET_TESTBED_Controller *controller;
86
87   /**
88    * The next ptr for DLL
89    */
90   struct RegisteredController *next;
91
92   /**
93    * The prev ptr for DLL
94    */
95   struct RegisteredController *prev;
96 };
97
98
99 /**
100  * A slot to record time taken by an overlay connect operation
101  */
102 struct TimeSlot
103 {
104   /**
105    * A key to identify this timeslot
106    */
107   void *key;
108
109   /**
110    * Time
111    */
112   struct GNUNET_TIME_Relative time;
113
114   /**
115    * Number of timing values accumulated
116    */
117   unsigned int nvals;
118 };
119
120
121 /**
122  * Opaque handle to a host running experiments managed by the testing framework.
123  * The master process must be able to SSH to this host without password (via
124  * ssh-agent).
125  */
126 struct GNUNET_TESTBED_Host
127 {
128
129   /**
130    * The hostname of the host; NULL for localhost
131    */
132   const char *hostname;
133
134   /**
135    * The username to be used for SSH login
136    */
137   const char *username;
138
139   /**
140    * the configuration to use as a template while starting a controller on this
141    * host.  Operation queue size specific to a host are also read from this
142    * configuration handle.  After starting the controller, it points to the actual
143    * configuration with which the controller is running
144    */
145   struct GNUNET_CONFIGURATION_Handle *cfg;
146
147   /**
148    * The head for the list of controllers where this host is registered
149    */
150   struct RegisteredController *rc_head;
151
152   /**
153    * The tail for the list of controllers where this host is registered
154    */
155   struct RegisteredController *rc_tail;
156
157   /**
158    * Operation queue for simultaneous overlay connect operations target at this
159    * host
160    */
161   struct OperationQueue *opq_parallel_overlay_connect_operations;
162
163   /**
164    * An array of timing slots; size should be equal to the current number of parallel
165    * overlay connects
166    */
167   struct TimeSlot *tslots;
168
169   /**
170    * Handle for SD calculations amount parallel overlay connect operation finish
171    * times
172    */
173   struct SDHandle *poc_sd;  
174
175   /**
176    * The number of parallel overlay connects we do currently
177    */
178   unsigned int num_parallel_connects;
179
180   /**
181    * Counter to indicate when all the available time slots are filled
182    */
183   unsigned int tslots_filled;
184
185   /**
186    * Is a controller started on this host? FIXME: Is this needed?
187    */
188   int controller_started;
189
190   /**
191    * Is this host locked by GNUNET_TESTBED_controller_start()?
192    */
193   int locked;
194
195   /**
196    * Global ID we use to refer to a host on the network
197    */
198   uint32_t id;
199
200   /**
201    * The port which is to be used for SSH
202    */
203   uint16_t port;
204
205 };
206
207
208 /**
209  * Array of available hosts
210  */
211 static struct GNUNET_TESTBED_Host **host_list;
212
213 /**
214  * The size of the available hosts list
215  */
216 static unsigned int host_list_size;
217
218
219 /**
220  * Lookup a host by ID.
221  *
222  * @param id global host ID assigned to the host; 0 is
223  *        reserved to always mean 'localhost'
224  * @return handle to the host, NULL if host not found
225  */
226 struct GNUNET_TESTBED_Host *
227 GNUNET_TESTBED_host_lookup_by_id_ (uint32_t id)
228 {
229   if (host_list_size <= id)
230     return NULL;
231   return host_list[id];
232 }
233
234
235 /**
236  * Create a host by ID; given this host handle, we could not
237  * run peers at the host, but we can talk about the host
238  * internally.
239  *
240  * @param id global host ID assigned to the host; 0 is
241  *        reserved to always mean 'localhost'
242  * @param cfg the configuration to use as a template while starting a controller
243  *          on this host.  Operation queue sizes specific to a host are also
244  *          read from this configuration handle
245  * @return handle to the host, NULL on error
246  */
247 struct GNUNET_TESTBED_Host *
248 GNUNET_TESTBED_host_create_by_id_ (uint32_t id,
249                                    const struct GNUNET_CONFIGURATION_Handle
250                                    *cfg)
251 {
252   return GNUNET_TESTBED_host_create_with_id (id, NULL, NULL, cfg, 0);
253 }
254
255
256 /**
257  * Obtain the host's unique global ID.
258  *
259  * @param host handle to the host, NULL means 'localhost'
260  * @return id global host ID assigned to the host (0 is
261  *         'localhost', but then obviously not globally unique)
262  */
263 uint32_t
264 GNUNET_TESTBED_host_get_id_ (const struct GNUNET_TESTBED_Host * host)
265 {
266   return host->id;
267 }
268
269
270 /**
271  * Obtain the host's hostname.
272  *
273  * @param host handle to the host, NULL means 'localhost'
274  * @return hostname of the host
275  */
276 const char *
277 GNUNET_TESTBED_host_get_hostname (const struct GNUNET_TESTBED_Host *host)
278 {
279   return host->hostname;
280 }
281
282
283 /**
284  * Obtain the host's username
285  *
286  * @param host handle to the host, NULL means 'localhost'
287  * @return username to login to the host
288  */
289 const char *
290 GNUNET_TESTBED_host_get_username_ (const struct GNUNET_TESTBED_Host *host)
291 {
292   return host->username;
293 }
294
295
296 /**
297  * Obtain the host's ssh port
298  *
299  * @param host handle to the host, NULL means 'localhost'
300  * @return username to login to the host
301  */
302 uint16_t
303 GNUNET_TESTBED_host_get_ssh_port_ (const struct GNUNET_TESTBED_Host * host)
304 {
305   return host->port;
306 }
307
308
309 /**
310  * Check whether a controller is already started on the given host
311  *
312  * @param host the handle to the host
313  * @return GNUNET_YES if the controller is already started; GNUNET_NO if not
314  */
315 int
316 GNUNET_TESTBED_host_controller_started (const struct GNUNET_TESTBED_Host *host)
317 {
318   return host->controller_started;
319 }
320
321
322 /**
323  * Obtain the host's configuration template
324  *
325  * @param host handle to the host
326  * @return the host's configuration template
327  */
328 const struct GNUNET_CONFIGURATION_Handle *
329 GNUNET_TESTBED_host_get_cfg_ (const struct GNUNET_TESTBED_Host *host)
330 {
331   return host->cfg;
332 }
333
334
335 /**
336  * Function to replace host's configuration
337  *
338  * @param host the host handle
339  * @param new_cfg the new configuration to replace the old one
340  */
341 void
342 GNUNET_TESTBED_host_replace_cfg_ (struct GNUNET_TESTBED_Host *host,
343                                   const struct GNUNET_CONFIGURATION_Handle *new_cfg)
344 {
345   GNUNET_CONFIGURATION_destroy (host->cfg);
346   host->cfg = GNUNET_CONFIGURATION_dup (new_cfg);
347 }
348
349
350 /**
351  * Create a host to run peers and controllers on.
352  *
353  * @param id global host ID assigned to the host; 0 is
354  *        reserved to always mean 'localhost'
355  * @param hostname name of the host, use "NULL" for localhost
356  * @param username username to use for the login; may be NULL
357  * @param cfg the configuration to use as a template while starting a controller
358  *          on this host.  Operation queue sizes specific to a host are also
359  *          read from this configuration handle
360  * @param port port number to use for ssh; use 0 to let ssh decide
361  * @return handle to the host, NULL on error
362  */
363 struct GNUNET_TESTBED_Host *
364 GNUNET_TESTBED_host_create_with_id (uint32_t id, const char *hostname,
365                                     const char *username, 
366                                     const struct GNUNET_CONFIGURATION_Handle
367                                     *cfg,
368                                     uint16_t port)
369 {
370   struct GNUNET_TESTBED_Host *host;
371   unsigned int new_size;
372
373   if ((id < host_list_size) && (NULL != host_list[id]))
374   {
375     LOG (GNUNET_ERROR_TYPE_WARNING, "Host with id: %u already created\n", id);
376     return NULL;
377   }
378   host = GNUNET_malloc (sizeof (struct GNUNET_TESTBED_Host));
379   host->hostname = (NULL != hostname) ? GNUNET_strdup (hostname) : NULL;
380   host->username = (NULL != username) ? GNUNET_strdup (username) : NULL;
381   host->id = id;
382   host->port = (0 == port) ? 22 : port;
383   host->cfg = GNUNET_CONFIGURATION_dup (cfg);
384   host->opq_parallel_overlay_connect_operations =
385       GNUNET_TESTBED_operation_queue_create_ (0);
386   GNUNET_TESTBED_set_num_parallel_overlay_connects_ (host, 1);
387   host->poc_sd = GNUNET_TESTBED_SD_init_ (10);
388   new_size = host_list_size;
389   while (id >= new_size)
390     new_size += HOST_LIST_GROW_STEP;
391   if (new_size != host_list_size)
392     GNUNET_array_grow (host_list, host_list_size, new_size);
393   GNUNET_assert (id < host_list_size);
394   LOG (GNUNET_ERROR_TYPE_DEBUG, "Adding host with id: %u\n", host->id);
395   host_list[id] = host;
396   return host;
397 }
398
399
400 /**
401  * Create a host to run peers and controllers on.
402  *
403  * @param hostname name of the host, use "NULL" for localhost
404  * @param username username to use for the login; may be NULL
405  * @param cfg the configuration to use as a template while starting a controller
406  *          on this host.  Operation queue sizes specific to a host are also
407  *          read from this configuration handle
408  * @param port port number to use for ssh; use 0 to let ssh decide
409  * @return handle to the host, NULL on error
410  */
411 struct GNUNET_TESTBED_Host *
412 GNUNET_TESTBED_host_create (const char *hostname, const char *username,
413                             const struct GNUNET_CONFIGURATION_Handle *cfg,
414                             uint16_t port)
415 {
416   static uint32_t uid_generator;
417
418   if (NULL == hostname)
419     return GNUNET_TESTBED_host_create_with_id (0, hostname, username, 
420                                                cfg, port);
421   return GNUNET_TESTBED_host_create_with_id (++uid_generator, hostname,
422                                              username, cfg, port);
423 }
424
425
426 /**
427  * Load a set of hosts from a configuration file.
428  *
429  * @param filename file with the host specification
430  * @param cfg the configuration to use as a template while starting a controller
431  *          on any of the loaded hosts.  Operation queue sizes specific to a host
432  *          are also read from this configuration handle
433  * @param hosts set to the hosts found in the file; caller must free this if
434  *          number of hosts returned is greater than 0
435  * @return number of hosts returned in 'hosts', 0 on error
436  */
437 unsigned int
438 GNUNET_TESTBED_hosts_load_from_file (const char *filename,
439                                      const struct GNUNET_CONFIGURATION_Handle
440                                      *cfg,
441                                      struct GNUNET_TESTBED_Host ***hosts)
442 {
443   //struct GNUNET_TESTBED_Host **host_array;
444   struct GNUNET_TESTBED_Host *starting_host;
445   char *data;
446   char *buf;
447   char username[256];
448   char hostname[256];
449   uint64_t fs;
450   short int port;
451   int ret;
452   unsigned int offset;
453   unsigned int count;
454
455
456   GNUNET_assert (NULL != filename);
457   if (GNUNET_YES != GNUNET_DISK_file_test (filename))
458   {
459     LOG (GNUNET_ERROR_TYPE_WARNING, _("Hosts file %s not found\n"), filename);
460     return 0;
461   }
462   if (GNUNET_OK !=
463       GNUNET_DISK_file_size (filename, &fs, GNUNET_YES, GNUNET_YES))
464     fs = 0;
465   if (0 == fs)
466   {
467     LOG (GNUNET_ERROR_TYPE_WARNING, _("Hosts file %s has no data\n"), filename);
468     return 0;
469   }
470   data = GNUNET_malloc (fs);
471   if (fs != GNUNET_DISK_fn_read (filename, data, fs))
472   {
473     GNUNET_free (data);
474     LOG (GNUNET_ERROR_TYPE_WARNING, _("Hosts file %s cannot be read\n"),
475          filename);
476     return 0;
477   }
478   buf = data;
479   offset = 0;
480   starting_host = NULL;
481   count = 0;
482   while (offset < (fs - 1))
483   {
484     offset++;
485     if (((data[offset] == '\n')) && (buf != &data[offset]))
486     {
487       data[offset] = '\0';
488       ret =
489           SSCANF (buf, "%255[a-zA-Z0-9_]@%255[a-zA-Z0-9.]:%5hd", username,
490                   hostname, &port);
491       if (3 == ret)
492       {
493         GNUNET_log (GNUNET_ERROR_TYPE_DEBUG,
494                     "Successfully read host %s, port %d and user %s from file\n",
495                     hostname, port, username);
496         /* We store hosts in a static list; hence we only require the starting
497          * host pointer in that list to access the newly created list of hosts */
498         if (NULL == starting_host)
499           starting_host = GNUNET_TESTBED_host_create (hostname, username, cfg,
500                                                       port);
501         else
502           (void) GNUNET_TESTBED_host_create (hostname, username, cfg, port);
503         count++;
504       }
505       else
506         GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
507                     "Error reading line `%s' in hostfile\n", buf);
508       buf = &data[offset + 1];
509     }
510     else if ((data[offset] == '\n') || (data[offset] == '\0'))
511       buf = &data[offset + 1];
512   }
513   GNUNET_free (data);
514   if (NULL == starting_host)
515     return 0;
516   *hosts = GNUNET_malloc (sizeof (struct GNUNET_TESTBED_Host *) * count);
517   memcpy (*hosts, &host_list[GNUNET_TESTBED_host_get_id_ (starting_host)],
518           sizeof (struct GNUNET_TESTBED_Host *) * count);
519   return count;
520 }
521
522
523 /**
524  * Resolves a hostname using getaddrinfo
525  *
526  * @param host the hostname
527  * @return the string representing the IPv4 address of the given host; NULL upon error
528  */
529 const char *
530 simple_resolve (const char *host)
531 {
532   struct addrinfo *res;
533   const struct sockaddr_in *in_addr; 
534   char *hostip;
535   struct addrinfo hint;
536   unsigned int rc;
537
538   hint.ai_family = AF_INET;     /* IPv4 */
539   hint.ai_socktype = 0;
540   hint.ai_protocol = 0;
541   hint.ai_addrlen = 0;
542   hint.ai_addr = NULL;
543   hint.ai_canonname = NULL;
544   hint.ai_next = NULL;
545   hint.ai_flags = AI_NUMERICSERV;
546   res = NULL;
547   LOG_DEBUG ("Resolving [%s]\n", host);
548   if (0 != (rc = getaddrinfo (host, "22", &hint, &res)))
549   {
550     LOG_GAI (GNUNET_ERROR_TYPE_ERROR, "getaddrinfo", rc);
551     return NULL;
552   }
553   GNUNET_assert (NULL != res);
554   GNUNET_assert (NULL != res->ai_addr);
555   GNUNET_assert (sizeof (struct sockaddr_in) == res->ai_addrlen);
556   in_addr = (const struct sockaddr_in *) res->ai_addr;
557   hostip = inet_ntoa (in_addr->sin_addr);
558   GNUNET_assert (NULL != hostip);
559   LOG_DEBUG ("Resolved [%s] to [%s]\n", host, hostip);
560   return hostip;
561 }
562
563
564 /**
565  * Loads the set of host allocated by the LoadLeveler Job Scheduler.  This
566  * function is only available when compiled with support for LoadLeveler and is
567  * used for running on the SuperMUC
568  *
569  * @param cfg the configuration to use as a template while starting a controller
570  *          on any of the loaded hosts.  Operation queue sizes specific to a host
571  *          are also read from this configuration handle
572  * @param hosts set to the hosts found in the file; caller must free this if
573  *          number of hosts returned is greater than 0
574  * @return number of hosts returned in 'hosts', 0 on error
575  */
576 unsigned int
577 GNUNET_TESTBED_hosts_load_from_loadleveler (const struct
578                                             GNUNET_CONFIGURATION_Handle *cfg,
579                                             struct GNUNET_TESTBED_Host ***hosts)
580 {
581 #if !ENABLE_LL
582   LOG (GNUNET_ERROR_TYPE_ERROR, 
583        _("The function %s is only available when compiled with (--with-ll)\n"),
584        __func__);
585   GNUNET_assert (0);
586 #else
587   const char *hostfile;
588   char *buf;
589   char *hostname;
590   char **hostnames;
591   char **hostaddrs;
592   const char *hostip;
593   struct GNUNET_TESTBED_Host **host_list;
594   ssize_t rsize;
595   uint64_t size;
596   uint64_t offset;
597   enum {
598     SCAN,
599     SKIP,
600     TRIM,
601     READHOST
602   } pstep;
603   unsigned int host;
604   unsigned int nhosts;
605   unsigned int nhostaddrs;
606   
607   if (NULL == (hostfile = getenv ("MP_SAVEHOSTFILE")))
608   {
609     GNUNET_break (0);
610     return 0;
611   }
612   if (GNUNET_SYSERR == GNUNET_DISK_file_size (hostfile, &size, GNUNET_YES,
613                                               GNUNET_YES))
614   {
615     GNUNET_break (0);
616     return 0;
617   }
618   if (0 == size)
619   {
620     GNUNET_break (0);
621     return 0;
622   }
623   buf = GNUNET_malloc (size + 1);
624   rsize = GNUNET_DISK_fn_read (hostfile, buf, (size_t) size);
625   if ( (GNUNET_SYSERR == rsize) || ((ssize_t) size != rsize) )
626   {
627     GNUNET_free (buf);
628     GNUNET_break (0);
629     return 0;
630   }
631   size++;
632   offset = 0;
633   pstep = SCAN;
634   hostname = NULL;
635   hostnames = NULL;
636   hostaddrs = NULL;
637   nhosts = 0;
638   nhostaddrs = 0;
639   while (offset < size)
640   {
641     switch (pstep)
642     {
643     case SCAN:
644       if ('!' == buf[offset])
645         pstep = SKIP;
646       else 
647         pstep = TRIM;
648       break;
649     case SKIP:
650       if ('\n' == buf[offset])
651         pstep = SCAN;
652       break;
653     case TRIM:
654       if ('!' == buf[offset])
655       {
656         pstep = SKIP;
657         break;
658       }
659       if ( (' ' == buf[offset]) 
660            || ('\t' == buf[offset])
661            || ('\r' == buf[offset]) )
662         pstep = TRIM;
663       else
664       {
665         pstep = READHOST;
666         hostname = &buf[offset];        
667       }
668       break;
669     case READHOST:
670       if (isspace (buf[offset]))
671       {
672         buf[offset] = '\0';
673         for (host = 0; host < nhosts; host++)
674           if (0 == strcmp (hostnames[host], hostname))
675             break;
676         if (host == nhosts)
677         {
678           LOG_DEBUG ("Adding host [%s]\n", hostname);
679           hostname = GNUNET_strdup (hostname);
680           GNUNET_array_append (hostnames, nhosts, hostname);
681         }
682         else
683           LOG_DEBUG ("Not adding host [%s] as it is already included\n", hostname);
684         hostname = NULL;
685         pstep = SCAN;
686       }
687       break;
688     }
689     offset++;
690   }
691   GNUNET_free_non_null (buf);
692   if (NULL == hostnames)
693     return 0;
694   for (host = 0; host < nhosts; host++)
695   {
696     hostip = simple_resolve (hostnames[host]);
697     if (NULL == hostip)
698     {
699       nhosts = 0;
700       goto cleanup;
701     }
702     GNUNET_array_append (hostaddrs, nhostaddrs, GNUNET_strdup (hostip));
703   }
704   GNUNET_assert (nhostaddrs == nhosts);
705   if (NULL == hosts)
706     goto cleanup;
707   host_list = GNUNET_malloc (sizeof (struct GNUNET_TESTBED_Host *) * nhostaddrs);
708   for (host = 0; host < nhosts; host++)
709     host_list[host] = GNUNET_TESTBED_host_create (hostaddrs[host], NULL, cfg, 0);
710   *hosts = host_list;
711
712  cleanup:
713   for (host = 0; host < nhosts; host++)
714     GNUNET_free (hostnames[host]);
715   GNUNET_free(hostnames);
716   for (host = 0; (NULL != hostaddrs) && (host < nhostaddrs); host++)
717     GNUNET_free (hostaddrs[host]);
718   GNUNET_free (hostaddrs);
719   return nhosts;
720 #endif
721 }
722
723
724 /**
725  * Destroy a host handle.  Must only be called once everything
726  * running on that host has been stopped.
727  *
728  * @param host handle to destroy
729  */
730 void
731 GNUNET_TESTBED_host_destroy (struct GNUNET_TESTBED_Host *host)
732 {
733   struct RegisteredController *rc;
734   uint32_t id;
735
736   GNUNET_assert (host->id < host_list_size);
737   GNUNET_assert (host_list[host->id] == host);
738   host_list[host->id] = NULL;
739   /* clear registered controllers list */
740   for (rc = host->rc_head; NULL != rc; rc = host->rc_head)
741   {
742     GNUNET_CONTAINER_DLL_remove (host->rc_head, host->rc_tail, rc);
743     GNUNET_free (rc);
744   }
745   GNUNET_free_non_null ((char *) host->username);
746   GNUNET_free_non_null ((char *) host->hostname);
747   GNUNET_TESTBED_operation_queue_destroy_
748       (host->opq_parallel_overlay_connect_operations);
749   GNUNET_TESTBED_SD_destroy_ (host->poc_sd);
750   GNUNET_free_non_null (host->tslots);
751   GNUNET_CONFIGURATION_destroy (host->cfg);
752   GNUNET_free (host);
753   while (host_list_size >= HOST_LIST_GROW_STEP)
754   {
755     for (id = host_list_size - 1; id > host_list_size - HOST_LIST_GROW_STEP;
756          id--)
757       if (NULL != host_list[id])
758         break;
759     if (id != host_list_size - HOST_LIST_GROW_STEP)
760       break;
761     if (NULL != host_list[id])
762       break;
763     host_list_size -= HOST_LIST_GROW_STEP;
764   }
765   host_list =
766       GNUNET_realloc (host_list,
767                       sizeof (struct GNUNET_TESTBED_Host *) * host_list_size);
768 }
769
770
771 /**
772  * Marks a host as registered with a controller
773  *
774  * @param host the host to mark
775  * @param controller the controller at which this host is registered
776  */
777 void
778 GNUNET_TESTBED_mark_host_registered_at_ (struct GNUNET_TESTBED_Host *host,
779                                          const struct GNUNET_TESTBED_Controller
780                                          *const controller)
781 {
782   struct RegisteredController *rc;
783
784   for (rc = host->rc_head; NULL != rc; rc = rc->next)
785   {
786     if (controller == rc->controller)   /* already registered at controller */
787     {
788       GNUNET_break (0);
789       return;
790     }
791   }
792   rc = GNUNET_malloc (sizeof (struct RegisteredController));
793   rc->controller = controller;
794   GNUNET_CONTAINER_DLL_insert_tail (host->rc_head, host->rc_tail, rc);
795 }
796
797
798 /**
799  * Unmarks a host registered at a controller
800  *
801  * @param host the host to unmark
802  * @param controller the controller at which this host has to be unmarked
803  */
804 void
805 GNUNET_TESTBED_deregister_host_at_ (struct GNUNET_TESTBED_Host *host,
806                                     const struct GNUNET_TESTBED_Controller
807                                     *const controller)
808 {
809   struct RegisteredController *rc;
810
811   for (rc = host->rc_head; NULL != rc; rc=rc->next)
812     if (controller == rc->controller)
813       break;
814   if (NULL == rc)
815   {
816     GNUNET_break (0);
817     return;
818   }
819   GNUNET_CONTAINER_DLL_remove (host->rc_head, host->rc_tail, rc);
820   GNUNET_free (rc);
821 }
822
823
824 /**
825  * Checks whether a host has been registered
826  *
827  * @param host the host to check
828  * @param controller the controller at which host's registration is checked
829  * @return GNUNET_YES if registered; GNUNET_NO if not
830  */
831 int
832 GNUNET_TESTBED_is_host_registered_ (const struct GNUNET_TESTBED_Host *host,
833                                     const struct GNUNET_TESTBED_Controller
834                                     *const controller)
835 {
836   struct RegisteredController *rc;
837
838   for (rc = host->rc_head; NULL != rc; rc = rc->next)
839   {
840     if (controller == rc->controller)   /* already registered at controller */
841     {
842       return GNUNET_YES;
843     }
844   }
845   return GNUNET_NO;
846 }
847
848
849 /**
850  * Handle for controller process
851  */
852 struct GNUNET_TESTBED_ControllerProc
853 {
854   /**
855    * The process handle
856    */
857   struct GNUNET_HELPER_Handle *helper;
858
859   /**
860    * The arguments used to start the helper
861    */
862   char **helper_argv;
863
864   /**
865    * The host where the helper is run
866    */
867   struct GNUNET_TESTBED_Host *host;
868
869   /**
870    * The controller error callback
871    */
872   GNUNET_TESTBED_ControllerStatusCallback cb;
873
874   /**
875    * The closure for the above callback
876    */
877   void *cls;
878
879   /**
880    * The send handle for the helper
881    */
882   struct GNUNET_HELPER_SendHandle *shandle;
883
884   /**
885    * The message corresponding to send handle
886    */
887   struct GNUNET_MessageHeader *msg;
888
889 };
890
891
892 /**
893  * Function to copy NULL terminated list of arguments
894  *
895  * @param argv the NULL terminated list of arguments. Cannot be NULL.
896  * @return the copied NULL terminated arguments
897  */
898 static char **
899 copy_argv (const char *const *argv)
900 {
901   char **argv_dup;
902   unsigned int argp;
903
904   GNUNET_assert (NULL != argv);
905   for (argp = 0; NULL != argv[argp]; argp++) ;
906   argv_dup = GNUNET_malloc (sizeof (char *) * (argp + 1));
907   for (argp = 0; NULL != argv[argp]; argp++)
908     argv_dup[argp] = strdup (argv[argp]);
909   return argv_dup;
910 }
911
912
913 /**
914  * Function to join NULL terminated list of arguments
915  *
916  * @param argv1 the NULL terminated list of arguments. Cannot be NULL.
917  * @param argv2 the NULL terminated list of arguments. Cannot be NULL.
918  * @return the joined NULL terminated arguments
919  */
920 static char **
921 join_argv (const char *const *argv1, const char *const *argv2)
922 {
923   char **argvj;
924   char *argv;
925   unsigned int carg;
926   unsigned int cnt;
927
928   carg = 0;
929   argvj = NULL;
930   for (cnt = 0; NULL != argv1[cnt]; cnt++)
931   {
932     argv = GNUNET_strdup (argv1[cnt]);
933     GNUNET_array_append (argvj, carg, argv);
934   }
935   for (cnt = 0; NULL != argv2[cnt]; cnt++)
936   {
937     argv = GNUNET_strdup (argv2[cnt]);
938     GNUNET_array_append (argvj, carg, argv);
939   }
940   GNUNET_array_append (argvj, carg, NULL);
941   return argvj;
942 }
943
944
945 /**
946  * Frees the given NULL terminated arguments
947  *
948  * @param argv the NULL terminated list of arguments
949  */
950 static void
951 free_argv (char **argv)
952 {
953   unsigned int argp;
954
955   for (argp = 0; NULL != argv[argp]; argp++)
956     GNUNET_free (argv[argp]);
957   GNUNET_free (argv);
958 }
959
960
961 /**
962  * Generates arguments for opening a remote shell. Builds up the arguments
963  * from the environment variable GNUNET_TESTBED_RSH_CMD. The variable
964  * should not mention `-p' (port) option and destination address as these will
965  * be set locally in the function from its parameteres. If the environmental
966  * variable is not found then it defaults to `ssh -o BatchMode=yes -o
967  * NoHostAuthenticationForLocalhost=yes'
968  *
969  * @param port the destination port number
970  * @param dst the destination address
971  * @return NULL terminated list of arguments
972  */
973 static char **
974 gen_rsh_args (const char *port, const char *dst)
975 {
976   static const char *default_ssh_args[] = {
977     "ssh",
978     "-o",
979     "BatchMode=yes",
980     "-o",
981     "NoHostAuthenticationForLocalhost=yes",
982     NULL
983   };
984   char **ssh_args;
985   char *ssh_cmd;
986   char *ssh_cmd_cp;
987   char *arg;
988   unsigned int cnt;
989
990   ssh_args = NULL;
991   if (NULL != (ssh_cmd = getenv ("GNUNET_TESTBED_RSH_CMD")))
992   {
993     ssh_cmd = GNUNET_strdup (ssh_cmd);
994     ssh_cmd_cp = ssh_cmd;
995     for (cnt = 0; NULL != (arg = strtok (ssh_cmd, " ")); ssh_cmd = NULL)
996       GNUNET_array_append (ssh_args, cnt, GNUNET_strdup (arg));
997     GNUNET_free (ssh_cmd_cp);
998   }
999   else
1000   {
1001     ssh_args = copy_argv (default_ssh_args);
1002     cnt = (sizeof (default_ssh_args)) / (sizeof (const char *));
1003     GNUNET_array_grow (ssh_args, cnt, cnt - 1);
1004   }
1005   GNUNET_array_append (ssh_args, cnt, GNUNET_strdup ("-p"));
1006   GNUNET_array_append (ssh_args, cnt, GNUNET_strdup (port));
1007   GNUNET_array_append (ssh_args, cnt, GNUNET_strdup (dst));
1008   GNUNET_array_append (ssh_args, cnt, NULL);
1009   return ssh_args;
1010 }
1011
1012
1013 /**
1014  * Generates the arguments needed for executing the given binary in a remote
1015  * shell. Builds the arguments from the environmental variable
1016  * GNUNET_TETSBED_RSH_CMD_SUFFIX. If the environmental variable is not found,
1017  * only the given binary name will be present in the returned arguments
1018  *
1019  * @param append_args the arguments to append after generating the suffix
1020  *          arguments. Can be NULL; if not must be NULL terminated 'char *' array
1021  * @return NULL-terminated args
1022  */
1023 static char **
1024 gen_rsh_suffix_args (const char * const *append_args)
1025 {
1026   char **rshell_args;
1027   char *rshell_cmd;
1028   char *rshell_cmd_cp;
1029   char *arg;
1030   unsigned int cnt;
1031   unsigned int append_cnt;
1032
1033   rshell_args = NULL;
1034   cnt = 0;
1035   if (NULL != (rshell_cmd = getenv ("GNUNET_TESTBED_RSH_CMD_SUFFIX")))
1036   {
1037     rshell_cmd = GNUNET_strdup (rshell_cmd);
1038     rshell_cmd_cp = rshell_cmd;
1039     for (; NULL != (arg = strtok (rshell_cmd, " ")); rshell_cmd = NULL)
1040       GNUNET_array_append (rshell_args, cnt, GNUNET_strdup (arg));
1041     GNUNET_free (rshell_cmd_cp);
1042   }
1043   if (NULL != append_args)
1044   {
1045     for (append_cnt = 0; NULL != append_args[append_cnt]; append_cnt++)      
1046       GNUNET_array_append (rshell_args, cnt, GNUNET_strdup (append_args[append_cnt]));
1047   }
1048   GNUNET_array_append (rshell_args, cnt, NULL);
1049   return rshell_args;
1050 }
1051
1052
1053 /**
1054  * Functions with this signature are called whenever a
1055  * complete message is received by the tokenizer.
1056  *
1057  * Do not call GNUNET_SERVER_mst_destroy in callback
1058  *
1059  * @param cls closure
1060  * @param client identification of the client
1061  * @param message the actual message
1062  *
1063  * @return GNUNET_OK on success, GNUNET_SYSERR to stop further processing
1064  */
1065 static int
1066 helper_mst (void *cls, void *client, const struct GNUNET_MessageHeader *message)
1067 {
1068   struct GNUNET_TESTBED_ControllerProc *cp = cls;
1069   const struct GNUNET_TESTBED_HelperReply *msg;
1070   const char *hostname;
1071   char *config;
1072   uLongf config_size;
1073   uLongf xconfig_size;
1074
1075   msg = (const struct GNUNET_TESTBED_HelperReply *) message;
1076   GNUNET_assert (sizeof (struct GNUNET_TESTBED_HelperReply) <
1077                  ntohs (msg->header.size));
1078   GNUNET_assert (GNUNET_MESSAGE_TYPE_TESTBED_HELPER_REPLY ==
1079                  ntohs (msg->header.type));
1080   config_size = (uLongf) ntohs (msg->config_size);
1081   xconfig_size =
1082       (uLongf) (ntohs (msg->header.size) -
1083                 sizeof (struct GNUNET_TESTBED_HelperReply));
1084   config = GNUNET_malloc (config_size);
1085   GNUNET_assert (Z_OK ==
1086                  uncompress ((Bytef *) config, &config_size,
1087                              (const Bytef *) &msg[1], xconfig_size));
1088   /* Replace the configuration template present in the host with the
1089      controller's running configuration */
1090   GNUNET_CONFIGURATION_destroy (cp->host->cfg);
1091   cp->host->cfg = GNUNET_CONFIGURATION_create ();
1092   GNUNET_assert (GNUNET_CONFIGURATION_deserialize
1093                  (cp->host->cfg, config, config_size, GNUNET_NO));
1094   GNUNET_free (config);
1095   if ((NULL == cp->host) ||
1096       (NULL == (hostname = GNUNET_TESTBED_host_get_hostname (cp->host))))
1097     hostname = "localhost";
1098   /* Change the hostname so that we can connect to it */
1099   GNUNET_CONFIGURATION_set_value_string (cp->host->cfg, "testbed", "hostname",
1100                                          hostname);
1101   cp->host->locked = GNUNET_NO;
1102   cp->host->controller_started = GNUNET_YES;
1103   cp->cb (cp->cls, cp->host->cfg, GNUNET_OK);
1104   return GNUNET_OK;
1105 }
1106
1107
1108 /**
1109  * Continuation function from GNUNET_HELPER_send()
1110  *
1111  * @param cls closure
1112  * @param result GNUNET_OK on success,
1113  *               GNUNET_NO if helper process died
1114  *               GNUNET_SYSERR during GNUNET_HELPER_stop
1115  */
1116 static void
1117 clear_msg (void *cls, int result)
1118 {
1119   struct GNUNET_TESTBED_ControllerProc *cp = cls;
1120
1121   GNUNET_assert (NULL != cp->shandle);
1122   cp->shandle = NULL;
1123   GNUNET_free (cp->msg);
1124 }
1125
1126
1127 /**
1128  * Callback that will be called when the helper process dies. This is not called
1129  * when the helper process is stoped using GNUNET_HELPER_stop()
1130  *
1131  * @param cls the closure from GNUNET_HELPER_start()
1132  */
1133 static void
1134 helper_exp_cb (void *cls)
1135 {
1136   struct GNUNET_TESTBED_ControllerProc *cp = cls;
1137   GNUNET_TESTBED_ControllerStatusCallback cb;
1138   void *cb_cls;
1139
1140   cb = cp->cb;
1141   cb_cls = cp->cls;
1142   cp->helper = NULL;
1143   GNUNET_TESTBED_controller_stop (cp);
1144   if (NULL != cb)
1145     cb (cb_cls, NULL, GNUNET_SYSERR);
1146 }
1147
1148
1149 /**
1150  * Starts a controller process at the given host.  The given host's configration
1151  * is used as a Template configuration to use for the remote controller; the
1152  * remote controller will be started with a slightly modified configuration
1153  * (port numbers, unix domain sockets and service home values are changed as per
1154  * TESTING library on the remote host).  The modified configuration replaces the
1155  * host's existing configuration before signalling success through the
1156  * GNUNET_TESTBED_ControllerStatusCallback()
1157  *
1158  * @param trusted_ip the ip address of the controller which will be set as TRUSTED
1159  *          HOST(all connections form this ip are permitted by the testbed) when
1160  *          starting testbed controller at host. This can either be a single ip
1161  *          address or a network address in CIDR notation.
1162  * @param host the host where the controller has to be started.  CANNOT be NULL.
1163  * @param cb function called when the controller is successfully started or
1164  *          dies unexpectedly; GNUNET_TESTBED_controller_stop shouldn't be
1165  *          called if cb is called with GNUNET_SYSERR as status. Will never be
1166  *          called in the same task as 'GNUNET_TESTBED_controller_start'
1167  *          (synchronous errors will be signalled by returning NULL). This
1168  *          parameter cannot be NULL.
1169  * @param cls closure for above callbacks
1170  * @return the controller process handle, NULL on errors
1171  */
1172 struct GNUNET_TESTBED_ControllerProc *
1173 GNUNET_TESTBED_controller_start (const char *trusted_ip,
1174                                  struct GNUNET_TESTBED_Host *host,
1175                                  GNUNET_TESTBED_ControllerStatusCallback cb,
1176                                  void *cls)
1177 {
1178   struct GNUNET_TESTBED_ControllerProc *cp;
1179   struct GNUNET_TESTBED_HelperInit *msg;
1180   const struct GNUNET_CONFIGURATION_Handle *cfg;
1181   const char *hostname;
1182   static char *const binary_argv[] = {
1183     HELPER_TESTBED_BINARY, NULL
1184   };
1185   
1186   GNUNET_assert (NULL != host);
1187   GNUNET_assert (NULL != (cfg = GNUNET_TESTBED_host_get_cfg_ (host)));
1188   hostname = NULL;
1189   API_VIOLATION (GNUNET_NO == host->locked,
1190                  "Host is already locked by a previous call to GNUNET_TESTBED_controller_start()");
1191   host->locked = GNUNET_YES;
1192   API_VIOLATION (GNUNET_NO == host->controller_started,
1193                  "Attempting to start a controller on a host which is already started a controller");
1194   cp = GNUNET_malloc (sizeof (struct GNUNET_TESTBED_ControllerProc));
1195   if (0 == GNUNET_TESTBED_host_get_id_ (host))
1196   {
1197     cp->helper =
1198         GNUNET_HELPER_start (GNUNET_YES, HELPER_TESTBED_BINARY, binary_argv,
1199                              &helper_mst, &helper_exp_cb, cp);
1200   }
1201   else
1202   {
1203     char *helper_binary_path_args[2];
1204     char **rsh_args;
1205     char **rsh_suffix_args;
1206     const char *username;
1207     char *port;
1208     char *dst;
1209
1210     username = GNUNET_TESTBED_host_get_username_ (host);
1211     hostname = GNUNET_TESTBED_host_get_hostname (host);
1212     GNUNET_asprintf (&port, "%u", GNUNET_TESTBED_host_get_ssh_port_ (host));
1213     if (NULL == username)
1214       GNUNET_asprintf (&dst, "%s", hostname);
1215     else
1216       GNUNET_asprintf (&dst, "%s@%s", username, hostname);
1217     LOG_DEBUG ("Starting SSH to destination %s\n", dst);
1218
1219     if (GNUNET_OK !=
1220         GNUNET_CONFIGURATION_get_value_string (cfg, "testbed",
1221                                                "HELPER_BINARY_PATH",
1222                                                &helper_binary_path_args[0]))
1223       helper_binary_path_args[0] =
1224           GNUNET_OS_get_libexec_binary_path (HELPER_TESTBED_BINARY);
1225     helper_binary_path_args[1] = NULL;
1226     rsh_args = gen_rsh_args (port, dst);
1227     rsh_suffix_args = gen_rsh_suffix_args ((const char **) helper_binary_path_args);
1228     cp->helper_argv =
1229         join_argv ((const char **) rsh_args, (const char **) rsh_suffix_args);
1230     free_argv (rsh_args);
1231     free_argv (rsh_suffix_args);
1232     GNUNET_free (port);
1233     GNUNET_free (dst);
1234     cp->helper =
1235         GNUNET_HELPER_start (GNUNET_NO, cp->helper_argv[0], cp->helper_argv, &helper_mst,
1236                              &helper_exp_cb, cp);
1237     GNUNET_free (helper_binary_path_args[0]);
1238   }
1239   if (NULL == cp->helper)
1240   {
1241     if (NULL != cp->helper_argv)
1242       free_argv (cp->helper_argv);
1243     GNUNET_free (cp);
1244     return NULL;
1245   }
1246   cp->host = host;
1247   cp->cb = cb;
1248   cp->cls = cls;
1249   msg = GNUNET_TESTBED_create_helper_init_msg_ (trusted_ip, hostname, cfg);
1250   cp->msg = &msg->header;
1251   cp->shandle =
1252       GNUNET_HELPER_send (cp->helper, &msg->header, GNUNET_NO, &clear_msg, cp);
1253   if (NULL == cp->shandle)
1254   {
1255     GNUNET_free (msg);
1256     GNUNET_TESTBED_controller_stop (cp);
1257     return NULL;
1258   }
1259   return cp;
1260 }
1261
1262
1263 /**
1264  * Sends termination signal to the controller's helper process
1265  *
1266  * @param cproc the handle to the controller's helper process
1267  */
1268 void
1269 GNUNET_TESTBED_controller_kill_ (struct GNUNET_TESTBED_ControllerProc *cproc)
1270 {
1271   if (NULL != cproc->shandle)
1272     GNUNET_HELPER_send_cancel (cproc->shandle);
1273   if (NULL != cproc->helper)
1274     GNUNET_HELPER_kill (cproc->helper, GNUNET_YES);
1275 }
1276
1277
1278 /**
1279  * Cleans-up the controller's helper process handle
1280  *
1281  * @param cproc the handle to the controller's helper process
1282  */
1283 void
1284 GNUNET_TESTBED_controller_destroy_ (struct GNUNET_TESTBED_ControllerProc *cproc)
1285 {
1286   if (NULL != cproc->helper)
1287   {
1288     GNUNET_break (GNUNET_OK == GNUNET_HELPER_wait (cproc->helper));
1289     GNUNET_HELPER_destroy (cproc->helper);
1290   }
1291   if (NULL != cproc->helper_argv)
1292     free_argv (cproc->helper_argv);
1293   cproc->host->controller_started = GNUNET_NO;
1294   cproc->host->locked = GNUNET_NO;
1295   GNUNET_free (cproc);
1296 }
1297
1298
1299 /**
1300  * Stop the controller process (also will terminate all peers and controllers
1301  * dependent on this controller).  This function blocks until the testbed has
1302  * been fully terminated (!). The controller status cb from
1303  * GNUNET_TESTBED_controller_start() will not be called.
1304  *
1305  * @param cproc the controller process handle
1306  */
1307 void
1308 GNUNET_TESTBED_controller_stop (struct GNUNET_TESTBED_ControllerProc *cproc)
1309 {
1310   GNUNET_TESTBED_controller_kill_ (cproc);
1311   GNUNET_TESTBED_controller_destroy_ (cproc);
1312 }
1313
1314
1315 /**
1316  * The handle for whether a host is habitable or not
1317  */
1318 struct GNUNET_TESTBED_HostHabitableCheckHandle
1319 {
1320   /**
1321    * The host to check
1322    */
1323   const struct GNUNET_TESTBED_Host *host;
1324
1325   /**
1326    * The callback to call once we have the status
1327    */
1328   GNUNET_TESTBED_HostHabitableCallback cb;
1329
1330   /**
1331    * The callback closure
1332    */
1333   void *cb_cls;
1334
1335   /**
1336    * The process handle for the SSH process
1337    */
1338   struct GNUNET_OS_Process *auxp;
1339
1340   /**
1341    * The arguments used to start the helper
1342    */
1343   char **helper_argv;
1344
1345   /**
1346    * Task id for the habitability check task
1347    */
1348   GNUNET_SCHEDULER_TaskIdentifier habitability_check_task;
1349
1350   /**
1351    * How long we wait before checking the process status. Should grow
1352    * exponentially
1353    */
1354   struct GNUNET_TIME_Relative wait_time;
1355
1356 };
1357
1358
1359 /**
1360  * Task for checking whether a host is habitable or not
1361  *
1362  * @param cls GNUNET_TESTBED_HostHabitableCheckHandle
1363  * @param tc the scheduler task context
1364  */
1365 static void
1366 habitability_check (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
1367 {
1368   struct GNUNET_TESTBED_HostHabitableCheckHandle *h = cls;
1369   void *cb_cls;
1370   GNUNET_TESTBED_HostHabitableCallback cb;
1371   const struct GNUNET_TESTBED_Host *host;
1372   unsigned long code;
1373   enum GNUNET_OS_ProcessStatusType type;
1374   int ret;
1375
1376   h->habitability_check_task = GNUNET_SCHEDULER_NO_TASK;
1377   ret = GNUNET_OS_process_status (h->auxp, &type, &code);
1378   if (GNUNET_SYSERR == ret)
1379   {
1380     GNUNET_break (0);
1381     ret = GNUNET_NO;
1382     goto call_cb;
1383   }
1384   if (GNUNET_NO == ret)
1385   {
1386     h->wait_time = GNUNET_TIME_STD_BACKOFF (h->wait_time);
1387     h->habitability_check_task =
1388         GNUNET_SCHEDULER_add_delayed (h->wait_time, &habitability_check, h);
1389     return;
1390   }
1391   GNUNET_OS_process_destroy (h->auxp);
1392   h->auxp = NULL;
1393   ret = (0 != code) ? GNUNET_NO : GNUNET_YES;
1394
1395 call_cb:
1396   if (NULL != h->auxp)
1397     GNUNET_OS_process_destroy (h->auxp);
1398   cb = h->cb;
1399   cb_cls = h->cb_cls;
1400   host = h->host;
1401   free_argv (h->helper_argv);
1402   GNUNET_free (h);
1403   if (NULL != cb)
1404     cb (cb_cls, host, ret);
1405 }
1406
1407
1408 /**
1409  * Checks whether a host can be used to start testbed service
1410  *
1411  * @param host the host to check
1412  * @param config the configuration handle to lookup the path of the testbed
1413  *          helper
1414  * @param cb the callback to call to inform about habitability of the given host
1415  * @param cb_cls the closure for the callback
1416  * @return NULL upon any error or a handle which can be passed to
1417  *           GNUNET_TESTBED_is_host_habitable_cancel()
1418  */
1419 struct GNUNET_TESTBED_HostHabitableCheckHandle *
1420 GNUNET_TESTBED_is_host_habitable (const struct GNUNET_TESTBED_Host *host,
1421                                   const struct GNUNET_CONFIGURATION_Handle
1422                                   *config,
1423                                   GNUNET_TESTBED_HostHabitableCallback cb,
1424                                   void *cb_cls)
1425 {
1426   struct GNUNET_TESTBED_HostHabitableCheckHandle *h;
1427   char **rsh_args;
1428   char **rsh_suffix_args;
1429   char *stat_args[3];
1430   const char *hostname;
1431   char *port;
1432   char *dst;
1433
1434   h = GNUNET_malloc (sizeof (struct GNUNET_TESTBED_HostHabitableCheckHandle));
1435   h->cb = cb;
1436   h->cb_cls = cb_cls;
1437   h->host = host;
1438   hostname = (NULL == host->hostname) ? "127.0.0.1" : host->hostname;
1439   if (NULL == host->username)
1440     dst = GNUNET_strdup (hostname);
1441   else
1442     GNUNET_asprintf (&dst, "%s@%s", host->username, hostname);
1443   if (GNUNET_OK !=
1444       GNUNET_CONFIGURATION_get_value_string (config, "testbed",
1445                                              "HELPER_BINARY_PATH",
1446                                              &stat_args[1]))
1447     stat_args[1] =
1448         GNUNET_OS_get_libexec_binary_path (HELPER_TESTBED_BINARY);  
1449   GNUNET_asprintf (&port, "%u", host->port);
1450   rsh_args = gen_rsh_args (port, dst);
1451   GNUNET_free (port);
1452   GNUNET_free (dst);
1453   port = NULL;
1454   dst = NULL;
1455   stat_args[0] = "stat";
1456   stat_args[2] = NULL;
1457   rsh_suffix_args = gen_rsh_suffix_args ((const char **) stat_args);
1458   GNUNET_free (stat_args[1]);
1459   h->helper_argv = join_argv ((const char **) rsh_args,
1460                               (const char **) rsh_suffix_args);
1461   free_argv (rsh_suffix_args);
1462   free_argv (rsh_args);
1463   h->auxp =
1464       GNUNET_OS_start_process_vap (GNUNET_NO, GNUNET_OS_INHERIT_STD_ERR, NULL,
1465                                    NULL, h->helper_argv[0], h->helper_argv);
1466   if (NULL == h->auxp)
1467   {
1468     GNUNET_break (0);           /* Cannot exec SSH? */
1469     GNUNET_free (h);
1470     return NULL;
1471   }
1472   h->wait_time = GNUNET_TIME_STD_BACKOFF (h->wait_time);
1473   h->habitability_check_task =
1474       GNUNET_SCHEDULER_add_delayed (h->wait_time, &habitability_check, h);
1475   return h;
1476 }
1477
1478
1479 /**
1480  * Function to cancel a request started using GNUNET_TESTBED_is_host_habitable()
1481  *
1482  * @param handle the habitability check handle
1483  */
1484 void
1485 GNUNET_TESTBED_is_host_habitable_cancel (struct
1486                                          GNUNET_TESTBED_HostHabitableCheckHandle
1487                                          *handle)
1488 {
1489   GNUNET_SCHEDULER_cancel (handle->habitability_check_task);
1490   (void) GNUNET_OS_process_kill (handle->auxp, SIGTERM);
1491   (void) GNUNET_OS_process_wait (handle->auxp);
1492   GNUNET_OS_process_destroy (handle->auxp);
1493   free_argv (handle->helper_argv);
1494   GNUNET_free (handle);
1495 }
1496
1497
1498 /**
1499  * handle for host registration
1500  */
1501 struct GNUNET_TESTBED_HostRegistrationHandle
1502 {
1503   /**
1504    * The host being registered
1505    */
1506   struct GNUNET_TESTBED_Host *host;
1507
1508   /**
1509    * The controller at which this host is being registered
1510    */
1511   struct GNUNET_TESTBED_Controller *c;
1512
1513   /**
1514    * The Registartion completion callback
1515    */
1516   GNUNET_TESTBED_HostRegistrationCompletion cc;
1517
1518   /**
1519    * The closure for above callback
1520    */
1521   void *cc_cls;
1522 };
1523
1524
1525 /**
1526  * Register a host with the controller
1527  *
1528  * @param controller the controller handle
1529  * @param host the host to register
1530  * @param cc the completion callback to call to inform the status of
1531  *          registration. After calling this callback the registration handle
1532  *          will be invalid. Cannot be NULL.
1533  * @param cc_cls the closure for the cc
1534  * @return handle to the host registration which can be used to cancel the
1535  *           registration
1536  */
1537 struct GNUNET_TESTBED_HostRegistrationHandle *
1538 GNUNET_TESTBED_register_host (struct GNUNET_TESTBED_Controller *controller,
1539                               struct GNUNET_TESTBED_Host *host,
1540                               GNUNET_TESTBED_HostRegistrationCompletion cc,
1541                               void *cc_cls)
1542 {
1543   struct GNUNET_TESTBED_HostRegistrationHandle *rh;
1544   struct GNUNET_TESTBED_AddHostMessage *msg;
1545   const char *username;
1546   const char *hostname;
1547   char *config;
1548   char *cconfig;
1549   void *ptr;
1550   size_t cc_size;
1551   size_t config_size;
1552   uint16_t msg_size;
1553   uint16_t username_length;
1554   uint16_t hostname_length;
1555
1556   if (NULL != controller->rh)
1557     return NULL;
1558   hostname = GNUNET_TESTBED_host_get_hostname (host);
1559   if (GNUNET_YES == GNUNET_TESTBED_is_host_registered_ (host, controller))
1560   {
1561     LOG (GNUNET_ERROR_TYPE_WARNING, "Host hostname: %s already registered\n",
1562          (NULL == hostname) ? "localhost" : hostname);
1563     return NULL;
1564   }
1565   rh = GNUNET_malloc (sizeof (struct GNUNET_TESTBED_HostRegistrationHandle));
1566   rh->host = host;
1567   rh->c = controller;
1568   GNUNET_assert (NULL != cc);
1569   rh->cc = cc;
1570   rh->cc_cls = cc_cls;
1571   controller->rh = rh;
1572   username = GNUNET_TESTBED_host_get_username_ (host);
1573   username_length = 0;
1574   if (NULL != username)
1575     username_length = strlen (username);
1576   GNUNET_assert (NULL != hostname); /* Hostname must be present */
1577   hostname_length = strlen (hostname);
1578   GNUNET_assert (NULL != host->cfg);
1579   config = GNUNET_CONFIGURATION_serialize (host->cfg, &config_size);
1580   cc_size = GNUNET_TESTBED_compress_config_ (config, config_size, &cconfig);
1581   GNUNET_free (config);
1582   msg_size = (sizeof (struct GNUNET_TESTBED_AddHostMessage));
1583   msg_size += username_length;
1584   msg_size += hostname_length;
1585   msg_size += cc_size;
1586   msg = GNUNET_malloc (msg_size);
1587   msg->header.size = htons (msg_size);
1588   msg->header.type = htons (GNUNET_MESSAGE_TYPE_TESTBED_ADD_HOST);
1589   msg->host_id = htonl (GNUNET_TESTBED_host_get_id_ (host));
1590   msg->ssh_port = htons (GNUNET_TESTBED_host_get_ssh_port_ (host));
1591   ptr = &msg[1];
1592   if (NULL != username)
1593   {
1594     msg->username_length = htons (username_length);
1595     ptr = memcpy (ptr, username, username_length);
1596     ptr += username_length;
1597   }
1598   msg->hostname_length = htons (hostname_length);
1599   ptr = memcpy (ptr, hostname, hostname_length);
1600   ptr += hostname_length;
1601   msg->config_size = htons (config_size);
1602   ptr = memcpy (ptr, cconfig, cc_size);
1603   ptr += cc_size;
1604   GNUNET_assert ((ptr - (void *) msg) == msg_size);
1605   GNUNET_free (cconfig);
1606   GNUNET_TESTBED_queue_message_ (controller,
1607                                  (struct GNUNET_MessageHeader *) msg);
1608   return rh;
1609 }
1610
1611
1612 /**
1613  * Cancel the pending registration. Note that if the registration message is
1614  * already sent to the service the cancellation has only the effect that the
1615  * registration completion callback for the registration is never called.
1616  *
1617  * @param handle the registration handle to cancel
1618  */
1619 void
1620 GNUNET_TESTBED_cancel_registration (struct GNUNET_TESTBED_HostRegistrationHandle
1621                                     *handle)
1622 {
1623   if (handle != handle->c->rh)
1624   {
1625     GNUNET_break (0);
1626     return;
1627   }
1628   handle->c->rh = NULL;
1629   GNUNET_free (handle);
1630 }
1631
1632
1633 /**
1634  * Initializes the operation queue for parallel overlay connects
1635  *
1636  * @param h the host handle
1637  * @param npoc the number of parallel overlay connects - the queue size
1638  */
1639 void
1640 GNUNET_TESTBED_set_num_parallel_overlay_connects_ (struct
1641                                                    GNUNET_TESTBED_Host *h,
1642                                                    unsigned int npoc)
1643 {
1644   //fprintf (stderr, "%d", npoc);
1645   GNUNET_free_non_null (h->tslots);
1646   h->tslots_filled = 0;
1647   h->num_parallel_connects = npoc;
1648   h->tslots = GNUNET_malloc (npoc * sizeof (struct TimeSlot));
1649   GNUNET_TESTBED_operation_queue_reset_max_active_
1650       (h->opq_parallel_overlay_connect_operations, npoc);
1651 }
1652
1653
1654 /**
1655  * Returns a timing slot which will be exclusively locked
1656  *
1657  * @param h the host handle
1658  * @param key a pointer which is associated to the returned slot; should not be
1659  *          NULL. It serves as a key to determine the correct owner of the slot
1660  * @return the time slot index in the array of time slots in the controller
1661  *           handle
1662  */
1663 unsigned int
1664 GNUNET_TESTBED_get_tslot_ (struct GNUNET_TESTBED_Host *h, void *key)
1665 {
1666   unsigned int slot;
1667
1668   GNUNET_assert (NULL != h->tslots);
1669   GNUNET_assert (NULL != key);
1670   for (slot = 0; slot < h->num_parallel_connects; slot++)
1671     if (NULL == h->tslots[slot].key)
1672     {
1673       h->tslots[slot].key = key;
1674       return slot;
1675     }
1676   GNUNET_assert (0);            /* We should always find a free tslot */
1677 }
1678
1679
1680 /**
1681  * Decides whether any change in the number of parallel overlay connects is
1682  * necessary to adapt to the load on the system
1683  *
1684  * @param h the host handle
1685  */
1686 static void
1687 decide_npoc (struct GNUNET_TESTBED_Host *h)
1688 {
1689   struct GNUNET_TIME_Relative avg;
1690   int sd;
1691   unsigned int slot;
1692   unsigned int nvals;
1693
1694   if (h->tslots_filled != h->num_parallel_connects)
1695     return;
1696   avg = GNUNET_TIME_UNIT_ZERO;
1697   nvals = 0;
1698   for (slot = 0; slot < h->num_parallel_connects; slot++)
1699   {
1700     avg = GNUNET_TIME_relative_add (avg, h->tslots[slot].time);
1701     nvals += h->tslots[slot].nvals;
1702   }
1703   GNUNET_assert (nvals >= h->num_parallel_connects);
1704   avg = GNUNET_TIME_relative_divide (avg, nvals);
1705   GNUNET_assert (GNUNET_TIME_UNIT_FOREVER_REL.rel_value != avg.rel_value);
1706   sd = GNUNET_TESTBED_SD_deviation_factor_ (h->poc_sd, (unsigned int) avg.rel_value);
1707   if ( (sd <= 5) ||
1708        (0 == GNUNET_CRYPTO_random_u32 (GNUNET_CRYPTO_QUALITY_WEAK,
1709                                        h->num_parallel_connects)) )
1710     GNUNET_TESTBED_SD_add_data_ (h->poc_sd, (unsigned int) avg.rel_value);
1711   if (GNUNET_SYSERR == sd)
1712   {
1713     GNUNET_TESTBED_set_num_parallel_overlay_connects_ (h,
1714                                                        h->num_parallel_connects);
1715     return;
1716   }
1717   GNUNET_assert (0 <= sd);
1718   if (0 == sd)
1719   {
1720     GNUNET_TESTBED_set_num_parallel_overlay_connects_ (h,
1721                                                        h->num_parallel_connects
1722                                                        * 2);
1723     return;
1724   }
1725   if (1 == sd)
1726   {
1727     GNUNET_TESTBED_set_num_parallel_overlay_connects_ (h,
1728                                                        h->num_parallel_connects
1729                                                        + 1);
1730     return;
1731   }
1732   if (1 == h->num_parallel_connects)
1733   {
1734     GNUNET_TESTBED_set_num_parallel_overlay_connects_ (h, 1);
1735     return;
1736   }
1737   if (2 == sd)
1738   {
1739     GNUNET_TESTBED_set_num_parallel_overlay_connects_ (h,
1740                                                        h->num_parallel_connects
1741                                                        - 1);
1742     return;
1743   }
1744   GNUNET_TESTBED_set_num_parallel_overlay_connects_ (h,
1745                                                      h->num_parallel_connects /
1746                                                      2);
1747 }
1748
1749
1750 /**
1751  * Releases a time slot thus making it available for be used again
1752  *
1753  * @param h the host handle
1754  * @param index the index of the the time slot
1755  * @param key the key to prove ownership of the timeslot
1756  * @return GNUNET_YES if the time slot is successfully removed; GNUNET_NO if the
1757  *           time slot cannot be removed - this could be because of the index
1758  *           greater than existing number of time slots or `key' being different
1759  */
1760 int
1761 GNUNET_TESTBED_release_time_slot_ (struct GNUNET_TESTBED_Host *h,
1762                                    unsigned int index, void *key)
1763 {
1764   struct TimeSlot *slot;
1765
1766   GNUNET_assert (NULL != key);
1767   if (index >= h->num_parallel_connects)
1768     return GNUNET_NO;
1769   slot = &h->tslots[index];
1770   if (key != slot->key)
1771     return GNUNET_NO;
1772   slot->key = NULL;
1773   return GNUNET_YES;
1774 }
1775
1776
1777 /**
1778  * Function to update a time slot
1779  *
1780  * @param h the host handle
1781  * @param index the index of the time slot to update
1782  * @param key the key to identify ownership of the slot
1783  * @param time the new time
1784  * @param failed should this reading be treated as coming from a fail event
1785  */
1786 void
1787 GNUNET_TESTBED_update_time_slot_ (struct GNUNET_TESTBED_Host *h,
1788                                   unsigned int index, void *key,
1789                                   struct GNUNET_TIME_Relative time, int failed)
1790 {
1791   struct TimeSlot *slot;
1792
1793   if (GNUNET_YES == failed)
1794   {
1795     if (1 == h->num_parallel_connects)
1796     {
1797       GNUNET_TESTBED_set_num_parallel_overlay_connects_ (h, 1);
1798       return;
1799     }
1800     GNUNET_TESTBED_set_num_parallel_overlay_connects_ (h,
1801                                                        h->num_parallel_connects
1802                                                        - 1);
1803   }
1804   if (GNUNET_NO == GNUNET_TESTBED_release_time_slot_ (h, index, key))
1805     return;
1806   slot = &h->tslots[index];
1807   slot->nvals++;
1808   if (GNUNET_TIME_UNIT_ZERO.rel_value == slot->time.rel_value)
1809   {
1810     slot->time = time;
1811     h->tslots_filled++;
1812     decide_npoc (h);
1813     return;
1814   }
1815   slot->time = GNUNET_TIME_relative_add (slot->time, time);
1816 }
1817
1818
1819 /**
1820  * Queues the given operation in the queue for parallel overlay connects of the
1821  * given host
1822  *
1823  * @param h the host handle
1824  * @param op the operation to queue in the given host's parally overlay connect
1825  *          queue 
1826  */
1827 void
1828 GNUNET_TESTBED_host_queue_oc_ (struct GNUNET_TESTBED_Host *h, 
1829                                struct GNUNET_TESTBED_Operation *op)
1830 {  
1831   GNUNET_TESTBED_operation_queue_insert_
1832       (h->opq_parallel_overlay_connect_operations, op);
1833 }
1834
1835
1836 /**
1837  * Handler for GNUNET_MESSAGE_TYPE_TESTBED_ADDHOSTCONFIRM message from
1838  * controller (testbed service)
1839  *
1840  * @param c the controller handler
1841  * @param msg message received
1842  * @return GNUNET_YES if we can continue receiving from service; GNUNET_NO if
1843  *           not
1844  */
1845 int
1846 GNUNET_TESTBED_host_handle_addhostconfirm_ (struct GNUNET_TESTBED_Controller *c,
1847                                             const struct
1848                                             GNUNET_TESTBED_HostConfirmedMessage
1849                                             *msg)
1850 {
1851   struct GNUNET_TESTBED_HostRegistrationHandle *rh;
1852   char *emsg;
1853   uint16_t msg_size;
1854
1855   rh = c->rh;
1856   if (NULL == rh)
1857   {
1858     return GNUNET_OK;
1859   }
1860   if (GNUNET_TESTBED_host_get_id_ (rh->host) != ntohl (msg->host_id))
1861   {
1862     LOG_DEBUG ("Mismatch in host id's %u, %u of host confirm msg\n",
1863                GNUNET_TESTBED_host_get_id_ (rh->host), ntohl (msg->host_id));
1864     return GNUNET_OK;
1865   }
1866   c->rh = NULL;
1867   msg_size = ntohs (msg->header.size);
1868   if (sizeof (struct GNUNET_TESTBED_HostConfirmedMessage) == msg_size)
1869   {
1870     LOG_DEBUG ("Host %u successfully registered\n", ntohl (msg->host_id));
1871     GNUNET_TESTBED_mark_host_registered_at_ (rh->host, c);
1872     rh->cc (rh->cc_cls, NULL);
1873     GNUNET_free (rh);
1874     return GNUNET_OK;
1875   }
1876   /* We have an error message */
1877   emsg = (char *) &msg[1];
1878   if ('\0' !=
1879       emsg[msg_size - sizeof (struct GNUNET_TESTBED_HostConfirmedMessage)])
1880   {
1881     GNUNET_break (0);
1882     GNUNET_free (rh);
1883     return GNUNET_NO;
1884   }
1885   LOG (GNUNET_ERROR_TYPE_ERROR, _("Adding host %u failed with error: %s\n"),
1886        ntohl (msg->host_id), emsg);
1887   rh->cc (rh->cc_cls, emsg);
1888   GNUNET_free (rh);
1889   return GNUNET_OK;
1890 }
1891
1892 /* end of testbed_api_hosts.c */