changes
[oweals/gnunet.git] / src / regex / gnunet-regex-profiler.c
1 /*
2      This file is part of GNUnet.
3      (C) 2011 - 2013 Christian Grothoff (and other contributing authors)
4
5      GNUnet is free software; you can redistribute it and/or modify
6      it under the terms of the GNU General Public License as published
7      by the Free Software Foundation; either version 3, or (at your
8      option) any later version.
9
10      GNUnet is distributed in the hope that it will be useful, but
11      WITHOUT ANY WARRANTY; without even the implied warranty of
12      MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13      General Public License for more details.
14
15      You should have received a copy of the GNU General Public License
16      along with GNUnet; see the file COPYING.  If not, write to the
17      Free Software Foundation, Inc., 59 Temple Place - Suite 330,
18      Boston, MA 02111-1307, USA.
19 */
20
21 /**
22  * @file regex/gnunet-regex-profiler.c
23  * @brief Regex profiler for testing distributed regex use.
24  * @author Bartlomiej Polot
25  * @author Maximilian Szengel
26  *
27  */
28
29 #include <string.h>
30
31 #include "platform.h"
32 #include "gnunet_applications.h"
33 #include "gnunet_util_lib.h"
34 #include "gnunet_regex_lib.h"
35 #include "gnunet_arm_service.h"
36 #include "gnunet_dht_service.h"
37 #include "gnunet_testbed_service.h"
38
39 #define FIND_TIMEOUT \
40         GNUNET_TIME_relative_multiply(GNUNET_TIME_UNIT_SECONDS, 90)
41
42 /**
43  * DLL of operations
44  */
45 struct DLLOperation
46 {
47   /**
48    * The testbed operation handle
49    */
50   struct GNUNET_TESTBED_Operation *op;
51
52   /**
53    * Closure
54    */
55   void *cls;
56
57   /**
58    * The next pointer for DLL
59    */
60   struct DLLOperation *next;
61
62   /**
63    * The prev pointer for DLL
64    */
65   struct DLLOperation *prev;
66 };
67
68
69 /**
70  * Available states during profiling
71  */
72 enum State
73 {
74   /**
75    * Initial state
76    */
77   STATE_INIT = 0,
78
79   /**
80    * Starting slaves
81    */
82   STATE_SLAVES_STARTING,
83
84   /**
85    * Creating peers
86    */
87   STATE_PEERS_CREATING,
88
89   /**
90    * Starting peers
91    */
92   STATE_PEERS_STARTING,
93
94   /**
95    * Linking peers
96    */
97   STATE_PEERS_LINKING,
98
99   /**
100    * Matching strings against announced regexes
101    */
102   STATE_SEARCH_REGEX,
103
104   /**
105    * Destroying peers; we can do this as the controller takes care of stopping a
106    * peer if it is running
107    */
108   STATE_PEERS_DESTROYING
109 };
110
111
112 /**
113  * Peer handles.
114  */
115 struct RegexPeer
116 {
117   /**
118    * Peer id.
119    */
120   unsigned int id;
121
122   /**
123    * Peer configuration handle.
124    */
125   struct GNUNET_CONFIGURATION_Handle *cfg;
126
127   /**
128    * The actual testbed peer handle.
129    */
130   struct GNUNET_TESTBED_Peer *peer_handle;
131
132   /**
133    * Peer's search string.
134    */
135   const char *search_str;
136
137   /**
138    * Set to GNUNET_YES if the peer successfully matched the above
139    * search string. GNUNET_NO if the string could not be matched
140    * during the profiler run. GNUNET_SYSERR if the string matching
141    * timed out. Undefined if search_str is NULL
142    */
143   int search_str_matched;
144
145   /**
146    * Peer's DHT handle.
147    */
148   struct GNUNET_DHT_Handle *dht_handle;
149
150   /**
151    * Handle to a running regex search.
152    */
153    struct GNUNET_REGEX_search_handle *search_handle;
154
155   /**
156    * Testbed operation handle for DHT.
157    */
158   struct GNUNET_TESTBED_Operation *op_handle;
159
160   /**
161    * Peers's statistics handle.
162    */
163   struct GNUNET_STATISTICS_Handle *stats_handle;
164
165   /**
166    * The starting time of a profiling step.
167    */
168   struct GNUNET_TIME_Absolute prof_start_time;
169
170   /**
171    * Operation timeout
172    */
173   GNUNET_SCHEDULER_TaskIdentifier timeout;
174
175   /**
176    * Deamon start
177    */
178   struct GNUNET_TESTBED_Operation *daemon_op;
179 };
180
181 /**
182  * Set when shutting down to avoid making more queries.
183  */
184 static int in_shutdown;
185
186 /**
187  * The array of peers; we fill this as the peers are given to us by the testbed
188  */
189 static struct RegexPeer *peers;
190
191 /**
192  * Host registration handle
193  */
194 static struct GNUNET_TESTBED_HostRegistrationHandle *reg_handle;
195
196 /**
197  * Handle to the master controller process
198  */
199 static struct GNUNET_TESTBED_ControllerProc *mc_proc;
200
201 /**
202  * Handle to the master controller
203  */
204 static struct GNUNET_TESTBED_Controller *mc;
205
206 /**
207  * Handle to global configuration
208  */
209 static struct GNUNET_CONFIGURATION_Handle *cfg;
210
211 /**
212  * Abort task identifier
213  */
214 static GNUNET_SCHEDULER_TaskIdentifier abort_task;
215
216 /**
217  * Shutdown task identifier
218  */
219 static GNUNET_SCHEDULER_TaskIdentifier shutdown_task;
220
221 /**
222  * Host registration task identifier
223  */
224 static GNUNET_SCHEDULER_TaskIdentifier register_hosts_task;
225
226 /**
227  * Global event mask for all testbed events
228  */
229 static uint64_t event_mask;
230
231 /**
232  * The starting time of a profiling step
233  */
234 static struct GNUNET_TIME_Absolute prof_start_time;
235
236 /**
237  * Duration profiling step has taken
238  */
239 static struct GNUNET_TIME_Relative prof_time;
240
241 /**
242  * Number of peers to be started by the profiler
243  */
244 static unsigned int num_peers;
245
246 /**
247  * Global testing status
248  */
249 static int result;
250
251 /**
252  * current state of profiling
253  */
254 enum State state;
255
256 /**
257  * Folder where policy files are stored.
258  */
259 static char * policy_dir;
260
261 /**
262  * File with hostnames where to execute the test.
263  */
264 static char *hosts_file;
265
266 /**
267  * File with the strings to look for.
268  */
269 static char *strings_file;
270
271 /**
272  * Search strings (num_peers of them).
273  */
274 static char **search_strings;
275
276 /**
277  * How many searches are we going to start in parallel
278  */
279 static long long unsigned int init_parallel_searches;
280
281 /**
282  * How many searches are running in parallel
283  */
284 static unsigned int parallel_searches;
285
286 /**
287  * Number of strings found in the published regexes.
288  */
289 static unsigned int strings_found;
290
291 /**
292  * Index of peer to start next announce/search.
293  */
294 static unsigned int next_search;
295
296 /**
297  * Search timeout task identifier.
298  */
299 static GNUNET_SCHEDULER_TaskIdentifier search_timeout_task;
300
301 /**
302  * Search timeout in seconds.
303  */
304 static struct GNUNET_TIME_Relative search_timeout_time = { 60000 };
305
306 /**
307  * File to log statistics to.
308  */
309 static struct GNUNET_DISK_FileHandle *data_file;
310
311 /**
312  * Filename to log statistics to.
313  */
314 static char *data_filename;
315
316 /**
317  * Prefix used for regex announcing. We need to prefix the search
318  * strings with it, in order to find something.
319  */
320 static char * regex_prefix;
321
322 /**
323  * What's the maximum regex reannounce period.
324  */
325 static struct GNUNET_TIME_Relative reannounce_period_max;
326
327
328 /******************************************************************************/
329 /******************************  DECLARATIONS  ********************************/
330 /******************************************************************************/
331
332 /**
333  * DHT connect callback.
334  *
335  * @param cls internal peer id.
336  * @param op operation handle.
337  * @param ca_result connect adapter result.
338  * @param emsg error message.
339  */
340 static void
341 dht_connect_cb (void *cls, struct GNUNET_TESTBED_Operation *op,
342                 void *ca_result, const char *emsg);
343
344 /**
345  * DHT connect adapter.
346  *
347  * @param cls not used.
348  * @param cfg configuration handle.
349  *
350  * @return
351  */
352 static void *
353 dht_ca (void *cls, const struct GNUNET_CONFIGURATION_Handle *cfg);
354
355
356 /**
357  * Adapter function called to destroy a connection to
358  * the DHT service
359  *
360  * @param cls closure
361  * @param op_result service handle returned from the connect adapter
362  */
363 static void
364 dht_da (void *cls, void *op_result);
365
366
367 /**
368  * Function called by testbed once we are connected to stats
369  * service. Get the statistics for the services of interest.
370  *
371  * @param cls the 'struct RegexPeer' for which we connected to stats
372  * @param op connect operation handle
373  * @param ca_result handle to stats service
374  * @param emsg error message on failure
375  */
376 static void
377 stats_connect_cb (void *cls,
378                   struct GNUNET_TESTBED_Operation *op,
379                   void *ca_result,
380                   const char *emsg);
381
382
383 /**
384  * Start announcing the next regex in the DHT.
385  *
386  * @param cls Index of the next peer in the peers array.
387  * @param tc TaskContext.
388  */
389 static void
390 announce_next_regex (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc);
391
392
393 /******************************************************************************/
394 /********************************  SHUTDOWN  **********************************/
395 /******************************************************************************/
396
397
398 /**
399  * Shutdown nicely
400  *
401  * @param cls NULL
402  * @param tc the task context
403  */
404 static void
405 do_shutdown (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
406 {
407   struct RegexPeer *peer;
408   unsigned int peer_cnt;
409   unsigned int search_str_cnt;
410   char output_buffer[512];
411   size_t size;
412
413   shutdown_task = GNUNET_SCHEDULER_NO_TASK;
414   if (GNUNET_SCHEDULER_NO_TASK != abort_task)
415     GNUNET_SCHEDULER_cancel (abort_task);
416   if (GNUNET_SCHEDULER_NO_TASK != register_hosts_task)
417     GNUNET_SCHEDULER_cancel (register_hosts_task);
418
419   for (peer_cnt = 0; peer_cnt < num_peers; peer_cnt++)
420   {
421     peer = &peers[peer_cnt];
422
423     if (GNUNET_YES != peer->search_str_matched && NULL != data_file)
424     {
425       prof_time = GNUNET_TIME_absolute_get_duration (peer->prof_start_time);
426       size =
427         GNUNET_snprintf (output_buffer,
428                          sizeof (output_buffer),
429                          "%p Search string not found: %s (%d)\n"
430                          "%p On peer: %u (%p)\n"
431                          "%p After: %s\n",
432                          peer, peer->search_str, peer->search_str_matched,
433                          peer, peer->id, peer,
434                          peer,
435                          GNUNET_STRINGS_relative_time_to_string (prof_time,
436                                                                  GNUNET_NO));
437       if (size != GNUNET_DISK_file_write (data_file, output_buffer, size))
438         GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Unable to write to file!\n");
439     }
440
441     if (NULL != peers[peer_cnt].op_handle)
442       GNUNET_TESTBED_operation_done (peers[peer_cnt].op_handle);
443   }
444
445   if (NULL != data_file)
446     GNUNET_DISK_file_close (data_file);
447
448   for (search_str_cnt = 0;
449        search_str_cnt < num_peers && NULL != search_strings;
450        search_str_cnt++)
451   {
452     GNUNET_free_non_null (search_strings[search_str_cnt]);
453   }
454   GNUNET_free_non_null (search_strings);
455
456   if (NULL != reg_handle)
457     GNUNET_TESTBED_cancel_registration (reg_handle);
458
459   if (NULL != mc)
460     GNUNET_TESTBED_controller_disconnect (mc);
461   if (NULL != mc_proc)
462     GNUNET_TESTBED_controller_stop (mc_proc);
463   if (NULL != cfg)
464     GNUNET_CONFIGURATION_destroy (cfg);
465
466   GNUNET_SCHEDULER_shutdown (); /* Stop scheduler to shutdown testbed run */
467 }
468
469
470 /**
471  * abort task to run on test timed out
472  *
473  * @param cls NULL
474  * @param tc the task context
475  */
476 static void
477 do_abort (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
478 {
479   unsigned long i = (unsigned long) cls;
480
481   GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Aborting from line %lu...\n", i);
482   abort_task = GNUNET_SCHEDULER_NO_TASK;
483   result = GNUNET_SYSERR;
484   if (GNUNET_SCHEDULER_NO_TASK != shutdown_task)
485     GNUNET_SCHEDULER_cancel (shutdown_task);
486   shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
487 }
488
489
490 /******************************************************************************/
491 /*********************  STATISTICS SERVICE CONNECTIONS  ***********************/
492 /******************************************************************************/
493
494 /**
495  * Adapter function called to establish a connection to
496  * statistics service.
497  *
498  * @param cls closure
499  * @param cfg configuration of the peer to connect to; will be available until
500  *          GNUNET_TESTBED_operation_done() is called on the operation returned
501  *          from GNUNET_TESTBED_service_connect()
502  * @return service handle to return in 'op_result', NULL on error
503  */
504 static void *
505 stats_ca (void *cls, const struct GNUNET_CONFIGURATION_Handle *cfg)
506 {
507   return GNUNET_STATISTICS_create ("<driver>", cfg);
508 }
509
510
511 /**
512  * Adapter function called to destroy a connection to
513  * statistics service.
514  *
515  * @param cls closure
516  * @param op_result service handle returned from the connect adapter
517  */
518 static void
519 stats_da (void *cls, void *op_result)
520 {
521   struct RegexPeer *peer = cls;
522
523   GNUNET_assert (op_result == peer->stats_handle);
524
525   GNUNET_STATISTICS_destroy (peer->stats_handle, GNUNET_NO);
526   peer->stats_handle = NULL;
527 }
528
529
530 /**
531  * Process statistic values. Write all values to global 'data_file', if present.
532  *
533  * @param cls closure
534  * @param subsystem name of subsystem that created the statistic
535  * @param name the name of the datum
536  * @param value the current value
537  * @param is_persistent GNUNET_YES if the value is persistent, GNUNET_NO if not
538  * @return GNUNET_OK to continue, GNUNET_SYSERR to abort iteration
539  */
540 static int
541 stats_iterator (void *cls, const char *subsystem, const char *name,
542                 uint64_t value, int is_persistent)
543 {
544   struct RegexPeer *peer = cls;
545   char output_buffer[512];
546   size_t size;
547
548   if (NULL == data_file)
549   {
550     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
551                 "%p -> %s [%s]: %llu\n",
552                 peer, subsystem, name, value);
553     return GNUNET_OK;
554   }
555   size =
556     GNUNET_snprintf (output_buffer,
557                      sizeof (output_buffer),
558                      "%p [%s] %llu %s\n",
559                      peer,
560                      subsystem, value, name);
561   if (size != GNUNET_DISK_file_write (data_file, output_buffer, size))
562     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Unable to write to file!\n");
563
564   return GNUNET_OK;
565 }
566
567
568 /**
569  * Stats callback. Finish the stats testbed operation and when all stats have
570  * been iterated, shutdown the profiler.
571  *
572  * @param cls closure
573  * @param success GNUNET_OK if statistics were
574  *        successfully obtained, GNUNET_SYSERR if not.
575  */
576 static void
577 stats_cb (void *cls,
578           int success)
579 {
580   static unsigned int peer_cnt;
581   struct RegexPeer *peer = cls;
582
583   if (GNUNET_OK != success)
584   {
585     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
586                 "Getting statistics for peer %u failed!\n",
587                 peer->id);
588     return;
589   }
590
591   GNUNET_assert (NULL != peer->op_handle);
592
593   GNUNET_TESTBED_operation_done (peer->op_handle);
594   peer->op_handle = NULL;
595
596   peer_cnt++;
597   peer = &peers[peer_cnt];
598
599   if (peer_cnt == num_peers)
600   {
601     struct GNUNET_TIME_Relative delay = { 100 };
602     shutdown_task = GNUNET_SCHEDULER_add_delayed (delay, &do_shutdown, NULL);
603   }
604   else
605   {
606     peer->op_handle =
607       GNUNET_TESTBED_service_connect (NULL,
608                                       peer->peer_handle,
609                                       "statistics",
610                                       &stats_connect_cb,
611                                       peer,
612                                       &stats_ca,
613                                       &stats_da,
614                                       peer);
615   }
616 }
617
618
619 /**
620  * Function called by testbed once we are connected to stats
621  * service. Get the statistics for the services of interest.
622  *
623  * @param cls the 'struct RegexPeer' for which we connected to stats
624  * @param op connect operation handle
625  * @param ca_result handle to stats service
626  * @param emsg error message on failure
627  */
628 static void
629 stats_connect_cb (void *cls,
630                   struct GNUNET_TESTBED_Operation *op,
631                   void *ca_result,
632                   const char *emsg)
633 {
634   struct RegexPeer *peer = cls;
635
636   if (NULL == ca_result || NULL != emsg)
637   {
638     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
639                 "Failed to connect to statistics service on peer %u: %s\n",
640                 peer->id, emsg);
641
642     peer->stats_handle = NULL;
643     return;
644   }
645
646   peer->stats_handle = ca_result;
647
648   if (NULL == GNUNET_STATISTICS_get (peer->stats_handle, NULL, NULL,
649                                      GNUNET_TIME_UNIT_FOREVER_REL,
650                                      &stats_cb,
651                                      &stats_iterator, peer))
652   {
653     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
654                 "Could not get statistics of peer %u!\n", peer->id);
655   }
656 }
657
658
659 /**
660  * Task to collect all statistics from all peers, will shutdown the
661  * profiler, when done.
662  *
663  * @param cls NULL
664  * @param tc the task context
665  */
666 static void
667 do_collect_stats (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
668 {
669   struct RegexPeer *peer = &peers[0];
670
671   GNUNET_assert (NULL != peer->peer_handle);
672
673   peer->op_handle =
674     GNUNET_TESTBED_service_connect (NULL,
675                                     peer->peer_handle,
676                                     "statistics",
677                                     &stats_connect_cb,
678                                     peer,
679                                     &stats_ca,
680                                     &stats_da,
681                                     peer);
682 }
683
684
685 /******************************************************************************/
686 /************************   REGEX FIND CONNECTIONS   **************************/
687 /******************************************************************************/
688
689
690 /**
691  * Start searching for the next string in the DHT.
692  *
693  * @param cls Index of the next peer in the peers array.
694  * @param tc TaskContext.
695  */
696 static void
697 find_string (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc);
698
699
700 /**
701  * Method called when we've found a peer that announced a regex
702  * that matches our search string. Now get the statistics.
703  *
704  * @param cls Closure provided in GNUNET_REGEX_search.
705  * @param id Peer providing a regex that matches the string.
706  * @param get_path Path of the get request.
707  * @param get_path_length Lenght of get_path.
708  * @param put_path Path of the put request.
709  * @param put_path_length Length of the put_path.
710  */
711 static void
712 regex_found_handler (void *cls,
713                      const struct GNUNET_PeerIdentity *id,
714                      const struct GNUNET_PeerIdentity *get_path,
715                      unsigned int get_path_length,
716                      const struct GNUNET_PeerIdentity *put_path,
717                      unsigned int put_path_length)
718 {
719   struct RegexPeer *peer = cls;
720   char output_buffer[512];
721   size_t size;
722
723   if (GNUNET_YES == peer->search_str_matched)
724   {
725     GNUNET_log (GNUNET_ERROR_TYPE_ERROR, 
726                 "String %s on peer %u already matched!\n",
727                 peer->search_str, peer->id);
728     return;
729   }
730
731   strings_found++;
732   parallel_searches--;
733
734   if (GNUNET_SCHEDULER_NO_TASK != peer->timeout)
735   {
736     GNUNET_SCHEDULER_cancel (peer->timeout);
737     peer->timeout = GNUNET_SCHEDULER_NO_TASK;
738     if (GNUNET_NO == in_shutdown)
739       GNUNET_SCHEDULER_add_now (&announce_next_regex, NULL);
740   }
741
742   if (NULL == id)
743   {
744     // FIXME not possible right now
745     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
746                 "String matching timed out for string %s on peer %u (%i/%i)\n",
747                 peer->search_str, peer->id, strings_found, num_peers);
748     peer->search_str_matched = GNUNET_SYSERR;
749   }
750   else
751   {
752     prof_time = GNUNET_TIME_absolute_get_duration (peer->prof_start_time);
753
754     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
755                 "String %s found on peer %u after %s (%i/%i) (%u||)\n",
756                 peer->search_str, peer->id,
757                 GNUNET_STRINGS_relative_time_to_string (prof_time, GNUNET_NO),
758                 strings_found, num_peers, parallel_searches);
759
760     peer->search_str_matched = GNUNET_YES;
761
762     if (NULL != data_file)
763     {
764       size =
765         GNUNET_snprintf (output_buffer,
766                          sizeof (output_buffer),
767                          "%p Peer: %u\n"
768                          "%p Search string: %s\n"
769                          "%p Search duration: %s\n\n",
770                          peer, peer->id,
771                          peer, peer->search_str,
772                          peer,
773                          GNUNET_STRINGS_relative_time_to_string (prof_time,
774                                                                  GNUNET_NO));
775
776       if (size != GNUNET_DISK_file_write (data_file, output_buffer, size))
777         GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Unable to write to file!\n");
778     }
779   }
780
781   GNUNET_TESTBED_operation_done (peer->op_handle);
782   peer->op_handle = NULL;
783
784   if (strings_found == num_peers)
785   {
786     prof_time = GNUNET_TIME_absolute_get_duration (prof_start_time);
787     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
788                 "All strings successfully matched in %s\n",
789                 GNUNET_STRINGS_relative_time_to_string (prof_time, GNUNET_NO));
790
791     if (GNUNET_SCHEDULER_NO_TASK != search_timeout_task)
792     {
793       GNUNET_SCHEDULER_cancel (search_timeout_task);
794       search_timeout_task = GNUNET_SCHEDULER_NO_TASK;
795     }
796
797     GNUNET_log (GNUNET_ERROR_TYPE_INFO, "Collecting stats and shutting down.\n");
798     GNUNET_SCHEDULER_add_now (&do_collect_stats, NULL);
799   }
800 }
801
802
803 /**
804  * Connect by string timeout task. This will cancel the profiler after the
805  * specified timeout 'search_timeout'.
806  *
807  * @param cls NULL
808  * @param tc the task context
809  */
810 static void
811 search_timed_out (void *cls, const struct GNUNET_SCHEDULER_TaskContext * tc)
812 {
813   unsigned int i;
814
815   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
816               "Finding matches to all strings did not succeed after %s.\n",
817               GNUNET_STRINGS_relative_time_to_string (search_timeout_time,
818                                                       GNUNET_NO));
819   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
820               "Found %i of %i strings\n", strings_found, num_peers);
821
822   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
823               "Search timed out after %s."
824               "Collecting stats and shutting down.\n", 
825               GNUNET_STRINGS_relative_time_to_string (search_timeout_time,
826                                                       GNUNET_NO));
827
828   in_shutdown = GNUNET_YES;
829   for (i = 0; i < num_peers; i++)
830   {
831     if (NULL != peers[i].op_handle)
832     {
833       GNUNET_TESTBED_operation_done (peers[i].op_handle);
834       peers[i].op_handle = NULL;
835     }
836   }
837   GNUNET_SCHEDULER_add_now (&do_collect_stats, NULL);
838 }
839
840
841 /**
842  * Search timed out. It might still complete in the future,
843  * but we should start another one.
844  *
845  * @param cls Index of the next peer in the peers array.
846  * @param tc TaskContext.
847  */
848 static void
849 find_timed_out (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
850 {
851   struct RegexPeer *p = cls;
852
853   p->timeout = GNUNET_SCHEDULER_NO_TASK;
854
855   if ((tc->reason & GNUNET_SCHEDULER_REASON_SHUTDOWN) != 0)
856     return;
857   GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
858               "Searching for string \"%s\" on peer %d timed out.\n",
859               p->search_str,
860               p->id);
861   if (GNUNET_NO == in_shutdown)
862     GNUNET_SCHEDULER_add_now (&announce_next_regex, NULL);
863 }
864
865
866 /**
867  * Start searching for a string in the DHT.
868  *
869  * @param cls Index of the next peer in the peers array.
870  * @param tc TaskContext.
871  */
872 static void
873 find_string (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
874 {
875   unsigned int search_peer = (unsigned int) (long) cls;
876
877   if (0 != (tc->reason & GNUNET_SCHEDULER_REASON_SHUTDOWN) ||
878       search_peer >= num_peers ||
879       GNUNET_YES == in_shutdown)
880     return;
881
882   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
883               "Searching for string \"%s\" on peer %d (%u||)\n",
884               peers[search_peer].search_str,
885               search_peer,
886               parallel_searches);
887
888   peers[search_peer].op_handle =
889     GNUNET_TESTBED_service_connect (NULL,
890                                     peers[search_peer].peer_handle,
891                                     "dht",
892                                     &dht_connect_cb,
893                                     &peers[search_peer],
894                                     &dht_ca,
895                                     &dht_da,
896                                     &peers[search_peer]);
897   GNUNET_assert (NULL != peers[search_peer].op_handle);
898   peers[search_peer].timeout = GNUNET_SCHEDULER_add_delayed (FIND_TIMEOUT,
899                                                           &find_timed_out,
900                                                           &peers[search_peer]);
901 }
902
903
904
905
906 /**
907  * Callback called when testbed has started the daemon we asked for.
908  *
909  * @param cls NULL
910  * @param op the operation handle
911  * @param emsg NULL on success; otherwise an error description
912  */
913 static void
914 daemon_started (void *cls, struct GNUNET_TESTBED_Operation *op,
915                 const char *emsg)
916 {
917   struct RegexPeer *peer = (struct RegexPeer *) cls;
918   unsigned long search_peer;
919   unsigned int i;
920
921   GNUNET_TESTBED_operation_done (peer->daemon_op);
922   peer->daemon_op = NULL;
923   if (NULL != emsg)
924   {
925     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
926                 "Failed to start/stop daemon at peer %u: %s\n", peer->id, emsg);
927     GNUNET_abort ();
928   }
929
930   /* Find a peer to look for a string matching the regex announced */
931   search_peer = GNUNET_CRYPTO_random_u32 (GNUNET_CRYPTO_QUALITY_WEAK,
932                                           num_peers);
933   for (i = 0; peers[search_peer].search_str != NULL; i++)
934   {
935     search_peer = (search_peer + 1) % num_peers;
936     if (i > num_peers)
937       GNUNET_abort (); /* we ran out of peers, must be a bug */
938   }
939   peers[search_peer].search_str = search_strings[peer->id];
940   peers[search_peer].search_str_matched = GNUNET_NO;
941   GNUNET_SCHEDULER_add_delayed (GNUNET_TIME_relative_multiply(
942                                   reannounce_period_max,
943                                   2),
944                                 &find_string,
945                                 (void *) search_peer);
946 }
947
948
949 /**
950  * Task to start the daemons on each peer so that the regexes are announced
951  * into the DHT.
952  *
953  * @param cls NULL
954  * @param tc the task context
955  */
956 static void
957 do_announce (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
958 {
959   unsigned int i;
960
961   GNUNET_log (GNUNET_ERROR_TYPE_INFO, "Starting announce.\n");
962
963   for (i = 0; i < init_parallel_searches; i++)
964   {
965     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
966                 "  scheduling announce %u\n",
967                 i);
968     (void) GNUNET_SCHEDULER_add_now (&announce_next_regex, NULL);
969   }
970 }
971
972
973 /**
974  * Start announcing the next regex in the DHT.
975  *
976  * @param cls Closure (unused).
977  * @param tc TaskContext.
978  */
979 static void
980 announce_next_regex (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
981 {
982   struct RegexPeer *peer;
983
984   if (0 != (tc->reason & GNUNET_SCHEDULER_REASON_SHUTDOWN))
985     return;
986   if (next_search >= num_peers)
987   {
988     if (strings_found != num_peers)
989     {
990       if (GNUNET_SCHEDULER_NO_TASK != search_timeout_task)
991         GNUNET_SCHEDULER_cancel (search_timeout_task);
992       search_timeout_task = GNUNET_SCHEDULER_add_delayed (GNUNET_TIME_UNIT_HOURS,
993                                                           &search_timed_out,
994                                                           NULL);
995     }
996     return;
997   }
998
999   GNUNET_log (GNUNET_ERROR_TYPE_INFO, "Starting daemon %u\n", next_search);
1000   peer = &peers[next_search];
1001   peer->daemon_op = 
1002   GNUNET_TESTBED_peer_manage_service (NULL,
1003                                       peer->peer_handle,
1004                                       "regexprofiler",
1005                                       &daemon_started,
1006                                       peer,
1007                                       1);
1008   next_search++;
1009   parallel_searches++;
1010 }
1011
1012 /**
1013  * DHT connect callback. Called when we are connected to the dht service for
1014  * the peer in 'cls'. If successfull we connect to the stats service of this
1015  * peer and then try to match the search string of this peer.
1016  *
1017  * @param cls internal peer id.
1018  * @param op operation handle.
1019  * @param ca_result connect adapter result.
1020  * @param emsg error message.
1021  */
1022 static void
1023 dht_connect_cb (void *cls, struct GNUNET_TESTBED_Operation *op,
1024                 void *ca_result, const char *emsg)
1025 {
1026   struct RegexPeer *peer = (struct RegexPeer *) cls;
1027
1028   if (NULL != emsg || NULL == op || NULL == ca_result)
1029   {
1030     GNUNET_log (GNUNET_ERROR_TYPE_ERROR, "DHT connect failed: %s\n", emsg);
1031     GNUNET_abort ();
1032   }
1033
1034   GNUNET_assert (NULL != peer->dht_handle);
1035   GNUNET_assert (peer->op_handle == op);
1036   GNUNET_assert (peer->dht_handle == ca_result);
1037
1038   peer->search_str_matched = GNUNET_NO;
1039   peer->search_handle = GNUNET_REGEX_search (peer->dht_handle,
1040                                              peer->search_str,
1041                                              &regex_found_handler, peer,
1042                                              NULL);
1043   peer->prof_start_time = GNUNET_TIME_absolute_get ();
1044 }
1045
1046
1047 /**
1048  * DHT connect adapter. Opens a connection to the dht service.
1049  *
1050  * @param cls Closure (peer).
1051  * @param cfg Configuration handle.
1052  *
1053  * @return
1054  */
1055 static void *
1056 dht_ca (void *cls, const struct GNUNET_CONFIGURATION_Handle *cfg)
1057 {
1058   struct RegexPeer *peer = cls;
1059
1060   peer->dht_handle = GNUNET_DHT_connect (cfg, 32);
1061
1062   return peer->dht_handle;
1063 }
1064
1065
1066 /**
1067  * Adapter function called to destroy a connection to the dht service.
1068  *
1069  * @param cls Closure (peer).
1070  * @param op_result Service handle returned from the connect adapter.
1071  */
1072 static void
1073 dht_da (void *cls, void *op_result)
1074 {
1075   struct RegexPeer *peer = (struct RegexPeer *) cls;
1076
1077   GNUNET_assert (peer->dht_handle == op_result);
1078
1079   if (NULL != peer->search_handle)
1080   {
1081     GNUNET_REGEX_search_cancel (peer->search_handle);
1082     peer->search_handle = NULL;
1083   }
1084
1085   if (NULL != peer->dht_handle)
1086   {
1087     GNUNET_DHT_disconnect (peer->dht_handle);
1088     peer->dht_handle = NULL;
1089   }
1090 }
1091
1092
1093 /**
1094  * Signature of a main function for a testcase.
1095  *
1096  * @param cls NULL
1097  * @param num_peers_ number of peers in 'peers'
1098  * @param peers handle to peers run in the testbed.  NULL upon timeout (see
1099  *          GNUNET_TESTBED_test_run()).
1100  * @param links_succeeded the number of overlay link connection attempts that
1101  *          succeeded
1102  * @param links_failed the number of overlay link connection attempts that
1103  *          failed
1104  */
1105 static void 
1106 test_master (void *cls,
1107              unsigned int num_peers_,
1108              struct GNUNET_TESTBED_Peer **testbed_peers,
1109              unsigned int links_succeeded,
1110              unsigned int links_failed)
1111 {
1112   unsigned int i;
1113
1114   GNUNET_assert (num_peers_ == num_peers);
1115
1116   prof_time = GNUNET_TIME_absolute_get_duration (prof_start_time);
1117   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
1118               "Testbed started in %s\n",
1119               GNUNET_STRINGS_relative_time_to_string (prof_time, GNUNET_NO));
1120
1121   if (GNUNET_SCHEDULER_NO_TASK != abort_task)
1122   {
1123     GNUNET_SCHEDULER_cancel (abort_task);
1124     abort_task = GNUNET_SCHEDULER_NO_TASK;
1125   }
1126
1127   for (i = 0; i < num_peers; i++)
1128   {
1129     peers[i].peer_handle = testbed_peers[i];
1130   }
1131   if (GNUNET_NO ==
1132       GNUNET_CONFIGURATION_get_value_yesno (cfg, "DHT", "DISABLE_TRY_CONNECT"))
1133   {
1134     struct GNUNET_TIME_Relative settle_time;
1135
1136     settle_time =
1137       GNUNET_TIME_relative_multiply (GNUNET_TIME_UNIT_MILLISECONDS,
1138                                      10 * num_peers);
1139     GNUNET_log (GNUNET_ERROR_TYPE_INFO, 
1140                 "Waiting for DHT for %s to settle new connections.\n\n",
1141                 GNUNET_STRINGS_relative_time_to_string(settle_time, GNUNET_NO));
1142     GNUNET_SCHEDULER_add_delayed (settle_time, &do_announce, NULL);
1143   }
1144   else
1145   {
1146     GNUNET_SCHEDULER_add_now (&do_announce, NULL);
1147   }
1148   search_timeout_task =
1149       GNUNET_SCHEDULER_add_delayed (search_timeout_time, &search_timed_out, NULL);
1150 }
1151
1152 /**
1153  * Function that will be called whenever something in the testbed changes.
1154  *
1155  * @param cls closure, NULL
1156  * @param event information on what is happening
1157  */
1158 static void
1159 master_controller_cb (void *cls, 
1160                       const struct GNUNET_TESTBED_EventInformation *event)
1161 {
1162   switch (event->type)
1163   {
1164   case GNUNET_TESTBED_ET_CONNECT:
1165     printf(".");
1166     break;
1167   case GNUNET_TESTBED_ET_PEER_START:
1168     printf("#");
1169     break;
1170   default:
1171     break;
1172   }
1173   fflush(stdout);
1174 }
1175
1176
1177 /******************************************************************************/
1178 /***************************  TESTBED PEER SETUP  *****************************/
1179 /******************************************************************************/
1180
1181
1182 /**
1183  * Load search strings from given filename. One search string per line.
1184  *
1185  * @param filename filename of the file containing the search strings.
1186  * @param strings set of strings loaded from file. Caller needs to free this
1187  *                if number returned is greater than zero.
1188  * @param limit upper limit on the number of strings read from the file
1189  * @return number of strings found in the file. GNUNET_SYSERR on error.
1190  */
1191 static int
1192 load_search_strings (const char *filename, char ***strings, unsigned int limit)
1193 {
1194   char *data;
1195   char *buf;
1196   uint64_t filesize;
1197   unsigned int offset;
1198   int str_cnt;
1199   unsigned int i;
1200
1201   if (NULL == filename)
1202   {
1203     return GNUNET_SYSERR;
1204   }
1205
1206   if (GNUNET_YES != GNUNET_DISK_file_test (filename))
1207   {
1208     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
1209                 "Could not find search strings file %s\n", filename);
1210     return GNUNET_SYSERR;
1211   }
1212   if (GNUNET_OK != GNUNET_DISK_file_size (filename, &filesize, GNUNET_YES, GNUNET_YES))
1213     filesize = 0;
1214   if (0 == filesize)
1215   {
1216     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Search strings file %s is empty.\n", filename);
1217     return GNUNET_SYSERR;
1218   }
1219   data = GNUNET_malloc (filesize);
1220   if (filesize != GNUNET_DISK_fn_read (filename, data, filesize))
1221   {
1222     GNUNET_free (data);
1223     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Could not read search strings file %s.\n",
1224          filename);
1225     return GNUNET_SYSERR;
1226   }
1227   buf = data;
1228   offset = 0;
1229   str_cnt = 0;
1230   while (offset < (filesize - 1) && str_cnt < limit)
1231   {
1232     offset++;
1233     if (((data[offset] == '\n')) && (buf != &data[offset]))
1234     {
1235       data[offset] = '\0';
1236       str_cnt++;
1237       buf = &data[offset + 1];
1238     }
1239     else if ((data[offset] == '\n') || (data[offset] == '\0'))
1240       buf = &data[offset + 1];
1241   }
1242   *strings = GNUNET_malloc (sizeof (char *) * str_cnt);
1243   offset = 0;
1244   for (i = 0; i < str_cnt; i++)
1245   {
1246     GNUNET_asprintf (&(*strings)[i], "%s%s", regex_prefix, &data[offset]);
1247     offset += strlen (&data[offset]) + 1;
1248   }
1249   GNUNET_free (data);
1250   return str_cnt;
1251 }
1252
1253
1254 /**
1255  * Main function that will be run by the scheduler.
1256  *
1257  * @param cls closure
1258  * @param args remaining command-line arguments
1259  * @param cfgfile name of the configuration file used (for saving, can be NULL!)
1260  * @param config configuration
1261  */
1262 static void
1263 run (void *cls, char *const *args, const char *cfgfile,
1264      const struct GNUNET_CONFIGURATION_Handle *config)
1265 {
1266   unsigned int nsearchstrs;
1267   unsigned int i;
1268   struct GNUNET_TIME_Relative abort_time;
1269
1270   in_shutdown = GNUNET_NO;
1271
1272   /* Check config */
1273   if (NULL == config)
1274   {
1275     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1276                 _("No configuration file given. Exiting\n"));
1277     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1278     return;
1279   }
1280   cfg = GNUNET_CONFIGURATION_dup (config);
1281   if (GNUNET_OK !=
1282       GNUNET_CONFIGURATION_get_value_string (cfg, "REGEXPROFILER",
1283                                              "REGEX_PREFIX",
1284                                              &regex_prefix))
1285   {
1286     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1287                 _("Configuration option \"regex_prefix\" missing. Exiting\n"));
1288     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1289     return;
1290   }
1291   if (GNUNET_OK !=
1292       GNUNET_CONFIGURATION_get_value_number (cfg, "REGEXPROFILER",
1293                                              "PARALLEL_SEARCHES",
1294                                              &init_parallel_searches))
1295   {
1296     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
1297                 "Configuration option \"PARALLEL_SEARCHES\" missing."
1298                 " Using default (%d)\n", 10);
1299     init_parallel_searches = 10;
1300   }
1301   if (GNUNET_OK !=
1302       GNUNET_CONFIGURATION_get_value_time (cfg, "REGEXPROFILER",
1303                                            "REANNOUNCE_PERIOD_MAX",
1304                                            &reannounce_period_max))
1305   {
1306     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, 
1307                 "reannounce_period_max not given. Using 10 minutes.\n");
1308     reannounce_period_max =
1309       GNUNET_TIME_relative_multiply (GNUNET_TIME_UNIT_MINUTES, 10);
1310   }
1311
1312   /* Check arguments */
1313   if (NULL == policy_dir)
1314   {
1315     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1316                 _("No policy directory specified on command line. Exiting.\n"));
1317     return;
1318   }
1319   if (GNUNET_YES != GNUNET_DISK_directory_test (policy_dir, GNUNET_YES))
1320   {
1321     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1322                 _("Specified policies directory does not exist. Exiting.\n"));
1323     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1324     return;
1325   }
1326   if (-1 == (num_peers = GNUNET_DISK_directory_scan (policy_dir, NULL, NULL)))
1327   {
1328     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1329                 _("No files found in `%s'\n"),
1330                 policy_dir);
1331     return;
1332   }
1333   GNUNET_CONFIGURATION_set_value_string (cfg, "REGEXPROFILER",
1334                                          "POLICY_DIR", policy_dir);
1335   if (GNUNET_YES != GNUNET_DISK_file_test (strings_file))
1336   {
1337     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1338                 _("No search strings file given. Exiting.\n"));
1339     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1340     return;
1341   }
1342   nsearchstrs = load_search_strings (strings_file,
1343                                      &search_strings,
1344                                      num_peers);
1345   if (num_peers != nsearchstrs)
1346   {
1347     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1348                 "Error loading search strings.\n");
1349     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1350                 "File (%s) does not contain enough strings (%u/%u).\n",
1351                 strings_file, nsearchstrs, num_peers);
1352     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1353     return;
1354   }
1355   if (0 >= num_peers || NULL == search_strings)
1356   {
1357     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1358                 _("Error loading search strings. Exiting.\n"));
1359     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1360     return;
1361   }
1362   for (i = 0; i < num_peers; i++)
1363     GNUNET_log (GNUNET_ERROR_TYPE_DEBUG,
1364                 "search string: %s\n",
1365                 search_strings[i]);
1366
1367   /* Check logfile */
1368   if ( (NULL != data_filename) &&
1369        (NULL == (data_file =
1370                  GNUNET_DISK_file_open (data_filename,
1371                                         GNUNET_DISK_OPEN_READWRITE |
1372                                         GNUNET_DISK_OPEN_TRUNCATE |
1373                                         GNUNET_DISK_OPEN_CREATE,
1374                                         GNUNET_DISK_PERM_USER_READ |
1375                                         GNUNET_DISK_PERM_USER_WRITE))) )
1376   {
1377     GNUNET_log_strerror_file (GNUNET_ERROR_TYPE_ERROR,
1378                               "open",
1379                               data_filename);
1380     return;
1381   }
1382
1383   /* Initialize peers */
1384   peers = GNUNET_malloc (sizeof (struct RegexPeer) * num_peers);
1385   for (i = 0; i < num_peers; i++)
1386   {
1387     peers[i].id = i;
1388   }
1389
1390   GNUNET_CONFIGURATION_set_value_number (cfg,
1391                                          "TESTBED", "OVERLAY_RANDOM_LINKS",
1392                                          num_peers * 20);
1393   GNUNET_CONFIGURATION_set_value_number (cfg,
1394                                          "DHT", "FORCE_NSE",
1395                                          (long long unsigned) log2 (num_peers));
1396   event_mask = 0LL;
1397 /* For feedback about the start process activate these and pass master_cb */
1398   event_mask |= (1LL << GNUNET_TESTBED_ET_PEER_START);
1399 //   event_mask |= (1LL << GNUNET_TESTBED_ET_PEER_STOP);
1400   event_mask |= (1LL << GNUNET_TESTBED_ET_CONNECT);
1401 //   event_mask |= (1LL << GNUNET_TESTBED_ET_DISCONNECT);
1402   prof_start_time = GNUNET_TIME_absolute_get ();
1403   GNUNET_TESTBED_run (hosts_file,
1404                       cfg,
1405                       num_peers,
1406                       event_mask,
1407                       &master_controller_cb,
1408                       NULL,     /* master_controller_cb cls */
1409                       &test_master,
1410                       NULL);    /* test_master cls */
1411   if (GNUNET_OK !=
1412       GNUNET_CONFIGURATION_get_value_time (cfg, "TESTBED",
1413                                            "SETUP_TIMEOUT",
1414                                            &abort_time))
1415   {
1416     abort_time =
1417       GNUNET_TIME_relative_multiply (GNUNET_TIME_UNIT_MINUTES, 15);
1418   }
1419   abort_time = GNUNET_TIME_relative_add (abort_time, GNUNET_TIME_UNIT_MINUTES);
1420   abort_task =
1421       GNUNET_SCHEDULER_add_delayed (abort_time,
1422                                     &do_abort,
1423                                     (void*) __LINE__);
1424 }
1425
1426
1427 /**
1428  * Main function.
1429  *
1430  * @param argc argument count
1431  * @param argv argument values
1432  * @return 0 on success
1433  */
1434 int
1435 main (int argc, char *const *argv)
1436 {
1437   static const struct GNUNET_GETOPT_CommandLineOption options[] = {
1438     {'o', "output-file", "FILENAME",
1439      gettext_noop ("name of the file for writing statistics"),
1440      GNUNET_YES, &GNUNET_GETOPT_set_string, &data_filename},
1441     {'t', "matching-timeout", "TIMEOUT",
1442       gettext_noop ("wait TIMEOUT before ending the experiment"),
1443       GNUNET_YES, &GNUNET_GETOPT_set_relative_time, &search_timeout_time},
1444     {'p', "policy-dir", "DIRECTORY",
1445       gettext_noop ("directory with policy files"),
1446       GNUNET_YES, &GNUNET_GETOPT_set_filename, &policy_dir},
1447     {'s', "strings-file", "FILENAME",
1448       gettext_noop ("name of file with input strings"),
1449       GNUNET_YES, &GNUNET_GETOPT_set_filename, &strings_file},
1450     {'H', "hosts-file", "FILENAME",
1451       gettext_noop ("name of file with hosts' names"),
1452       GNUNET_YES, &GNUNET_GETOPT_set_filename, &hosts_file},
1453     GNUNET_GETOPT_OPTION_END
1454   };
1455   int ret;
1456
1457   if (GNUNET_OK != GNUNET_STRINGS_get_utf8_args (argc, argv, &argc, &argv))
1458     return 2;
1459   result = GNUNET_SYSERR;
1460   ret =
1461       GNUNET_PROGRAM_run (argc, argv,
1462                           "gnunet-regex-profiler",
1463                           _("Profiler for regex"),
1464                           options, &run, NULL);
1465   if (GNUNET_OK != ret)
1466     return ret;
1467   if (GNUNET_OK != result)
1468     return 1;
1469   return 0;
1470 }