- distribute peers equally among island nodes on SuperMUC
[oweals/gnunet.git] / src / regex / gnunet-regex-profiler.c
1 /*
2      This file is part of GNUnet.
3      (C) 2011 - 2013 Christian Grothoff (and other contributing authors)
4
5      GNUnet is free software; you can redistribute it and/or modify
6      it under the terms of the GNU General Public License as published
7      by the Free Software Foundation; either version 3, or (at your
8      option) any later version.
9
10      GNUnet is distributed in the hope that it will be useful, but
11      WITHOUT ANY WARRANTY; without even the implied warranty of
12      MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13      General Public License for more details.
14
15      You should have received a copy of the GNU General Public License
16      along with GNUnet; see the file COPYING.  If not, write to the
17      Free Software Foundation, Inc., 59 Temple Place - Suite 330,
18      Boston, MA 02111-1307, USA.
19 */
20
21 /**
22  * @file regex/gnunet-regex-profiler.c
23  * @brief Regex profiler for testing distributed regex use.
24  * @author Bartlomiej Polot
25  * @author Maximilian Szengel
26  *
27  */
28
29 #include <string.h>
30
31 #include "platform.h"
32 #include "gnunet_applications.h"
33 #include "gnunet_util_lib.h"
34 #include "gnunet_regex_lib.h"
35 #include "gnunet_arm_service.h"
36 #include "gnunet_dht_service.h"
37 #include "gnunet_testbed_service.h"
38
39 #define FIND_TIMEOUT \
40         GNUNET_TIME_relative_multiply(GNUNET_TIME_UNIT_SECONDS, 90)
41
42 /**
43  * DLL of operations
44  */
45 struct DLLOperation
46 {
47   /**
48    * The testbed operation handle
49    */
50   struct GNUNET_TESTBED_Operation *op;
51
52   /**
53    * Closure
54    */
55   void *cls;
56
57   /**
58    * The next pointer for DLL
59    */
60   struct DLLOperation *next;
61
62   /**
63    * The prev pointer for DLL
64    */
65   struct DLLOperation *prev;
66 };
67
68
69 /**
70  * Available states during profiling
71  */
72 enum State
73 {
74   /**
75    * Initial state
76    */
77   STATE_INIT = 0,
78
79   /**
80    * Starting slaves
81    */
82   STATE_SLAVES_STARTING,
83
84   /**
85    * Creating peers
86    */
87   STATE_PEERS_CREATING,
88
89   /**
90    * Starting peers
91    */
92   STATE_PEERS_STARTING,
93
94   /**
95    * Linking peers
96    */
97   STATE_PEERS_LINKING,
98
99   /**
100    * Matching strings against announced regexes
101    */
102   STATE_SEARCH_REGEX,
103
104   /**
105    * Destroying peers; we can do this as the controller takes care of stopping a
106    * peer if it is running
107    */
108   STATE_PEERS_DESTROYING
109 };
110
111
112 /**
113  * Peer handles.
114  */
115 struct RegexPeer
116 {
117   /**
118    * Peer id.
119    */
120   unsigned int id;
121
122   /**
123    * Peer configuration handle.
124    */
125   struct GNUNET_CONFIGURATION_Handle *cfg;
126
127   /**
128    * The actual testbed peer handle.
129    */
130   struct GNUNET_TESTBED_Peer *peer_handle;
131
132   /**
133    * Peer's search string.
134    */
135   const char *search_str;
136
137   /**
138    * Set to GNUNET_YES if the peer successfully matched the above
139    * search string. GNUNET_NO if the string could not be matched
140    * during the profiler run. GNUNET_SYSERR if the string matching
141    * timed out. Undefined if search_str is NULL
142    */
143   int search_str_matched;
144
145   /**
146    * Peer's DHT handle.
147    */
148   struct GNUNET_DHT_Handle *dht_handle;
149
150   /**
151    * Handle to a running regex search.
152    */
153    struct GNUNET_REGEX_search_handle *search_handle;
154
155   /**
156    * Testbed operation handle for DHT.
157    */
158   struct GNUNET_TESTBED_Operation *op_handle;
159
160   /**
161    * Peers's statistics handle.
162    */
163   struct GNUNET_STATISTICS_Handle *stats_handle;
164
165   /**
166    * The starting time of a profiling step.
167    */
168   struct GNUNET_TIME_Absolute prof_start_time;
169
170   /**
171    * Operation timeout
172    */
173   GNUNET_SCHEDULER_TaskIdentifier timeout;
174
175   /**
176    * Deamon start
177    */
178   struct GNUNET_TESTBED_Operation *daemon_op;
179 };
180
181 /**
182  * Set when shutting down to avoid making more queries.
183  */
184 static int in_shutdown;
185
186 /**
187  * The array of peers; we fill this as the peers are given to us by the testbed
188  */
189 static struct RegexPeer *peers;
190
191 /**
192  * Host registration handle
193  */
194 static struct GNUNET_TESTBED_HostRegistrationHandle *reg_handle;
195
196 /**
197  * Handle to the master controller process
198  */
199 static struct GNUNET_TESTBED_ControllerProc *mc_proc;
200
201 /**
202  * Handle to the master controller
203  */
204 static struct GNUNET_TESTBED_Controller *mc;
205
206 /**
207  * Handle to global configuration
208  */
209 static struct GNUNET_CONFIGURATION_Handle *cfg;
210
211 /**
212  * Abort task identifier
213  */
214 static GNUNET_SCHEDULER_TaskIdentifier abort_task;
215
216 /**
217  * Shutdown task identifier
218  */
219 static GNUNET_SCHEDULER_TaskIdentifier shutdown_task;
220
221 /**
222  * Host registration task identifier
223  */
224 static GNUNET_SCHEDULER_TaskIdentifier register_hosts_task;
225
226 /**
227  * Global event mask for all testbed events
228  */
229 static uint64_t event_mask;
230
231 /**
232  * The starting time of a profiling step
233  */
234 static struct GNUNET_TIME_Absolute prof_start_time;
235
236 /**
237  * Duration profiling step has taken
238  */
239 static struct GNUNET_TIME_Relative prof_time;
240
241 /**
242  * Number of peers to be started by the profiler
243  */
244 static unsigned int num_peers;
245
246 /**
247  * Global testing status
248  */
249 static int result;
250
251 /**
252  * current state of profiling
253  */
254 enum State state;
255
256 /**
257  * Folder where policy files are stored.
258  */
259 static char * policy_dir;
260
261 /**
262  * File with hostnames where to execute the test.
263  */
264 static char *hosts_file;
265
266 /**
267  * File with the strings to look for.
268  */
269 static char *strings_file;
270
271 /**
272  * Search strings (num_peers of them).
273  */
274 static char **search_strings;
275
276 /**
277  * How many searches are we going to start in parallel
278  */
279 static long long unsigned int init_parallel_searches;
280
281 /**
282  * How many searches are running in parallel
283  */
284 static unsigned int parallel_searches;
285
286 /**
287  * Number of strings found in the published regexes.
288  */
289 static unsigned int strings_found;
290
291 /**
292  * Index of peer to start next announce/search.
293  */
294 static unsigned int next_search;
295
296 /**
297  * Search timeout task identifier.
298  */
299 static GNUNET_SCHEDULER_TaskIdentifier search_timeout_task;
300
301 /**
302  * Search timeout in seconds.
303  */
304 static struct GNUNET_TIME_Relative search_timeout_time = { 60000 };
305
306 /**
307  * File to log statistics to.
308  */
309 static struct GNUNET_DISK_FileHandle *data_file;
310
311 /**
312  * Filename to log statistics to.
313  */
314 static char *data_filename;
315
316 /**
317  * Prefix used for regex announcing. We need to prefix the search
318  * strings with it, in order to find something.
319  */
320 static char * regex_prefix;
321
322 /**
323  * What's the maximum regex reannounce period.
324  */
325 static struct GNUNET_TIME_Relative reannounce_period_max;
326
327
328 /******************************************************************************/
329 /******************************  DECLARATIONS  ********************************/
330 /******************************************************************************/
331
332 /**
333  * DHT connect callback.
334  *
335  * @param cls internal peer id.
336  * @param op operation handle.
337  * @param ca_result connect adapter result.
338  * @param emsg error message.
339  */
340 static void
341 dht_connect_cb (void *cls, struct GNUNET_TESTBED_Operation *op,
342                 void *ca_result, const char *emsg);
343
344 /**
345  * DHT connect adapter.
346  *
347  * @param cls not used.
348  * @param cfg configuration handle.
349  *
350  * @return
351  */
352 static void *
353 dht_ca (void *cls, const struct GNUNET_CONFIGURATION_Handle *cfg);
354
355
356 /**
357  * Adapter function called to destroy a connection to
358  * the DHT service
359  *
360  * @param cls closure
361  * @param op_result service handle returned from the connect adapter
362  */
363 static void
364 dht_da (void *cls, void *op_result);
365
366
367 /**
368  * Function called by testbed once we are connected to stats
369  * service. Get the statistics for the services of interest.
370  *
371  * @param cls the 'struct RegexPeer' for which we connected to stats
372  * @param op connect operation handle
373  * @param ca_result handle to stats service
374  * @param emsg error message on failure
375  */
376 static void
377 stats_connect_cb (void *cls,
378                   struct GNUNET_TESTBED_Operation *op,
379                   void *ca_result,
380                   const char *emsg);
381
382
383 /**
384  * Start announcing the next regex in the DHT.
385  *
386  * @param cls Index of the next peer in the peers array.
387  * @param tc TaskContext.
388  */
389 static void
390 announce_next_regex (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc);
391
392
393 /******************************************************************************/
394 /********************************  SHUTDOWN  **********************************/
395 /******************************************************************************/
396
397
398 /**
399  * Shutdown nicely
400  *
401  * @param cls NULL
402  * @param tc the task context
403  */
404 static void
405 do_shutdown (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
406 {
407   struct RegexPeer *peer;
408   unsigned int peer_cnt;
409   unsigned int search_str_cnt;
410   char output_buffer[512];
411   size_t size;
412
413   shutdown_task = GNUNET_SCHEDULER_NO_TASK;
414   if (GNUNET_SCHEDULER_NO_TASK != abort_task)
415     GNUNET_SCHEDULER_cancel (abort_task);
416   if (GNUNET_SCHEDULER_NO_TASK != register_hosts_task)
417     GNUNET_SCHEDULER_cancel (register_hosts_task);
418
419   for (peer_cnt = 0; peer_cnt < num_peers; peer_cnt++)
420   {
421     peer = &peers[peer_cnt];
422
423     if (GNUNET_YES != peer->search_str_matched && NULL != data_file)
424     {
425       prof_time = GNUNET_TIME_absolute_get_duration (peer->prof_start_time);
426       size =
427         GNUNET_snprintf (output_buffer,
428                          sizeof (output_buffer),
429                          "%p Search string not found: %s (%d)\n"
430                          "%p On peer: %u (%p)\n"
431                          "%p After: %s\n",
432                          peer, peer->search_str, peer->search_str_matched,
433                          peer, peer->id, peer,
434                          peer,
435                          GNUNET_STRINGS_relative_time_to_string (prof_time,
436                                                                  GNUNET_NO));
437       if (size != GNUNET_DISK_file_write (data_file, output_buffer, size))
438         GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Unable to write to file!\n");
439     }
440
441     if (NULL != peers[peer_cnt].op_handle)
442       GNUNET_TESTBED_operation_done (peers[peer_cnt].op_handle);
443   }
444
445   if (NULL != data_file)
446     GNUNET_DISK_file_close (data_file);
447
448   for (search_str_cnt = 0;
449        search_str_cnt < num_peers && NULL != search_strings;
450        search_str_cnt++)
451   {
452     GNUNET_free_non_null (search_strings[search_str_cnt]);
453   }
454   GNUNET_free_non_null (search_strings);
455
456   if (NULL != reg_handle)
457     GNUNET_TESTBED_cancel_registration (reg_handle);
458
459   if (NULL != mc)
460     GNUNET_TESTBED_controller_disconnect (mc);
461   if (NULL != mc_proc)
462     GNUNET_TESTBED_controller_stop (mc_proc);
463   if (NULL != cfg)
464     GNUNET_CONFIGURATION_destroy (cfg);
465
466   GNUNET_SCHEDULER_shutdown (); /* Stop scheduler to shutdown testbed run */
467 }
468
469
470 /**
471  * abort task to run on test timed out
472  *
473  * @param cls NULL
474  * @param tc the task context
475  */
476 static void
477 do_abort (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
478 {
479   unsigned long i = (unsigned long) cls;
480
481   GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Aborting from line %lu...\n", i);
482   abort_task = GNUNET_SCHEDULER_NO_TASK;
483   result = GNUNET_SYSERR;
484   if (GNUNET_SCHEDULER_NO_TASK != shutdown_task)
485     GNUNET_SCHEDULER_cancel (shutdown_task);
486   shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
487 }
488
489
490 /******************************************************************************/
491 /*********************  STATISTICS SERVICE CONNECTIONS  ***********************/
492 /******************************************************************************/
493
494 /**
495  * Adapter function called to establish a connection to
496  * statistics service.
497  *
498  * @param cls closure
499  * @param cfg configuration of the peer to connect to; will be available until
500  *          GNUNET_TESTBED_operation_done() is called on the operation returned
501  *          from GNUNET_TESTBED_service_connect()
502  * @return service handle to return in 'op_result', NULL on error
503  */
504 static void *
505 stats_ca (void *cls, const struct GNUNET_CONFIGURATION_Handle *cfg)
506 {
507   return GNUNET_STATISTICS_create ("<driver>", cfg);
508 }
509
510
511 /**
512  * Adapter function called to destroy a connection to
513  * statistics service.
514  *
515  * @param cls closure
516  * @param op_result service handle returned from the connect adapter
517  */
518 static void
519 stats_da (void *cls, void *op_result)
520 {
521   struct RegexPeer *peer = cls;
522
523   GNUNET_assert (op_result == peer->stats_handle);
524
525   GNUNET_STATISTICS_destroy (peer->stats_handle, GNUNET_NO);
526   peer->stats_handle = NULL;
527 }
528
529
530 /**
531  * Process statistic values. Write all values to global 'data_file', if present.
532  *
533  * @param cls closure
534  * @param subsystem name of subsystem that created the statistic
535  * @param name the name of the datum
536  * @param value the current value
537  * @param is_persistent GNUNET_YES if the value is persistent, GNUNET_NO if not
538  * @return GNUNET_OK to continue, GNUNET_SYSERR to abort iteration
539  */
540 static int
541 stats_iterator (void *cls, const char *subsystem, const char *name,
542                 uint64_t value, int is_persistent)
543 {
544   struct RegexPeer *peer = cls;
545   char output_buffer[512];
546   size_t size;
547
548   if (NULL == data_file)
549   {
550     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
551                 "%p -> %s [%s]: %llu\n",
552                 peer, subsystem, name, value);
553     return GNUNET_OK;
554   }
555   size =
556     GNUNET_snprintf (output_buffer,
557                      sizeof (output_buffer),
558                      "%p [%s] %llu %s\n",
559                      peer,
560                      subsystem, value, name);
561   if (size != GNUNET_DISK_file_write (data_file, output_buffer, size))
562     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Unable to write to file!\n");
563
564   return GNUNET_OK;
565 }
566
567
568 /**
569  * Stats callback. Finish the stats testbed operation and when all stats have
570  * been iterated, shutdown the profiler.
571  *
572  * @param cls closure
573  * @param success GNUNET_OK if statistics were
574  *        successfully obtained, GNUNET_SYSERR if not.
575  */
576 static void
577 stats_cb (void *cls,
578           int success)
579 {
580   static unsigned int peer_cnt;
581   struct RegexPeer *peer = cls;
582
583   if (GNUNET_OK != success)
584   {
585     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
586                 "Getting statistics for peer %u failed!\n",
587                 peer->id);
588     return;
589   }
590
591   GNUNET_assert (NULL != peer->op_handle);
592
593   GNUNET_TESTBED_operation_done (peer->op_handle);
594   peer->op_handle = NULL;
595
596   peer_cnt++;
597   peer = &peers[peer_cnt];
598
599   if (peer_cnt == num_peers)
600   {
601     struct GNUNET_TIME_Relative delay = { 100 };
602     shutdown_task = GNUNET_SCHEDULER_add_delayed (delay, &do_shutdown, NULL);
603   }
604   else
605   {
606     peer->op_handle =
607       GNUNET_TESTBED_service_connect (NULL,
608                                       peer->peer_handle,
609                                       "statistics",
610                                       &stats_connect_cb,
611                                       peer,
612                                       &stats_ca,
613                                       &stats_da,
614                                       peer);
615   }
616 }
617
618
619 /**
620  * Function called by testbed once we are connected to stats
621  * service. Get the statistics for the services of interest.
622  *
623  * @param cls the 'struct RegexPeer' for which we connected to stats
624  * @param op connect operation handle
625  * @param ca_result handle to stats service
626  * @param emsg error message on failure
627  */
628 static void
629 stats_connect_cb (void *cls,
630                   struct GNUNET_TESTBED_Operation *op,
631                   void *ca_result,
632                   const char *emsg)
633 {
634   struct RegexPeer *peer = cls;
635
636   if (NULL == ca_result || NULL != emsg)
637   {
638     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
639                 "Failed to connect to statistics service on peer %u: %s\n",
640                 peer->id, emsg);
641
642     peer->stats_handle = NULL;
643     return;
644   }
645
646   peer->stats_handle = ca_result;
647
648   if (NULL == GNUNET_STATISTICS_get (peer->stats_handle, NULL, NULL,
649                                      GNUNET_TIME_UNIT_FOREVER_REL,
650                                      &stats_cb,
651                                      &stats_iterator, peer))
652   {
653     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
654                 "Could not get statistics of peer %u!\n", peer->id);
655   }
656 }
657
658
659 /**
660  * Task to collect all statistics from all peers, will shutdown the
661  * profiler, when done.
662  *
663  * @param cls NULL
664  * @param tc the task context
665  */
666 static void
667 do_collect_stats (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
668 {
669   struct RegexPeer *peer = &peers[0];
670
671   GNUNET_assert (NULL != peer->peer_handle);
672
673   peer->op_handle =
674     GNUNET_TESTBED_service_connect (NULL,
675                                     peer->peer_handle,
676                                     "statistics",
677                                     &stats_connect_cb,
678                                     peer,
679                                     &stats_ca,
680                                     &stats_da,
681                                     peer);
682 }
683
684
685 /******************************************************************************/
686 /************************   REGEX FIND CONNECTIONS   **************************/
687 /******************************************************************************/
688
689
690 /**
691  * Start searching for the next string in the DHT.
692  *
693  * @param cls Index of the next peer in the peers array.
694  * @param tc TaskContext.
695  */
696 static void
697 find_string (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc);
698
699
700 /**
701  * Method called when we've found a peer that announced a regex
702  * that matches our search string. Now get the statistics.
703  *
704  * @param cls Closure provided in GNUNET_REGEX_search.
705  * @param id Peer providing a regex that matches the string.
706  * @param get_path Path of the get request.
707  * @param get_path_length Lenght of get_path.
708  * @param put_path Path of the put request.
709  * @param put_path_length Length of the put_path.
710  */
711 static void
712 regex_found_handler (void *cls,
713                      const struct GNUNET_PeerIdentity *id,
714                      const struct GNUNET_PeerIdentity *get_path,
715                      unsigned int get_path_length,
716                      const struct GNUNET_PeerIdentity *put_path,
717                      unsigned int put_path_length)
718 {
719   struct RegexPeer *peer = cls;
720   char output_buffer[512];
721   size_t size;
722
723   if (GNUNET_YES == peer->search_str_matched)
724   {
725     GNUNET_log (GNUNET_ERROR_TYPE_ERROR, 
726                 "String %s on peer %u already matched!\n",
727                 peer->search_str, peer->id);
728     return;
729   }
730
731   strings_found++;
732   parallel_searches--;
733
734   if (GNUNET_SCHEDULER_NO_TASK != peer->timeout)
735   {
736     GNUNET_SCHEDULER_cancel (peer->timeout);
737     peer->timeout = GNUNET_SCHEDULER_NO_TASK;
738     if (GNUNET_NO == in_shutdown)
739       GNUNET_SCHEDULER_add_now (&announce_next_regex, NULL);
740   }
741
742   if (NULL == id)
743   {
744     // FIXME not possible right now
745     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
746                 "String matching timed out for string %s on peer %u (%i/%i)\n",
747                 peer->search_str, peer->id, strings_found, num_peers);
748     peer->search_str_matched = GNUNET_SYSERR;
749   }
750   else
751   {
752     prof_time = GNUNET_TIME_absolute_get_duration (peer->prof_start_time);
753
754     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
755                 "String %s found on peer %u after %s (%i/%i) (%u||)\n",
756                 peer->search_str, peer->id,
757                 GNUNET_STRINGS_relative_time_to_string (prof_time, GNUNET_NO),
758                 strings_found, num_peers, parallel_searches);
759
760     peer->search_str_matched = GNUNET_YES;
761
762     if (NULL != data_file)
763     {
764       size =
765         GNUNET_snprintf (output_buffer,
766                          sizeof (output_buffer),
767                          "%p Peer: %u\n"
768                          "%p Search string: %s\n"
769                          "%p Search duration: %s\n\n",
770                          peer, peer->id,
771                          peer, peer->search_str,
772                          peer,
773                          GNUNET_STRINGS_relative_time_to_string (prof_time,
774                                                                  GNUNET_NO));
775
776       if (size != GNUNET_DISK_file_write (data_file, output_buffer, size))
777         GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Unable to write to file!\n");
778     }
779   }
780
781   GNUNET_TESTBED_operation_done (peer->op_handle);
782   peer->op_handle = NULL;
783
784   if (strings_found == num_peers)
785   {
786     prof_time = GNUNET_TIME_absolute_get_duration (prof_start_time);
787     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
788                 "All strings successfully matched in %s\n",
789                 GNUNET_STRINGS_relative_time_to_string (prof_time, GNUNET_NO));
790
791     if (GNUNET_SCHEDULER_NO_TASK != search_timeout_task)
792       GNUNET_SCHEDULER_cancel (search_timeout_task);
793
794     GNUNET_log (GNUNET_ERROR_TYPE_INFO, "Collecting stats and shutting down.\n");
795     GNUNET_SCHEDULER_add_now (&do_collect_stats, NULL);
796   }
797 }
798
799
800 /**
801  * Connect by string timeout task. This will cancel the profiler after the
802  * specified timeout 'search_timeout'.
803  *
804  * @param cls NULL
805  * @param tc the task context
806  */
807 static void
808 search_timed_out (void *cls, const struct GNUNET_SCHEDULER_TaskContext * tc)
809 {
810   unsigned int i;
811
812   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
813               "Finding matches to all strings did not succeed after %s.\n",
814               GNUNET_STRINGS_relative_time_to_string (search_timeout_time,
815                                                       GNUNET_NO));
816   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
817               "Found %i of %i strings\n", strings_found, num_peers);
818
819   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
820               "Search timed out after %s."
821               "Collecting stats and shutting down.\n", 
822               GNUNET_STRINGS_relative_time_to_string (search_timeout_time,
823                                                       GNUNET_NO));
824
825   in_shutdown = GNUNET_YES;
826   for (i = 0; i < num_peers; i++)
827   {
828     if (NULL != peers[i].op_handle)
829     {
830       GNUNET_TESTBED_operation_done (peers[i].op_handle);
831       peers[i].op_handle = NULL;
832     }
833   }
834   GNUNET_SCHEDULER_add_now (&do_collect_stats, NULL);
835 }
836
837
838 /**
839  * Search timed out. It might still complete in the future,
840  * but we should start another one.
841  *
842  * @param cls Index of the next peer in the peers array.
843  * @param tc TaskContext.
844  */
845 static void
846 find_timed_out (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
847 {
848   struct RegexPeer *p = cls;
849
850   p->timeout = GNUNET_SCHEDULER_NO_TASK;
851
852   if ((tc->reason & GNUNET_SCHEDULER_REASON_SHUTDOWN) != 0)
853     return;
854   GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
855               "Searching for string \"%s\" on peer %d timed out."
856               "Starting new search: %d.\n",
857               p->search_str,
858               p->id,
859               !in_shutdown);
860   if (GNUNET_NO == in_shutdown)
861     GNUNET_SCHEDULER_add_now (&announce_next_regex, NULL);
862 }
863
864
865 /**
866  * Start searching for a string in the DHT.
867  *
868  * @param cls Index of the next peer in the peers array.
869  * @param tc TaskContext.
870  */
871 static void
872 find_string (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
873 {
874   unsigned int search_peer = (unsigned int) (long) cls;
875
876   if (0 != (tc->reason & GNUNET_SCHEDULER_REASON_SHUTDOWN) ||
877       search_peer >= num_peers ||
878       GNUNET_YES == in_shutdown)
879     return;
880
881   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
882               "Searching for string \"%s\" on peer %d (%u||)\n",
883               peers[search_peer].search_str,
884               search_peer,
885               parallel_searches);
886
887   peers[search_peer].op_handle =
888     GNUNET_TESTBED_service_connect (NULL,
889                                     peers[search_peer].peer_handle,
890                                     "dht",
891                                     &dht_connect_cb,
892                                     &peers[search_peer],
893                                     &dht_ca,
894                                     &dht_da,
895                                     &peers[search_peer]);
896   GNUNET_assert (NULL != peers[search_peer].op_handle);
897   peers[search_peer].timeout = GNUNET_SCHEDULER_add_delayed (FIND_TIMEOUT,
898                                                           &find_timed_out,
899                                                           &peers[search_peer]);
900 }
901
902
903
904
905 /**
906  * Callback called when testbed has started the daemon we asked for.
907  *
908  * @param cls NULL
909  * @param op the operation handle
910  * @param emsg NULL on success; otherwise an error description
911  */
912 static void
913 daemon_started (void *cls, struct GNUNET_TESTBED_Operation *op,
914                 const char *emsg)
915 {
916   struct RegexPeer *peer = (struct RegexPeer *) cls;
917   unsigned long search_peer;
918   unsigned int i;
919
920   GNUNET_TESTBED_operation_done (peer->daemon_op);
921   peer->daemon_op = NULL;
922   if (NULL != emsg)
923   {
924     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
925                 "Failed to start/stop daemon at peer %u: %s\n", peer->id, emsg);
926     GNUNET_abort ();
927   }
928
929   /* Find a peer to look for a string matching the regex announced */
930   search_peer = GNUNET_CRYPTO_random_u32 (GNUNET_CRYPTO_QUALITY_WEAK,
931                                           num_peers);
932   for (i = 0; peers[search_peer].search_str != NULL; i++)
933   {
934     search_peer = (search_peer + 1) % num_peers;
935     if (i > num_peers)
936       GNUNET_abort (); /* we ran out of peers, must be a bug */
937   }
938   peers[search_peer].search_str = search_strings[peer->id];
939   peers[search_peer].search_str_matched = GNUNET_NO;
940   GNUNET_SCHEDULER_add_delayed (GNUNET_TIME_relative_multiply(
941                                   reannounce_period_max,
942                                   2),
943                                 &find_string,
944                                 (void *) search_peer);
945 }
946
947
948 /**
949  * Task to start the daemons on each peer so that the regexes are announced
950  * into the DHT.
951  *
952  * @param cls NULL
953  * @param tc the task context
954  */
955 static void
956 do_announce (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
957 {
958   unsigned int i;
959
960   GNUNET_log (GNUNET_ERROR_TYPE_INFO, "Starting announce.\n");
961
962   for (i = 0; i < init_parallel_searches; i++)
963   {
964     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
965                 "  scheduling announce %u\n",
966                 i);
967     (void) GNUNET_SCHEDULER_add_now (&announce_next_regex, NULL);
968   }
969 }
970
971
972 /**
973  * Start announcing the next regex in the DHT.
974  *
975  * @param cls Closure (unused).
976  * @param tc TaskContext.
977  */
978 static void
979 announce_next_regex (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
980 {
981   struct RegexPeer *peer;
982
983   if (0 != (tc->reason & GNUNET_SCHEDULER_REASON_SHUTDOWN) ||
984             next_search >= num_peers)
985     return;
986
987   GNUNET_log (GNUNET_ERROR_TYPE_INFO, "Starting daemon %u\n", next_search);
988   peer = &peers[next_search];
989   peer->daemon_op = 
990   GNUNET_TESTBED_peer_manage_service (NULL,
991                                       peer->peer_handle,
992                                       "regexprofiler",
993                                       &daemon_started,
994                                       peer,
995                                       1);
996   next_search++;
997   parallel_searches++;
998 }
999
1000 /**
1001  * DHT connect callback. Called when we are connected to the dht service for
1002  * the peer in 'cls'. If successfull we connect to the stats service of this
1003  * peer and then try to match the search string of this peer.
1004  *
1005  * @param cls internal peer id.
1006  * @param op operation handle.
1007  * @param ca_result connect adapter result.
1008  * @param emsg error message.
1009  */
1010 static void
1011 dht_connect_cb (void *cls, struct GNUNET_TESTBED_Operation *op,
1012                 void *ca_result, const char *emsg)
1013 {
1014   struct RegexPeer *peer = (struct RegexPeer *) cls;
1015
1016   if (NULL != emsg || NULL == op || NULL == ca_result)
1017   {
1018     GNUNET_log (GNUNET_ERROR_TYPE_ERROR, "DHT connect failed: %s\n", emsg);
1019     GNUNET_abort ();
1020   }
1021
1022   GNUNET_assert (NULL != peer->dht_handle);
1023   GNUNET_assert (peer->op_handle == op);
1024   GNUNET_assert (peer->dht_handle == ca_result);
1025
1026   peer->search_str_matched = GNUNET_NO;
1027   peer->search_handle = GNUNET_REGEX_search (peer->dht_handle,
1028                                              peer->search_str,
1029                                              &regex_found_handler, peer,
1030                                              NULL);
1031   peer->prof_start_time = GNUNET_TIME_absolute_get ();
1032 }
1033
1034
1035 /**
1036  * DHT connect adapter. Opens a connection to the dht service.
1037  *
1038  * @param cls Closure (peer).
1039  * @param cfg Configuration handle.
1040  *
1041  * @return
1042  */
1043 static void *
1044 dht_ca (void *cls, const struct GNUNET_CONFIGURATION_Handle *cfg)
1045 {
1046   struct RegexPeer *peer = cls;
1047
1048   peer->dht_handle = GNUNET_DHT_connect (cfg, 32);
1049
1050   return peer->dht_handle;
1051 }
1052
1053
1054 /**
1055  * Adapter function called to destroy a connection to the dht service.
1056  *
1057  * @param cls Closure (peer).
1058  * @param op_result Service handle returned from the connect adapter.
1059  */
1060 static void
1061 dht_da (void *cls, void *op_result)
1062 {
1063   struct RegexPeer *peer = (struct RegexPeer *) cls;
1064
1065   GNUNET_assert (peer->dht_handle == op_result);
1066
1067   if (NULL != peer->search_handle)
1068   {
1069     GNUNET_REGEX_search_cancel (peer->search_handle);
1070     peer->search_handle = NULL;
1071   }
1072
1073   if (NULL != peer->dht_handle)
1074   {
1075     GNUNET_DHT_disconnect (peer->dht_handle);
1076     peer->dht_handle = NULL;
1077   }
1078 }
1079
1080
1081 /**
1082  * Signature of a main function for a testcase.
1083  *
1084  * @param cls NULL
1085  * @param num_peers_ number of peers in 'peers'
1086  * @param peers handle to peers run in the testbed.  NULL upon timeout (see
1087  *          GNUNET_TESTBED_test_run()).
1088  * @param links_succeeded the number of overlay link connection attempts that
1089  *          succeeded
1090  * @param links_failed the number of overlay link connection attempts that
1091  *          failed
1092  */
1093 static void 
1094 test_master (void *cls,
1095              unsigned int num_peers_,
1096              struct GNUNET_TESTBED_Peer **testbed_peers,
1097              unsigned int links_succeeded,
1098              unsigned int links_failed)
1099 {
1100   unsigned int i;
1101
1102   GNUNET_assert (num_peers_ == num_peers);
1103
1104   prof_time = GNUNET_TIME_absolute_get_duration (prof_start_time);
1105   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
1106               "Testbed started in %s\n",
1107               GNUNET_STRINGS_relative_time_to_string (prof_time, GNUNET_NO));
1108
1109   if (GNUNET_SCHEDULER_NO_TASK != abort_task)
1110   {
1111     GNUNET_SCHEDULER_cancel (abort_task);
1112     abort_task = GNUNET_SCHEDULER_NO_TASK;
1113   }
1114
1115   for (i = 0; i < num_peers; i++)
1116   {
1117     peers[i].peer_handle = testbed_peers[i];
1118   }
1119   GNUNET_SCHEDULER_add_now (&do_announce, NULL);
1120   search_timeout_task =
1121       GNUNET_SCHEDULER_add_delayed (search_timeout_time, &search_timed_out, NULL);
1122 }
1123
1124 /**
1125  * Function that will be called whenever something in the testbed changes.
1126  *
1127  * @param cls closure, NULL
1128  * @param event information on what is happening
1129  */
1130 static void
1131 master_controller_cb (void *cls, 
1132                       const struct GNUNET_TESTBED_EventInformation *event)
1133 {
1134   switch (event->type)
1135   {
1136   case GNUNET_TESTBED_ET_CONNECT:
1137     printf(".");
1138     break;
1139   case GNUNET_TESTBED_ET_PEER_START:
1140     printf("#");
1141     break;
1142   default:
1143     break;
1144   }
1145   fflush(stdout);
1146 }
1147
1148
1149 /******************************************************************************/
1150 /***************************  TESTBED PEER SETUP  *****************************/
1151 /******************************************************************************/
1152
1153
1154 /**
1155  * Load search strings from given filename. One search string per line.
1156  *
1157  * @param filename filename of the file containing the search strings.
1158  * @param strings set of strings loaded from file. Caller needs to free this
1159  *                if number returned is greater than zero.
1160  * @param limit upper limit on the number of strings read from the file
1161  * @return number of strings found in the file. GNUNET_SYSERR on error.
1162  */
1163 static int
1164 load_search_strings (const char *filename, char ***strings, unsigned int limit)
1165 {
1166   char *data;
1167   char *buf;
1168   uint64_t filesize;
1169   unsigned int offset;
1170   int str_cnt;
1171   unsigned int i;
1172
1173   if (NULL == filename)
1174   {
1175     return GNUNET_SYSERR;
1176   }
1177
1178   if (GNUNET_YES != GNUNET_DISK_file_test (filename))
1179   {
1180     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
1181                 "Could not find search strings file %s\n", filename);
1182     return GNUNET_SYSERR;
1183   }
1184   if (GNUNET_OK != GNUNET_DISK_file_size (filename, &filesize, GNUNET_YES, GNUNET_YES))
1185     filesize = 0;
1186   if (0 == filesize)
1187   {
1188     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Search strings file %s is empty.\n", filename);
1189     return GNUNET_SYSERR;
1190   }
1191   data = GNUNET_malloc (filesize);
1192   if (filesize != GNUNET_DISK_fn_read (filename, data, filesize))
1193   {
1194     GNUNET_free (data);
1195     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Could not read search strings file %s.\n",
1196          filename);
1197     return GNUNET_SYSERR;
1198   }
1199   buf = data;
1200   offset = 0;
1201   str_cnt = 0;
1202   while (offset < (filesize - 1) && str_cnt < limit)
1203   {
1204     offset++;
1205     if (((data[offset] == '\n')) && (buf != &data[offset]))
1206     {
1207       data[offset] = '\0';
1208       str_cnt++;
1209       buf = &data[offset + 1];
1210     }
1211     else if ((data[offset] == '\n') || (data[offset] == '\0'))
1212       buf = &data[offset + 1];
1213   }
1214   *strings = GNUNET_malloc (sizeof (char *) * str_cnt);
1215   offset = 0;
1216   for (i = 0; i < str_cnt; i++)
1217   {
1218     GNUNET_asprintf (&(*strings)[i], "%s%s", regex_prefix, &data[offset]);
1219     offset += strlen (&data[offset]) + 1;
1220   }
1221   GNUNET_free (data);
1222   return str_cnt;
1223 }
1224
1225
1226 /**
1227  * Main function that will be run by the scheduler.
1228  *
1229  * @param cls closure
1230  * @param args remaining command-line arguments
1231  * @param cfgfile name of the configuration file used (for saving, can be NULL!)
1232  * @param config configuration
1233  */
1234 static void
1235 run (void *cls, char *const *args, const char *cfgfile,
1236      const struct GNUNET_CONFIGURATION_Handle *config)
1237 {
1238   unsigned int nsearchstrs;
1239   unsigned int i;
1240
1241   in_shutdown = GNUNET_NO;
1242
1243   /* Check config */
1244   if (NULL == config)
1245   {
1246     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1247                 _("No configuration file given. Exiting\n"));
1248     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1249     return;
1250   }
1251   cfg = GNUNET_CONFIGURATION_dup (config);
1252   if (GNUNET_OK !=
1253       GNUNET_CONFIGURATION_get_value_string (cfg, "REGEXPROFILER",
1254                                              "REGEX_PREFIX",
1255                                              &regex_prefix))
1256   {
1257     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1258                 _("Configuration option \"regex_prefix\" missing. Exiting\n"));
1259     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1260     return;
1261   }
1262   if (GNUNET_OK !=
1263       GNUNET_CONFIGURATION_get_value_number (cfg, "REGEXPROFILER",
1264                                              "PARALLEL_SEARCHES",
1265                                              &init_parallel_searches))
1266   {
1267     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
1268                 "Configuration option \"PARALLEL_SEARCHES\" missing."
1269                 " Using default (%d)\n", 10);
1270     init_parallel_searches = 10;
1271   }
1272   if (GNUNET_OK !=
1273       GNUNET_CONFIGURATION_get_value_time (cfg, "REGEXPROFILER",
1274                                            "REANNOUNCE_PERIOD_MAX",
1275                                            &reannounce_period_max))
1276   {
1277     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, 
1278                 "reannounce_period_max not given. Using 10 minutes.\n");
1279     reannounce_period_max =
1280       GNUNET_TIME_relative_multiply (GNUNET_TIME_UNIT_MINUTES, 10);
1281   }
1282
1283   /* Check arguments */
1284   if (NULL == policy_dir)
1285   {
1286     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1287                 _("No policy directory specified on command line. Exiting.\n"));
1288     return;
1289   }
1290   if (GNUNET_YES != GNUNET_DISK_directory_test (policy_dir, GNUNET_YES))
1291   {
1292     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1293                 _("Specified policies directory does not exist. Exiting.\n"));
1294     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1295     return;
1296   }
1297   if (-1 == (num_peers = GNUNET_DISK_directory_scan (policy_dir, NULL, NULL)))
1298   {
1299     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1300                 _("No files found in `%s'\n"),
1301                 policy_dir);
1302     return;
1303   }
1304   GNUNET_CONFIGURATION_set_value_string (cfg, "REGEXPROFILER",
1305                                          "POLICY_DIR", policy_dir);
1306   if (GNUNET_YES != GNUNET_DISK_file_test (strings_file))
1307   {
1308     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1309                 _("No search strings file given. Exiting.\n"));
1310     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1311     return;
1312   }
1313   nsearchstrs = load_search_strings (strings_file,
1314                                      &search_strings,
1315                                      num_peers);
1316   if (num_peers != nsearchstrs)
1317   {
1318     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1319                 _("Error loading search strings."
1320                   "Given file does not contain enough strings. Exiting.\n"));
1321     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1322     return;
1323   }
1324   if (0 >= num_peers || NULL == search_strings)
1325   {
1326     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1327                 _("Error loading search strings. Exiting.\n"));
1328     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1329     return;
1330   }
1331   for (i = 0; i < num_peers; i++)
1332     GNUNET_log (GNUNET_ERROR_TYPE_DEBUG,
1333                 "search string: %s\n",
1334                 search_strings[i]);
1335
1336   /* Check logfile */
1337   if ( (NULL != data_filename) &&
1338        (NULL == (data_file =
1339                  GNUNET_DISK_file_open (data_filename,
1340                                         GNUNET_DISK_OPEN_READWRITE |
1341                                         GNUNET_DISK_OPEN_TRUNCATE |
1342                                         GNUNET_DISK_OPEN_CREATE,
1343                                         GNUNET_DISK_PERM_USER_READ |
1344                                         GNUNET_DISK_PERM_USER_WRITE))) )
1345   {
1346     GNUNET_log_strerror_file (GNUNET_ERROR_TYPE_ERROR,
1347                               "open",
1348                               data_filename);
1349     return;
1350   }
1351
1352   /* Initialize peers */
1353   peers = GNUNET_malloc (sizeof (struct RegexPeer) * num_peers);
1354   for (i = 0; i < num_peers; i++)
1355   {
1356     peers[i].id = i;
1357   }
1358
1359   event_mask = 0LL;
1360 /* For feedback about the start process activate these and pass master_cb */
1361   event_mask |= (1LL << GNUNET_TESTBED_ET_PEER_START);
1362 //   event_mask |= (1LL << GNUNET_TESTBED_ET_PEER_STOP);
1363   event_mask |= (1LL << GNUNET_TESTBED_ET_CONNECT);
1364 //   event_mask |= (1LL << GNUNET_TESTBED_ET_DISCONNECT);
1365   prof_start_time = GNUNET_TIME_absolute_get ();
1366   GNUNET_TESTBED_run (hosts_file,
1367                       cfg,
1368                       num_peers,
1369                       event_mask,
1370                       &master_controller_cb,
1371                       NULL,     /* master_controller_cb cls */
1372                       &test_master,
1373                       NULL);    /* test_master cls */
1374   abort_task =
1375       GNUNET_SCHEDULER_add_delayed (GNUNET_TIME_relative_multiply
1376                                     (GNUNET_TIME_UNIT_MINUTES, 15),
1377                                     &do_abort,
1378                                     (void*) __LINE__);
1379 }
1380
1381
1382 /**
1383  * Main function.
1384  *
1385  * @param argc argument count
1386  * @param argv argument values
1387  * @return 0 on success
1388  */
1389 int
1390 main (int argc, char *const *argv)
1391 {
1392   static const struct GNUNET_GETOPT_CommandLineOption options[] = {
1393     {'o', "output-file", "FILENAME",
1394      gettext_noop ("name of the file for writing statistics"),
1395      GNUNET_YES, &GNUNET_GETOPT_set_string, &data_filename},
1396     {'t', "matching-timeout", "TIMEOUT",
1397       gettext_noop ("wait TIMEOUT before ending the experiment"),
1398       GNUNET_YES, &GNUNET_GETOPT_set_relative_time, &search_timeout_time},
1399     {'p', "policy-dir", "DIRECTORY",
1400       gettext_noop ("directory with policy files"),
1401       GNUNET_YES, &GNUNET_GETOPT_set_filename, &policy_dir},
1402     {'s', "strings-file", "FILENAME",
1403       gettext_noop ("name of file with input strings"),
1404       GNUNET_YES, &GNUNET_GETOPT_set_filename, &strings_file},
1405     {'H', "hosts-file", "FILENAME",
1406       gettext_noop ("name of file with hosts' names"),
1407       GNUNET_NO, &GNUNET_GETOPT_set_filename, &hosts_file},
1408     GNUNET_GETOPT_OPTION_END
1409   };
1410   int ret;
1411
1412   if (GNUNET_OK != GNUNET_STRINGS_get_utf8_args (argc, argv, &argc, &argv))
1413     return 2;
1414   result = GNUNET_SYSERR;
1415   ret =
1416       GNUNET_PROGRAM_run (argc, argv,
1417                           "gnunet-regex-profiler",
1418                           _("Profiler for regex"),
1419                           options, &run, NULL);
1420   if (GNUNET_OK != ret)
1421     return ret;
1422   if (GNUNET_OK != result)
1423     return 1;
1424   return 0;
1425 }