c3861549834730e2598c8a3031d1d474f7ac0dea
[oweals/gnunet.git] / src / regex / gnunet-regex-profiler.c
1 /*
2      This file is part of GNUnet.
3      (C) 2011 - 2013 Christian Grothoff (and other contributing authors)
4
5      GNUnet is free software; you can redistribute it and/or modify
6      it under the terms of the GNU General Public License as published
7      by the Free Software Foundation; either version 3, or (at your
8      option) any later version.
9
10      GNUnet is distributed in the hope that it will be useful, but
11      WITHOUT ANY WARRANTY; without even the implied warranty of
12      MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13      General Public License for more details.
14
15      You should have received a copy of the GNU General Public License
16      along with GNUnet; see the file COPYING.  If not, write to the
17      Free Software Foundation, Inc., 59 Temple Place - Suite 330,
18      Boston, MA 02111-1307, USA.
19 */
20
21 /**
22  * @file regex/gnunet-regex-profiler.c
23  * @brief Regex profiler for testing distributed regex use.
24  * @author Bartlomiej Polot
25  * @author Maximilian Szengel
26  *
27  */
28
29 #include <string.h>
30
31 #include "platform.h"
32 #include "gnunet_applications.h"
33 #include "gnunet_util_lib.h"
34 #include "gnunet_regex_lib.h"
35 #include "gnunet_arm_service.h"
36 #include "gnunet_dht_service.h"
37 #include "gnunet_testbed_service.h"
38
39 #define FIND_TIMEOUT \
40         GNUNET_TIME_relative_multiply(GNUNET_TIME_UNIT_SECONDS, 90)
41
42 /**
43  * DLL of operations
44  */
45 struct DLLOperation
46 {
47   /**
48    * The testbed operation handle
49    */
50   struct GNUNET_TESTBED_Operation *op;
51
52   /**
53    * Closure
54    */
55   void *cls;
56
57   /**
58    * The next pointer for DLL
59    */
60   struct DLLOperation *next;
61
62   /**
63    * The prev pointer for DLL
64    */
65   struct DLLOperation *prev;
66 };
67
68
69 /**
70  * Available states during profiling
71  */
72 enum State
73 {
74   /**
75    * Initial state
76    */
77   STATE_INIT = 0,
78
79   /**
80    * Starting slaves
81    */
82   STATE_SLAVES_STARTING,
83
84   /**
85    * Creating peers
86    */
87   STATE_PEERS_CREATING,
88
89   /**
90    * Starting peers
91    */
92   STATE_PEERS_STARTING,
93
94   /**
95    * Linking peers
96    */
97   STATE_PEERS_LINKING,
98
99   /**
100    * Matching strings against announced regexes
101    */
102   STATE_SEARCH_REGEX,
103
104   /**
105    * Destroying peers; we can do this as the controller takes care of stopping a
106    * peer if it is running
107    */
108   STATE_PEERS_DESTROYING
109 };
110
111
112 /**
113  * Peer handles.
114  */
115 struct RegexPeer
116 {
117   /**
118    * Peer id.
119    */
120   unsigned int id;
121
122   /**
123    * Peer configuration handle.
124    */
125   struct GNUNET_CONFIGURATION_Handle *cfg;
126
127   /**
128    * The actual testbed peer handle.
129    */
130   struct GNUNET_TESTBED_Peer *peer_handle;
131
132   /**
133    * Peer's search string.
134    */
135   const char *search_str;
136
137   /**
138    * Set to GNUNET_YES if the peer successfully matched the above
139    * search string. GNUNET_NO if the string could not be matched
140    * during the profiler run. GNUNET_SYSERR if the string matching
141    * timed out. Undefined if search_str is NULL
142    */
143   int search_str_matched;
144
145   /**
146    * Peer's DHT handle.
147    */
148   struct GNUNET_DHT_Handle *dht_handle;
149
150   /**
151    * Handle to a running regex search.
152    */
153    struct GNUNET_REGEX_search_handle *search_handle;
154
155   /**
156    * Testbed operation handle for DHT.
157    */
158   struct GNUNET_TESTBED_Operation *op_handle;
159
160   /**
161    * Peers's statistics handle.
162    */
163   struct GNUNET_STATISTICS_Handle *stats_handle;
164
165   /**
166    * The starting time of a profiling step.
167    */
168   struct GNUNET_TIME_Absolute prof_start_time;
169
170   /**
171    * Operation timeout
172    */
173   GNUNET_SCHEDULER_TaskIdentifier timeout;
174
175   /**
176    * Deamon start
177    */
178   struct GNUNET_TESTBED_Operation *daemon_op;
179 };
180
181 /**
182  * Set when shutting down to avoid making more queries.
183  */
184 static int in_shutdown;
185
186 /**
187  * The array of peers; we fill this as the peers are given to us by the testbed
188  */
189 static struct RegexPeer *peers;
190
191 /**
192  * Host registration handle
193  */
194 static struct GNUNET_TESTBED_HostRegistrationHandle *reg_handle;
195
196 /**
197  * Handle to the master controller process
198  */
199 static struct GNUNET_TESTBED_ControllerProc *mc_proc;
200
201 /**
202  * Handle to the master controller
203  */
204 static struct GNUNET_TESTBED_Controller *mc;
205
206 /**
207  * Handle to global configuration
208  */
209 static struct GNUNET_CONFIGURATION_Handle *cfg;
210
211 /**
212  * Abort task identifier
213  */
214 static GNUNET_SCHEDULER_TaskIdentifier abort_task;
215
216 /**
217  * Shutdown task identifier
218  */
219 static GNUNET_SCHEDULER_TaskIdentifier shutdown_task;
220
221 /**
222  * Host registration task identifier
223  */
224 static GNUNET_SCHEDULER_TaskIdentifier register_hosts_task;
225
226 /**
227  * Global event mask for all testbed events
228  */
229 static uint64_t event_mask;
230
231 /**
232  * The starting time of a profiling step
233  */
234 static struct GNUNET_TIME_Absolute prof_start_time;
235
236 /**
237  * Duration profiling step has taken
238  */
239 static struct GNUNET_TIME_Relative prof_time;
240
241 /**
242  * Number of peers to be started by the profiler
243  */
244 static unsigned int num_peers;
245
246 /**
247  * Global testing status
248  */
249 static int result;
250
251 /**
252  * current state of profiling
253  */
254 enum State state;
255
256 /**
257  * Folder where policy files are stored.
258  */
259 static char * policy_dir;
260
261 /**
262  * File with hostnames where to execute the test.
263  */
264 static char *hosts_file;
265
266 /**
267  * File with the strings to look for.
268  */
269 static char *strings_file;
270
271 /**
272  * Search strings (num_peers of them).
273  */
274 static char **search_strings;
275
276 /**
277  * How many searches are we going to start in parallel
278  */
279 static long long unsigned int init_parallel_searches;
280
281 /**
282  * How many searches are running in parallel
283  */
284 static unsigned int parallel_searches;
285
286 /**
287  * Number of strings found in the published regexes.
288  */
289 static unsigned int strings_found;
290
291 /**
292  * Index of peer to start next announce/search.
293  */
294 static unsigned int next_search;
295
296 /**
297  * Search timeout task identifier.
298  */
299 static GNUNET_SCHEDULER_TaskIdentifier search_timeout_task;
300
301 /**
302  * Search timeout in seconds.
303  */
304 static struct GNUNET_TIME_Relative search_timeout_time = { 60000 };
305
306 /**
307  * File to log statistics to.
308  */
309 static struct GNUNET_DISK_FileHandle *data_file;
310
311 /**
312  * Filename to log statistics to.
313  */
314 static char *data_filename;
315
316 /**
317  * Prefix used for regex announcing. We need to prefix the search
318  * strings with it, in order to find something.
319  */
320 static char * regex_prefix;
321
322 /**
323  * What's the maximum regex reannounce period.
324  */
325 static struct GNUNET_TIME_Relative reannounce_period_max;
326
327
328 /******************************************************************************/
329 /******************************  DECLARATIONS  ********************************/
330 /******************************************************************************/
331
332 /**
333  * DHT connect callback.
334  *
335  * @param cls internal peer id.
336  * @param op operation handle.
337  * @param ca_result connect adapter result.
338  * @param emsg error message.
339  */
340 static void
341 dht_connect_cb (void *cls, struct GNUNET_TESTBED_Operation *op,
342                 void *ca_result, const char *emsg);
343
344 /**
345  * DHT connect adapter.
346  *
347  * @param cls not used.
348  * @param cfg configuration handle.
349  *
350  * @return
351  */
352 static void *
353 dht_ca (void *cls, const struct GNUNET_CONFIGURATION_Handle *cfg);
354
355
356 /**
357  * Adapter function called to destroy a connection to
358  * the DHT service
359  *
360  * @param cls closure
361  * @param op_result service handle returned from the connect adapter
362  */
363 static void
364 dht_da (void *cls, void *op_result);
365
366
367 /**
368  * Function called by testbed once we are connected to stats
369  * service. Get the statistics for the services of interest.
370  *
371  * @param cls the 'struct RegexPeer' for which we connected to stats
372  * @param op connect operation handle
373  * @param ca_result handle to stats service
374  * @param emsg error message on failure
375  */
376 static void
377 stats_connect_cb (void *cls,
378                   struct GNUNET_TESTBED_Operation *op,
379                   void *ca_result,
380                   const char *emsg);
381
382
383 /**
384  * Start announcing the next regex in the DHT.
385  *
386  * @param cls Index of the next peer in the peers array.
387  * @param tc TaskContext.
388  */
389 static void
390 announce_next_regex (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc);
391
392
393 /******************************************************************************/
394 /********************************  SHUTDOWN  **********************************/
395 /******************************************************************************/
396
397
398 /**
399  * Shutdown nicely
400  *
401  * @param cls NULL
402  * @param tc the task context
403  */
404 static void
405 do_shutdown (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
406 {
407   struct RegexPeer *peer;
408   unsigned int peer_cnt;
409   unsigned int search_str_cnt;
410   char output_buffer[512];
411   size_t size;
412
413   shutdown_task = GNUNET_SCHEDULER_NO_TASK;
414   if (GNUNET_SCHEDULER_NO_TASK != abort_task)
415     GNUNET_SCHEDULER_cancel (abort_task);
416   if (GNUNET_SCHEDULER_NO_TASK != register_hosts_task)
417     GNUNET_SCHEDULER_cancel (register_hosts_task);
418
419   for (peer_cnt = 0; peer_cnt < num_peers; peer_cnt++)
420   {
421     peer = &peers[peer_cnt];
422
423     if (GNUNET_YES != peer->search_str_matched && NULL != data_file)
424     {
425       prof_time = GNUNET_TIME_absolute_get_duration (peer->prof_start_time);
426       size =
427         GNUNET_snprintf (output_buffer,
428                          sizeof (output_buffer),
429                          "%p Search string not found: %s (%d)\n"
430                          "%p On peer: %u (%p)\n"
431                          "%p After: %s\n",
432                          peer, peer->search_str, peer->search_str_matched,
433                          peer, peer->id, peer,
434                          peer,
435                          GNUNET_STRINGS_relative_time_to_string (prof_time,
436                                                                  GNUNET_NO));
437       if (size != GNUNET_DISK_file_write (data_file, output_buffer, size))
438         GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Unable to write to file!\n");
439     }
440
441     if (NULL != peers[peer_cnt].op_handle)
442       GNUNET_TESTBED_operation_done (peers[peer_cnt].op_handle);
443   }
444
445   if (NULL != data_file)
446     GNUNET_DISK_file_close (data_file);
447
448   for (search_str_cnt = 0;
449        search_str_cnt < num_peers && NULL != search_strings;
450        search_str_cnt++)
451   {
452     GNUNET_free_non_null (search_strings[search_str_cnt]);
453   }
454   GNUNET_free_non_null (search_strings);
455
456   if (NULL != reg_handle)
457     GNUNET_TESTBED_cancel_registration (reg_handle);
458
459   if (NULL != mc)
460     GNUNET_TESTBED_controller_disconnect (mc);
461   if (NULL != mc_proc)
462     GNUNET_TESTBED_controller_stop (mc_proc);
463   if (NULL != cfg)
464     GNUNET_CONFIGURATION_destroy (cfg);
465
466   GNUNET_SCHEDULER_shutdown (); /* Stop scheduler to shutdown testbed run */
467 }
468
469
470 /**
471  * abort task to run on test timed out
472  *
473  * @param cls NULL
474  * @param tc the task context
475  */
476 static void
477 do_abort (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
478 {
479   unsigned long i = (unsigned long) cls;
480
481   GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Aborting from line %lu...\n", i);
482   abort_task = GNUNET_SCHEDULER_NO_TASK;
483   result = GNUNET_SYSERR;
484   if (GNUNET_SCHEDULER_NO_TASK != shutdown_task)
485     GNUNET_SCHEDULER_cancel (shutdown_task);
486   shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
487 }
488
489
490 /******************************************************************************/
491 /*********************  STATISTICS SERVICE CONNECTIONS  ***********************/
492 /******************************************************************************/
493
494 /**
495  * Adapter function called to establish a connection to
496  * statistics service.
497  *
498  * @param cls closure
499  * @param cfg configuration of the peer to connect to; will be available until
500  *          GNUNET_TESTBED_operation_done() is called on the operation returned
501  *          from GNUNET_TESTBED_service_connect()
502  * @return service handle to return in 'op_result', NULL on error
503  */
504 static void *
505 stats_ca (void *cls, const struct GNUNET_CONFIGURATION_Handle *cfg)
506 {
507   return GNUNET_STATISTICS_create ("<driver>", cfg);
508 }
509
510
511 /**
512  * Adapter function called to destroy a connection to
513  * statistics service.
514  *
515  * @param cls closure
516  * @param op_result service handle returned from the connect adapter
517  */
518 static void
519 stats_da (void *cls, void *op_result)
520 {
521   struct RegexPeer *peer = cls;
522
523   GNUNET_assert (op_result == peer->stats_handle);
524
525   GNUNET_STATISTICS_destroy (peer->stats_handle, GNUNET_NO);
526   peer->stats_handle = NULL;
527 }
528
529
530 /**
531  * Process statistic values. Write all values to global 'data_file', if present.
532  *
533  * @param cls closure
534  * @param subsystem name of subsystem that created the statistic
535  * @param name the name of the datum
536  * @param value the current value
537  * @param is_persistent GNUNET_YES if the value is persistent, GNUNET_NO if not
538  * @return GNUNET_OK to continue, GNUNET_SYSERR to abort iteration
539  */
540 static int
541 stats_iterator (void *cls, const char *subsystem, const char *name,
542                 uint64_t value, int is_persistent)
543 {
544   struct RegexPeer *peer = cls;
545   char output_buffer[512];
546   size_t size;
547
548   if (NULL == data_file)
549   {
550     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
551                 "%p -> %s [%s]: %llu\n",
552                 peer, subsystem, name, value);
553     return GNUNET_OK;
554   }
555   size =
556     GNUNET_snprintf (output_buffer,
557                      sizeof (output_buffer),
558                      "%p [%s] %llu %s\n",
559                      peer,
560                      subsystem, value, name);
561   if (size != GNUNET_DISK_file_write (data_file, output_buffer, size))
562     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Unable to write to file!\n");
563
564   return GNUNET_OK;
565 }
566
567
568 /**
569  * Stats callback. Finish the stats testbed operation and when all stats have
570  * been iterated, shutdown the profiler.
571  *
572  * @param cls closure
573  * @param success GNUNET_OK if statistics were
574  *        successfully obtained, GNUNET_SYSERR if not.
575  */
576 static void
577 stats_cb (void *cls,
578           int success)
579 {
580   static unsigned int peer_cnt;
581   struct RegexPeer *peer = cls;
582
583   if (GNUNET_OK != success)
584   {
585     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
586                 "Getting statistics for peer %u failed!\n",
587                 peer->id);
588     return;
589   }
590
591   GNUNET_assert (NULL != peer->op_handle);
592
593   GNUNET_TESTBED_operation_done (peer->op_handle);
594   peer->op_handle = NULL;
595
596   peer_cnt++;
597   peer = &peers[peer_cnt];
598
599   if (peer_cnt == num_peers)
600   {
601     struct GNUNET_TIME_Relative delay = { 100 };
602     shutdown_task = GNUNET_SCHEDULER_add_delayed (delay, &do_shutdown, NULL);
603   }
604   else
605   {
606     peer->op_handle =
607       GNUNET_TESTBED_service_connect (NULL,
608                                       peer->peer_handle,
609                                       "statistics",
610                                       &stats_connect_cb,
611                                       peer,
612                                       &stats_ca,
613                                       &stats_da,
614                                       peer);
615   }
616 }
617
618
619 /**
620  * Function called by testbed once we are connected to stats
621  * service. Get the statistics for the services of interest.
622  *
623  * @param cls the 'struct RegexPeer' for which we connected to stats
624  * @param op connect operation handle
625  * @param ca_result handle to stats service
626  * @param emsg error message on failure
627  */
628 static void
629 stats_connect_cb (void *cls,
630                   struct GNUNET_TESTBED_Operation *op,
631                   void *ca_result,
632                   const char *emsg)
633 {
634   struct RegexPeer *peer = cls;
635
636   if (NULL == ca_result || NULL != emsg)
637   {
638     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
639                 "Failed to connect to statistics service on peer %u: %s\n",
640                 peer->id, emsg);
641
642     peer->stats_handle = NULL;
643     return;
644   }
645
646   peer->stats_handle = ca_result;
647
648   if (NULL == GNUNET_STATISTICS_get (peer->stats_handle, NULL, NULL,
649                                      GNUNET_TIME_UNIT_FOREVER_REL,
650                                      &stats_cb,
651                                      &stats_iterator, peer))
652   {
653     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
654                 "Could not get statistics of peer %u!\n", peer->id);
655   }
656 }
657
658
659 /**
660  * Task to collect all statistics from all peers, will shutdown the
661  * profiler, when done.
662  *
663  * @param cls NULL
664  * @param tc the task context
665  */
666 static void
667 do_collect_stats (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
668 {
669   struct RegexPeer *peer = &peers[0];
670
671   GNUNET_assert (NULL != peer->peer_handle);
672
673   peer->op_handle =
674     GNUNET_TESTBED_service_connect (NULL,
675                                     peer->peer_handle,
676                                     "statistics",
677                                     &stats_connect_cb,
678                                     peer,
679                                     &stats_ca,
680                                     &stats_da,
681                                     peer);
682 }
683
684
685 /******************************************************************************/
686 /************************   REGEX FIND CONNECTIONS   **************************/
687 /******************************************************************************/
688
689
690 /**
691  * Start searching for the next string in the DHT.
692  *
693  * @param cls Index of the next peer in the peers array.
694  * @param tc TaskContext.
695  */
696 static void
697 find_string (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc);
698
699
700 /**
701  * Method called when we've found a peer that announced a regex
702  * that matches our search string. Now get the statistics.
703  *
704  * @param cls Closure provided in GNUNET_REGEX_search.
705  * @param id Peer providing a regex that matches the string.
706  * @param get_path Path of the get request.
707  * @param get_path_length Lenght of get_path.
708  * @param put_path Path of the put request.
709  * @param put_path_length Length of the put_path.
710  */
711 static void
712 regex_found_handler (void *cls,
713                      const struct GNUNET_PeerIdentity *id,
714                      const struct GNUNET_PeerIdentity *get_path,
715                      unsigned int get_path_length,
716                      const struct GNUNET_PeerIdentity *put_path,
717                      unsigned int put_path_length)
718 {
719   struct RegexPeer *peer = cls;
720   char output_buffer[512];
721   size_t size;
722
723   if (GNUNET_YES == peer->search_str_matched)
724   {
725     GNUNET_log (GNUNET_ERROR_TYPE_ERROR, 
726                 "String %s on peer %u already matched!\n",
727                 peer->search_str, peer->id);
728     return;
729   }
730
731   strings_found++;
732   parallel_searches--;
733
734   if (GNUNET_SCHEDULER_NO_TASK != peer->timeout)
735   {
736     GNUNET_SCHEDULER_cancel (peer->timeout);
737     peer->timeout = GNUNET_SCHEDULER_NO_TASK;
738     if (GNUNET_NO == in_shutdown)
739       GNUNET_SCHEDULER_add_now (&announce_next_regex, NULL);
740   }
741
742   if (NULL == id)
743   {
744     // FIXME not possible right now
745     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
746                 "String matching timed out for string %s on peer %u (%i/%i)\n",
747                 peer->search_str, peer->id, strings_found, num_peers);
748     peer->search_str_matched = GNUNET_SYSERR;
749   }
750   else
751   {
752     prof_time = GNUNET_TIME_absolute_get_duration (peer->prof_start_time);
753
754     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
755                 "String %s found on peer %u after %s (%i/%i) (%u||)\n",
756                 peer->search_str, peer->id,
757                 GNUNET_STRINGS_relative_time_to_string (prof_time, GNUNET_NO),
758                 strings_found, num_peers, parallel_searches);
759
760     peer->search_str_matched = GNUNET_YES;
761
762     if (NULL != data_file)
763     {
764       size =
765         GNUNET_snprintf (output_buffer,
766                          sizeof (output_buffer),
767                          "%p Peer: %u\n"
768                          "%p Search string: %s\n"
769                          "%p Search duration: %s\n\n",
770                          peer, peer->id,
771                          peer, peer->search_str,
772                          peer,
773                          GNUNET_STRINGS_relative_time_to_string (prof_time,
774                                                                  GNUNET_NO));
775
776       if (size != GNUNET_DISK_file_write (data_file, output_buffer, size))
777         GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Unable to write to file!\n");
778     }
779   }
780
781   GNUNET_TESTBED_operation_done (peer->op_handle);
782   peer->op_handle = NULL;
783
784   if (strings_found == num_peers)
785   {
786     prof_time = GNUNET_TIME_absolute_get_duration (prof_start_time);
787     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
788                 "All strings successfully matched in %s\n",
789                 GNUNET_STRINGS_relative_time_to_string (prof_time, GNUNET_NO));
790
791     if (GNUNET_SCHEDULER_NO_TASK != search_timeout_task)
792       GNUNET_SCHEDULER_cancel (search_timeout_task);
793
794     GNUNET_log (GNUNET_ERROR_TYPE_INFO, "Collecting stats and shutting down.\n");
795     GNUNET_SCHEDULER_add_now (&do_collect_stats, NULL);
796   }
797 }
798
799
800 /**
801  * Connect by string timeout task. This will cancel the profiler after the
802  * specified timeout 'search_timeout'.
803  *
804  * @param cls NULL
805  * @param tc the task context
806  */
807 static void
808 search_timed_out (void *cls, const struct GNUNET_SCHEDULER_TaskContext * tc)
809 {
810   unsigned int i;
811
812   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
813               "Finding matches to all strings did not succeed after %s.\n",
814               GNUNET_STRINGS_relative_time_to_string (search_timeout_time,
815                                                       GNUNET_NO));
816   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
817               "Found %i of %i strings\n", strings_found, num_peers);
818
819   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
820               "Search timed out after %s."
821               "Collecting stats and shutting down.\n", 
822               GNUNET_STRINGS_relative_time_to_string (search_timeout_time,
823                                                       GNUNET_NO));
824
825   in_shutdown = GNUNET_YES;
826   for (i = 0; i < num_peers; i++)
827   {
828     if (NULL != peers[i].op_handle)
829     {
830       GNUNET_TESTBED_operation_done (peers[i].op_handle);
831       peers[i].op_handle = NULL;
832     }
833   }
834   GNUNET_SCHEDULER_add_now (&do_collect_stats, NULL);
835 }
836
837
838 /**
839  * Search timed out. It might still complete in the future,
840  * but we should start another one.
841  *
842  * @param cls Index of the next peer in the peers array.
843  * @param tc TaskContext.
844  */
845 static void
846 find_timed_out (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
847 {
848   struct RegexPeer *p = cls;
849
850   p->timeout = GNUNET_SCHEDULER_NO_TASK;
851
852   if ((tc->reason & GNUNET_SCHEDULER_REASON_SHUTDOWN) != 0)
853     return;
854   GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
855               "Searching for string \"%s\" on peer %d timed out.\n",
856               p->search_str,
857               p->id);
858   if (GNUNET_NO == in_shutdown)
859     GNUNET_SCHEDULER_add_now (&announce_next_regex, NULL);
860 }
861
862
863 /**
864  * Start searching for a string in the DHT.
865  *
866  * @param cls Index of the next peer in the peers array.
867  * @param tc TaskContext.
868  */
869 static void
870 find_string (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
871 {
872   unsigned int search_peer = (unsigned int) (long) cls;
873
874   if (0 != (tc->reason & GNUNET_SCHEDULER_REASON_SHUTDOWN) ||
875       search_peer >= num_peers ||
876       GNUNET_YES == in_shutdown)
877     return;
878
879   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
880               "Searching for string \"%s\" on peer %d (%u||)\n",
881               peers[search_peer].search_str,
882               search_peer,
883               parallel_searches);
884
885   peers[search_peer].op_handle =
886     GNUNET_TESTBED_service_connect (NULL,
887                                     peers[search_peer].peer_handle,
888                                     "dht",
889                                     &dht_connect_cb,
890                                     &peers[search_peer],
891                                     &dht_ca,
892                                     &dht_da,
893                                     &peers[search_peer]);
894   GNUNET_assert (NULL != peers[search_peer].op_handle);
895   peers[search_peer].timeout = GNUNET_SCHEDULER_add_delayed (FIND_TIMEOUT,
896                                                           &find_timed_out,
897                                                           &peers[search_peer]);
898 }
899
900
901
902
903 /**
904  * Callback called when testbed has started the daemon we asked for.
905  *
906  * @param cls NULL
907  * @param op the operation handle
908  * @param emsg NULL on success; otherwise an error description
909  */
910 static void
911 daemon_started (void *cls, struct GNUNET_TESTBED_Operation *op,
912                 const char *emsg)
913 {
914   struct RegexPeer *peer = (struct RegexPeer *) cls;
915   unsigned long search_peer;
916   unsigned int i;
917
918   GNUNET_TESTBED_operation_done (peer->daemon_op);
919   peer->daemon_op = NULL;
920   if (NULL != emsg)
921   {
922     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
923                 "Failed to start/stop daemon at peer %u: %s\n", peer->id, emsg);
924     GNUNET_abort ();
925   }
926
927   /* Find a peer to look for a string matching the regex announced */
928   search_peer = GNUNET_CRYPTO_random_u32 (GNUNET_CRYPTO_QUALITY_WEAK,
929                                           num_peers);
930   for (i = 0; peers[search_peer].search_str != NULL; i++)
931   {
932     search_peer = (search_peer + 1) % num_peers;
933     if (i > num_peers)
934       GNUNET_abort (); /* we ran out of peers, must be a bug */
935   }
936   peers[search_peer].search_str = search_strings[peer->id];
937   peers[search_peer].search_str_matched = GNUNET_NO;
938   GNUNET_SCHEDULER_add_delayed (GNUNET_TIME_relative_multiply(
939                                   reannounce_period_max,
940                                   2),
941                                 &find_string,
942                                 (void *) search_peer);
943 }
944
945
946 /**
947  * Task to start the daemons on each peer so that the regexes are announced
948  * into the DHT.
949  *
950  * @param cls NULL
951  * @param tc the task context
952  */
953 static void
954 do_announce (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
955 {
956   unsigned int i;
957
958   GNUNET_log (GNUNET_ERROR_TYPE_INFO, "Starting announce.\n");
959
960   for (i = 0; i < init_parallel_searches; i++)
961   {
962     GNUNET_log (GNUNET_ERROR_TYPE_INFO,
963                 "  scheduling announce %u\n",
964                 i);
965     (void) GNUNET_SCHEDULER_add_now (&announce_next_regex, NULL);
966   }
967 }
968
969
970 /**
971  * Start announcing the next regex in the DHT.
972  *
973  * @param cls Closure (unused).
974  * @param tc TaskContext.
975  */
976 static void
977 announce_next_regex (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
978 {
979   struct RegexPeer *peer;
980
981   if (0 != (tc->reason & GNUNET_SCHEDULER_REASON_SHUTDOWN) ||
982             next_search >= num_peers)
983     return;
984
985   GNUNET_log (GNUNET_ERROR_TYPE_INFO, "Starting daemon %u\n", next_search);
986   peer = &peers[next_search];
987   peer->daemon_op = 
988   GNUNET_TESTBED_peer_manage_service (NULL,
989                                       peer->peer_handle,
990                                       "regexprofiler",
991                                       &daemon_started,
992                                       peer,
993                                       1);
994   next_search++;
995   parallel_searches++;
996 }
997
998 /**
999  * DHT connect callback. Called when we are connected to the dht service for
1000  * the peer in 'cls'. If successfull we connect to the stats service of this
1001  * peer and then try to match the search string of this peer.
1002  *
1003  * @param cls internal peer id.
1004  * @param op operation handle.
1005  * @param ca_result connect adapter result.
1006  * @param emsg error message.
1007  */
1008 static void
1009 dht_connect_cb (void *cls, struct GNUNET_TESTBED_Operation *op,
1010                 void *ca_result, const char *emsg)
1011 {
1012   struct RegexPeer *peer = (struct RegexPeer *) cls;
1013
1014   if (NULL != emsg || NULL == op || NULL == ca_result)
1015   {
1016     GNUNET_log (GNUNET_ERROR_TYPE_ERROR, "DHT connect failed: %s\n", emsg);
1017     GNUNET_abort ();
1018   }
1019
1020   GNUNET_assert (NULL != peer->dht_handle);
1021   GNUNET_assert (peer->op_handle == op);
1022   GNUNET_assert (peer->dht_handle == ca_result);
1023
1024   peer->search_str_matched = GNUNET_NO;
1025   peer->search_handle = GNUNET_REGEX_search (peer->dht_handle,
1026                                              peer->search_str,
1027                                              &regex_found_handler, peer,
1028                                              NULL);
1029   peer->prof_start_time = GNUNET_TIME_absolute_get ();
1030 }
1031
1032
1033 /**
1034  * DHT connect adapter. Opens a connection to the dht service.
1035  *
1036  * @param cls Closure (peer).
1037  * @param cfg Configuration handle.
1038  *
1039  * @return
1040  */
1041 static void *
1042 dht_ca (void *cls, const struct GNUNET_CONFIGURATION_Handle *cfg)
1043 {
1044   struct RegexPeer *peer = cls;
1045
1046   peer->dht_handle = GNUNET_DHT_connect (cfg, 32);
1047
1048   return peer->dht_handle;
1049 }
1050
1051
1052 /**
1053  * Adapter function called to destroy a connection to the dht service.
1054  *
1055  * @param cls Closure (peer).
1056  * @param op_result Service handle returned from the connect adapter.
1057  */
1058 static void
1059 dht_da (void *cls, void *op_result)
1060 {
1061   struct RegexPeer *peer = (struct RegexPeer *) cls;
1062
1063   GNUNET_assert (peer->dht_handle == op_result);
1064
1065   if (NULL != peer->search_handle)
1066   {
1067     GNUNET_REGEX_search_cancel (peer->search_handle);
1068     peer->search_handle = NULL;
1069   }
1070
1071   if (NULL != peer->dht_handle)
1072   {
1073     GNUNET_DHT_disconnect (peer->dht_handle);
1074     peer->dht_handle = NULL;
1075   }
1076 }
1077
1078
1079 /**
1080  * Signature of a main function for a testcase.
1081  *
1082  * @param cls NULL
1083  * @param num_peers_ number of peers in 'peers'
1084  * @param peers handle to peers run in the testbed.  NULL upon timeout (see
1085  *          GNUNET_TESTBED_test_run()).
1086  * @param links_succeeded the number of overlay link connection attempts that
1087  *          succeeded
1088  * @param links_failed the number of overlay link connection attempts that
1089  *          failed
1090  */
1091 static void 
1092 test_master (void *cls,
1093              unsigned int num_peers_,
1094              struct GNUNET_TESTBED_Peer **testbed_peers,
1095              unsigned int links_succeeded,
1096              unsigned int links_failed)
1097 {
1098   unsigned int i;
1099
1100   GNUNET_assert (num_peers_ == num_peers);
1101
1102   prof_time = GNUNET_TIME_absolute_get_duration (prof_start_time);
1103   GNUNET_log (GNUNET_ERROR_TYPE_INFO,
1104               "Testbed started in %s\n",
1105               GNUNET_STRINGS_relative_time_to_string (prof_time, GNUNET_NO));
1106
1107   if (GNUNET_SCHEDULER_NO_TASK != abort_task)
1108   {
1109     GNUNET_SCHEDULER_cancel (abort_task);
1110     abort_task = GNUNET_SCHEDULER_NO_TASK;
1111   }
1112
1113   for (i = 0; i < num_peers; i++)
1114   {
1115     peers[i].peer_handle = testbed_peers[i];
1116   }
1117   if (GNUNET_NO ==
1118       GNUNET_CONFIGURATION_get_value_yesno (cfg, "DHT", "DISABLE_TRY_CONNECT"))
1119   {
1120     struct GNUNET_TIME_Relative settle_time;
1121
1122     settle_time =
1123       GNUNET_TIME_relative_multiply (GNUNET_TIME_UNIT_MILLISECONDS,
1124                                      10 * num_peers);
1125     GNUNET_log (GNUNET_ERROR_TYPE_INFO, 
1126                 "Waiting for DHT for %s to settle new connections.\n\n",
1127                 GNUNET_STRINGS_relative_time_to_string(settle_time, GNUNET_NO));
1128     GNUNET_SCHEDULER_add_delayed (settle_time, &do_announce, NULL);
1129   }
1130   else
1131   {
1132     GNUNET_SCHEDULER_add_now (&do_announce, NULL);
1133   }
1134   search_timeout_task =
1135       GNUNET_SCHEDULER_add_delayed (search_timeout_time, &search_timed_out, NULL);
1136 }
1137
1138 /**
1139  * Function that will be called whenever something in the testbed changes.
1140  *
1141  * @param cls closure, NULL
1142  * @param event information on what is happening
1143  */
1144 static void
1145 master_controller_cb (void *cls, 
1146                       const struct GNUNET_TESTBED_EventInformation *event)
1147 {
1148   switch (event->type)
1149   {
1150   case GNUNET_TESTBED_ET_CONNECT:
1151     printf(".");
1152     break;
1153   case GNUNET_TESTBED_ET_PEER_START:
1154     printf("#");
1155     break;
1156   default:
1157     break;
1158   }
1159   fflush(stdout);
1160 }
1161
1162
1163 /******************************************************************************/
1164 /***************************  TESTBED PEER SETUP  *****************************/
1165 /******************************************************************************/
1166
1167
1168 /**
1169  * Load search strings from given filename. One search string per line.
1170  *
1171  * @param filename filename of the file containing the search strings.
1172  * @param strings set of strings loaded from file. Caller needs to free this
1173  *                if number returned is greater than zero.
1174  * @param limit upper limit on the number of strings read from the file
1175  * @return number of strings found in the file. GNUNET_SYSERR on error.
1176  */
1177 static int
1178 load_search_strings (const char *filename, char ***strings, unsigned int limit)
1179 {
1180   char *data;
1181   char *buf;
1182   uint64_t filesize;
1183   unsigned int offset;
1184   int str_cnt;
1185   unsigned int i;
1186
1187   if (NULL == filename)
1188   {
1189     return GNUNET_SYSERR;
1190   }
1191
1192   if (GNUNET_YES != GNUNET_DISK_file_test (filename))
1193   {
1194     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
1195                 "Could not find search strings file %s\n", filename);
1196     return GNUNET_SYSERR;
1197   }
1198   if (GNUNET_OK != GNUNET_DISK_file_size (filename, &filesize, GNUNET_YES, GNUNET_YES))
1199     filesize = 0;
1200   if (0 == filesize)
1201   {
1202     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Search strings file %s is empty.\n", filename);
1203     return GNUNET_SYSERR;
1204   }
1205   data = GNUNET_malloc (filesize);
1206   if (filesize != GNUNET_DISK_fn_read (filename, data, filesize))
1207   {
1208     GNUNET_free (data);
1209     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, "Could not read search strings file %s.\n",
1210          filename);
1211     return GNUNET_SYSERR;
1212   }
1213   buf = data;
1214   offset = 0;
1215   str_cnt = 0;
1216   while (offset < (filesize - 1) && str_cnt < limit)
1217   {
1218     offset++;
1219     if (((data[offset] == '\n')) && (buf != &data[offset]))
1220     {
1221       data[offset] = '\0';
1222       str_cnt++;
1223       buf = &data[offset + 1];
1224     }
1225     else if ((data[offset] == '\n') || (data[offset] == '\0'))
1226       buf = &data[offset + 1];
1227   }
1228   *strings = GNUNET_malloc (sizeof (char *) * str_cnt);
1229   offset = 0;
1230   for (i = 0; i < str_cnt; i++)
1231   {
1232     GNUNET_asprintf (&(*strings)[i], "%s%s", regex_prefix, &data[offset]);
1233     offset += strlen (&data[offset]) + 1;
1234   }
1235   GNUNET_free (data);
1236   return str_cnt;
1237 }
1238
1239
1240 /**
1241  * Main function that will be run by the scheduler.
1242  *
1243  * @param cls closure
1244  * @param args remaining command-line arguments
1245  * @param cfgfile name of the configuration file used (for saving, can be NULL!)
1246  * @param config configuration
1247  */
1248 static void
1249 run (void *cls, char *const *args, const char *cfgfile,
1250      const struct GNUNET_CONFIGURATION_Handle *config)
1251 {
1252   unsigned int nsearchstrs;
1253   unsigned int i;
1254   struct GNUNET_TIME_Relative abort_time;
1255
1256   in_shutdown = GNUNET_NO;
1257
1258   /* Check config */
1259   if (NULL == config)
1260   {
1261     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1262                 _("No configuration file given. Exiting\n"));
1263     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1264     return;
1265   }
1266   cfg = GNUNET_CONFIGURATION_dup (config);
1267   if (GNUNET_OK !=
1268       GNUNET_CONFIGURATION_get_value_string (cfg, "REGEXPROFILER",
1269                                              "REGEX_PREFIX",
1270                                              &regex_prefix))
1271   {
1272     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1273                 _("Configuration option \"regex_prefix\" missing. Exiting\n"));
1274     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1275     return;
1276   }
1277   if (GNUNET_OK !=
1278       GNUNET_CONFIGURATION_get_value_number (cfg, "REGEXPROFILER",
1279                                              "PARALLEL_SEARCHES",
1280                                              &init_parallel_searches))
1281   {
1282     GNUNET_log (GNUNET_ERROR_TYPE_WARNING,
1283                 "Configuration option \"PARALLEL_SEARCHES\" missing."
1284                 " Using default (%d)\n", 10);
1285     init_parallel_searches = 10;
1286   }
1287   if (GNUNET_OK !=
1288       GNUNET_CONFIGURATION_get_value_time (cfg, "REGEXPROFILER",
1289                                            "REANNOUNCE_PERIOD_MAX",
1290                                            &reannounce_period_max))
1291   {
1292     GNUNET_log (GNUNET_ERROR_TYPE_WARNING, 
1293                 "reannounce_period_max not given. Using 10 minutes.\n");
1294     reannounce_period_max =
1295       GNUNET_TIME_relative_multiply (GNUNET_TIME_UNIT_MINUTES, 10);
1296   }
1297
1298   /* Check arguments */
1299   if (NULL == policy_dir)
1300   {
1301     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1302                 _("No policy directory specified on command line. Exiting.\n"));
1303     return;
1304   }
1305   if (GNUNET_YES != GNUNET_DISK_directory_test (policy_dir, GNUNET_YES))
1306   {
1307     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1308                 _("Specified policies directory does not exist. Exiting.\n"));
1309     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1310     return;
1311   }
1312   if (-1 == (num_peers = GNUNET_DISK_directory_scan (policy_dir, NULL, NULL)))
1313   {
1314     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1315                 _("No files found in `%s'\n"),
1316                 policy_dir);
1317     return;
1318   }
1319   GNUNET_CONFIGURATION_set_value_string (cfg, "REGEXPROFILER",
1320                                          "POLICY_DIR", policy_dir);
1321   if (GNUNET_YES != GNUNET_DISK_file_test (strings_file))
1322   {
1323     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1324                 _("No search strings file given. Exiting.\n"));
1325     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1326     return;
1327   }
1328   nsearchstrs = load_search_strings (strings_file,
1329                                      &search_strings,
1330                                      num_peers);
1331   if (num_peers != nsearchstrs)
1332   {
1333     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1334                 "Error loading search strings.\n");
1335     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1336                 "File (%s) does not contain enough strings (%u/%u).\n",
1337                 strings_file, nsearchstrs, num_peers);
1338     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1339     return;
1340   }
1341   if (0 >= num_peers || NULL == search_strings)
1342   {
1343     GNUNET_log (GNUNET_ERROR_TYPE_ERROR,
1344                 _("Error loading search strings. Exiting.\n"));
1345     shutdown_task = GNUNET_SCHEDULER_add_now (&do_shutdown, NULL);
1346     return;
1347   }
1348   for (i = 0; i < num_peers; i++)
1349     GNUNET_log (GNUNET_ERROR_TYPE_DEBUG,
1350                 "search string: %s\n",
1351                 search_strings[i]);
1352
1353   /* Check logfile */
1354   if ( (NULL != data_filename) &&
1355        (NULL == (data_file =
1356                  GNUNET_DISK_file_open (data_filename,
1357                                         GNUNET_DISK_OPEN_READWRITE |
1358                                         GNUNET_DISK_OPEN_TRUNCATE |
1359                                         GNUNET_DISK_OPEN_CREATE,
1360                                         GNUNET_DISK_PERM_USER_READ |
1361                                         GNUNET_DISK_PERM_USER_WRITE))) )
1362   {
1363     GNUNET_log_strerror_file (GNUNET_ERROR_TYPE_ERROR,
1364                               "open",
1365                               data_filename);
1366     return;
1367   }
1368
1369   /* Initialize peers */
1370   peers = GNUNET_malloc (sizeof (struct RegexPeer) * num_peers);
1371   for (i = 0; i < num_peers; i++)
1372   {
1373     peers[i].id = i;
1374   }
1375
1376   GNUNET_CONFIGURATION_set_value_number (cfg,
1377                                          "TESTBED", "OVERLAY_RANDOM_LINKS",
1378                                          num_peers * 10);
1379   GNUNET_CONFIGURATION_set_value_number (cfg,
1380                                          "DHT", "FORCE_NSE",
1381                                          (long long unsigned) log2 (num_peers));
1382   event_mask = 0LL;
1383 /* For feedback about the start process activate these and pass master_cb */
1384   event_mask |= (1LL << GNUNET_TESTBED_ET_PEER_START);
1385 //   event_mask |= (1LL << GNUNET_TESTBED_ET_PEER_STOP);
1386   event_mask |= (1LL << GNUNET_TESTBED_ET_CONNECT);
1387 //   event_mask |= (1LL << GNUNET_TESTBED_ET_DISCONNECT);
1388   prof_start_time = GNUNET_TIME_absolute_get ();
1389   GNUNET_TESTBED_run (hosts_file,
1390                       cfg,
1391                       num_peers,
1392                       event_mask,
1393                       &master_controller_cb,
1394                       NULL,     /* master_controller_cb cls */
1395                       &test_master,
1396                       NULL);    /* test_master cls */
1397   if (GNUNET_OK !=
1398       GNUNET_CONFIGURATION_get_value_time (cfg, "TESTBED",
1399                                            "SETUP_TIMEOUT",
1400                                            &abort_time))
1401   {
1402     abort_time =
1403       GNUNET_TIME_relative_multiply (GNUNET_TIME_UNIT_MINUTES, 15);
1404   }
1405   abort_time = GNUNET_TIME_relative_add (abort_time, GNUNET_TIME_UNIT_MINUTES);
1406   abort_task =
1407       GNUNET_SCHEDULER_add_delayed (abort_time,
1408                                     &do_abort,
1409                                     (void*) __LINE__);
1410 }
1411
1412
1413 /**
1414  * Main function.
1415  *
1416  * @param argc argument count
1417  * @param argv argument values
1418  * @return 0 on success
1419  */
1420 int
1421 main (int argc, char *const *argv)
1422 {
1423   static const struct GNUNET_GETOPT_CommandLineOption options[] = {
1424     {'o', "output-file", "FILENAME",
1425      gettext_noop ("name of the file for writing statistics"),
1426      GNUNET_YES, &GNUNET_GETOPT_set_string, &data_filename},
1427     {'t', "matching-timeout", "TIMEOUT",
1428       gettext_noop ("wait TIMEOUT before ending the experiment"),
1429       GNUNET_YES, &GNUNET_GETOPT_set_relative_time, &search_timeout_time},
1430     {'p', "policy-dir", "DIRECTORY",
1431       gettext_noop ("directory with policy files"),
1432       GNUNET_YES, &GNUNET_GETOPT_set_filename, &policy_dir},
1433     {'s', "strings-file", "FILENAME",
1434       gettext_noop ("name of file with input strings"),
1435       GNUNET_YES, &GNUNET_GETOPT_set_filename, &strings_file},
1436     {'H', "hosts-file", "FILENAME",
1437       gettext_noop ("name of file with hosts' names"),
1438       GNUNET_YES, &GNUNET_GETOPT_set_filename, &hosts_file},
1439     GNUNET_GETOPT_OPTION_END
1440   };
1441   int ret;
1442
1443   if (GNUNET_OK != GNUNET_STRINGS_get_utf8_args (argc, argv, &argc, &argv))
1444     return 2;
1445   result = GNUNET_SYSERR;
1446   ret =
1447       GNUNET_PROGRAM_run (argc, argv,
1448                           "gnunet-regex-profiler",
1449                           _("Profiler for regex"),
1450                           options, &run, NULL);
1451   if (GNUNET_OK != ret)
1452     return ret;
1453   if (GNUNET_OK != result)
1454     return 1;
1455   return 0;
1456 }