ats_ril: fixed trying to suggest address, when none is left
[oweals/gnunet.git] / src / ats / gnunet-service-ats-solver_ril.c
1 /*
2  This file is part of GNUnet.
3  (C) 2011 Christian Grothoff (and other contributing authors)
4
5  GNUnet is free software; you can redistribute it and/or modify
6  it under the terms of the GNU General Public License as published
7  by the Free Software Foundation; either version 3, or (at your
8  option) any later version.
9
10  GNUnet is distributed in the hope that it will be useful, but
11  WITHOUT ANY WARRANTY; without even the implied warranty of
12  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  General Public License for more details.
14
15  You should have received a copy of the GNU General Public License
16  along with GNUnet; see the file COPYING.  If not, write to the
17  Free Software Foundation, Inc., 59 Temple Place - Suite 330,
18  Boston, MA 02111-1307, USA.
19  */
20
21 /**
22  * @file ats/gnunet-service-ats-solver_ril.c
23  * @brief ATS reinforcement learning solver
24  * @author Fabian Oehlmann
25  * @author Matthias Wachs
26  */
27 #include "platform.h"
28 #include "float.h"
29 #include "gnunet_util_lib.h"
30 #include "gnunet-service-ats_addresses.h"
31 #include "gnunet_statistics_service.h"
32
33 #define LOG(kind,...) GNUNET_log_from (kind, "ats-ril",__VA_ARGS__)
34
35 #define RIL_ACTION_INVALID -1
36
37 #define RIL_DEFAULT_STEP_TIME GNUNET_TIME_relative_multiply (GNUNET_TIME_UNIT_MILLISECONDS, 3000)
38 #define RIL_DEFAULT_ALGORITHM RIL_ALGO_Q
39 #define RIL_DEFAULT_DISCOUNT_FACTOR 0.5
40 #define RIL_DEFAULT_GRADIENT_STEP_SIZE 0.4
41 #define RIL_DEFAULT_TRACE_DECAY 0.6
42 #define RIL_EXPLORE_RATIO 0.1
43
44 /**
45  * ATS reinforcement learning solver
46  *
47  * General description
48  */
49
50 /**
51  * TODO! implement reward calculation 1 and 2 (i.e. meeting preferences and taking scores)
52  */
53
54 enum RIL_Action_Type
55 {
56   RIL_ACTION_NOTHING = 0,
57   RIL_ACTION_BW_IN_DBL = 1,
58   RIL_ACTION_BW_IN_HLV = 2,
59   RIL_ACTION_BW_IN_INC = 3,
60   RIL_ACTION_BW_IN_DEC = 4,
61   RIL_ACTION_BW_OUT_DBL = 5,
62   RIL_ACTION_BW_OUT_HLV = 6,
63   RIL_ACTION_BW_OUT_INC = 7,
64   RIL_ACTION_BW_OUT_DEC = 8,
65   RIL_ACTION_TYPE_NUM = 9
66 };
67
68 enum RIL_Algorithm
69 {
70   RIL_ALGO_SARSA = 0,
71   RIL_ALGO_Q = 1
72 };
73
74 enum RIL_E_Modification
75 {
76   RIL_E_SET,
77   RIL_E_ZERO,
78   RIL_E_ACCUMULATE,
79   RIL_E_REPLACE
80 };
81
82 /**
83  * Global learning parameters
84  */
85 struct RIL_Learning_Parameters
86 {
87   /**
88    * The TD-algorithm to use
89    */
90   enum RIL_Algorithm algorithm;
91
92   /**
93    * Learning discount factor in the TD-update
94    */
95   float gamma;
96
97   /**
98    * Gradient-descent step-size
99    */
100   float alpha;
101
102   /**
103    * Trace-decay factor for eligibility traces
104    */
105   float lambda;
106 };
107
108 /**
109  * Wrapper for addresses to store them in agent's linked list
110  */
111 struct RIL_Address_Wrapped
112 {
113   /**
114    * Next in DLL
115    */
116   struct RIL_Address_Wrapped *next;
117
118   /**
119    * Previous in DLL
120    */
121   struct RIL_Address_Wrapped *prev;
122
123   /**
124    * The address
125    */
126   struct ATS_Address *address_naked;
127 };
128
129 struct RIL_Peer_Agent
130 {
131   /**
132    * Next agent in solver's linked list
133    */
134   struct RIL_Peer_Agent *next;
135
136   /**
137    * Previous agent in solver's linked list
138    */
139   struct RIL_Peer_Agent *prev;
140
141   /**
142    * Environment handle
143    */
144   struct GAS_RIL_Handle *envi;
145
146   /**
147    * Peer ID
148    */
149   struct GNUNET_PeerIdentity peer;
150
151   /**
152    * Whether the agent is active or not
153    */
154   int active;
155
156   /**
157    * Number of performed time-steps
158    */
159   unsigned long long step_count;
160
161   /**
162    * Experience matrix W
163    */
164   double ** W;
165
166   /**
167    * Number of rows of W / Number of state-vector features
168    */
169   unsigned int m;
170
171   /**
172    * Number of columns of W / Number of actions
173    */
174   unsigned int n;
175
176   /**
177    * Last perceived state feature vector
178    */
179   double * s_old;
180
181   /**
182    * Last chosen action
183    */
184   int a_old;
185
186   /**
187    * Eligibility trace vector
188    */
189   double * e;
190
191   /**
192    * Address in use
193    */
194   struct ATS_Address * address_inuse;
195
196   /**
197    * Head of addresses DLL
198    */
199   struct RIL_Address_Wrapped * addresses_head;
200
201   /**
202    * Tail of addresses DLL
203    */
204   struct RIL_Address_Wrapped * addresses_tail;
205
206   /**
207    * Inbound bandwidth assigned by the agent
208    */
209   unsigned long long bw_in;
210
211   /**
212    * Outbound bandwidth assigned by the agent
213    */
214   unsigned long long bw_out;
215 };
216
217 struct RIL_Network
218 {
219   /**
220    * ATS network type
221    */
222   enum GNUNET_ATS_Network_Type type;
223
224   /**
225    * Total available inbound bandwidth
226    */
227   unsigned long long bw_in_available;
228
229   /**
230    * Total assigned outbound bandwidth
231    */
232   unsigned long long bw_in_assigned;
233
234   /**
235    * Total available outbound bandwidth
236    */
237   unsigned long long bw_out_available;
238
239   /**
240    * Total assigned outbound bandwidth
241    */
242   unsigned long long bw_out_assigned;
243 };
244
245 struct RIL_Callbacks
246 {
247   /**
248    * Bandwidth changed callback
249    */
250   GAS_bandwidth_changed_cb bw_changed;
251
252   /**
253    * Bandwidth changed callback cls
254    */
255   void *bw_changed_cls;
256
257   /**
258    * ATS function to get preferences
259    */
260   GAS_get_preferences get_preferences;
261
262   /**
263    * Closure for ATS function to get preferences
264    */
265   void *get_preferences_cls;
266
267   /**
268    * ATS function to get properties
269    */
270   GAS_get_properties get_properties;
271
272   /**
273    * Closure for ATS function to get properties
274    */
275   void *get_properties_cls;
276 };
277
278 /**
279  * A handle for the reinforcement learning solver
280  */
281 struct GAS_RIL_Handle
282 {
283   /**
284    * Statistics handle
285    */
286   struct GNUNET_STATISTICS_Handle *stats;
287
288   /**
289    * Hashmap containing all valid addresses
290    */
291   const struct GNUNET_CONTAINER_MultiHashMap *addresses;
292
293   /**
294    * Callbacks for the solver
295    */
296   struct RIL_Callbacks *callbacks;
297
298   /**
299    * Bulk lock
300    */
301   int bulk_lock;
302
303   /**
304    * Number of changes while solver was locked
305    */
306   int bulk_requests;
307
308   /**
309    * Number of performed time-steps
310    */
311   unsigned long long step_count;
312
313   /**
314    * Interval time between steps in milliseconds //TODO? put in agent
315    */
316   struct GNUNET_TIME_Relative step_time;
317
318   /**
319    * Task identifier of the next time-step to be executed //TODO? put in agent
320    */
321   GNUNET_SCHEDULER_TaskIdentifier next_step;
322
323   /**
324    * Learning parameters
325    */
326   struct RIL_Learning_Parameters parameters;
327
328   /**
329    * Array of networks with global assignment state
330    */
331   struct RIL_Network * network_entries;
332
333   /**
334    * Networks count
335    */
336   unsigned int networks_count;
337
338   /**
339    * List of active peer-agents
340    */
341   struct RIL_Peer_Agent * agents_head;
342   struct RIL_Peer_Agent * agents_tail;
343 };
344
345 /**
346  *  Private functions
347  *  ---------------------------
348  */
349
350 /**
351  * Estimate the current action-value for state s and action a
352  * @param agent agent performing the estimation
353  * @param state s
354  * @param action a
355  * @return estimation value
356  */
357 static double
358 agent_estimate_q (struct RIL_Peer_Agent *agent, double *state, int action)
359 {
360   int i;
361   double result = 0;
362
363   for (i = 0; i < agent->m; i++)
364   {
365     result += state[i] * agent->W[action][i];
366   }
367
368   return result;
369 }
370
371 /**
372  * Decide whether to do exploration (i.e. taking a new action) or exploitation (i.e. taking the
373  * currently estimated best action) in the current step
374  * @param agent agent performing the step
375  * @return yes, if exploring
376  */
377 static int
378 agent_decide_exploration (struct RIL_Peer_Agent *agent)
379 {
380   double r = (double) GNUNET_CRYPTO_random_u32 (GNUNET_CRYPTO_QUALITY_WEAK,
381       UINT32_MAX) / (double) UINT32_MAX;
382
383 if  (r < RIL_EXPLORE_RATIO)
384   {
385     return GNUNET_YES;
386   }
387   return GNUNET_NO;
388 }
389
390 static int
391 agent_address_get_index (struct RIL_Peer_Agent *agent, struct ATS_Address *address)
392 {
393   int i;
394   struct RIL_Address_Wrapped *cur;
395
396   i = 0;
397   for (cur = agent->addresses_head; NULL != cur; cur = cur->next)
398   {
399     if (cur->address_naked == address)
400     {
401       return i;
402     }
403     i++;
404   }
405
406   return -1;
407 }
408
409 static struct RIL_Address_Wrapped *
410 agent_address_get (struct RIL_Peer_Agent *agent, struct ATS_Address *address)
411 {
412   struct RIL_Address_Wrapped *cur;
413
414   for (cur = agent->addresses_head; NULL != cur; cur = cur->next)
415   {
416     if (cur->address_naked == address)
417     {
418       return cur;
419     }
420   }
421
422   return NULL;
423 }
424
425   /**
426    * Gets the action, with the maximal estimated Q-value (i.e. the one currently estimated to bring the
427    * most reward in the future)
428    * @param agent agent performing the calculation
429    * @param state the state from which to take the action
430    * @return the action promising most future reward
431    */
432 static int
433 agent_get_action_best (struct RIL_Peer_Agent *agent, double *state)
434 {
435   int i;
436   int max_i = RIL_ACTION_INVALID;
437   double cur_q;
438   double max_q = -DBL_MAX;
439
440   for (i = 0; i < agent->n; i++)
441   {
442     cur_q = agent_estimate_q (agent, state, i);
443     if (cur_q > max_q)
444     {
445       max_q = cur_q;
446       max_i = i;
447     }
448   }
449
450   GNUNET_assert(RIL_ACTION_INVALID != max_i);
451
452   return max_i;
453 }
454
455 /**
456  * Gets any action, to explore the action space from that state
457  * @param agent agent performing the calculation
458  * @param state the state from which to take the action
459  * @return any action
460  */
461 static int
462 agent_get_action_explore (struct RIL_Peer_Agent *agent, double *state)
463 {
464   return GNUNET_CRYPTO_random_u32 (GNUNET_CRYPTO_QUALITY_WEAK, agent->n);
465 }
466
467 /**
468  * Updates the weights (i.e. coefficients) of the weight vector in matrix W for action a
469  * @param agent the agent performing the update
470  * @param reward the reward received for the last action
471  * @param s_next the new state, the last step got the agent into
472  * @param a_prime the new
473  */
474 static void
475 agent_update_weights (struct RIL_Peer_Agent *agent, double reward, double *s_next, int a_prime)
476 {
477   int i;
478   double delta;
479   double *theta = agent->W[agent->a_old];
480
481   delta = reward + agent_estimate_q (agent, s_next, a_prime)
482       - agent_estimate_q (agent, agent->s_old, agent->a_old);
483   for (i = 0; i < agent->m; i++)
484   {
485     theta[i] += agent->envi->parameters.alpha * delta * (agent->e)[i];
486   }
487 }
488
489 /**
490  * Changes the eligibility trace vector e in various manners:
491  * RIL_E_ACCUMULATE - adds 1 to each component as in accumulating eligibility traces
492  * RIL_E_REPLACE - resets each component to 1 as in replacing traces
493  * RIL_E_SET - multiplies e with gamma and lambda as in the update rule
494  * RIL_E_ZERO - sets e to 0 as in Watkin's Q-learning algorithm when exploring and when initializing
495  * @param agent
496  * @param mod
497  */
498 static void
499 agent_modify_eligibility (struct RIL_Peer_Agent *agent, enum RIL_E_Modification mod)
500 {
501   int i;
502   double *e = agent->e;
503   double gamma = agent->envi->parameters.gamma;
504   double lambda = agent->envi->parameters.lambda;
505
506   for (i = 0; i < agent->m; i++)
507   {
508     switch (mod)
509     {
510     case RIL_E_ACCUMULATE:
511       e[i] += 1;
512       break;
513     case RIL_E_REPLACE:
514       e[i] = 1;
515       break;
516     case RIL_E_SET:
517       e[i] = gamma * lambda;
518       break;
519     case RIL_E_ZERO:
520       e[i] = 0;
521       break;
522     }
523   }
524 }
525
526 static void
527 envi_set_active_suggestion (struct GAS_RIL_Handle *solver,
528     struct RIL_Peer_Agent *agent,
529     struct ATS_Address *new_address,
530     unsigned long long new_bw_in,
531     unsigned long long new_bw_out)
532 {
533   int notify = GNUNET_NO;
534
535   if (agent->address_inuse != new_address)
536   {
537     if (NULL != agent->address_inuse)
538     {
539       agent->address_inuse->active = GNUNET_NO;
540     }
541     agent->address_inuse = new_address;
542     agent->address_inuse->active = GNUNET_YES;
543     agent->address_inuse->assigned_bw_in.value__ = htonl (agent->bw_in);
544     agent->address_inuse->assigned_bw_out.value__ = htonl (agent->bw_out);
545     notify |= GNUNET_YES;
546   }
547
548   if (agent->bw_in != new_bw_in)
549   {
550     agent->bw_in = new_bw_in;
551     agent->address_inuse->assigned_bw_in.value__ = htonl (new_bw_out);
552     notify |= GNUNET_YES;
553   }
554   if (agent->bw_out != new_bw_out)
555   {
556     agent->bw_out = new_bw_out;
557     agent->address_inuse->assigned_bw_out.value__ = htonl (new_bw_out);
558     notify |= GNUNET_YES;
559   }
560
561   if (notify && agent->active)
562   {
563     solver->callbacks->bw_changed (solver->callbacks->bw_changed_cls, agent->address_inuse);
564   }
565 }
566
567 /**
568  * Allocates a state vector and fills it with the features present
569  * @param solver the solver handle
570  * @return pointer to the state vector
571  */
572 static double *
573 envi_get_state (struct GAS_RIL_Handle *solver)
574 {
575   int i;
576   struct RIL_Network *net;
577   double *state = GNUNET_malloc (sizeof (double) * solver->networks_count * 4);
578
579   for (i = 0; i < solver->networks_count; i++)
580   {
581     net = &solver->network_entries[i];
582     state[i * 4 + 0] = (double) net->bw_in_assigned;
583     state[i * 4 + 1] = (double) net->bw_in_available;
584     state[i * 4 + 2] = (double) net->bw_out_assigned;
585     state[i * 4 + 3] = (double) net->bw_out_available;
586   }
587
588   return state;
589 }
590
591 /**
592  * Gets the reward of the last performed step
593  * @param solver solver handle
594  * @return the reward
595  */
596 static double
597 envi_get_reward (struct GAS_RIL_Handle *solver, struct RIL_Peer_Agent *agent)
598 {
599   //TODO! implement reward calculation
600
601   return (double) GNUNET_CRYPTO_random_u32 (GNUNET_CRYPTO_QUALITY_WEAK, UINT32_MAX)
602       / (double) UINT32_MAX;
603 }
604
605 static void
606 envi_action_bw_double (struct GAS_RIL_Handle *solver,
607     struct RIL_Peer_Agent *agent,
608     int direction_in)
609 {
610   if (direction_in)
611   {
612     envi_set_active_suggestion (solver, agent, agent->address_inuse, agent->bw_in * 2, agent->bw_out);
613   }
614   else
615   {
616     envi_set_active_suggestion (solver, agent, agent->address_inuse, agent->bw_in, agent->bw_out * 2);
617   }
618 }
619
620 static void
621 envi_action_bw_halven (struct GAS_RIL_Handle *solver,
622     struct RIL_Peer_Agent *agent,
623     int direction_in)
624 {
625   uint32_t min_bw = ntohl (GNUNET_CONSTANTS_DEFAULT_BW_IN_OUT.value__);
626   unsigned long long new_bw;
627
628   if (direction_in)
629   {
630     new_bw = agent->bw_in / 2;
631     if (new_bw < min_bw)
632       new_bw = min_bw;
633     envi_set_active_suggestion (solver, agent, agent->address_inuse, new_bw, agent->bw_out);
634   }
635   else
636   {
637     new_bw = agent->bw_out / 2;
638     if (new_bw < min_bw)
639       new_bw = min_bw;
640     envi_set_active_suggestion (solver, agent, agent->address_inuse, agent->bw_in, new_bw);
641   }
642 }
643
644 static void
645 envi_action_bw_inc (struct GAS_RIL_Handle *solver, struct RIL_Peer_Agent *agent, int direction_in)
646 {
647   uint32_t min_bw = ntohl (GNUNET_CONSTANTS_DEFAULT_BW_IN_OUT.value__);
648
649   if (direction_in)
650   {
651     envi_set_active_suggestion (solver, agent, agent->address_inuse, agent->bw_in + (5 * min_bw),
652         agent->bw_out);
653   }
654   else
655   {
656     envi_set_active_suggestion (solver, agent, agent->address_inuse, agent->bw_in,
657         agent->bw_out + (5 * min_bw));
658   }
659 }
660
661 static void
662 envi_action_bw_dec (struct GAS_RIL_Handle *solver, struct RIL_Peer_Agent *agent, int direction_in)
663 {
664   uint32_t min_bw = ntohl (GNUNET_CONSTANTS_DEFAULT_BW_IN_OUT.value__);
665   unsigned long long new_bw;
666
667   if (direction_in)
668   {
669     new_bw = agent->bw_in - (5 * min_bw);
670     if (new_bw < min_bw)
671       new_bw = min_bw;
672     envi_set_active_suggestion (solver, agent, agent->address_inuse, new_bw, agent->bw_out);
673   }
674   else
675   {
676     new_bw = agent->bw_out - (5 * min_bw);
677     if (new_bw < min_bw)
678       new_bw = min_bw;
679     envi_set_active_suggestion (solver, agent, agent->address_inuse, agent->bw_in, new_bw);
680   }
681 }
682
683 static void
684 envi_action_address_switch (struct GAS_RIL_Handle *solver,
685     struct RIL_Peer_Agent *agent,
686     unsigned int address_index)
687 {
688   struct RIL_Address_Wrapped *cur;
689   int i = 0;
690
691   for (cur = agent->addresses_head; NULL != cur; cur = cur->next)
692   {
693     if (i == address_index) {
694       envi_set_active_suggestion(solver, agent, cur->address_naked, agent->bw_in, agent->bw_out);
695       return;
696     }
697
698     i++;
699   }
700
701   //no address with address_index exists
702   GNUNET_assert (GNUNET_NO);
703 }
704
705 /**
706  * Puts the action into effect
707  * @param solver solver handle
708  * @param action action to perform by the solver
709  */
710 static void
711 envi_do_action (struct GAS_RIL_Handle *solver, struct RIL_Peer_Agent *agent, int action)
712 {
713   unsigned int address_index;
714
715   switch (action)
716   {
717   case RIL_ACTION_NOTHING:
718     break;
719   case RIL_ACTION_BW_IN_DBL:
720     envi_action_bw_double (solver, agent, GNUNET_YES);
721     break;
722   case RIL_ACTION_BW_IN_HLV:
723     envi_action_bw_halven (solver, agent, GNUNET_YES);
724     break;
725   case RIL_ACTION_BW_IN_INC:
726     envi_action_bw_inc (solver, agent, GNUNET_YES);
727     break;
728   case RIL_ACTION_BW_IN_DEC:
729     envi_action_bw_dec (solver, agent, GNUNET_YES);
730     break;
731   case RIL_ACTION_BW_OUT_DBL:
732     envi_action_bw_double (solver, agent, GNUNET_NO);
733     break;
734   case RIL_ACTION_BW_OUT_HLV:
735     envi_action_bw_halven (solver, agent, GNUNET_NO);
736     break;
737   case RIL_ACTION_BW_OUT_INC:
738     envi_action_bw_inc (solver, agent, GNUNET_NO);
739     break;
740   case RIL_ACTION_BW_OUT_DEC:
741     envi_action_bw_dec (solver, agent, GNUNET_NO);
742     break;
743   default:
744     if ((action >= RIL_ACTION_TYPE_NUM) && (action < agent->n))
745     {
746       address_index = agent->n - RIL_ACTION_TYPE_NUM;
747
748       GNUNET_assert (address_index >= 0);
749       GNUNET_assert (address_index <= agent_address_get_index (agent, agent->addresses_tail->address_naked));
750
751       envi_action_address_switch (solver, agent, address_index);
752       break;
753     }
754     // error - action does not exist
755     GNUNET_assert(GNUNET_NO);
756   }
757 }
758
759 /**
760  * Performs one step of the Markov Decision Process. Other than in the literature the step starts
761  * after having done the last action a_old. It observes the new state s_next and the reward
762  * received. Then the coefficient update is done according to the SARSA or Q-learning method. The
763  * next action is put into effect.
764  * @param agent the agent performing the step
765  */
766 static void
767 agent_step (struct RIL_Peer_Agent *agent)
768 {
769   int a_next = RIL_ACTION_INVALID;
770   double *s_next;
771   double reward;
772
773   s_next = envi_get_state (agent->envi);
774   reward = envi_get_reward (agent->envi, agent);
775
776   LOG(GNUNET_ERROR_TYPE_DEBUG, "agent_step() with algorithm %s\n",
777       agent->envi->parameters.algorithm ? "Q" : "SARSA");
778
779   switch (agent->envi->parameters.algorithm)
780   {
781   case RIL_ALGO_SARSA:
782     agent_modify_eligibility (agent, RIL_E_SET);
783     if (agent_decide_exploration (agent))
784     {
785       a_next = agent_get_action_explore (agent, s_next);
786     }
787     else
788     {
789       a_next = agent_get_action_best (agent, s_next);
790     }
791     if (RIL_ACTION_INVALID != agent->a_old)
792     {
793       //updates weights with selected action (on-policy), if not first step
794       agent_update_weights (agent, reward, s_next, a_next);
795     }
796     break;
797
798   case RIL_ALGO_Q:
799     a_next = agent_get_action_best (agent, s_next);
800     if (RIL_ACTION_INVALID != agent->a_old)
801     {
802       //updates weights with best action, disregarding actually selected action (off-policy), if not first step
803       agent_update_weights (agent, reward, s_next, a_next);
804     }
805     if (agent_decide_exploration (agent))
806     {
807       a_next = agent_get_action_explore (agent, s_next);
808       agent_modify_eligibility (agent, RIL_E_ZERO);
809     }
810     else
811     {
812       a_next = agent_get_action_best (agent, s_next);
813       agent_modify_eligibility (agent, RIL_E_SET);
814     }
815     break;
816   }
817
818   GNUNET_assert(RIL_ACTION_INVALID != a_next);
819
820   agent_modify_eligibility (agent, RIL_E_ACCUMULATE);
821
822   envi_do_action (agent->envi, agent, a_next);
823
824   GNUNET_free(agent->s_old);
825   agent->s_old = s_next;
826   agent->a_old = a_next;
827
828   agent->step_count += 1;
829 }
830
831 /**
832  * Cycles through all agents and lets the active ones do a step. Schedules the next step.
833  * @param solver the solver handle
834  * @param tc task context for the scheduler
835  */
836 static void
837 ril_periodic_step (void *cls, const struct GNUNET_SCHEDULER_TaskContext *tc)
838 {
839   struct GAS_RIL_Handle *solver = cls;
840   struct RIL_Peer_Agent *cur;
841
842   LOG(GNUNET_ERROR_TYPE_DEBUG, "RIL step number %d\n", solver->step_count);
843
844   for (cur = solver->agents_head; NULL != cur; cur = cur->next)
845   {
846     if (cur->active)
847     {
848       agent_step (cur);
849     }
850   }
851
852   solver->step_count += 1;
853   solver->next_step = GNUNET_SCHEDULER_add_delayed (solver->step_time, &ril_periodic_step, solver);
854 }
855
856 /**
857  * Initialize an agent without addresses and its knowledge base
858  * @param s ril solver
859  * @param peer the one in question
860  * @return handle to the new agent
861  */
862 static struct RIL_Peer_Agent *
863 agent_init (void *s, const struct GNUNET_PeerIdentity *peer)
864 {
865   int i;
866   struct GAS_RIL_Handle * solver = s;
867   struct RIL_Peer_Agent * agent = GNUNET_malloc (sizeof (struct RIL_Peer_Agent));
868
869   agent->envi = solver;
870   agent->peer = *peer;
871   agent->step_count = 0;
872   agent->active = GNUNET_NO;
873   agent->s_old = envi_get_state (solver);
874   agent->n = RIL_ACTION_TYPE_NUM;
875   agent->m = solver->networks_count * 4;
876   agent->W = (double **) GNUNET_malloc (sizeof (double) * agent->n);
877   for (i = 0; i < agent->n; i++)
878   {
879     agent->W[i] = (double *) GNUNET_malloc (sizeof (double) * agent->m);
880   }
881   agent->a_old = RIL_ACTION_INVALID;
882   agent->e = (double *) GNUNET_malloc (sizeof (double) * agent->m);
883   agent_modify_eligibility (agent, RIL_E_ZERO);
884
885   GNUNET_CONTAINER_DLL_insert_tail(solver->agents_head, solver->agents_tail, agent);
886
887   return agent;
888 }
889
890 /**
891  * Deallocate agent
892  * @param s solver handle
893  * @param agent the agent to retire
894  */
895 static void
896 agent_die (struct GAS_RIL_Handle *solver, struct RIL_Peer_Agent *agent)
897 {
898   int i;
899
900   for (i = 0; i < agent->n; i++)
901   {
902     GNUNET_free(agent->W[i]);
903   }
904   GNUNET_free(agent->W);
905   GNUNET_free(agent->e);
906   GNUNET_free(agent->s_old);
907 }
908
909 /**
910  * Returns the agent for a peer
911  * @param s solver handle
912  * @param peer identity of the peer
913  * @param create whether to create an agent if none is allocated yet
914  * @return agent
915  */
916 static struct RIL_Peer_Agent *
917 ril_get_agent (struct GAS_RIL_Handle *solver, const struct GNUNET_PeerIdentity *peer, int create)
918 {
919   struct RIL_Peer_Agent *cur;
920
921   for (cur = solver->agents_head; NULL != cur; cur = cur->next)
922   {
923     if (0 == GNUNET_CRYPTO_hash_cmp (&peer->hashPubKey, &cur->peer.hashPubKey))
924     {
925       return cur;
926     }
927   }
928
929   if (create)
930     return agent_init (solver, peer);
931   return NULL ;
932 }
933
934 /**
935  * Lookup network struct by type
936  *
937  * @param s the solver handle
938  * @param type the network type
939  * @return the network struct
940  */
941 static struct RIL_Network *
942 ril_get_network (struct GAS_RIL_Handle *s, uint32_t type)
943 {
944   int i;
945
946   for (i = 0; i < s->networks_count; i++)
947   {
948     if (s->network_entries[i].type == type)
949     {
950       return &s->network_entries[i];
951     }
952   }
953   return NULL ;
954 }
955
956 static int
957 ril_network_is_active (struct GAS_RIL_Handle *solver, enum GNUNET_ATS_Network_Type network)
958 {
959   struct RIL_Network *net;
960   uint32_t min_bw = ntohl (GNUNET_CONSTANTS_DEFAULT_BW_IN_OUT.value__);
961
962   net = ril_get_network(solver, network);
963   if (net->bw_out_available < min_bw)
964     return GNUNET_NO;
965   return GNUNET_YES;
966 }
967
968 static void
969 ril_cut_from_vector (void **old, size_t element_size, unsigned int hole_start, unsigned int hole_length, unsigned int old_length)
970 {
971   char *tmpptr;
972   char *oldptr = (char *) *old;
973   size_t size;
974   unsigned int bytes_before;
975   unsigned int bytes_hole;
976   unsigned int bytes_after;
977
978 //  LOG(GNUNET_ERROR_TYPE_DEBUG, "hole_start = %d, hole_length = %d, old_length = %d\n", hole_start, hole_length, old_length);
979   GNUNET_assert(old_length > hole_length);
980   GNUNET_assert(old_length >= (hole_start + hole_length));
981
982   size = (old_length - hole_length) * element_size;
983
984   bytes_before = element_size * hole_start;
985   bytes_hole   = element_size * hole_length;
986   bytes_after  = element_size * (old_length - hole_start - hole_length);
987
988   if (0 == size)
989   {
990     tmpptr = NULL;
991   }
992   else
993   {
994     tmpptr = GNUNET_malloc (size);
995     memcpy (tmpptr, oldptr, bytes_before);
996     memcpy (tmpptr + bytes_before, oldptr + (bytes_before + bytes_hole), bytes_after);
997   }
998   if (NULL != *old)
999   {
1000     GNUNET_free(*old);
1001   }
1002   *old = (void *) tmpptr;
1003 }
1004
1005 /**
1006  *  Solver API functions
1007  *  ---------------------------
1008  */
1009
1010 /**
1011  * Changes the preferences for a peer in the problem
1012  *
1013  * @param solver the solver handle
1014  * @param peer the peer to change the preference for
1015  * @param kind the kind to change the preference
1016  * @param pref_rel the normalized preference value for this kind over all clients
1017  */
1018 void
1019 GAS_ril_address_change_preference (void *s,
1020     const struct GNUNET_PeerIdentity *peer,
1021     enum GNUNET_ATS_PreferenceKind kind,
1022     double pref_rel)
1023 {
1024   LOG(GNUNET_ERROR_TYPE_DEBUG,
1025       "API_address_change_preference() Preference '%s' for peer '%s' changed to %.2f \n",
1026       GNUNET_ATS_print_preference_type (kind), GNUNET_i2s (peer), pref_rel);
1027   /*
1028    * Nothing to do here. Preferences are considered during reward calculation.
1029    */
1030 }
1031
1032 /**
1033  * Init the reinforcement learning problem solver
1034  *
1035  * Quotas:
1036  * network[i] contains the network type as type GNUNET_ATS_NetworkType[i]
1037  * out_quota[i] contains outbound quota for network type i
1038  * in_quota[i] contains inbound quota for network type i
1039  *
1040  * Example
1041  * network = {GNUNET_ATS_NET_UNSPECIFIED, GNUNET_ATS_NET_LOOPBACK, GNUNET_ATS_NET_LAN, GNUNET_ATS_NET_WAN, GNUNET_ATS_NET_WLAN}
1042  * network[2]   == GNUNET_ATS_NET_LAN
1043  * out_quota[2] == 65353
1044  * in_quota[2]  == 65353
1045  *
1046  * @param cfg configuration handle
1047  * @param stats the GNUNET_STATISTICS handle
1048  * @param network array of GNUNET_ATS_NetworkType with length dest_length
1049  * @param addresses hashmap containing all addresses
1050  * @param out_quota array of outbound quotas
1051  * @param in_quota array of outbound quota
1052  * @param dest_length array length for quota arrays
1053  * @param bw_changed_cb callback for changed bandwidth amounts
1054  * @param bw_changed_cb_cls cls for callback
1055  * @param get_preference callback to get relative preferences for a peer
1056  * @param get_preference_cls cls for callback to get relative preferences
1057  * @param get_properties_cls for callback to get relative properties
1058  * @param get_properties_cls cls for callback to get relative properties
1059  * @return handle for the solver on success, NULL on fail
1060  */
1061 void *
1062 GAS_ril_init (const struct GNUNET_CONFIGURATION_Handle *cfg,
1063     const struct GNUNET_STATISTICS_Handle *stats,
1064     const struct GNUNET_CONTAINER_MultiHashMap *addresses,
1065     int *network,
1066     unsigned long long *out_quota,
1067     unsigned long long *in_quota,
1068     int dest_length,
1069     GAS_bandwidth_changed_cb bw_changed_cb,
1070     void *bw_changed_cb_cls,
1071     GAS_get_preferences get_preference,
1072     void *get_preference_cls,
1073     GAS_get_properties get_properties,
1074     void *get_properties_cls)
1075 {
1076   int c;
1077   unsigned long long tmp;
1078   char *string;
1079   struct RIL_Network * cur;
1080   struct GAS_RIL_Handle *solver = GNUNET_malloc (sizeof (struct GAS_RIL_Handle));
1081
1082   LOG(GNUNET_ERROR_TYPE_DEBUG, "API_init() Initializing RIL solver\n");
1083
1084   GNUNET_assert(NULL != cfg);
1085   GNUNET_assert(NULL != stats);
1086   GNUNET_assert(NULL != network);
1087   GNUNET_assert(NULL != bw_changed_cb);
1088   GNUNET_assert(NULL != get_preference);
1089   GNUNET_assert(NULL != get_properties);
1090
1091   if (GNUNET_OK
1092       != GNUNET_CONFIGURATION_get_value_time (cfg, "ats", "RIL_STEP_TIME", &solver->step_time))
1093   {
1094     solver->step_time = RIL_DEFAULT_STEP_TIME;
1095   }
1096   if (GNUNET_OK == GNUNET_CONFIGURATION_get_value_string (cfg, "ats", "RIL_ALGORITHM", &string)
1097       && NULL != string && 0 == strcmp (string, "SARSA"))
1098   {
1099     solver->parameters.algorithm = RIL_ALGO_SARSA;
1100   }
1101   else
1102   {
1103     solver->parameters.algorithm = RIL_DEFAULT_ALGORITHM;
1104   }
1105   if (GNUNET_OK == GNUNET_CONFIGURATION_get_value_size (cfg, "ats", "RIL_DISCOUNT_FACTOR", &tmp))
1106   {
1107     solver->parameters.gamma = (double) tmp / 100;
1108   }
1109   else
1110   {
1111     solver->parameters.gamma = RIL_DEFAULT_DISCOUNT_FACTOR;
1112   }
1113   if (GNUNET_OK == GNUNET_CONFIGURATION_get_value_size (cfg, "ats", "RIL_GRADIENT_STEP_SIZE", &tmp))
1114   {
1115     solver->parameters.alpha = (double) tmp / 100;
1116   }
1117   else
1118   {
1119     solver->parameters.alpha = RIL_DEFAULT_GRADIENT_STEP_SIZE;
1120   }
1121   if (GNUNET_OK == GNUNET_CONFIGURATION_get_value_size (cfg, "ats", "RIL_TRACE_DECAY", &tmp))
1122   {
1123     solver->parameters.lambda = (double) tmp / 100;
1124   }
1125   else
1126   {
1127     solver->parameters.lambda = RIL_DEFAULT_TRACE_DECAY;
1128   }
1129
1130   solver->stats = (struct GNUNET_STATISTICS_Handle *) stats;
1131   solver->callbacks = GNUNET_malloc (sizeof (struct RIL_Callbacks));
1132   solver->callbacks->bw_changed = bw_changed_cb;
1133   solver->callbacks->bw_changed_cls = bw_changed_cb_cls;
1134   solver->callbacks->get_preferences = get_preference;
1135   solver->callbacks->get_preferences_cls = get_preference_cls;
1136   solver->callbacks->get_properties = get_properties;
1137   solver->callbacks->get_properties_cls = get_properties_cls;
1138   solver->networks_count = dest_length;
1139   solver->network_entries = GNUNET_malloc (dest_length * sizeof (struct RIL_Network));
1140   solver->bulk_lock = GNUNET_NO;
1141   solver->addresses = addresses;
1142   solver->step_count = 0;
1143
1144   for (c = 0; c < dest_length; c++)
1145   {
1146     cur = &solver->network_entries[c];
1147     cur->type = network[c];
1148     cur->bw_in_available = in_quota[c];
1149     cur->bw_in_assigned = 0;
1150     cur->bw_out_available = out_quota[c];
1151     cur->bw_out_assigned = 0;
1152   }
1153
1154   solver->next_step = GNUNET_SCHEDULER_add_delayed (
1155       GNUNET_TIME_relative_multiply (GNUNET_TIME_relative_get_millisecond_ (), 1000),
1156       &ril_periodic_step, solver);
1157
1158   return solver;
1159 }
1160
1161 /**
1162  * Shutdown the reinforcement learning problem solver
1163  *
1164  * @param solver the respective handle to shutdown
1165  */
1166 void
1167 GAS_ril_done (void * solver)
1168 {
1169   struct GAS_RIL_Handle *s = solver;
1170   struct RIL_Peer_Agent *cur_agent;
1171   struct RIL_Peer_Agent *next_agent;
1172
1173   LOG(GNUNET_ERROR_TYPE_DEBUG, "API_done() Shutting down RIL solver\n");
1174
1175   cur_agent = s->agents_head;
1176   while (NULL != cur_agent)
1177   {
1178     next_agent = cur_agent->next;
1179     GNUNET_CONTAINER_DLL_remove(s->agents_head, s->agents_tail, cur_agent);
1180     agent_die (s, cur_agent);
1181     cur_agent = next_agent;
1182   }
1183
1184   GNUNET_SCHEDULER_cancel (s->next_step);
1185   GNUNET_free(s->callbacks);
1186   GNUNET_free(s->network_entries);
1187   GNUNET_free(s);
1188 }
1189
1190 /**
1191  * Add a single address within a network to the solver
1192  *
1193  * @param solver the solver Handle
1194  * @param address the address to add
1195  * @param network network type of this address
1196  */
1197 void
1198 GAS_ril_address_add (void *solver, struct ATS_Address *address, uint32_t network)
1199 {
1200   struct GAS_RIL_Handle *s = solver;
1201   struct RIL_Peer_Agent *agent;
1202   struct RIL_Address_Wrapped *address_wrapped;
1203   unsigned int m_new;
1204   unsigned int m_old;
1205   unsigned int n_new;
1206   unsigned int n_old;
1207   int i;
1208   unsigned int zero;
1209   uint32_t min_bw = ntohl (GNUNET_CONSTANTS_DEFAULT_BW_IN_OUT.value__);
1210
1211   address->solver_information = ril_get_network (s, network);
1212
1213   if (!ril_network_is_active(s, network))
1214   {
1215     LOG(GNUNET_ERROR_TYPE_DEBUG, "API_address_add() Did not add %s address %p for peer '%s', network does not have enough bandwidth\n",
1216         address->plugin, address->addr, GNUNET_i2s (&address->peer));
1217     return;
1218   }
1219
1220   agent = ril_get_agent(s, &address->peer, GNUNET_YES);
1221
1222   //add address
1223   address_wrapped = GNUNET_malloc (sizeof (struct RIL_Address_Wrapped));
1224   address_wrapped->address_naked = address;
1225   GNUNET_CONTAINER_DLL_insert_tail(agent->addresses_head, agent->addresses_tail, address_wrapped);
1226
1227   //increase size of W
1228   m_new = agent->m + 5; //TODO! make size of features from address variable (Note to self: ctrl+f for "5" or I kill you!)
1229   m_old = agent->m;
1230   n_new = agent->n + 1;
1231   n_old = agent->n;
1232
1233   GNUNET_array_grow (agent->W, agent->n, n_new);
1234   for (i = 0; i < n_new; i++)
1235   {
1236     if (i < n_old)
1237     {
1238       agent->m = m_old;
1239       GNUNET_array_grow(agent->W[i], agent->m, m_new);
1240     }
1241     else
1242     {
1243       zero = 0;
1244       GNUNET_array_grow(agent->W[i], zero, m_new);
1245     }
1246   }
1247
1248   //increase size of old state vector if there is one
1249   if (RIL_ACTION_INVALID != agent->a_old)
1250   {
1251     agent->m = m_old;
1252     GNUNET_array_grow(agent->s_old, agent->m, m_new); //TODO initialize new state features?
1253   }
1254
1255   agent->m = m_old;
1256   GNUNET_array_grow(agent->e, agent->m, m_new);
1257
1258   if (NULL == agent->address_inuse)
1259   {
1260     envi_set_active_suggestion(s, agent, address, min_bw, min_bw);
1261   }
1262
1263   LOG(GNUNET_ERROR_TYPE_DEBUG, "API_address_add() Added %s address %p for peer '%s'\n",
1264       address->plugin, address->addr, GNUNET_i2s (&address->peer));
1265 }
1266
1267 /**
1268  * Remove an address from the solver
1269  *
1270  * @param solver the solver handle
1271  * @param address the address to remove
1272  * @param session_only delete only session not whole address
1273  */
1274 void
1275 GAS_ril_address_delete (void *solver, struct ATS_Address *address, int session_only)
1276 {
1277   //TODO! delete session only
1278   struct GAS_RIL_Handle *s = solver;
1279   struct RIL_Peer_Agent *agent;
1280   struct RIL_Address_Wrapped *address_wrapped;
1281   int address_was_used = address->active;
1282   int address_index;
1283   unsigned int m_new;
1284   unsigned int n_new;
1285   int i;
1286   struct RIL_Network *net;
1287   uint32_t min_bw = ntohl (GNUNET_CONSTANTS_DEFAULT_BW_IN_OUT.value__);
1288
1289   LOG(GNUNET_ERROR_TYPE_DEBUG, "API_address_delete() Delete %s%s %s address %p for peer '%s'\n",
1290         session_only ? "session for " : "",
1291             address->active ? "active" : "inactive",
1292         address->plugin,
1293         address->addr,
1294         GNUNET_i2s (&address->peer));
1295
1296   agent = ril_get_agent(s, &address->peer, GNUNET_NO);
1297   if (NULL == agent)
1298   {
1299     net = address->solver_information;
1300     GNUNET_assert (!ril_network_is_active(s, net->type));
1301     LOG (GNUNET_ERROR_TYPE_DEBUG, "No agent allocated for peer yet, since address was in inactive network\n");
1302     return;
1303   }
1304
1305   address_index = agent_address_get_index(agent, address);
1306   address_wrapped = agent_address_get(agent, address);
1307
1308   if (NULL == address_wrapped)
1309   {
1310     net = address->solver_information;
1311     GNUNET_assert (!ril_network_is_active(s, net->type));
1312     LOG (GNUNET_ERROR_TYPE_DEBUG, "Address not considered by agent, address was in inactive network\n");
1313     return;
1314   }
1315
1316   GNUNET_CONTAINER_DLL_remove(agent->addresses_head, agent->addresses_tail, address_wrapped);
1317
1318   //decrease W
1319   m_new = agent->m - 5;
1320   n_new = agent->n - 1;
1321
1322   for (i = 0; i < agent->n; i++)
1323   {
1324 //    LOG (GNUNET_ERROR_TYPE_DEBUG, "first - cut vectors in W\n");
1325     ril_cut_from_vector((void **) &agent->W[i], sizeof (double), ((s->networks_count * 4) + (address_index * 5)), 5, agent->m);
1326   }
1327 //  LOG (GNUNET_ERROR_TYPE_DEBUG, "second - cut action vector out of W\n");
1328   ril_cut_from_vector((void **) &agent->W, sizeof (double *), RIL_ACTION_TYPE_NUM + address_index, 1, agent->n);
1329   //correct last action
1330   if (agent->a_old > (RIL_ACTION_TYPE_NUM + address_index))
1331   {
1332     agent->a_old -= 1;
1333   }
1334   else if (agent->a_old == (RIL_ACTION_TYPE_NUM + address_index))
1335   {
1336     agent->a_old = RIL_ACTION_INVALID;
1337   }
1338   //decrease old state vector and eligibility vector
1339 //  LOG (GNUNET_ERROR_TYPE_DEBUG, "third - cut state vector\n");
1340   ril_cut_from_vector((void **) &agent->s_old, sizeof (double), ((s->networks_count * 4) + (address_index * 5)), 5, agent->m);
1341 //  LOG (GNUNET_ERROR_TYPE_DEBUG, "fourth - cut eligibility vector\n");
1342   ril_cut_from_vector((void **) &agent->e,     sizeof (double), ((s->networks_count * 4) + (address_index * 5)), 5, agent->m);
1343   agent->m = m_new;
1344   agent->n = n_new;
1345
1346   if (address_was_used)
1347   {
1348     net = address->solver_information;
1349     net->bw_in_assigned -= agent->bw_in;
1350     net->bw_out_assigned -= agent->bw_out;
1351
1352     if (NULL != agent->addresses_head) //if peer has an address left, use it
1353     {
1354     //TODO? check if network/bandwidth update can be done more clever/elegant at different function
1355       envi_set_active_suggestion(s, agent, agent->addresses_head->address_naked, min_bw, min_bw);
1356       net = agent->addresses_head->address_naked->solver_information;
1357       net->bw_in_assigned -= min_bw;
1358       net->bw_out_assigned -= min_bw;
1359     }
1360   }
1361
1362   LOG (GNUNET_ERROR_TYPE_DEBUG, "Address deleted\n");
1363 }
1364
1365 /**
1366  * Transport properties for this address have changed
1367  *
1368  * @param solver solver handle
1369  * @param address the address
1370  * @param type the ATSI type in HBO
1371  * @param abs_value the absolute value of the property
1372  * @param rel_value the normalized value
1373  */
1374 void
1375 GAS_ril_address_property_changed (void *solver,
1376     struct ATS_Address *address,
1377     uint32_t type,
1378     uint32_t abs_value,
1379     double rel_value)
1380 {
1381   LOG(GNUNET_ERROR_TYPE_DEBUG,
1382       "API_address_property_changed() Property '%s' for peer '%s' address %p changed "
1383           "to %.2f \n", GNUNET_ATS_print_property_type (type), GNUNET_i2s (&address->peer), address->addr,
1384       rel_value);
1385   /*
1386    * Nothing to do here, properties are considered in every reward calculation
1387    */
1388 }
1389
1390 /**
1391  * Transport session for this address has changed
1392  *
1393  * NOTE: values in addresses are already updated
1394  *
1395  * @param solver solver handle
1396  * @param address the address
1397  * @param cur_session the current session
1398  * @param new_session the new session
1399  */
1400 void
1401 GAS_ril_address_session_changed (void *solver,
1402     struct ATS_Address *address,
1403     uint32_t cur_session,
1404     uint32_t new_session)
1405 {
1406   //TODO? consider session changed in solver behaviour
1407   /*
1408    * Potentially add session activity as a feature in state vector
1409    */
1410   LOG(GNUNET_ERROR_TYPE_DEBUG, "API_address_session_changed()\n");
1411 }
1412
1413 /**
1414  * Usage for this address has changed
1415  *
1416  * NOTE: values in addresses are already updated
1417  *
1418  * @param solver solver handle
1419  * @param address the address
1420  * @param in_use usage state
1421  */
1422 void
1423 GAS_ril_address_inuse_changed (void *solver, struct ATS_Address *address, int in_use)
1424 {
1425   //TODO! consider address_inuse_changed according to matthias' email
1426   /**
1427    * See matthias' email
1428    */
1429   LOG(GNUNET_ERROR_TYPE_DEBUG,
1430       "API_address_inuse_changed() Usage for %s address of peer '%s' changed to %s\n",
1431       address->plugin, GNUNET_i2s (&address->peer), (GNUNET_YES == in_use) ? "USED" : "UNUSED");
1432 }
1433
1434 /**
1435  * Network scope for this address has changed
1436  *
1437  * NOTE: values in addresses are already updated
1438  *
1439  * @param solver solver handle
1440  * @param address the address
1441  * @param current_network the current network
1442  * @param new_network the new network
1443  */
1444 void
1445 GAS_ril_address_change_network (void *solver,
1446     struct ATS_Address *address,
1447     uint32_t current_network,
1448     uint32_t new_network)
1449 {
1450   struct GAS_RIL_Handle *s = solver;
1451   struct RIL_Peer_Agent *agent;
1452   struct RIL_Network *net;
1453   uint32_t min_bw = ntohl (GNUNET_CONSTANTS_DEFAULT_BW_IN_OUT.value__);
1454
1455   LOG(GNUNET_ERROR_TYPE_DEBUG, "API_address_change_network() Network type changed, moving "
1456       "%s address of peer %s from '%s' to '%s'\n",
1457       (GNUNET_YES == address->active) ? "active" : "inactive", GNUNET_i2s (&address->peer),
1458       GNUNET_ATS_print_network_type (current_network), GNUNET_ATS_print_network_type (new_network));
1459
1460   if (address->active && !ril_network_is_active(solver, new_network))
1461   {
1462     GAS_ril_address_delete(solver, address, GNUNET_NO);
1463     return;
1464   }
1465
1466   agent = ril_get_agent(s, &address->peer, GNUNET_NO);
1467   if (NULL == agent)
1468   {
1469     //no agent there yet, so add as if address is new
1470     address->solver_information = ril_get_network (s, new_network);
1471     GAS_ril_address_add(s,address,new_network);
1472     return;
1473   }
1474
1475   net = ril_get_network (s, current_network);
1476   net->bw_in_assigned -= agent->bw_in;
1477   net->bw_out_assigned -= agent->bw_out;
1478
1479   net = ril_get_network (s, new_network);
1480   net->bw_in_assigned -= min_bw;
1481   net->bw_out_assigned -= min_bw;
1482   address->solver_information = net;
1483 }
1484
1485 /**
1486  * Get application feedback for a peer
1487  *
1488  * @param solver the solver handle
1489  * @param application the application
1490  * @param peer the peer to change the preference for
1491  * @param scope the time interval for this feedback: [now - scope .. now]
1492  * @param kind the kind to change the preference
1493  * @param score the score
1494  */
1495 void
1496 GAS_ril_address_preference_feedback (void *solver,
1497     void *application,
1498     const struct GNUNET_PeerIdentity *peer,
1499     const struct GNUNET_TIME_Relative scope,
1500     enum GNUNET_ATS_PreferenceKind kind,
1501     double score)
1502 {
1503   //TODO! collect reward until next reward calculation
1504   LOG(GNUNET_ERROR_TYPE_DEBUG,
1505       "API_address_preference_feedback() Peer '%s' got a feedback of %+.3f from application %s for "
1506           "preference %s for %d seconds\n", GNUNET_i2s (peer), "UNKNOWN",
1507       GNUNET_ATS_print_preference_type (kind), scope.rel_value_us / 1000000);
1508 }
1509
1510 /**
1511  * Start a bulk operation
1512  *
1513  * @param solver the solver
1514  */
1515 void
1516 GAS_ril_bulk_start (void *solver)
1517 {
1518   //TODO? consideration: keep bulk counter and stop agents during bulk
1519   /*
1520    * bulk counter up, but not really relevant, because there is no complete calculation of the
1521    * bandwidth assignment triggered anyway. Therefore, changes to addresses can come and go as
1522    * they want. Consideration: Step-pause during bulk-start-stop period...
1523    */
1524
1525   //LOG(GNUNET_ERROR_TYPE_DEBUG, "API_bulk_start()\n");
1526 }
1527
1528 /**
1529  * Bulk operation done
1530  */
1531 void
1532 GAS_ril_bulk_stop (void *solver)
1533 {
1534   //TODO? consideration: keep bulk counter and stop agents during bulk
1535   /*
1536    * bulk counter down, see bulk_start()
1537    */
1538
1539   //LOG(GNUNET_ERROR_TYPE_DEBUG, "API_bulk_stop()\n");
1540 }
1541
1542 /**
1543  * Get the preferred address for a specific peer
1544  *
1545  * @param solver the solver handle
1546  * @param peer the identity of the peer
1547  */
1548 const struct ATS_Address *
1549 GAS_ril_get_preferred_address (void *solver, const struct GNUNET_PeerIdentity *peer)
1550 {
1551   /*
1552    * activate agent, return currently chosen address
1553    */
1554   struct GAS_RIL_Handle *s = solver;
1555   struct RIL_Peer_Agent *agent;
1556
1557   agent = ril_get_agent (s, peer, GNUNET_NO);
1558
1559   if (NULL == agent)
1560   {
1561     LOG(GNUNET_ERROR_TYPE_DEBUG,
1562         "API_get_preferred_address() No agent for peer '%s' do not suggest address\n",
1563         GNUNET_i2s (peer));
1564     return NULL ;
1565   }
1566
1567   agent->active = GNUNET_YES;
1568
1569   GNUNET_assert(NULL != agent->address_inuse);
1570
1571   LOG(GNUNET_ERROR_TYPE_DEBUG,
1572       "API_get_preferred_address() Activated agent for peer '%s' with %s address\n",
1573       GNUNET_i2s (peer), agent->address_inuse->plugin);
1574
1575   return agent->address_inuse;
1576 }
1577
1578 /**
1579  * Stop notifying about address and bandwidth changes for this peer
1580  *
1581  * @param solver the solver handle
1582  * @param peer the peer
1583  */
1584 void
1585 GAS_ril_stop_get_preferred_address (void *solver, const struct GNUNET_PeerIdentity *peer)
1586 {
1587   struct GAS_RIL_Handle *s = solver;
1588   struct RIL_Peer_Agent *agent;
1589
1590   agent = ril_get_agent (s, peer, GNUNET_NO);
1591   agent->active = GNUNET_NO;
1592
1593   LOG(GNUNET_ERROR_TYPE_DEBUG,
1594       "API_stop_get_preferred_address() Paused agent for peer '%s' with %s address\n",
1595       GNUNET_i2s (peer), agent->address_inuse->plugin);
1596 }
1597
1598 /* end of gnunet-service-ats-solver_ril.c */