controller link as operation
[oweals/gnunet.git] / src / include / gnunet_regex_lib.h
1 /*
2      This file is part of GNUnet
3      (C) 2012 Christian Grothoff (and other contributing authors)
4
5      GNUnet is free software; you can redistribute it and/or modify
6      it under the terms of the GNU General Public License as published
7      by the Free Software Foundation; either version 3, or (at your
8      option) any later version.
9
10      GNUnet is distributed in the hope that it will be useful, but
11      WITHOUT ANY WARRANTY; without even the implied warranty of
12      MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13      General Public License for more details.
14
15      You should have received a copy of the GNU General Public License
16      along with GNUnet; see the file COPYING.  If not, write to the
17      Free Software Foundation, Inc., 59 Temple Place - Suite 330,
18      Boston, MA 02111-1307, USA.
19 */
20 /**
21  * @file include/gnunet_regex_lib.h
22  * @brief library to parse regular expressions into dfa
23  * @author Maximilian Szengel
24  *
25  */
26
27 #ifndef GNUNET_REGEX_LIB_H
28 #define GNUNET_REGEX_LIB_H
29
30 #include "gnunet_util_lib.h"
31
32 #ifdef __cplusplus
33 extern "C"
34 {
35 #if 0                           /* keep Emacsens' auto-indent happy */
36 }
37 #endif
38 #endif
39
40 /**
41  * Automaton (NFA/DFA) representation.
42  */
43 struct GNUNET_REGEX_Automaton;
44
45
46 /**
47  * Edge representation.
48  */
49 struct GNUNET_REGEX_Edge
50 {
51   /**
52    * Label of the edge.  FIXME: might want to not consume exactly multiples of 8 bits, need length?
53    */
54   const char *label;
55
56   /**
57    * Destionation of the edge.
58    */
59   struct GNUNET_HashCode destination;
60 };
61
62
63 /**
64  * Construct an NFA by parsing the regex string of length 'len'.
65  *
66  * @param regex regular expression string.
67  * @param len length of the string.
68  *
69  * @return NFA, needs to be freed using GNUNET_REGEX_destroy_automaton.
70  */
71 struct GNUNET_REGEX_Automaton *
72 GNUNET_REGEX_construct_nfa (const char *regex, const size_t len);
73
74
75 /**
76  * Construct DFA for the given 'regex' of length 'len'.
77  *
78  * @param regex regular expression string.
79  * @param len length of the regular expression.
80  *
81  * @return DFA, needs to be freed using GNUNET_REGEX_destroy_automaton.
82  */
83 struct GNUNET_REGEX_Automaton *
84 GNUNET_REGEX_construct_dfa (const char *regex, const size_t len);
85
86
87 /**
88  * Free the memory allocated by constructing the GNUNET_REGEX_Automaton.
89  * data structure.
90  *
91  * @param a automaton to be destroyed.
92  */
93 void
94 GNUNET_REGEX_automaton_destroy (struct GNUNET_REGEX_Automaton *a);
95
96
97 /**
98  * Options for graph creation function
99  * GNUNET_REGEX_automaton_save_graph.
100  */
101
102 enum GNUNET_REGEX_GraphSavingOptions
103 {
104   /**
105    * Default. Do nothing special.
106    */
107   GNUNET_REGEX_GRAPH_DEFAULT = 0,
108
109   /**
110    * The generated graph will include extra information such as the NFA states
111    * that were used to generate the DFA state.
112    */
113   GNUNET_REGEX_GRAPH_VERBOSE = 1,
114
115   /**
116    * Enable graph coloring. Will color each SCC in a different color.
117    */
118   GNUNET_REGEX_GRAPH_COLORING = 2
119 };
120
121
122 /**
123  * Save the given automaton as a GraphViz dot file.
124  *
125  * @param a the automaton to be saved.
126  * @param filename where to save the file.
127  * @param options options for graph generation that include coloring or verbose
128  *                mode
129  */
130 void
131 GNUNET_REGEX_automaton_save_graph (struct GNUNET_REGEX_Automaton *a,
132                                    const char *filename,
133                                    enum GNUNET_REGEX_GraphSavingOptions options);
134
135
136 /**
137  * Evaluates the given 'string' against the given compiled regex.
138  *
139  * @param a automaton.
140  * @param string string to check.
141  *
142  * @return 0 if string matches, non 0 otherwise.
143  */
144 int
145 GNUNET_REGEX_eval (struct GNUNET_REGEX_Automaton *a,
146                    const char *string);
147
148
149 /**
150  * Get the first key for the given 'input_string'. This hashes
151  * the first x bits of the 'input_string'.
152  *
153  * @param input_string string.
154  * @param string_len length of the 'input_string'.
155  * @param key pointer to where to write the hash code.
156  *
157  * @return number of bits of 'input_string' that have been consumed
158  *         to construct the key
159  */
160 size_t
161 GNUNET_REGEX_get_first_key (const char *input_string, size_t string_len,
162                             struct GNUNET_HashCode * key);
163
164
165 /**
166  * Check if the given 'proof' matches the given 'key'.
167  *
168  * @param proof partial regex of a state.
169  * @param key hash of a state.
170  *
171  * @return GNUNET_OK if the proof is valid for the given key.
172  */
173 int
174 GNUNET_REGEX_check_proof (const char *proof,
175                           const struct GNUNET_HashCode *key);
176
177
178 /**
179  * Iterator callback function.
180  *
181  * @param cls closure.
182  * @param key hash for current state.
183  * @param proof proof for current state.
184  * @param accepting GNUNET_YES if this is an accepting state, GNUNET_NO if not.
185  * @param num_edges number of edges leaving current state.
186  * @param edges edges leaving current state.
187  */
188 typedef void (*GNUNET_REGEX_KeyIterator)(void *cls,
189                                          const struct GNUNET_HashCode *key,
190                                          const char *proof,
191                                          int accepting,
192                                          unsigned int num_edges,
193                                          const struct GNUNET_REGEX_Edge *edges);
194
195
196 /**
197  * Iterate over all edges starting from start state of automaton 'a'. Calling
198  * iterator for each edge.
199  *
200  * @param a automaton.
201  * @param iterator iterator called for each edge.
202  * @param iterator_cls closure.
203  */
204 void
205 GNUNET_REGEX_iterate_all_edges (struct GNUNET_REGEX_Automaton *a,
206                                 GNUNET_REGEX_KeyIterator iterator,
207                                 void *iterator_cls);
208
209
210 #if 0                           /* keep Emacsens' auto-indent happy */
211 {
212 #endif
213 #ifdef __cplusplus
214 }
215 #endif
216
217 /* end of gnunet_regex_lib.h */
218 #endif