(no commit message)
[oweals/gnunet.git] / TODO
diff --git a/TODO b/TODO
index 22c52e934144d6f3c0265b6f86fb9e72ca853300..bf30d665a86108ea09e28352f9602f3281d3f91a 100644 (file)
--- a/TODO
+++ b/TODO
@@ -1,42 +1,15 @@
-Implementable right now (but not necessarily important), with caveats
-(unavailable components that will limit what can be implemented right
-away), in order in which they will likely be done:
-* TESTING [Nate]
-* DV [Nate]
-* DHT [Nate]
-* TBENCH [MW]
-* TRACEKIT [MW]
-* FRAGMENTATION [Ji Lu]
-* HTTP transport [Matthias]
-* UPNP [Milan]
-* ARM [Safey]
-* FS [CG]
-* SETUP
-* MySQL / Postgres plugins (datastore, datacache)
-
-0.9.0pre0 [April]:
-* CORE: [CG]
-  - "Forcing disconnect of XXX due to inactivity" -- can happen every few MS!?
-    (disconnect does not really succeed, or what?)
-    Also, core does not seem to actually decrement the number of active
-    sessions even if no connections exist for a while! (likely related...)
-  - transport reports bw quota violations on slow systems (core or
-    transport issue? tracking issue or actual violation?)
-* DATASTORE: [CG]
-  - utilization can (easily, restart?) go out of control (very large), causing
-    content expiration job to go crazy and delete everything!
+0.9.0pre1:
+* MIGRATION [CG]
+  - on-demand encoding => move logic to block-library!?
+  - peer selection => how to consider latency/bw/etc?
+  - content transmission => how often the same block?
+  - how to select delay before next migration? 
+  - migration to us
+  - testing
+  - integrate with FS or not? (peer list, index/on-demand encoding, block code,
+    inbound priority assignment; all would be easier with tight integration!)
 * FS: [CG]
-  - on some systems, keyword search does not find locally published content
-    (need testcase of command-line tools! - also good to cover getopt API!)
-    [could be related to datastore issue above!]
-  - 2-peer download is still too slow (why?)
-  - advanced FS API parts
-    + support recursive download even if filename is NULL and we hence
-      do not generate files on disk (use temp_filename)
-    + bound parallelism (# fs downloads)
-    + distinguish in performance tracking and event signalling between
-      downloads that are actually running and those that are merely in the queue
-    + gnunet-service-fs (hot-path routing, load-based routing, nitpicks)
+  - gnunet-service-fs (hot-path routing, load-based routing, nitpicks)  
   - [gnunet-service-fs.c:208]: member 'LocalGetContext::results_bf_size' is never used
   - [gnunet-service-fs.c:501]: member 'PendingRequest::used_pids_size' is never used
   - [gnunet-service-fs.c:654]: member 'ConnectedPeer::last_client_replies' is never used
@@ -45,82 +18,39 @@ away), in order in which they will likely be done:
   - [gnunet-service-fs.c:688]: member 'ConnectedPeer::pending_requests' is never used
   - [gnunet-service-fs.c:694]: member 'ConnectedPeer::last_p2p_replies_woff' is never used
   - [gnunet-service-fs.c:700]: member 'ConnectedPeer::last_client_replies_woff' is never used
-* WWW:
-  - Get IPv6 hooked up
-  - change DNS
-
-0.9.0pre1:
-* PEERINFO:
-  - trust: need *fast* way to check/update trust in peers
-           (async peerinfo would not be right; certainly not with the
-            current API)
-* UTIL:
-  - scheduler should change OS process priority based on task priority;   
-    should make better use of task priorities in general
-  - only connect() sockets that are ready (select()) [Nils]
-    [On W32, we need to select after calling socket before
-     doing connect etc.]
-* HELLO: [CG]
-  - need function to test "equivalency" of HELLOs (or integrate with "merge"?); use in PEERINFO
-* SETUP:
-  - design & implement new setup tool
+  - GAP improvements:
+    + active reply route caching design & implementation of service; gap extension!
 * TBENCH: [MW]
   - good to have for transport/DV evaluation! 
 * DV: [Nate]
-  - write DV API 
-  - implement DV service
-  - implement DV library
+  - write DV API (need to move declarations from dv_api.c to gnunet_dv_service.h!)
+  - implement DV service 
+  - implement DV library (looks done)
   - implement DV transport plugin
   - implement testcases 
-  - implement performance tests
-* STATISTICS:
-  - does not seem to work with timeouts (especially if service is not running)
+  - implement performance tests (needs tbench)
 * TOPOLOGY:
-  - needs more testing (especially F2F topology)
-  - needs to re-try connecting after disconnect (currently, it
-    initially triggers a connection request, but if that connection
-    fails / goes down, it does not retry in a timely fashion;
-    cause seems to be the 'blacklist_after_attempt' being set to 1h,
-    which is rather long -- and should probably be adjusted based on
-    the number of connections / known peers)
-  - If the topology daemon crashes, peers that were put on the
-    blacklist with transport will never be removed from it (until
-    transport service dies); we should use the blacklist notification
-    API to learn about the exact set of blacklisted peers at all times
-    (FIXME: the transport_api implementation of blacklisting
-     also does not work nicely for this since it won't let us know about
-     disconnect-reconnect events and the implicit whitelisting
-     that might happen here; that's not so bad since we will
-     re-blacklist on pre-connect attempts anyway, so this is 
-     a minor issue; OTOH, we might want to be more explicit about
-     allowing/forbidding connects on pre-connect to avoid 
-     entering connect attempts to just be blacklisted shortly afterwards).
-  - the code uses the term 'blacklist' for both peers that are forbidden
-    to connect (i.e. F2F mode) as well as peers that we currently
-    won't try to actively connect to ourselves (since we just tried);
-    This is confusing.  We need two distinct terms (greylist?).
-  - move code to use hash table instead of linked list
-  - instead of periodically discarding blacklisted entries,
-    simply add task that is triggered at the right time (earlier free,
-    more balanced load)
-  - check if new HELLO learned is different from old HELLO
-    before resetting entire state!
-* FS: [CG]
-  - datastore reservation (publishing)
-  - search: availability probes
-  - persistence support (publish, unindex, search, download)
-  - active migration support (in fs or in datastore or new daemon?)
-  - GAP improvements:
-    + active reply route caching design & implementation of service; gap extension!
+  - needs more testing (especially F2F topology) & transport blacklisting
+* UTIL:
+  - only connect() sockets that are ready (select()) [Nils]
+    [On W32, we need to select after calling socket before doing connect etc.]
 * GNUNET-GTK:
-  - how to integrate scheduler with GTK event loop!?
+  - use g_main_context_set_poll_func to integrate GTK with GNUnet Scheduler!? (YUCK!)
+  - OR: add scheduler API to enable integration with GTK main loop instead of doing our own select
+  - use g_main_context_pending, g_main_context_query / g_main_context_check / g_main_context_dispatch
+    and NEVER g_main_loop_run (can this be done? might be the clean way to do this! But how
+    to integrate this with "gtk_main"?  Docu says:
+    "It's OK to use the GLib main loop directly instead of gtk_main(), though it involves 
+     slightly more typing. See GMainLoop in the GLib documentation."
+    => so maybe it "just works"?
+* SETUP:
+  - design & implement new setup tool
 
 0.9.0pre2:
 * TRACEKIT: [MW]
   - good to have for DV/DHT evaluation!
 * DHT: [Nate]
-  - implement DHT service (needs DV, DATACACHE)
-  - implement DHT library
+  - implement DHT service 
   - implement testcases
   - implement performance tests
 * TRANSPORT:
@@ -135,7 +65,12 @@ away), in order in which they will likely be done:
     debug output, detect random vs. deterministic crashes)
   - shutdown sequence?
 * FS: [CG]
+  - datastore reservation (publishing)
   - location URIs (publish, search, download)
+  - unindex on index failure
+  - utilize in-line files in meta data always (including in search results or
+    when download is triggered manually and for probes); currently the data is
+    only used when users do a general 'recursive' download
   - non-anonymous FS service (needs DHT)
     + DHT integration for search
     + CS-DHT-functions (DHT-put of LOC)
@@ -147,6 +82,8 @@ away), in order in which they will likely be done:
     + download
     + search
     + unindex
+* MIGRATION:
+  - improved content selection (not just 'get_random')
 
 0.9.0pre3:
 * Determine RC bugs and fix those!
@@ -168,6 +105,10 @@ away), in order in which they will likely be done:
 * MYSQL database backends: [CG]
   - datacache
   - datastore
+* FS:
+  - reconstruct IBLOCKS from DBLOCKS if possible (during download; see FIXME in fs_download)
+  - add support for pushing "already seen" search results to FS service for bloomfilter (can wait)
+  - use different 'priority' for probe downloads vs. normal downloads
 
 0.9.0:
 * new webpage:
@@ -175,8 +116,7 @@ away), in order in which they will likely be done:
   - convert documentation pages to books
   - update books (especially for developers)
   - create good Drupal theme for GNUnet
-  - make a NICE download page and figure out how to 
-    enable developers to publish TGZs nicely
+  - make a NICE download page and figure out how to enable developers to publish TGZs nicely
   - port "contact" page
   - add content type for "todo" items?
 * POSTGRES database backends: [CG]
@@ -210,8 +150,6 @@ away), in order in which they will likely be done:
     (Note: build library always, build service when libxml2/etc. are available)
 * FS: [CG]
   - Remove KBlocks in gnunet-unindex (see discussion with Kenneth Almquist on gnunet-devs in 9/2009)
-  - Allow checking of presence of search results and/or content via command-line tools
-    (add options to gnunet-search / gnunet-download to limit search to local peer)
 * PEERINFO: [CG]
   - expire 'ancient' HELLOs (those without valid addresses AND that 
     we have not 'used' (for their public keys) in a while; need a way
@@ -224,23 +162,21 @@ away), in order in which they will likely be done:
 Optimizations:
 * TCP:
   - should use hash map to look up sessions
-* PEERINFO:
-  - api creates many, many short-lived TCP connections; either some
-    clients should use the API differently or we need to change the
-    API to enable re-use of connections to the service
 * STATISTICS:
   - should use BIO instead of mmap
 * TRANSPORT:
   - need to periodically probe latency/transport cost changes & possibly switch transport
-  - instantly filter addresses from *other* peers that 
-    are *equal* to our own address + port (i.e., localhost:2086).  We 
-    no longer filter those for outgoing (helps with loopback testing
-    and keeps the code clean), but we should filter strictly *impossible*
-    incoming addresses!  This is for efficiency, not correctness.
-  - should use hash map to look up Neighbours
-* HOSTLIST:
-  - 'server' uses 'GNUNET_PEERINFO_iterate', should probably switch to notification API
-    (for more instant / up-to-date hostlists at lower cost) [OPTIMIZATION]
+  - should use hash map to look up Neighbours (service AND plugins!)
+* DATASTORE (?):
+  - check for duplicates on insertion (currently, same content is frequently
+    stored again [seen with KBLOCKS and SBLOCKS]!)
+* PEERINFO:
+  - merge multiple HELLOs of the same peer in the transmission queue
+    (theoretically reduces overhead; bounds message queue size)
+  - merge multiple iteration requests over "all" peers in the queue
+    (theoretically reduces overhead; bounds messgae queue size)
+* FS:
+  - use different queue prioritization for probe-downloads vs. normal downloads (!?)
 
 Minor features:
 * TCP:
@@ -248,7 +184,5 @@ Minor features:
   - [./transport/plugin_transport_tcp.c:391]: (style) struct or union member 'Plugin::address_update_task' is never used (related to issue above)
 * TRANSPORT:
   - [./transport/gnunet-service-transport.c:173]: (style) struct or union member 'TransportPlugin::rebuild' is never used (related to TCP not refreshing external addresses?)
-* DATACACHE:
-  - add stats (# bytes available, # bytes used, # PUTs, # GETs, # GETs satisfied)
-* FS:
-  - support inline data in directories for recursive file downloads (fs_download)
+* BLOCKS:
+  - testcase would be nice...