X-Git-Url: https://git.auder.net/?p=epclust.git;a=blobdiff_plain;f=TODO;h=f5e00156d85ec745d10934a03333ecbe5a475933;hp=96a8221f6b61b77fa95f0d3e59cab4b50f3ab899;hb=62deb4244895a20a35397dfb062f0b9fe94c5012;hpb=3eef8d3df59ded9a281cff51f79fe824198a7427

diff --git a/TODO b/TODO
index 96a8221..f5e0015 100644
--- a/TODO
+++ b/TODO
@@ -1,13 +1,7 @@
 simulateur : complÃ¨tement alÃ©atoire ? from Irish dataset ?
+wmtsa : wavBootstrap
 wavelets methods in statistics with R - p180
 
-00-convertir2009 et 2010.R
-01-extractFeatures.R pour 2009 [utilise Stbr.R] (car on prÃ©dit 2010, pas besoin)
-02-cluster2009.R
-03-compute-sum-of-classes2009.R
-05-cluster2WER-2009.R
-06-prediction.R
-
 Essayer distance wdist du package biwavelet ?
 
 geometric structure of high dim data and dim reduction 2011
@@ -18,61 +12,14 @@ A faire:
  - finir les experiences (sur nb de classes, nb de curves / chunk, nb de procs)
    et sur d'autres architectures
 
-dans old_C_code/build :
-cmake ../stage1/src
-make
-
-dans data/, lancer R puis :
-source("../old_C_code/wrapper.R")
-serialize("../old_C_code/build", "2009.csv","2009.bin",1)
-library(parallel)
-np = detectCores()
-nbSeriesPerChunk = 3000
-nbClusters = 20
-ppam_exe("../old_C_code/build",np,"2009.bin",nbSeriesPerChunk,nbClusters)
-C = getMedoids("../old_C_code/build", "ppamResult.xml", "ppamFinalSeries.bin")
-first100series = deserialize("../old_C_code/build", "2009.bin", "2009.csv.part", "1-100")
-distor = getDistor("../old_C_code/build", "ppamResult.xml", "2009.bin")
-
-- interface matrice -> binaire
-	 OK
-
- - courbe synchrone
-	 ??
-
 Piste Ã  explorer pour les comparaisons: H20
 
 renvoyer nombre d'individues par classe ? (+ somme ?)
 hypothÃ¨se : donnÃ©es dÃ©jÃ  ordonnÃ©es 48 1/2H sur 365j
 utiliser du mixmod avec modÃ¨les allongÃ©s
-doit toutner sur machine plutÃ´t standard, utilisateur "lambda"
+doit tourner sur machine plutÃ´t standard, utilisateur "lambda"
 utiliser Rcpp ?
 
-=====
-
-strategies for upscaling
-From 25K to 25M : in 1000 chunks of 25K
-Reference values :
- K0 = 200 super consumers (SC)
- Kâ = 15 nal clusters
-1st strategy
- Do 1000 times ONLY Energycon's 1st-step strategy on 25K clients
- With the 1000 Ã K0 SC perform a 2-step run leading to Kâ clusters
-
---> il faut lancer 1000(param: nbTasks?) tÃ¢ches avec itÃ©rations (Ã©ventuelles)
---> Ã©crire tous les rÃ©sultats, puis les rÃ©cupÃ©rer pour dÃ©marrer :
---> phase 2 sur 1000xK0 mÃ©doÃ¯des
-
-2nd strategy
- Do 1000 times Energycon's 2-step strategy on 25K clients leading to
- 1000 Ã Kâ intermediate clusters
- Treat the intermediate clusters as individual curves and perform a
- single 2-step run to get Kâ final clusters
-
---> 1000(nbTasks) tÃ¢ches avec itÃ©rations possibles, puis phase 2 en fin de chaqune des 1000
-tÃ¢ches. On obtient 1000xK* mÃ©doÃ¯des
---> Phase 2 sur les 1000xK* mÃ©doÃ¯des
-
 #point avec Jairo:
 #rentrer dans code C cwt continue Rwave
 #passer partie sowas Ã  C