reorganize folder
[epclust.git] / TODO
CommitLineData
572d139a
BA
1simulateur : complètement aléatoire ? from Irish dataset ?
2wavelets methods in statistics with R - p180
3
400-convertir2009 et 2010.R
501-extractFeatures.R pour 2009 [utilise Stbr.R] (car on prédit 2010, pas besoin)
602-cluster2009.R
703-compute-sum-of-classes2009.R
805-cluster2WER-2009.R
906-prediction.R
10
11Essayer distance wdist du package biwavelet ?
12
13geometric structure of high dim data and dim reduction 2011
1568db29
BA
14
15https://docs.docker.com/engine/getstarted/step_one/
7709d507
BA
16
17A faire:
5edda192 18 - finir les experiences (sur nb de classes, nb de curves / chunk, nb de procs)
7709d507 19 et sur d'autres architectures
14cb6cf8 20
14cb6cf8
BA
21dans old_C_code/build :
22cmake ../stage1/src
23make
24
25dans data/, lancer R puis :
26source("../old_C_code/wrapper.R")
65bd7506
BA
27serialize("../old_C_code/build", "2009.csv","2009.bin",1)
28library(parallel)
29np = detectCores()
30nbSeriesPerChunk = 3000
31nbClusters = 20
32ppam_exe("../old_C_code/build",np,"2009.bin",nbSeriesPerChunk,nbClusters)
33C = getMedoids("../old_C_code/build", "ppamResult.xml", "ppamFinalSeries.bin")
34first100series = deserialize("../old_C_code/build", "2009.bin", "2009.csv.part", "1-100")
35distor = getDistor("../old_C_code/build", "ppamResult.xml", "2009.bin")
5edda192
BA
36
37- interface matrice -> binaire
38 OK
39
7709d507 40 - courbe synchrone
5edda192 41 ??
7709d507 42
5edda192 43Piste à explorer pour les comparaisons: H20
e2a7484d
BA
44
45renvoyer nombre d'individues par classe ? (+ somme ?)
46hypothèse : données déjà ordonnées 48 1/2H sur 365j
47utiliser du mixmod avec modèles allongés
48doit toutner sur machine plutôt standard, utilisateur "lambda"
49utiliser Rcpp ?
50
dc1aa85a
BA
51=====
52
1c6f223e 53strategies for upscaling
dc1aa85a
BA
54From 25K to 25M : in 1000 chunks of 25K
55Reference values :
1c6f223e
BA
56 K0 = 200 super consumers (SC)
57 K∗ = 15 nal clusters
dc1aa85a
BA
581st strategy
59 Do 1000 times ONLY Energycon's 1st-step strategy on 25K clients
1c6f223e 60 With the 1000 × K0 SC perform a 2-step run leading to K∗ clusters
dc1aa85a 61
1c6f223e
BA
62--> il faut lancer 1000(param: nbTasks?) tâches avec itérations (éventuelles)
63--> écrire tous les résultats, puis les récupérer pour démarrer :
64--> phase 2 sur 1000xK0 médoïdes
dc1aa85a
BA
65
662nd strategy
67 Do 1000 times Energycon's 2-step strategy on 25K clients leading to
1c6f223e 68 1000 × K∗ intermediate clusters
dc1aa85a 69 Treat the intermediate clusters as individual curves and perform a
1c6f223e
BA
70 single 2-step run to get K∗ final clusters
71
72--> 1000(nbTasks) tâches avec itérations possibles, puis phase 2 en fin de chaqune des 1000
73tâches. On obtient 1000xK* médoïdes
74--> Phase 2 sur les 1000xK* médoïdes
d7d55bc1
BA
75
76#point avec Jairo:
77#rentrer dans code C cwt continue Rwave
78#passer partie sowas à C
79#fct qui pour deux series (ID, medoides) renvoie distance WER (Rwave ou à moi)
80#transformee croisee , smoothing lissage 3 composantes , + calcul pour WER
81#determiner nvoice noctave (entre octave + petit et + grand)