'update'
[epclust.git] / TODO
CommitLineData
572d139a
BA
1simulateur : complètement aléatoire ? from Irish dataset ?
2wavelets methods in statistics with R - p180
3
400-convertir2009 et 2010.R
501-extractFeatures.R pour 2009 [utilise Stbr.R] (car on prédit 2010, pas besoin)
602-cluster2009.R
703-compute-sum-of-classes2009.R
805-cluster2WER-2009.R
906-prediction.R
10
11Essayer distance wdist du package biwavelet ?
12
13geometric structure of high dim data and dim reduction 2011
1568db29
BA
14
15https://docs.docker.com/engine/getstarted/step_one/
7709d507
BA
16
17A faire:
5edda192 18 - finir les experiences (sur nb de classes, nb de curves / chunk, nb de procs)
7709d507 19 et sur d'autres architectures
14cb6cf8 20
14cb6cf8
BA
21dans old_C_code/build :
22cmake ../stage1/src
23make
24
25dans data/, lancer R puis :
26source("../old_C_code/wrapper.R")
65bd7506
BA
27serialize("../old_C_code/build", "2009.csv","2009.bin",1)
28library(parallel)
29np = detectCores()
30nbSeriesPerChunk = 3000
31nbClusters = 20
32ppam_exe("../old_C_code/build",np,"2009.bin",nbSeriesPerChunk,nbClusters)
33C = getMedoids("../old_C_code/build", "ppamResult.xml", "ppamFinalSeries.bin")
34first100series = deserialize("../old_C_code/build", "2009.bin", "2009.csv.part", "1-100")
35distor = getDistor("../old_C_code/build", "ppamResult.xml", "2009.bin")
5edda192
BA
36
37- interface matrice -> binaire
38 OK
39
7709d507 40 - courbe synchrone
5edda192 41 ??
7709d507 42
5edda192 43Piste à explorer pour les comparaisons: H20
e2a7484d
BA
44
45renvoyer nombre d'individues par classe ? (+ somme ?)
46hypothèse : données déjà ordonnées 48 1/2H sur 365j
47utiliser du mixmod avec modèles allongés
48doit toutner sur machine plutôt standard, utilisateur "lambda"
49utiliser Rcpp ?
50
dc1aa85a
BA
51=====
52
53trategies for upscaling
54From 25K to 25M : in 1000 chunks of 25K
55Reference values :
56 K 0 = 200 super consumers (SC)
57 K ∗ = 15 nal clusters
581st strategy
59 Do 1000 times ONLY Energycon's 1st-step strategy on 25K clients
60 With the 1000 × K 0 SC perform a 2-step run leading to K ∗ clusters
61
62--> il faut s'arranger pour que
63
642nd strategy
65 Do 1000 times Energycon's 2-step strategy on 25K clients leading to
66 1000 × K ∗ intermediate clusters
67 Treat the intermediate clusters as individual curves and perform a
68 single 2-step run to get K ∗ nal clusters