update TODO
[epclust.git] / TODO
1 simulateur : complètement aléatoire ? from Irish dataset ?
2 wavelets methods in statistics with R - p180
3
4 00-convertir2009 et 2010.R
5 01-extractFeatures.R pour 2009 [utilise Stbr.R] (car on prédit 2010, pas besoin)
6 02-cluster2009.R
7 03-compute-sum-of-classes2009.R
8 05-cluster2WER-2009.R
9 06-prediction.R
10
11 Essayer distance wdist du package biwavelet ?
12
13 geometric structure of high dim data and dim reduction 2011
14
15 https://docs.docker.com/engine/getstarted/step_one/
16
17 A faire:
18 - finir les experiences (sur nb de classes, nb de curves / chunk, nb de procs)
19 et sur d'autres architectures
20
21 dans old_C_code/build :
22 cmake ../stage1/src
23 make
24
25 dans data/, lancer R puis :
26 source("../old_C_code/wrapper.R")
27 serialize("../old_C_code/build", "2009.csv","2009.bin",1)
28 library(parallel)
29 np = detectCores()
30 nbSeriesPerChunk = 3000
31 nbClusters = 20
32 ppam_exe("../old_C_code/build",np,"2009.bin",nbSeriesPerChunk,nbClusters)
33 C = getMedoids("../old_C_code/build", "ppamResult.xml", "ppamFinalSeries.bin")
34 first100series = deserialize("../old_C_code/build", "2009.bin", "2009.csv.part", "1-100")
35 distor = getDistor("../old_C_code/build", "ppamResult.xml", "2009.bin")
36
37 - interface matrice -> binaire
38 OK
39
40 - courbe synchrone
41 ??
42
43 Piste à explorer pour les comparaisons: H20
44
45 renvoyer nombre d'individues par classe ? (+ somme ?)
46 hypothèse : données déjà ordonnées 48 1/2H sur 365j
47 utiliser du mixmod avec modèles allongés
48 doit toutner sur machine plutôt standard, utilisateur "lambda"
49 utiliser Rcpp ?
50