simulateur : complètement aléatoire ? from Irish dataset ? wavelets methods in statistics with R - p180 00-convertir2009 et 2010.R 01-extractFeatures.R pour 2009 [utilise Stbr.R] (car on prédit 2010, pas besoin) 02-cluster2009.R 03-compute-sum-of-classes2009.R 05-cluster2WER-2009.R 06-prediction.R Essayer distance wdist du package biwavelet ? geometric structure of high dim data and dim reduction 2011 https://docs.docker.com/engine/getstarted/step_one/ A faire: - finir les experiences (sur nb de classes, nb de curves / chunk, nb de procs) et sur d'autres architectures dans old_C_code/build : cmake ../stage1/src make dans data/, lancer R puis : source("../old_C_code/wrapper.R") serialize("../old_C_code/build", "2009.csv","2009.bin",1) library(parallel) np = detectCores() nbSeriesPerChunk = 3000 nbClusters = 20 ppam_exe("../old_C_code/build",np,"2009.bin",nbSeriesPerChunk,nbClusters) C = getMedoids("../old_C_code/build", "ppamResult.xml", "ppamFinalSeries.bin") first100series = deserialize("../old_C_code/build", "2009.bin", "2009.csv.part", "1-100") distor = getDistor("../old_C_code/build", "ppamResult.xml", "2009.bin") - interface matrice -> binaire OK - courbe synchrone ?? Piste à explorer pour les comparaisons: H20 renvoyer nombre d'individues par classe ? (+ somme ?) hypothèse : données déjà ordonnées 48 1/2H sur 365j utiliser du mixmod avec modèles allongés doit toutner sur machine plutôt standard, utilisateur "lambda" utiliser Rcpp ?