work on CSV preprocessing
[epclust.git] / TODO
... / ...
CommitLineData
1simulateur : complètement aléatoire ? from Irish dataset ?
2wmtsa : wavBootstrap
3wavelets methods in statistics with R - p180
4
5Essayer distance wdist du package biwavelet ?
6
7geometric structure of high dim data and dim reduction 2011
8
9https://docs.docker.com/engine/getstarted/step_one/
10
11A faire:
12 - finir les experiences (sur nb de classes, nb de curves / chunk, nb de procs)
13 et sur d'autres architectures
14
15Piste à explorer pour les comparaisons: H20
16
17renvoyer nombre d'individues par classe ? (+ somme ?)
18hypothèse : données déjà ordonnées 48 1/2H sur 365j
19utiliser du mixmod avec modèles allongés
20doit tourner sur machine plutôt standard, utilisateur "lambda"
21utiliser Rcpp ?
22
23#point avec Jairo:
24#rentrer dans code C cwt continue Rwave
25#passer partie sowas à C
26#fct qui pour deux series (ID, medoides) renvoie distance WER (Rwave ou à moi)
27#transformee croisee , smoothing lissage 3 composantes , + calcul pour WER
28#determiner nvoice noctave (entre octave + petit et + grand)
29
30#TODO: load some dataset ASCII CSV
31#data_bin_file <<- "/tmp/epclust_test.bin"
32#unlink(data_bin_file)
33
34#https://stat.ethz.ch/pipermail/r-help/2011-June/280133.html
35#randCov = function(d)
36#{
37# x <- matrix(rnorm(d*d), nrow=d)
38# x <- x / sqrt(rowSums(x^2))
39# x %*% t(x)
40#}
41
42#TODO: soften condition clustering.R line 37 ?
43#regarder mapply et mcmapply pour le // (pas OK pour Windows ou GUI... mais ?)
44#TODO: map-reduce more appropriate R/clustering.R ligne 88
45#Alternative: use bigmemory to share series when CSV or matrix(...)
46
47#' @importFrom synchronicity boost.mutex lock unlock
48
49subtree: epclust, shared. This root folder should remain private
50
51#TODO: use dbs(),
52 #https://www.r-bloggers.com/debugging-parallel-code-with-dbs/
53 #http://gforge.se/2015/02/how-to-go-parallel-in-r-basics-tips/
54
55synchrones --> somme, pas moyenne
56
57PLOT:
58plot manifold 2D distances WER /
59fenetre tempo forme des courbes /
60medoids /
61gain en prevision: clust puis full --> enercast
62
63réduire taille 17519 trop long ?
64
65synchrone : sum
66cwt : trim R part
67// : clever by rows retenir cwt...
68
69Stockage matrices : en colonnes systématiquement ?
70
71TODO: revoir les arguments, simplifier (dans les clustering...),
72 permettre algos de clustering quelconques, args: medoids (curves puis dists), K