X-Git-Url: https://git.auder.net/?p=epclust.git;a=blobdiff_plain;f=TODO;h=957c1119264e3d8542a2aa16803b38672c6afca8;hp=b96bad45f59d61713b46a2450acb6f567f3e0442;hb=e906736ea27105237e84c904dce6170353726292;hpb=b7cd987d286ed3b0bde10b15d0fbcdc355fc4b30 diff --git a/TODO b/TODO index b96bad4..957c111 100644 --- a/TODO +++ b/TODO @@ -8,11 +8,6 @@ geometric structure of high dim data and dim reduction 2011 Piste à explorer pour les comparaisons: H20 -renvoyer nombre d'individues par classe ? -hypothèse : données déjà ordonnées 48 1/2H sur 365j -utiliser mixmod avec modèles allongés -doit tourner sur machine plutôt standard, utilisateur "lambda" - #https://stat.ethz.ch/pipermail/r-help/2011-June/280133.html #randCov = function(d) #{ @@ -24,8 +19,8 @@ doit tourner sur machine plutôt standard, utilisateur "lambda" #TODO: map-reduce more appropriate R/clustering.R ligne 88 #TODO: use dbs(), - #https://www.r-bloggers.com/debugging-parallel-code-with-dbs/ - #http://gforge.se/2015/02/how-to-go-parallel-in-r-basics-tips/ +#https://www.r-bloggers.com/debugging-parallel-code-with-dbs/ +#http://gforge.se/2015/02/how-to-go-parallel-in-r-basics-tips/ PLOT: plot manifold 2D distances WER / @@ -33,9 +28,26 @@ fenetre tempo forme des courbes / medoids / gain en prevision: clust puis full --> enercast -réduire taille 17519 trop long ? +------- + +Voici le code : + +library(epclust) + +n <- 5 +N <- 128 +M <- matrix(runif(n * N), nrow = n) #séries en lignes +M <- t(apply(M, 1, cumsum)) / sqrt(n * N) +matplot(t(M), type = 'l', lty = 1) + +dists3a <- computeWerDists(1:n, function(inds) M[,inds], n) + +# je passe de distance Wer à corrélations : moralement tout est à 0 +summary((1 - dists3a[lower.tri(dists3a)]^2) / N / n) -TODO: revoir les arguments, simplifier (dans les clustering...), +# or, les courbes sont très similaires, nous devrions être proche de 1 ! +corM <- cor(t(M)) +summary(corM[lower.tri(corM)]) #si pas lissage --> on doit trouver 1 : TOCHECK #regarder biwavelets smooth.wavelet : s'en inspirer