X-Git-Url: https://git.auder.net/?a=blobdiff_plain;f=TODO;h=3a7c13e4f1b8dd5b7e39e0a34a6826f33c9e506d;hb=f19eee86bfca9eb821aaab3d03a0d438238a0c7e;hp=7e6aa9092b61a38905205d83d05674121f1ff160;hpb=e2a7484dfe72855d022ad03300787b3bf33b0352;p=epclust.git diff --git a/TODO b/TODO index 7e6aa90..3a7c13e 100644 --- a/TODO +++ b/TODO @@ -48,3 +48,27 @@ utiliser du mixmod avec modèles allongés doit toutner sur machine plutôt standard, utilisateur "lambda" utiliser Rcpp ? +===== + +strategies for upscaling +From 25K to 25M : in 1000 chunks of 25K +Reference values : + K0 = 200 super consumers (SC) + K∗ = 15 nal clusters +1st strategy + Do 1000 times ONLY Energycon's 1st-step strategy on 25K clients + With the 1000 × K0 SC perform a 2-step run leading to K∗ clusters + +--> il faut lancer 1000(param: nbTasks?) tâches avec itérations (éventuelles) +--> écrire tous les résultats, puis les récupérer pour démarrer : +--> phase 2 sur 1000xK0 médoïdes + +2nd strategy + Do 1000 times Energycon's 2-step strategy on 25K clients leading to + 1000 × K∗ intermediate clusters + Treat the intermediate clusters as individual curves and perform a + single 2-step run to get K∗ final clusters + +--> 1000(nbTasks) tâches avec itérations possibles, puis phase 2 en fin de chaqune des 1000 +tâches. On obtient 1000xK* médoïdes +--> Phase 2 sur les 1000xK* médoïdes