X-Git-Url: https://git.auder.net/?p=talweg.git;a=blobdiff_plain;f=reports%2FOLD%2Freport_OLD.gj;fp=reports%2Freport.gj;h=b8b9233e6b2c2f76cab3d08a03ad685ec6086e69;hp=e499ece066092ed78d2d9eafd5f16ea24e57858a;hb=4d376294a6286ca1548d978055731dac175ffa3a;hpb=b4bb50591a237f0510087e8bb9a2825b68037b47

diff --git a/reports/report.gj b/reports/OLD/report_OLD.gj
similarity index 66%
rename from reports/report.gj
rename to reports/OLD/report_OLD.gj
index e499ece..b8b9233 100644
--- a/reports/report.gj
+++ b/reports/OLD/report_OLD.gj
@@ -1,125 +1,16 @@
 -----
-# Package R "talweg"
+# RÃ©sultats numÃ©riques
 
-Le package $-$ Time-series sAmpLes forecasted With ExoGenous variables $-$ contient le
-code permettant de (re)lancer les expÃ©riences numÃ©riques dÃ©crites dans cette partie et la
-suivante. Les fonctions principales sont respectivement
-
- * **getData()** pour construire un objet R contenant les donnÃ©es Ã  partir de fichiers
-CSV (extraits de bases de donnÃ©es). Le format choisi en R est une classe R6 (du package
-du mÃªme nom) exposant en particulier les mÃ©thodes *getSerie(i)* et *getExo(i)* qui
-renvoient respectivement la $i^{eme}$ sÃ©rie de 24h et les variables exogÃ¨nes (mesurÃ©es)
-correspondantes. Voir ?Data pour plus d'information, une fois le package chargÃ©.
- * **computeForecast()** pour calculer des prÃ©dictions sur une certaine plage temporelle
-contenue dans *data <- getData(...)*
- * **computeError()** pour Ã©valuer les erreurs commises par diffÃ©rentes mÃ©thodes.
-
-Le package contient en outre diverses fonctions graphiques *plotXXX()*, utilisÃ©es dans la
-partie suivante.
------r
-# Chargement de la librairie (aprÃ¨s compilation, "R CMD INSTALL .")
-library(talweg)
-
-# Acquisition des donnÃ©es (depuis les fichiers CSV)
-ts_data <- read.csv(system.file("extdata","pm10_mesures_H_loc.csv",
-	package="talweg"))
-exo_data <- read.csv(system.file("extdata","meteo_extra_noNAs.csv",
-	package="talweg"))
-data <- getData(ts_data, exo_data, input_tz="GMT",
-	date_format="%d/%m/%Y %H:%M", working_tz="GMT",
-	predict_at=7, limit=120)
-# Plus de dÃ©tails Ã  la section 1 ci-aprÃ¨s.
-
-# PrÃ©diction de 10 courbes (jours 102 Ã  111)
-pred <- computeForecast(data, 101:110, "Persistence", "Zero", memory=50,
-	horizon=12, ncores=1)
-# Plus de dÃ©tails Ã  la section 2 ci-aprÃ¨s.
-
-# Calcul des erreurs (sur un horizon arbitraire <= horizon de prÃ©diction)
-err <- computeError(data, pred, horizon=6)
-# Plus de dÃ©tails Ã  la section 3 ci-aprÃ¨s.
-
-# Puis voir ?plotError et les autres plot dans le paragraphe 'seealso'
------
-${"##"} getData()
-
-Les arguments de cette fonction sont, dans l'ordre :
-
- 1. **ts_data** : sÃ©ries temporelles (fichier CSV avec entÃªte ou data.frame) ; la
-premiÃ¨re colonne contient les heures, la seconde les valeurs.
- 2. **exo_data** : variables exogÃ¨nes (fichier CSV avec entÃªte ou data.frame) ; la
-premiÃ¨re colonne contient les jours, les $m$ suivantes les variables mesurÃ©es pour ce
-jour, et les $m$ derniÃ¨res les variables prÃ©dites pour ce mÃªme jour. Dans notre cas $m=4$
-: pression, tempÃ©rature, gradient de tempÃ©rature, vitesse du vent.
- 3. **input_tz** : zone horaire pour ts_data (dÃ©faut : "GMT").
- 4. **date_format** : format des heures dans ts_data (dÃ©faut : "%d/%m/%Y %H:%M", format
-du fichier transmis par Michel).
- 5. **working_tz** : zone horaire dans laquelle on souhaite travailler avec les donnÃ©es
-(dÃ©faut : "GMT").
- 6. **predict_at** : heure Ã  laquelle s'effectue la prÃ©vision $-$ et donc derniÃ¨re heure
-d'un bloc de 24h, relativement Ã  working_tz. data`$`getSerie(3) renvoit ainsi les 24
-valeurs de 8h Ã  7h pour le $3^{eme}$ bloc de 24h prÃ©sent dans le jeu de donnÃ©es.
------r
-print(data)
-#?Data
------
-${"##"} computeForecast()
-
-Les arguments de cette fonction sont, dans l'ordre :
-
- 1. **data** : le jeu de donnÃ©es renvoyÃ© par getData()
- 2. **indices** : l'ensemble de jours dont on veut prÃ©voir les "lendemains" (prochains
-blocs de 24h) ; peut Ãªtre donnÃ©e sous forme d'un vecteur de dates ou d'entiers
-(correspondants aux numÃ©ros des jours).
- 3. **forecaster** : le nom du prÃ©dicteur principal Ã  utiliser ; voir ?computeForecast
- 4. **pjump** : le nom du prÃ©dicteur de saut d'une sÃ©rie Ã  l'autre ; voir
-?computeForecast
- 5. **memory** : le nombre de jours Ã  prendre en compte dans le passÃ© pour chaque
-prÃ©vision (par dÃ©faut : Inf, c'est-Ã -dire tout l'historique pris en compte).
- 6. **horizon** : le nombre d'heures Ã  prÃ©dire ; par dÃ©faut "data`$`getStdHorizon()",
-c'est-Ã -dire le nombre d'heures restantes Ã  partir de l'instant de prÃ©vision + 1 jusqu'Ã 
-minuit (17 pour predict_at=7 par exemple).
- 7. **ncores** : le nombre de processus parallÃ¨les (utiliser 1 pour une exÃ©cution
-sÃ©quentielle)
------r
-print(pred)
-#?computeForecast
------
-${"##"} computeError()
-
-Les arguments de cette fonction sont, dans l'ordre :
-
- 1. **data** : le jeu de donnÃ©es renvoyÃ© par getData()
- 2. **pred** : les prÃ©dictions renvoyÃ©es par computeForecast()
- 3. **horizon** : le nombre d'heures Ã  considÃ©rer pour le calcul de l'erreur ; doit Ãªtre
-infÃ©rieur ou Ã©gal Ã  l'horizon utilisÃ© pour la prÃ©diction (mÃªme valeur par dÃ©faut :
-"data`$`getStdHorizon()")
------r
-summary(err)
-summary(err$abs)
-summary(err$MAPE)
------
-${"##"} Graphiques
-
-Voir ?plotError : les autres fonctions graphiques sont dans la section 'seealso' :
-
-    âplotCurvesâ, âplotPredRealâ, âplotSimilsâ, âplotFboxâ,
-    âcomputeFilamentsâ, âplotFilamentsBoxâ, âplotRelVarâ
-
-?plotXXX, etc.
-## $\clearpage$ How to do that?
------
-# ExpÃ©rimentations
-
-Cette partie montre les rÃ©sultats obtenus via des variantes de l'algorithme dÃ©crit Ã  la
-section 2, en utilisant le package prÃ©sentÃ© Ã  la section 3. Cet algorithme est
+Cette partie montre les rÃ©sultats obtenus avec des variantes de l'algorithme dÃ©crit au
+chapitre 5, en utilisant le package prÃ©sentÃ© au chapitre 6.
+Les ........... options ...........
+Cet algorithme est
 systÃ©matiquement comparÃ© Ã  deux approches naÃ¯ves :
 
- * la moyenne des lendemains des jours "similaires" dans tout le passÃ©, c'est-Ã -dire
-prÃ©diction = moyenne de tous les mardis passÃ© si le jour courant est un lundi par
-exemple.
+ * la moyenne des lendemains des jours de mÃªme type dans tout le passÃ©, c'est-Ã -dire
+prÃ©diction = moyenne de tous les mardis passÃ©s si le jour courant est un lundi.
  * la persistence, reproduisant le jour courant ou allant chercher le lendemain de la
-derniÃ¨re journÃ©e "similaire" (mÃªme principe que ci-dessus ; argument "same\_day").
+derniÃ¨re journÃ©e de mÃªme type (mÃªme principe que ci-dessus ; argument "same\_day").
 
 Concernant l'algorithme principal Ã  voisins, trois variantes sont Ã©tudiÃ©es dans cette
 partie :
@@ -188,13 +79,25 @@ plotError(list(e1, e5, e4, e2, e3), cols=c(1,2,colors()[258],4,6))
 # mauve: Neighbors local none (p3), vert: moyenne (p4),
 # rouge: persistence (p5)
 
+##############TODO: expliquer "endo" "none"......etc
+## ajouter fenÃªtres essais dans rapport. --> dans chapitre actuel.
+## re-ajouter annexe sur ancienne mÃ©thode exo/endo/mix
+## ---------> fenetres comment elles sont optimisÃ©es
+#--------> ajouter Ã  la fin quelques graphes montrant/comparant autres mÃ©thodes
+#chapitre rÃ©sumÃ© avec diffÃ©rents essais conclusions. ---> synthÃ¨se des essais rÃ©alisÃ©s,
+#avec sous-paragraphes avec conclusions H3/H17 sans surprises on amÃ©liore les choses,
+#mais il y a des situations oÃ¹ c'est pas mieux.
+#---------> fichier tex rÃ©insÃ©rer synthÃ¨se de l'ensemble des essais rÃ©alisÃ©s.
+#++++++++ ajouter Ã  13h
+
 sum_p123 = e1$abs$indices + e2$abs$indices + e3$abs$indices
 i_np = which.min(sum_p123) #indice de (veille de) jour "facile"
 i_p = which.max(sum_p123) #indice de (veille de) jour "difficile"
 -----
 % if i == 0:
 L'erreur absolue deÌpasse 20 sur 1 aÌ 2 jours suivant les modeÌles (graphe en haut aÌ
-droite). C'est au-delaÌ de ce que l'on aimerait voir (disons +/- 5 environ). Sur cet
+droite). ##C'est au-delaÌ de ce que l'on aimerait voir (disons +/- 5 environ).
+Sur cet
 exemple le modeÌle aÌ voisins "contraint" (local=TRUE) utilisant des pondeÌrations baseÌes
 sur les similariteÌs de forme (simtype="endo") obtient en moyenne les meilleurs reÌsultats,
 avec un MAPE restant en geÌneÌral infeÌrieur aÌ 30% de 8h aÌ 19h (7+1 aÌ 7+12 : graphe en bas aÌ
@@ -227,11 +130,13 @@ plotPredReal(data, p3, i_p); title(paste("PredReal p3 day",i_p))
 # Bleu : prÃ©vue ; noir : rÃ©alisÃ©e
 -----
 % if i == 0:
-Le jour "facile aÌ preÌvoir", aÌ gauche, se deÌcompose en deux modes : un leÌger vers 10h
+La courbe non centrÃ©e du jour facile Ã  prÃ©voir (en noir),
+##Le jour "facile aÌ preÌvoir",
+aÌ gauche, se deÌcompose en deux modes : un leÌger vers 10h
 (7+3), puis un beaucoup plus marqueÌ vers 19h (7+12). Ces deux modes sont retrouveÌs par
 les trois variantes de l'algorithme aÌ voisins, bien que l'amplitude soit mal preÌdite.
-Concernant le jour "difficile aÌ preÌvoir" il y a deux pics en tout deÌbut et toute fin de
-journeÌe (aÌ 9h et 23h), qui ne sont pas du tout anticipeÌs par le programme ; la grande
+Concernant le jour "difficile aÌ preÌvoir" (Ã  droite) il y a deux pics en tout deÌbut et toute fin de
+journeÌe (aÌ 9h et 23h), qui ne sont pas du tout anticipÃ©s par les mÃ©thodes ; la grande
 amplitude de ces pics explique alors l'intensiteÌ de l'erreur observeÌe.
 % elif i == 1:
 Dans le cas d'un jour "facile" aÌ preÌdire $-$ aÌ gauche $-$ la forme est plus ou moins
@@ -276,10 +181,18 @@ par(mfrow=c(1,2))
 plotFilamentsBox(data, f_np1); title(paste("FilBox p1 day",i_np))
 plotFilamentsBox(data, f_p1); title(paste("FilBox p1 day",i_p))
 
+## Questions :
+#7h VS 13h
+#est-ce que prÃ©voir 24h ou 13 ou 3 facilite.
+#amplitude erreur raisonnable ? probleme facile difficile ?
+#place des exogÃ¨nes ?
+#H = ?
+#Ã©pandage > chauffage > np
+
 # En pointilleÌs la courbe du jour courant + lendemain (aÌ preÌdire)
 -----
 % if i == 0:
-Sur cette boxplot fonctionnelle (voir la fonction fboxplot() du package R "rainbow") l'on
+Sur cette boxplot fonctionnelle (voir la fonction fboxplot() du package R "rainbow") on
 constate essentiellement deux choses : le lendemain d'un voisin "normal" peut se reÌveÌler
 eÌtre une courbe atypique, fort eÌloigneÌe de ce que l'on souhaite preÌdire (courbes bleue et
 rouge aÌ gauche) ; et, dans le cas d'une courbe aÌ preÌdire atypique (aÌ droite) la plupart
@@ -362,9 +275,9 @@ p2$getParams(i_p)$window
 ${"##"} Bilan
 
 Nos algorithmes aÌ voisins ne sont pas adapteÌs aÌ ce jeu de donneÌes ouÌ la forme varie
-consideÌrablement d'un jour aÌ l'autre. Plus geÌneÌralement cette deÌcorreÌlation de forme rend
-ardue la taÌche de preÌvision pour toute autre meÌthode $-$ du moins, nous ne savons pas
-comment proceÌder pour parvenir aÌ une bonne preÌcision.
-
-Toutefois, un espoir reste permis par exemple en aggreÌger les courbes spatialement (sur
+consideÌrablement d'un jour aÌ l'autre.
+Toutefois, un espoir reste permis par exemple en aggreÌgeant les courbes spatialement (sur
 plusieurs stations situeÌes dans la meÌme agglomeÌration ou dans une meÌme zone).
+##Plus geÌneÌralement cette deÌcorreÌlation de forme rend
+##ardue la taÌche de preÌvision pour toute autre meÌthode $-$ du moins, nous ne savons pas
+##comment proceÌder pour parvenir aÌ une bonne preÌcision.