From: Benjamin Auder <benjamin.auder@somewhere>
Date: Fri, 14 Apr 2017 22:07:35 +0000 (+0200)
Subject: final changes
X-Git-Url: https://git.auder.net/doc/%7B%7B%20asset%28%27mixstore/current/pieces/%7B%7B%20pkg.url%20%7D%7D?a=commitdiff_plain;h=12119d214a88100dda180043cbe1e2afd10f79af;p=talweg.git

final changes
---

diff --git a/reports/report.gj b/reports/report.gj
index 8c8d6dc..e499ece 100644
--- a/reports/report.gj
+++ b/reports/report.gj
@@ -26,7 +26,8 @@ ts_data <- read.csv(system.file("extdata","pm10_mesures_H_loc.csv",
 exo_data <- read.csv(system.file("extdata","meteo_extra_noNAs.csv",
 	package="talweg"))
 data <- getData(ts_data, exo_data, input_tz="GMT",
-	date_format="%d/%m/%Y %H:%M", working_tz="GMT", predict_at=7, limit=120)
+	date_format="%d/%m/%Y %H:%M", working_tz="GMT",
+	predict_at=7, limit=120)
 # Plus de dÃ©tails Ã  la section 1 ci-aprÃ¨s.
 
 # PrÃ©diction de 10 courbes (jours 102 Ã  111)
@@ -191,14 +192,14 @@ sum_p123 = e1$abs$indices + e2$abs$indices + e3$abs$indices
 i_np = which.min(sum_p123) #indice de (veille de) jour "facile"
 i_p = which.max(sum_p123) #indice de (veille de) jour "difficile"
 -----
-% if i == 1:
+% if i == 0:
 L'erreur absolue deÌpasse 20 sur 1 aÌ 2 jours suivant les modeÌles (graphe en haut aÌ
 droite). C'est au-delaÌ de ce que l'on aimerait voir (disons +/- 5 environ). Sur cet
 exemple le modeÌle aÌ voisins "contraint" (local=TRUE) utilisant des pondeÌrations baseÌes
 sur les similariteÌs de forme (simtype="endo") obtient en moyenne les meilleurs reÌsultats,
 avec un MAPE restant en geÌneÌral infeÌrieur aÌ 30% de 8h aÌ 19h (7+1 aÌ 7+12 : graphe en bas aÌ
 gauche).
-% elif i == 2:
+% elif i == 1:
 Il est difficile dans ce cas de deÌterminer une meÌthode meilleure que les autres : elles
 donnent toutes de plutoÌt mauvais reÌsultats, avec une erreur absolue moyenneÌe sur la
 journeÌe deÌpassant presque toujours 15 (graphe en haut aÌ droite).
@@ -225,14 +226,14 @@ plotPredReal(data, p3, i_p); title(paste("PredReal p3 day",i_p))
 
 # Bleu : prÃ©vue ; noir : rÃ©alisÃ©e
 -----
-% if i == 1:
+% if i == 0:
 Le jour "facile aÌ preÌvoir", aÌ gauche, se deÌcompose en deux modes : un leÌger vers 10h
 (7+3), puis un beaucoup plus marqueÌ vers 19h (7+12). Ces deux modes sont retrouveÌs par
 les trois variantes de l'algorithme aÌ voisins, bien que l'amplitude soit mal preÌdite.
 Concernant le jour "difficile aÌ preÌvoir" il y a deux pics en tout deÌbut et toute fin de
 journeÌe (aÌ 9h et 23h), qui ne sont pas du tout anticipeÌs par le programme ; la grande
 amplitude de ces pics explique alors l'intensiteÌ de l'erreur observeÌe.
-% elif i == 2:
+% elif i == 1:
 Dans le cas d'un jour "facile" aÌ preÌdire $-$ aÌ gauche $-$ la forme est plus ou moins
 retrouveÌe, mais le niveau moyen est trop bas (courbe en bleu). Concernant le jour
 "difficile" aÌ droite, non seulement la forme n'est pas anticipeÌe mais surtout le niveau
@@ -255,14 +256,14 @@ f_np2 = computeFilaments(data, p2, i_np, plot=TRUE)
 f_p2 = computeFilaments(data, p2, i_p, plot=TRUE)
 	title(paste("Filaments p2 day",i_p))
 -----
-% if i == 1:
+% if i == 0:
 Les voisins du jour courant (peÌriode de 24h allant de 8h aÌ 7h le lendemain) sont afficheÌs
 avec un trait d'autant plus sombre qu'ils sont proches. On constate dans le cas non
 contraint (en haut) une grande variabiliteÌ des lendemains, treÌs nette sur le graphe en
 haut aÌ droite. Ceci indique une faible correÌlation entre la forme d'une courbe sur une
 peÌriode de 24h et la forme sur les 24h suivantes ; **cette observation est la source des
 difficulteÌs rencontreÌes par l'algorithme sur ce jeu de donneÌes.**
-% elif i == 2:
+% elif i == 1:
 Les observations sont les meÌmes qu'au paragraphe preÌceÌdent : trop de variabiliteÌ des
 lendemains (et meÌme des voisins du jour courant).
 % else:
@@ -277,14 +278,14 @@ plotFilamentsBox(data, f_p1); title(paste("FilBox p1 day",i_p))
 
 # En pointilleÌs la courbe du jour courant + lendemain (aÌ preÌdire)
 -----
-% if i == 1:
+% if i == 0:
 Sur cette boxplot fonctionnelle (voir la fonction fboxplot() du package R "rainbow") l'on
 constate essentiellement deux choses : le lendemain d'un voisin "normal" peut se reÌveÌler
 eÌtre une courbe atypique, fort eÌloigneÌe de ce que l'on souhaite preÌdire (courbes bleue et
 rouge aÌ gauche) ; et, dans le cas d'une courbe aÌ preÌdire atypique (aÌ droite) la plupart
 des voisins sont trop eÌloigneÌs de la forme aÌ preÌdire et forcent ainsi un aplatissement de
 la preÌdiction.
-% elif i == 2:
+% elif i == 1:
 On constate la preÌsence d'un voisin au lendemain compleÌtement atypique avec un pic en
 deÌbut de journeÌe (courbe en vert aÌ gauche), et d'un autre pheÌnomeÌne semblable avec la
 courbe rouge sur le graphe de droite. AjouteÌ au fait que le lendemain aÌ preÌvoir est
@@ -304,7 +305,7 @@ plotRelVar(data, f_p2); title(paste("StdDev p2 day",i_p))
 
 # VariabilitÃ© globale en rouge ; sur les voisins (+ lendemains) en noir
 -----
-% if i == 1:
+% if i == 0:
 Ces graphes viennent confirmer l'impression visuelle apreÌs observation des filaments. En
 effet, la variabiliteÌ globale en rouge (eÌcart-type heure par heure sur l'ensemble des
 couples "aujourd'hui/lendemain"du passeÌ) devrait rester nettement au-dessus de la
@@ -312,7 +313,7 @@ variabiliteÌ locale, calculeÌe respectivement sur un voisinage d'une soixantai
 (pour p1) et d'une dizaine de jours (pour p2). Or on constate que ce n'est pas du tout le
 cas sur la peÌriode "lendemain", sauf en partie pour p2 le jour 4 $-$ mais ce n'est pas
 suffisant.
-% elif i == 2:
+% elif i == 1:
 Comme preÌceÌdemment les variabiliteÌs locales et globales sont confondues dans les parties
 droites des graphes $-$ sauf pour la version "locale" sur le jour "facile"; mais cette
 bonne proprieÌteÌ n'est pas suffisante si l'on ne trouve pas les bons poids aÌ appliquer.
@@ -329,11 +330,11 @@ plotSimils(p1, i_p); title(paste("Weights p1 day",i_p))
 plotSimils(p2, i_np); title(paste("Weights p2 day",i_np))
 plotSimils(p2, i_p); title(paste("Weights p2 day",i_p))
 -----
-% if i == 1:
+% if i == 0:
 Les poids se concentrent preÌs de 0 dans le cas "non local" (p1), et se reÌpartissent assez
 uniformeÌment dans [ 0, 0.2 ] dans le cas "local" (p2). C'est ce que l'on souhaite
 observer pour eÌviter d'effectuer une simple moyenne.
-% elif i == 2:
+% elif i == 1:
 En comparaison avec le pragraphe preÌceÌdent on retrouve le meÌme (bon) comportement des
 poids pour la version "non locale". En revanche la feneÌtre optimiseÌe est trop grande sur
 le jour "facile" pour la meÌthode "locale" (voir affichage ci-dessous) : il en reÌsulte des
diff --git a/reports/report_P7_H17.zip b/reports/report_P7_H17.zip
new file mode 100644
index 0000000..65253b5
--- /dev/null
+++ b/reports/report_P7_H17.zip
@@ -0,0 +1 @@
+#$# git-fat 4a0e88af47c14a7cdb4d00b268517eefec453d90              2747183