X-Git-Url: https://git.auder.net/?p=talweg.git;a=blobdiff_plain;f=reports%2FOLD%2Freport_2017-01-13.rnw;fp=reports%2FOLD%2Freport_2017-01-13.rnw;h=0000000000000000000000000000000000000000;hp=c2425afe657a7693d30d9a7ed8d0c6c4b564a88a;hb=096e9798a4241f14d12c3663f8035d8def43d7e3;hpb=f71b975b140342f7ea80275359b7f4f9aa75153a

diff --git a/reports/OLD/report_2017-01-13.rnw b/reports/OLD/report_2017-01-13.rnw
deleted file mode 100644
index c2425af..0000000
--- a/reports/OLD/report_2017-01-13.rnw
+++ /dev/null
@@ -1,186 +0,0 @@
-\documentclass[a4paper,12pt]{article}
-\usepackage[utf8]{inputenc}
-\usepackage[T1]{fontenc}
-
-\renewcommand*\familydefault{\sfdefault}
-
-\marginparwidth 0pt
-\oddsidemargin 0pt
-\evensidemargin 0pt
-\marginparsep 0pt
-\topmargin 0pt
-\textwidth 16cm
-\textheight 23cm
-\parindent 5mm
-
-\begin{document}
-
-\section{Package R "ppmfun"}
-
-Le package $-$ Predict PM10 with FUNctional methods $-$ contient le code permettant de (re)lancer
-les expÃ©riences numÃ©riques dÃ©crites dans ce document. La fonction principale \emph{predictPM10}
-se divise en trois parties, dÃ©crites successivement au cours des trois paragraphes suivants.\\
-
-<<setup, out.width='7cm', out.height='7cm'>>=
-#Chargement de la librairie (aprÃ¨s compilation, "R CMD INSTALL ppmfun/")
-library(ppmfun)
-
-#Exemple d'appel principal (dÃ©taillÃ© ci-aprÃ¨s)
-p_mix = predictPM10("GMT", "7h", 400, 30, "Neighbors", NULL, 0, "direct",
-  simtype="mix")
-
-#Allure des courbes prÃ©dites
-yrange = range(p_mix$forecasts[401:430], na.rm=TRUE)
-plot(0,xaxt='n',yaxt='n',bty='n',pch='',ylab='PrÃ©dictions PM10',
-  xlab='Temps',ylim=yrange,main="Courbes PM10 prÃ©dites")
-for (i in 401:430)
-{
-  if (!any(is.na(p_mix$forecasts[[i]])))
-  {
-    par(new=TRUE)
-    plot(p_mix$forecasts[[i]], type="l", ylim=yrange, xlab="", ylab="")
-  }
-}
-@
-
-L'appel Ã  \emph{predictPM10()} ci-dessus se traduit par :
-\begin{enumerate}
-  \item charger les donnÃ©es dÃ©coupÃ©es selon le temps universel, en segments de $24h$ de $7h15$ Ã 
-    $7h$ le lendemain ;
-  \item commencer la prÃ©diction au jour $400$, terminer au jour $400+30-1 = 429$ ;
-  \item utiliser la mÃ©thode "Neighbors" qui place plus de poids sur les voisins de la courbe de
-    PM10 du jour courant, en tenant compte de tout l'historique ;
-  \item raccorder continÃ»ment la prÃ©vision centrÃ©e aux mesures sur le dernier bloc de $24h$.
-\end{enumerate}
-
-\subsection{Acquisition des donnÃ©es}
-
-Compte-tenu de la nature hÃ©tÃ©rogÃ¨ne des donnÃ©es utilisÃ©es $-$ fonctionnelles pour les PM10,
-vectorielles pour les variables exogÃ¨nes $-$, celles-ci sont organisÃ©es sous forme d'une liste
-\emph{data}, la $i^{eme}$ cellule correspondant aux donnÃ©es disponibles au $i^{eme}$ jour Ã 
-l'heure $H$ de prÃ©diction choisie (0h15, 7h15 ou 13h15) : c'est-Ã -dire les valeurs des PM10 de
-$H-24h$ Ã  $H-15m$, ainsi que les variables mÃ©tÃ©o mesurÃ©es du dernier jour complet avant l'heure
-$H$, et les variables mÃ©tÃ©o prÃ©dites pour la pÃ©riode de $0h15$ Ã  $0h$ du jour courant.\\
-
-Exemple :\\
-<<data>>=
-#Le premier argument indique la zone horaire souhaitÃ©e ; "GMT" ou "local"
-#pour l'heure franÃ§aise, ou tout autre fuseau horaire.
-data = getData("GMT", "7h")
-@
-
-\subsection{PrÃ©diction}
-
-Deux types de prÃ©visions du prochain bloc de $24h$ sont Ã  distinguer :
-\begin{itemize}
-  \item prÃ©vision de la forme (centrÃ©e) ;
-  \item prÃ©vision du niveau.
-\end{itemize}
-
-\noindent Si l'on choisit de raccorder la prÃ©vision de la forme au dernier PM10 mesurÃ©, alors le niveau n'a
-pas Ã  Ãªtre prÃ©dit (d'oÃ¹ l'argument \texttt{NULL} dans l'appel principal). Dans le cas contraire il faut
-prÃ©ciser une mÃ©thode ; seule la persistance est actuellement implÃ©mentÃ©e. la mÃ©thode de prÃ©vision
-de forme "Neighbors" est dÃ©taillÃ©e ci-aprÃ¨s (voir aussi le fichier S\_Neighbors.R).\\
-
-\begin{enumerate}
-  \item \textbf{PrÃ©paration des donnÃ©es} : calcul des niveaux sur 24h, fenÃªtrage si demandÃ©
-    (paramÃ¨tre "memory").
-  \item \textbf{Optimisation des paramÃ¨tres d'Ã©chelle} : via la fonction \emph{optim()}
-    minimisant la somme des 45 derniÃ¨res erreurs jounaliÃ¨res L2.
-  \item \textbf{PrÃ©diction finale} : une fois le (ou les, si "simtype" vaut "mix") paramÃ¨tre
-    d'Ã©chelle $h$ dÃ©terminÃ©, les similaritÃ©s sont Ã©valuÃ©es sur les variables exogÃ¨nes et/ou
-    endogÃ¨nes, sous la forme $s(i,j) = \mbox{exp}\left(-\frac{\mbox{dist}^2(i,j)}{h^2}\right)$.
-    La formule indiquÃ©e plus haut dans le rapport est alors appliquÃ©e.
-\end{enumerate}
-
-Exemple :\\
-<<forecasts>>=
-forecasts = as.list(rep(NA, length(data)))
-for (i in 400:429)
-{
-  #forecast with data up to index i
-  forecasts[[i+1]] = getForecasts(data[1:i], "Neighbors", NULL, 0,
-    "direct", simtype="mix")
-}
-@
-
-\subsection{Calcul des erreurs}
-
-Pour chacun des instants Ã  prÃ©voir jusqu'Ã  minuit du jour courant, on calcule l'erreur moyenne
-sur tous les instants similaires du passÃ© (sur la plage prÃ©dite, dans l'exemple 401 Ã  430). Deux
-types d'erreurs sont considÃ©rÃ©es :
-\begin{itemize}
-  \item l'erreur "L1" Ã©gale Ã  la valeur absolue entre la mesure et la prÃ©diction ;
-  \item l'erreur "MAPE" Ã©gale Ã  l'erreur L1 normalisÃ©e par la mesure.
-\end{itemize}
-
-Code :\\
-<<errors, out.width='7cm', out.height='7cm', fig.show='hold'>>=
-e = getErrors(data, forecasts)
-#Erreurs absolues, point par point, moyennÃ©es sur les 30 jours
-plot(e$L1, type="l", xlab="Temps", ylab="Erreur absolue")
-#Erreurs relatives, point par point, moyennÃ©es sur les 30 jours
-plot(e$MAPE, type="l", xlab="Temps", ylab="Erreur relative")
-@
-
-\subsection{Autres expÃ©riences numÃ©riques}
-
-<<others1, out.width='7cm', out.height='7cm', fig.show='hold'>>=
-p_endo = predictPM10("GMT", "7h", 400, 30, "Neighbors", NULL, 0,
-  "direct", simtype="endo")
-p_exo = predictPM10("GMT", "7h", 400, 30, "Neighbors", NULL, 0,
-  "direct", simtype="exo")
-yrange_L1 = range(p_mix$errors$L1, p_endo$errors$L1, p_exo$errors$L1)
-plot(p_mix$errors$L1, type="l", main="Erreur L1", xlab="Temps",
-  ylab="Erreur absolue", ylim=yrange_L1) ; par(new=TRUE)
-plot(p_endo$errors$L1, type="l", col=2, xlab="", ylab="",
-  ylim=yrange_L1) ; par(new=TRUE)
-plot(p_exo$errors$L1, type="l", col=3, xlab="", ylab="",
-  ylim=yrange_L1)
-yrange_MAPE =
-  range(p_mix$errors$MAPE, p_endo$errors$MAPE, p_exo$errors$MAPE)
-plot(p_mix$errors$MAPE, type="l", main="Erreur MAPE", xlab="Temps",
-  ylab="Erreur relative", ylim=yrange_MAPE) ; par(new=TRUE)
-plot(p_endo$errors$MAPE, type="l", col=2, xlab="", ylab="",
-  ylim=yrange_MAPE) ; par(new=TRUE)
-plot(p_exo$errors$MAPE, type="l", col=3, xlab="", ylab="",
-  ylim=yrange_MAPE)
-
-#Ne tenir compte que des similaritÃ©s sur les variables exogÃ¨nes semble
-#conduire Ã  l'erreur la plus faible.
-@
-
-<<others2, out.width='7cm', out.height='7cm', fig.show='hold'>>=
-p_exo_h = predictPM10("GMT", "7h", 400, 30, "Neighbors", NULL, 0,
-  "direct", simtype="exo", h_window=0.25)
-plot(p_exo_h$errors$L1, type="l", main="Erreur L1", xlab="Temps",
-  ylab="Erreur absolue")
-plot(p_exo_h$errors$MAPE, type="l", main="Erreur MAPE", xlab="Temps",
-  ylab="Erreur relative")
-
-#Diminuer la fenÃªtre n'amÃ©liore pas les performances moyennes
-#(car les donnÃ©es individuelles sont trÃ¨s variables).
-@
-
-<<others3, out.width='7cm', out.height='7cm', fig.show='hold'>>=
-p_exo_s = predictPM10("GMT", "7h", 400, 30, "Neighbors", "Persistence",
-  0, "separate", simtype="exo")
-plot(p_exo_s$errors$L1, type="l", main="Erreur L1", xlab="Temps",
-  ylab="Erreur absolue")
-plot(p_exo_s$errors$MAPE, type="l", main="Erreur MAPE", xlab="Temps",
-  ylab="Erreur relative")
-
-#PrÃ©dire sÃ©parÃ©ment forme et niveau mÃ¨ne Ã  une erreur plus grande ;
-#d'autres mÃ©thodes de prÃ©vision du niveau doivent tout de mÃªme Ãªtre testÃ©es.
-@
-
-\subsection{Suite du travail}
-
-Le type de jour n'est pas pris en compte dans la recherche de voisins ; cela diminuerait
-nettement le nombre de similaritÃ©s retenues, mais pourrait significativement amÃ©liorer les
-prÃ©visions.\\
-
-\noindent Il serait intÃ©ressant Ã©galement de disposer de plusieurs mÃ©thodes de prÃ©diction, pour
-par exemple les agrÃ©ger Ã  l'aide de mÃ©thodes similaires Ã  celles du prÃ©cÃ©dent contrat.
-
-\end{document}