Qu’est-ce qu’une série temporelle ?
Une série temporelle est tout simplement une suite d’observations numériques représentant l’évolution d’une grandeur au cours du temps. Dans la figure ci-dessous, on peut voir une série temporelle représentant les données de ventes du magasin en question sur plus de 700 jours. Les pics et les creux correspondent à une saisonnalité hebdomadaire (le jeudi pour les pics et le dimanche pour les creux, qui sont encore plus prononcés pendant les périodes de Noël et Pâques). On peut y voir également de longues périodes creuses, correspondant à une saisonnalité annuelle : les vacances d’été. La droite bleue tracée sur le graphique donne une tendance linéaire de l’évolution du chiffre d’affaires e-commerce sur la période considérée : celui-ci a connu globalement une légère progression entre mars 2017 et mars 2019. Ainsi, en visualisant les données à travers le temps, et à l’aide d’une simple régression linéaire, on peut avoir une intuition du profil temporel des ventes.

La prédiction avec des séries temporelles
Nous allons maintenant explorer deux techniques de prédiction avec des séries temporelles.
La première est basé sur le lissage exponentiel de Holt-Winters. C’est une méthode de prévision à court terme qui utilise une moyenne pondérée des valeurs passées pour prédire les valeurs futures.
La deuxième méthode est basée sur l’identification des fluctuations quotidiennes, de la tendance ainsi que des saisonnalités. Autrement dit, un modèle SARIMA.
Résultats des prédictions à moyen terme
Ici, les deux modèles sont entraînés ici sur un historique de données allant du 1er mars 2017 jusqu’au 28 février 2019. Les prédictions, quant à elles, sont réalisées sur les quatre premières semaines de mars 2019. L’erreur de prédiction est mesurée en considérant l’erreur relative moyenne (MAPE).
Les résultats obtenus sont illustrés dans le graphique suivant, où les prédictions obtenues à l’aide des deux méthodes (Holt-Winters en vert et SARIMA en bleu) sont comparées aux données réelles (en rouge). Comme on peut l’observer, les deux approches parviennent à capturer le profil de l’évolution des ventes. Plus quantitativement, le modèle SARIMA se révèle meilleur : celui-ci affiche en effet une erreur relative moyenne de 8% alors qu’elle est de 10% pour le Holt-Winters. Les deux approches sont cependant très largement satisfaisantes d’un point de vue métier.

En conclusion, à l’aide de techniques assez simples, il est possible de disposer d’un outil prédictif assez puissant, qui apporte une réelle valeur ajoutée à l’organisation. Il s’agissait, dans l’exemple que nous avons considéré, de prédire le chiffre d’affaires sur une base journalière pour atteindre une gestion optimale des ressources. Quant aux autres cas d’usages qui exigent une meilleure précision dans les prédictions ou encore de tenir en compte de paramètres exogènes, il existe d’autres techniques de prédiction, notamment basées sur le deep learning, qui prennent en charge de tels besoins.
Bibliographie

