Les mutations profondes que connaît le secteur du commerce aujourd’hui appellent les différents acteurs de la chaîne de valeur à devenir de plus en plus orientés données (data driven), afin de rationaliser les processus (gestion des stocks, des commandes, etc.) et prendre des décisions éclairées, dans un contexte où l’environnement est de plus en plus complexe.
Les techniques de prédiction exploitant les séries temporelles constituent alors un outil incontournable à double titre. D’une part, l’analyse des séries temporelles est une technologie assez mature, qui a déjà fait ses preuves puisqu’elle remonte aux années 80 (même s’il existe des techniques plus récentes, basées sur le deep learning). D’autre part, les données temporelles sont omniprésentes dans la mesure où celles-ci sont souvent collectées à travers le temps.
D’un point de vue métier, le prédictif sur des séries temporelles peut être utilisé de deux manières :
• Le prédictif permet d’aligner, en temps réel, l’offre et la demande à travers la gestion des stocks et des commandes. Cela est encore plus vrai dans le secteur alimentaire, où les éléments destinés à la vente sont périssables. La prédiction des ventes permet également à l’entreprise d’adapter sa politique commerciale et sa stratégie marketing : si les ventes sont amenées à baisser, par exemple, une offre promotionnelle peut alors être mise en place afin d’enrayer cette spirale négative.
• Le prédictif est également utile a posteriori comme outil de pilotage : la différence entre le chiffre d’affaires effectivement réalisé et le chiffre d’affaires prédit est un indicateur de la pertinence de la stratégie adoptée. Un chiffre d’affaires effectif inférieur à celui prédit, par exemple, peut constituer une alerte permettant aux responsables management de chercher les causes de la mauvaise performance et rectifier éventuellement la stratégie adoptée.
Dans la suite, nous allons considérer un cas d’usage en e-commerce : il s’agit des commandes en ligne d’un magasin appartenant à une chaîne de grande distribution.
Qu’est-ce qu’une série temporelle ?
Une série temporelle est tout simplement une suite d’observations numériques représentant l’évolution d’une grandeur au cours du temps. Dans la figure ci-dessous, on peut voir une série temporelle représentant les données de ventes du magasin en question sur plus de 700 jours. Les pics et les creux correspondent à une saisonnalité hebdomadaire (le jeudi pour les pics et le dimanche pour les creux, qui sont encore plus prononcés pendant les périodes de Noël et Pâques). On peut y voir également de longues périodes creuses, correspondant à une saisonnalité annuelle : les vacances d’été. La droite bleue tracée sur le graphique donne une tendance linéaire de l’évolution du chiffre d’affaires e-commerce sur la période considérée : celui-ci a connu globalement une légère progression entre mars 2017 et mars 2019. Ainsi, en visualisant les données à travers le temps, et à l’aide d’une simple régression linéaire, on peut avoir une intuition du profil temporel des ventes.
La prédiction avec des séries temporelles
Nous allons maintenant explorer deux techniques de prédiction avec des séries temporelles.
La première est basé sur le lissage exponentiel de Holt-Winters. C’est une méthode de prévision à court terme qui utilise une moyenne pondérée des valeurs passées pour prédire les valeurs futures.
La deuxième méthode est basée sur l’identification des fluctuations quotidiennes, de la tendance ainsi que des saisonnalités. Autrement dit, un modèle SARIMA.
Résultats des prédictions à moyen terme
Ici, les deux modèles sont entraînés ici sur un historique de données allant du 1er mars 2017 jusqu’au 28 février 2019. Les prédictions, quant à elles, sont réalisées sur les quatre premières semaines de mars 2019. L’erreur de prédiction est mesurée en considérant l’erreur relative moyenne (MAPE).
Les résultats obtenus sont illustrés dans le graphique suivant, où les prédictions obtenues à l’aide des deux méthodes (Holt-Winters en vert et SARIMA en bleu) sont comparées aux données réelles (en rouge). Comme on peut l’observer, les deux approches parviennent à capturer le profil de l’évolution des ventes. Plus quantitativement, le modèle SARIMA se révèle meilleur : celui-ci affiche en effet une erreur relative moyenne de 8% alors qu’elle est de 10% pour le Holt-Winters. Les deux approches sont cependant très largement satisfaisantes d’un point de vue métier.
En conclusion, à l’aide de techniques assez simples, il est possible de disposer d’un outil prédictif assez puissant, qui apporte une réelle valeur ajoutée à l’organisation. Il s’agissait, dans l’exemple que nous avons considéré, de prédire le chiffre d’affaires sur une base journalière pour atteindre une gestion optimale des ressources. Quant aux autres cas d’usages qui exigent une meilleure précision dans les prédictions ou encore de tenir en compte de paramètres exogènes, il existe d’autres techniques de prédiction, notamment basées sur le deep learning, qui prennent en charge de tels besoins.
Bibliographie
https://www.rocq.inria.fr/axis/modulad/numero-35/Tutoriel-melard-35/Melard-35.pdf
https://journals.sagepub.com/doi/full/10.1177/1847979018808673
https://a-little-book-of-r-for-time-series.readthedocs.io/en/latest/src/timeseries.html
https://www.fevad.com/bilan-e-commerce-ventes-internet/