Pour lire la version intégrale, cliquer ici
Pourquoi travailler sur l’emailing ?
Quand on observe un peu son entourage, il convient de penser que l’internaute moyen privilégie les réseaux sociaux et autres messageries en ligne à sa boite mail. Bien que le marketing s’adapte en conséquence, l’email n’en est pas pour autant délaissé, bien au contraire : l’internaute moyen possède plus de 2 boîtes mail, est abonné à plus de 6 newsletters et reçoit en conséquent de nombreux emails tous les jours. Des marketeurs nostalgiques qui s’accrochent à ce canal ancestral ? Pas vraiment : 76 % des abonnés à une newsletter affirment avoir déjà acheté un produit ou un service en ligne en cliquant sur le lien présent dans un mail, et 75 % se rendent en boutique pour acheter des produits ou services promus dans une newsletter. Il s’agit donc bien d’une réelle force de vente qui n’est pas amenée à mourir, car elle convient à tous : c’est même le canal préféré des utilisateurs pour communiquer avec les marques.
Pour en savoir plus sur le marché de l’emailing, voir l’étude EMA – Email Marketing Attitude, menée pour la onzième année en France :
https://comarketing-news.fr/lemail-en-2017-les-chiffres-cles-a-connaitre/
Classifier les emails promotionnels plus finement que Gmail
Ceci étant dit, améliorer l’expérience emailing est une problématique très actuelle.
Une boite mail a très vite tendance à devenir illisible, fouillie, car submergée par une quantité astronomique d’emails divers et variés. Les clients actuels (Gmail, Outlook, Yahoo, …) restent des interfaces relativement simples qui n’offrent rarement plus qu’un outil de recherche pour s’y retrouver dans cet océan de newsletter.
A la manière dont Gmail classifie les emails en grandes catégories (Principale, Réseaux sociaux, Promotions, Notifications), on se propose au sein de cet article d’aller encore plus loin et de catégoriser les emails promotionnels en fonction de leur catégorie de produit ou de service.
Par exemple, un email promotionnel de Samsung présentant son dernier smartphone serait classifié en « Phones », et un email d’Audi en « Vehicles ». Ainsi, l’utilisateur pourrait rechercher les promotions qui l’intéressent directement par secteur d’activité.
Si le problème semble simple lorsque l’on connaît le domaine d’activité d’une marque donnée, il l’est beaucoup moins si la marque n’est pas connue ou si elle propose des produits de différentes catégories, comme le fait la grande distribution de type Amazon ou Cdiscount.
Alors comment faire pour que l’email soit classé automatiquement dans la bonne catégorie ? Je me suis penché sur la question dans le cadre de mon stage chez Keley Data.
Vous avez dit machine learning ?
La classification est un problème classique que nous résolvons tous les jours. Imaginons que nous voulions classifier les jours du calendrier sur une année donnée en deux catégories : « week-end » et « semaine ». Il suffirait d’une condition simple, vérifiant que le jour est un samedi, un dimanche, ou un autre jour de la semaine. Il existe dans ce cas une loi connue permettant de classifier aisément ces jours.
Pour les emails promotionnels, il n’existe malheureusement pas de règle fondamentale connue permettant de classifier un email dans la catégorie « Phones ». Intuitivement, on pourrait penser que l’utilisation du mot « Téléphone » conduit à la catégorie « Phones », mais la réalité est plus complexe : le mot téléphone peut être utilisé dans n’importe quel email pour donner un contact téléphonique par exemple. Un programme simple ne permet donc pas de déterminer le secteur de l’email. Un humain en revanche, en lisant rapidement l’email, n’a aucun mal à le faire. Pourquoi ? Car il repère des schémas de mots, d’images, de style, … qui font appel à son expérience sensible et qui entraînent une conclusion : « ça parle de téléphones ».
En l’absence de règles formalisables, nous devons donc recourir au Machine Learning (apprentissage automatique en français). Cela consiste à créer une intelligence artificielle qui comme un enfant, apprend petit à petit à quoi ressemble un email qui « parle de téléphones » grâce à son « expérience sensible » qui est précisément choisie lors de la conception.
En termes de vocabulaire, on appelle cette IA un « classifieur » et son expérience sensible la « base d’apprentissage ». Il existe de nombreuses technologies permettant de concevoir des classifieurs, du plus complexe au plus simple : réseaux de neurones et deep learning, modèles à bases d’arbres (random forests et xgboost), régressions logistiques, Naive Bayes… Comment choisir parmi toutes ces technologies ? Quelles sont les questions-clés à se poser pour résoudre ce problème ?
Pour lire la version intégrale, cliquer ici