
Comment modéliser la valeur attendue des campagnes marketing
pour les campagnes marketing est extrêmement difficile. Cela se résume en grande partie à des essais et des erreurs, même si nous savons que des stratégies plus ciblées fonctionneraient mieux. Nous ne savons tout simplement pas comment y arriver. Le processus consiste souvent à lancer une campagne, à l’observer, à apprendre, à apporter des ajustements, puis à réessayer. Cette approche par essais et erreurs présente de réels atouts. Il encourage le mouvement plutôt que la paralysie. Cela permet aux équipes d’apprendre rapidement, en particulier sur des marchés en évolution rapide. Pour les premiers stades de croissance ou les environnements de données limités, c’est souvent la seule option pratique.
Je veux introduire une approche différente. Celui qui est sans aucun doute plus difficile, avancé et complexe, mais aussi révolutionnaire et remarquable. C’est l’approche qui amène les entreprises au niveau supérieur de maturité des données. Permettez-moi de vous présenter la modélisation de la valeur attendue.
Avant de commencer, je voudrais commencer en disant que cette approche occupe des chapitres entiers dans certains manuels de science des données. Cependant, j’ai l’intention d’être aussi non technique que possible. Je garderai les idées conceptuelles, tout en fournissant un cadre clair sur la manière d’y parvenir. Si vous souhaitez en savoir plus, je citerai des sources utiles à la fin.
Commençons.
Qu’est-ce que la modélisation de la valeur attendue ?
La valeur attendue est un cadre analytique clé qui permet aux décideurs d’envisager des compromis lorsque les coûts et les avantages sont inégaux. Pensez à un scénario dans lequel un modèle d’apprentissage automatique aide à diagnostiquer un patient atteint d’un cancer. Les cadres et les modèles qui incluent uniquement une précision simple (la prédiction était bonne ou fausse) ne tiennent pas compte des compromis dans les prédictions.
Dans ce cas, toutes les « fausses prédictions » ne sont pas identiques. Ne pas diagnostiquer un cancer chez un patient alors qu’il en est atteint est infiniment plus coûteux que de diagnostiquer un cancer chez quelqu’un alors qu’il en est réellement atteint. Les deux prédictions étaient techniquement fausses, mais l’une a coûté la vie, l’autre non.
Heureusement, nos stratégies marketing ne sont pas des situations de vie ou de mort. Mais ce principe s’applique de la même manière. La décision de savoir qui cibler ou non dans une campagne marketing peut entraîner des coûts très différents pour l’entreprise.
La modélisation de la valeur attendue élargit cet horizon pour tenir compte d’un plus grand nombre de résultats possibles et nous permet de mesurer le coût ou l’avantage de chacun. Ce cadre dépend profondément des connaissances métiers des experts en la matière pour déterminer les conséquences de chaque résultat. Notre objectif ici est de comprendre comment concevoir une stratégie qui optimise statistiquement notre objectif. Pour le reste de cet article, nous nous concentrerons sur l’apprentissage de qui cibler dans une stratégie marketing afin de maximiser les profits.
Commencez avec un modèle de probabilité d’achat
Un modèle de probabilité d’achat est un modèle d’apprentissage automatique qui prédit la probabilité qu’un client achète un produit. Imaginons que nous menons une campagne publicitaire pour une entreprise de commerce électronique. Chaque personne qui clique sur l’annonce crée une ligne de données. Ils voient la campagne, parcourent votre magasin et prennent finalement la décision d’acheter ou non un produit. Au cours de ce processus, une multitude de points de données doivent être collectés. Le modèle d’apprentissage automatique analyse toutes les données historiques pour reconnaître des modèles. Il apprend quels sont les facteurs qui influencent la probabilité d’achat d’un client. Ensuite, il applique ces modèles aux nouveaux clients pour prédire s’ils achèteront un produit.
Ce modèle en lui-même est d’une extrême valeur. Il indique à l’entreprise quels sont les clients les plus susceptibles d’acheter un produit et quels aspects de la campagne influencent la probabilité d’achat. Nous pouvons utiliser ces informations pour adapter notre prochaine campagne publicitaire. Voilà à quoi ressemble la prise de décision basée sur les données.
Mise en œuvre de la modélisation de la valeur attendue
Pour avancer, il est important de comprendre le concept de matrice de confusion. Une matrice de confusion est un n x n table où n représente tous les résultats possibles. Par souci de simplicité, je m’en tiendrai à une matrice de confusion 2 x 2.
Cette matrice contient les résultats prévus dans un axe et les résultats réels dans l’autre. Il nous fournit quatre cellules, une pour chaque résultat possible dans un problème de classification binaire, tout comme notre modèle de probabilité d’achat (soit un client achète un produit, soit il ne l’achète pas). Il en résulte les possibilités suivantes :
- Vrai positif : nous avions prédit que le client achèterait, et il l’a effectivement fait.
- Faux positif : nous avions prédit que le client achèterait, mais il ne l’a pas fait.
- Faux négatif : nous avions prédit que le client n’achèterait PAS, mais il l’a fait.
- Vrai négatif : nous avions prédit que le client n’achèterait PAS, et en fait il ne l’a pas fait.
Voici une illustration :

Pour mettre en œuvre les valeurs attendues pour chaque résultat, nous devons avoir une compréhension approfondie de l’entreprise. Nous avons besoin de connaître les informations suivantes :
- Bénéfice par produit vendu.
- Coût par clic.
- Probabilité d’achat par client.
Dans le même exemple pour notre boutique e-commerce, considérons les valeurs suivantes :
- Bénéfice par produit vendu = 50 $
- Coût par clic = 1 $
- Probabilité d’achat par client = à partir de notre modèle de probabilité d’achat
Connaissant ces informations, nous pouvons déterminer que l’avantage d’un client cliquant sur notre campagne publicitaire et achetant un produit (True Positive) serait le bénéfice par produit (50 $) moins le coût par clic (1 $), ce qui équivaut à 49 $. Le coût d’un client cliquant sur notre campagne mais n’achetant pas (Faux positif) est simplement le coût encouru pour le clic, donc -1 $. Le résultat de ne pas cibler un client qui n’achèterait pas est 0 $puisqu’aucun coût n’a été engagé et aucun revenu n’a été gagné. Le résultat de ne pas cibler quelqu’un qui serait prêt à acheter est également 0 $ pour les mêmes raisons.
Je tiens à reconnaître les coûts d’opportunité liés au fait de ne pas cibler quelqu’un qui achèterait ou la possibilité pour quelqu’un d’acheter sans être ciblé. Ceux-ci sont plus abstraits et subjectifs, bien qu’ils ne soient pas impossibles à mesurer. Par souci de simplicité, je ne les considérerai pas dans ce scénario.
Cela nous laisse avec la matrice de confusion suivante :

Cool, nous connaissons maintenant le coût ou le bénéfice concret de chaque résultat de notre campagne publicitaire. Cela nous permet de comprendre la valeur attendue du ciblage d’un client en utilisant l’équation suivante (désolé de vous lancer des calculs) :
Bénéfice attendu = P(acheter) × Profit si achat + (1 — P(acheter)) × Perte si pas d’achat
Où la valeur attendue est égale à probabilité de réponse (P(acheter)) fois le valeur d’une réponse (Profit si achat) plus le probabilité de non-réponse (1 — P(acheter)) fois le coût d’une non-réponse (Perte si non achat).
Si nous voulons que la valeur attendue du ciblage d’un client soit positive, ce qui signifie que nous réalisons un profit, alors nous pouvons réorganiser l’équation comme suit :
P(acheter) × 49 $ + (1 — P(acheter)) × (–1 $) > 0
P (acheter) > 0,02 (ou 2 %)
Cela signifie que, sur la base de notre modèle de probabilité d’achat, nous devons cibler chaque client ayant une probabilité d’achat supérieure à 2 %.
Il n’est pas nécessaire d’avoir un diplôme en mathématiques ou en statistiques pour mettre en œuvre cela, mais je voulais montrer comment nous y sommes arrivés.
Nous avons notre réponse : nous devons cibler tous les clients dont la probabilité d’achat est supérieure à 2 %. Nous pouvons maintenant revenir à notre modèle de probabilité d’achat et identifier les segments de clientèle qui correspondent aux critères.
Nous avons découvert exactement qui cibler, nous avons adapté notre campagne à leurs besoins et déployé une campagne marketing qui fonctionne. Nous avons conçu notre stratégie sur de bonnes bases en prenant de véritables décisions basées sur les données.
Aller encore plus loin avec les courbes de profit
Nous avons construit notre cadre et conçu notre campagne marketing de manière à optimiser notre retour sur investissement. Cependant, il existe souvent des contraintes supplémentaires qui limitent notre capacité à déployer une campagne, souvent liées au budget alloué et au nombre de personnes pouvant être ciblées. Dans ces scénarios, il est utile de connaître non seulement la décision optimale, mais également la valeur attendue parmi un large éventail de possibilités. Dans ces situations, nous pouvons intégrer le calcul de la valeur attendue dans notre processus de formation du modèle de probabilité d’achat.
Au lieu de choisir des modèles uniquement sur la base de leurs performances techniques, nous pouvons les évaluer en fonction du profit attendu. Ou utilisez une approche combinée qui équilibre la force prédictive et l’impact économique.
Pendant que nous construisons notre modèle, nous pouvons calculer le profit attendu pour l’ensemble des personnes que nous pouvons cibler, de personne à absolument tout le monde. En conséquence, nous obtenons un tracé de courbe de profit :

Sur l’axe des Y, nous avons le bénéfice attendu pour la campagne marketing en fonction du nombre de personnes que nous ciblons. Sur l’axe des X, nous avons le seuil de probabilité d’achat. Notre campagne devient de plus en plus étroite à mesure que nous augmentons le seuil. Si nous l’augmentons jusqu’à 100 %, nous ne ciblerons personne. Si nous descendons jusqu’à 0 %, nous pouvons cibler tout le monde.
Comme dans notre exemple précédent, nous voyons que le profit maximum attendu se situe lorsque nous ciblons chaque population ayant un score de probabilité d’achat supérieur à 2 %. Cependant, nous disposons peut-être d’un budget plus strict ou souhaitons-nous développer une campagne distincte uniquement pour les clients les plus susceptibles de le faire. Dans ce cas, nous pouvons comparer notre budget à la courbe et identifier que le ciblage des clients avec un score de probabilité supérieur à 12 % devrait toujours générer un bénéfice important pour une fraction du coût. Ensuite, nous pouvons suivre le même processus que nous avons suivi auparavant pour concevoir cette campagne. Nous identifions qui sont ces clients, ce qui a un impact sur leur probabilité d’achat, et adaptons notre campagne marketing à leurs besoins.
Cela commence et se termine par des connaissances commerciales
Nous avons vu les possibilités et la valeur que la modélisation de la valeur attendue peut apporter, mais je dois réitérer combien il est important d’avoir une connaissance de l’entreprise pour garantir que tout fonctionne correctement. Il est essentiel d’avoir une solide compréhension des coûts et des avantages associés à chaque résultat possible. Il est primordial d’interpréter correctement les résultats du modèle pour bien comprendre quels leviers peuvent être actionnés pour influencer la probabilité d’achat.
Bien qu’il s’agisse d’une approche complexe, mon intention n’est pas de décourager le lecteur qui découvre ces techniques pour la première fois. Bien au contraire. J’écris à ce sujet pour souligner que de telles méthodes ne sont plus réservées aux grandes entreprises. Les petites et moyennes entreprises ont accès aux mêmes outils de collecte de données et de modélisation, ouvrant ainsi la porte à tous ceux qui souhaitent faire passer leur entreprise au niveau supérieur.
Références
Provost, F., et Fawcett, T. Science des données pour les entreprises : ce que vous devez savoir sur l’exploration de données et la réflexion analytique sur les données. Médias O’Reilly.
Toutes les images, sauf indication contraire, sont de l’auteur.



