
Les compétences qui relient le travail technique et l’impact commercial
Dans la série Author Spotlight, les rédacteurs de TDS discutent avec les membres de notre communauté de leur parcours professionnel en science des données et en IA, de leurs écrits et de leurs sources d’inspiration. Aujourd’hui, nous sommes ravis de partager notre conversation avec Maria Mouschoutzi.
Maria est analyste de données et chef de projet avec une solide expérience en recherche opérationnelle, en génie mécanique et en optimisation de la chaîne d’approvisionnement maritime. Elle allie une expérience pratique de l’industrie à des analyses basées sur la recherche pour développer des outils d’aide à la décision, rationaliser les processus et communiquer des informations entre les équipes techniques et non techniques.
Dans « Que signifient réellement « penser » et « raisonner » dans l’IA et les LLM », vous abordez le fossé sémantique entre le raisonnement humain et celui de la machine. Quel est l’impact de la compréhension de cette distinction sur la façon dont vous abordez le développement et l’interprétation de modèles dans votre travail professionnel ?
L’IA a récemment généré un énorme battage médiatique. Tout d’un coup, de nombreux produits basés sur le ML à l’ancienne sont instantanément rebaptisés IA, et il semble y avoir une demande renouvelée pour tout ce qui est doté de l’IA. Pour cette raison, je pense qu’il est désormais essentiel que chacun ait une compréhension technique de base de ce qu’est l’IA et de son fonctionnement, afin d’être en mesure d’évaluer ce qu’elle peut et ne peut pas faire pour lui.
La vérité est que nous portons beaucoup de bagages sur la nature même de l’IA, provenant de récits issus de notre héritage de science-fiction. Ce bagage nous permet facilement de nous laisser emporter par tout le potentiel passionnant et prometteur de l’IA et d’oublier ses capacités actuelles réelles, en fin de compte en la considérant à tort comme une sorte de solution magique qui va atténuer tous nos problèmes. Les utilisateurs professionnels non techniques sont les plus enclins à cette surexcitation à l’égard de l’IA, l’imaginant parfois comme une superintelligence de type boîte noire, capable de fournir des réponses et des solutions correctes à tout.
Pour le meilleur ou pour le pire, cela ne pourrait être plus éloigné de la vérité. Les LLM – la principale avancée scientifique sur laquelle tourne tout le bruit de l’IA – sont incroyablement bons dans certaines choses (par exemple, générer des e-mails ou des résumés), mais pas aussi bons dans d’autres (par exemple, effectuer des calculs complexes ou analyser des relations de cause à effet à plusieurs niveaux).
Avoir une compréhension technique de ce qu’est l’IA et de son fonctionnement fondamental m’a énormément aidé dans mon travail professionnel. Cela me permet principalement de découvrir des cas d’utilisation valides de l’IA et de gérer les attentes des utilisateurs professionnels quant à ce qui peut et ne peut pas être fait. Sur un plan plus technique, cela me permet de distinguer les composants spécifiques qui doivent être utilisés dans des contextes spécifiques, afin que la solution livrée ait une réelle valeur pour l’entreprise.
Par exemple, si une application RAG est nécessaire pour rechercher une documentation technique spécifique et effectuer des calculs basés sur les informations trouvées dans cette documentation, cela signifie qu’un composant de terminal de code doit être inclus dans l’application pour effectuer les calculs (au lieu de laisser le modèle répondre directement).
Où puisez-vous l’inspiration initiale de vos articles, en particulier les plus philosophiques comme la série « Water Cooler Small Talk » ?
L’inspiration initiale pour ma série « Water Cooler Small Talk » est venue de discussions réelles que j’ai vécues dans un bureau, ainsi que d’histoires d’amis. Je pense qu’en raison de la tendance des gens à éviter les conflits inutiles dans les entreprises, des opinions vraiment scandaleuses peuvent parfois être exprimées lors de discussions informelles autour d’une fontaine à eau. Et généralement, personne ne dénonce des faits incorrects simplement pour éviter un conflit ou défier ses collègues.
Même si de telles conversations sont bienveillantes et bien intentionnées – en réalité une simple pause du travail – elles conduisent parfois à la perpétuation de faits scientifiques incorrects. Surtout pour des sujets complexes et pas si faciles à comprendre intuitivement comme les statistiques et l’IA, nous pouvons facilement simplifier les choses à l’extrême et perpétuer des opinions invalides.
La toute première opinion qui m’a poussé à écrire un article entier sur le sujet était que « Si vous jouez suffisamment de tours de roulette, vous finirez par gagner, car les probabilités sont d’environ 50/50, et les résultats finiront par s’équilibrer. » Maintenant, si vous avez déjà suivi un cours de statistiques, vous savez que ce n’est pas ainsi que cela fonctionne ; mais si vous n’avez pas suivi ce cours de statistiques et que personne ne le signale, vous risquez de quitter cette discussion avec des idées étranges sur le fonctionnement du jeu. Ainsi, mon inspiration initiale pour cette série était principalement des sujets statistiques mal compris.
Néanmoins, les mêmes malentendus, sinon davantage, s’appliquent aujourd’hui aux sujets liés à l’IA. L’énorme battage médiatique généré par l’IA a amené les gens à imaginer et à diffuser toutes sortes de fausses informations sur le fonctionnement de l’IA et ce qu’elle peut faire, et ils le font parfois avec une confiance incroyable. C’est pourquoi il est si important de se renseigner sur les fondamentaux, qu’il s’agisse de statistiques, d’IA ou de tout autre sujet.
Pouvez-vous nous expliquer votre processus de rédaction typique pour un article technique détaillé, de la recherche initiale à la version finale ? Comment concilier précision technique approfondie et accessibilité pour le grand public ?
Chaque article technique commence par un concept technique sur lequel je souhaite écrire – par exemple, démontrer comment utiliser une bibliothèque spécifique ou comment structurer un certain problème en Python. Par exemple, dans mon article Pokémon, le but était d’expliquer comment structurer un problème de recherche opérationnelle en Python. Après avoir identifié ce concept technique de base sur lequel je souhaite me concentrer, mon étape suivante consiste généralement à rechercher un ensemble de données approprié pouvant être utilisé pour le démontrer.
Je pense que c’est la partie la plus difficile et la plus longue : trouver un bon ensemble de données open source qui peut être librement utilisé pour votre analyse. Bien qu’il existe de nombreux ensembles de données, il n’est pas si simple d’en trouver un qui soit disponible gratuitement, avec des données complètes et suffisamment intéressant pour raconter une bonne histoire.
À mon avis, la saveur de l’ensemble de données que vous allez utiliser peut avoir un impact important sur la popularité de votre publication. Structurer un problème de recherche opérationnelle à l’aide de Pokémon semble bien plus amusant que d’utiliser les équipes d’employés (eww !). Dans l’ensemble, l’ensemble de données doit correspondre thématiquement au sujet technique que j’ai choisi et constituer une histoire quelque peu cohérente.
Après avoir identifié le sujet technique de l’article et l’ensemble de données que je vais utiliser, j’écris ensuite le code lui-même. Il s’agit d’une étape assez simple : écrivez le code à l’aide de l’ensemble de données et faites-le s’exécuter et produire des résultats corrects.
Une fois que j’ai terminé le code et que je me suis assuré qu’il fonctionne correctement, je commence à rédiger le message proprement dit. Je commence généralement mes articles par une brève introduction sur ce qui a initialement suscité mon intérêt pour ce sujet spécifique (par exemple, je voulais créer une visualisation complexe pour mon doctorat, et la bibliothèque Searoute Python m’a facilité la vie), et comment ce sujet peut être utile au lecteur (la lecture de mon tutoriel expliquant les appels d’API à l’API de données Pokémon peut vous aider à comprendre comment écrire des appels à n’importe quelle API).
J’ajoute également quelques brèves explications générales, le cas échéant, de la prémisse théorique sous-jacente au cas d’utilisation que je démontre, ainsi qu’une brève introduction aux bibliothèques de codes que j’utiliserai.
Dans la partie principale de l’article technique, je montre généralement comment structurer le code avec des extraits de code Python et je présente des explications étape par étape sur la façon dont tout se déroule et les résultats que vous êtes censé obtenir si tout fonctionne correctement.
J’aime également ajouter des captures d’écran GIF illustrant tous les diagrammes interactifs incorporés dans le code. Je pense qu’ils rendent les articles beaucoup plus intéressants, faciles à comprendre et visuellement attrayants pour le lecteur.
Et voilà ! Un tuto technique !
Qu’est-ce qui vous a initialement motivé à commencer à partager vos connaissances et vos idées avec la communauté plus large de la science des données, et qu’est-ce que le processus d’écriture apporte à votre pratique professionnelle ?
En 2017, alors que je rédigeais mon mémoire de diplôme, je suis tombé pour la toute première fois sur Medium et la publication Towards Data Science. Après avoir lu quelques articles, je me souviens avoir été complètement fasciné par l’abondance du matériel technique, la variété des sujets et la créativité des articles. Cela ressemblait à une communauté de science des données, avec des écrivains d’horizons divers et de différents niveaux techniques : il y avait des articles pour tous les niveaux et pour différents domaines.
Mais en plus d’apprécier la technicité des tutoriels qui m’ont permis d’apprendre et de mieux comprendre la science des données, j’ai aussi aimé la créativité et la narration des articles. Contrairement à une page GitHub ou à une réponse Stack Overflow, il y avait une certaine créativité et un certain talent artistique dans la plupart des messages. J’ai vraiment aimé lire de tels articles – ils m’ont aidé à apprendre beaucoup de choses sur la science des données et l’apprentissage automatique, et au fil du temps, j’ai silencieusement développé le désir d’écrire également de tels articles moi-même.
Après y avoir réfléchi un moment, j’ai rédigé et soumis à contrecœur mon tout premier article, et c’est ainsi que j’ai publié avec TDS pour la première fois début 2023. Depuis lors, j’ai écrit plusieurs autres articles pour TDS, appréciant chacun autant que ce premier article.
Une chose que j’apprécie vraiment dans l’écriture d’articles techniques pour TDS, c’est de partager des choses que j’ai moi-même trouvées difficiles à comprendre ou particulièrement intéressantes. Parfois, des sujets complexes comme la recherche opérationnelle, les probabilités ou l’IA peuvent sembler effrayants et intimidants, décourageant même les gens de commencer à lire et à en apprendre davantage sur eux – j’en suis moi-même coupable.
En créant une version simplifiée, directe, voire apparemment amusante, d’un sujet complexe, j’ai l’impression de permettre aux gens de commencer à lire et à en apprendre davantage sur le sujet avec un début doux et pas si formel et de constater par eux-mêmes que ce n’est pas si effrayant après tout.
D’un autre côté, l’écriture m’a grandement aidé sur le plan personnel et professionnel. Ma communication écrite s’est grandement améliorée. Au fil du temps, il est devenu plus facile pour moi de présenter des sujets techniques complexes d’une manière que peuvent comprendre un public professionnel non spécialisé. En fin de compte, se mettre en mesure d’expliquer un sujet à quelqu’un d’autre en termes simples vous oblige à le comprendre complètement et à éviter de laisser des points ambigus.
En repensant à votre progression de carrière, quelle est une compétence non technique sur laquelle vous auriez aimé vous concentrer plus tôt ?
Dans une carrière liée aux données, la compétence non technique la plus importante est la communication.
Si la communication est précieuse dans tous les domaines, elle est particulièrement essentielle dans les rôles liés aux données. C’est essentiellement ce qui comble le fossé entre le travail technique complexe et la compréhension pratique des affaires, et contribue à faire de vous un professionnel des données complet.
En effet, quelle que soit la qualité de vos compétences techniques, si vous ne parvenez pas à communiquer la valeur de vos livrables aux utilisateurs professionnels et à la direction, ils ne vous mèneront pas très loin.
Il est important d’être capable d’expliquer la valeur de votre travail à un public non spécialisé, de parler leur langage, de comprendre ce qui compte pour eux et de communiquer vos conclusions de manière à montrer comment votre travail leur profite.
Les données et les mathématiques, aussi précieux soient-ils, peuvent souvent sembler intimidants ou incompréhensibles pour les utilisateurs professionnels. Être capable de traduire les données en informations commerciales significatives, puis de communiquer ces informations efficacement, est en fin de compte ce qui permet à vos projets d’analyse de données d’avoir un réel impact sur une entreprise.
Pour en savoir plus sur le travail de Maria et rester au courant de ses derniers articles, vous pouvez la suivre sur TDS ou LinkedIn.



