Une carrière dans les données n’est pas toujours une ligne droite, et ce n’est pas grave

Dans la série Author Spotlight, les rédacteurs de TDS discutent avec les membres de notre communauté de leur parcours professionnel en science des données et en IA, de leurs écrits et de leurs sources d’inspiration. Aujourd’hui, nous sommes ravis de partager notre conversation avec Sabrine Bendimerad.

Sabrine est une ingénieure en mathématiques appliquées qui a passé les 10 dernières années à travailler en tant qu’ingénieure senior en IA, gérant des projets depuis la toute première idée jusqu’à la production.

Son parcours l’a conduite à travers des univers très différents, de l’analyse d’images satellite pour de grandes sociétés européennes de services publics à son rôle actuel de chercheuse en imagerie médicale chez Neurospin. Aujourd’hui, elle travaille sur des images cérébrales pour aider les patients victimes d’un AVC à se rétablir.

Sabrine est également mentor et fondatrice de Dataiilearn. Elle aime écrire non seulement sur le code, mais aussi sur la manière de construire une véritable carrière et de s’assurer que les projets de science des données atteignent réellement l’étape finale où ils ont un réel impact.

Il y a quelques mois, vous abordiez une question urgente à laquelle sont aujourd’hui confrontés les professionnels de la data : « est-ce que ça vaut encore le coup ? Pourquoi avez-vous décidé de vous en occuper et votre position a-t-elle évolué entre-temps ?

En fait, mon article « La science des données en 2026 : est-ce que ça vaut toujours le coup ? a déclenché une avalanche de messages sur LinkedIn. Je m’attendais à ce que les juniors s’inquiètent de cette question, mais j’ai été surpris de voir que les personnes ayant des années d’expérience s’interrogeaient également sur l’avenir.

Je suis dans l’IA depuis 10 ans maintenant, et c’est vrai qu’au début, le simple fait de connaître Python et les statistiques/mathématiques faisait de vous une licorne. Aujourd’hui, le marché est saturé de nouveaux data scientists et de nouveaux outils basés sur des agents d’IA prennent le relais des tâches manuelles et simples que nous effectuions auparavant.

Ma position est donc toujours la même, voire plus forte aujourd’hui : l’IA et la science des données en valent toujours la peine, mais le « data scientist généraliste » est une espèce en voie de disparition. Pour survivre, vous devez évoluer au-delà des simples modèles dans un cahier. Vous devez maîtriser le déploiement, les LLM, le RAG et, surtout, les connaissances du domaine qui facilitent l’interprétabilité des données. Si nous construisons des modèles de base dans un cahier, nos tâches pourraient bien sûr être effectuées par des agents. Les emplois ne disparaissent pas ; ils sont juste différents. Vous devez développer des compétences qui s’adaptent à ce nouveau marché.

Vous avez beaucoup écrit sur les carrières en science des données et en IA. Comment votre propre parcours a-t-il façonné les idées que vous partagez avec vos lecteurs ?

Dès le début, mon parcours n’a jamais été uniquement une question de code. J’ai réalisé très tôt que résoudre des problèmes du monde réel est quelque chose qui ne s’apprend pas dans une université ou dans un bootcamp. Vous l’apprenez en étant sur le terrain avec de vraies équipes. Au cours de mes années de travail avec des images satellite pour des sociétés d’énergie et d’eau, j’ai appris que pour créer une véritable solution, il faut penser « de bout en bout ». Si un modèle reste dans un notebook, il n’a aucun impact. C’est pourquoi j’écris autant sur MLOps : comment gérer, déployer et surveiller des modèles en production.

Passer au domaine médical a ajouté une nouvelle couche à ma réflexion. Dans le secteur des services publics, si vous faites une erreur, vous subissez une perte financière. Mais en imagerie médicale, on gère des vies humaines. Ce changement m’a appris que l’IA peut générer du code, mais qu’elle ne peut pas comprendre le poids d’une décision humaine. C’est exactement pourquoi j’ai commencé à écrire sur des choses comme RAG, LLM et leur impact. Ce n’est pas seulement un sujet à la mode pour moi ; il s’agit de la difficulté de rendre ces outils suffisamment fiables pour qu’un humain puisse leur faire confiance à 100 %.

Mes idées viennent de ce pont : j’ai une formation industrielle dans la construction pour la production, mais j’ai aussi une formation en recherche où la méthodologie doit être parfaite. J’écris pour partager ces compétences techniques, mais aussi pour aider les gens à naviguer dans leur propre voyage. Je veux leur montrer les possibilités qu’ils ont dans ce domaine, comment gérer leur parcours. et comment gérer des projets complexes. Je veux que mes lecteurs voient qu’une carrière dans les données n’est pas toujours une ligne droite, et ce n’est pas grave.

Quelles sont les différences les plus notables que vous observez entre vos débuts actuels et vos premières années dans le domaine ? Dans quelle mesure le manuel de jeu pour les praticiens en début de carrière est-il différent de nos jours ?

Le jeu a été totalement réécrit. Quand j’ai commencé, nous étions des constructeurs et nous passions des semaines à nettoyer les données et à configurer les serveurs. Aujourd’hui, vous devez être un orchestrateur d’IA. Vous pouvez construire un système en quelques jours, ce qui prenait auparavant des mois. Je ne dirais pas que c’est plus difficile maintenant, mais c’est certainement difficile si vous essayez de démarrer une carrière en utilisant les compétences à la mode d’il y a 10 ans.

Les juniors d’aujourd’hui ont tellement d’options pour se préparer au marché. Nous avons une mine d’or d’informations sur YouTube et sur les blogs. Le véritable défi consiste désormais à filtrer les déchets. Ceux qui survivent sont ceux qui surveillent et comprennent le marché pour s’adapter rapidement. Bien sûr, il faut comprendre l’aspect théorique de l’IA, mais la véritable compétence aujourd’hui est la flexibilité.

Ce n’est pas une bonne idée de vouloir être expert dans un seul outil spécifique. Il y a 10 ans, on parlait de passer de R à Python ou de statistiques au deep learning. Aujourd’hui, nous parlons de passer à l’IA et aux agents génératifs. Les fondations restent les mêmes, mais vous avez besoin de flexibilité pour comprendre rapidement une nouvelle tendance, la mettre en œuvre et répondre aux besoins de vos parties prenantes. La flexibilité a toujours été la compétence « secrète » d’un data scientist, que ce soit il y a 10 ans ou aujourd’hui.

Vos articles équilibrent généralement des informations de haut niveau avec des informations pratiques. Qu’espérez-vous que votre public gagne en lisant votre travail ?

Lorsque j’écris, je garde toujours à l’esprit que je partage des expériences pour aider les gens à construire leur propre expertise. Par exemple, lorsque j’écris sur MLOps, j’essaie de combler le fossé entre la vue d’ensemble de la production et les étapes techniques pratiques nécessaires pour y parvenir. J’hésite encore à chaque fois que je commence un nouvel article ! Habituellement, je discute de sujets avec mes étudiants ou mes collègues pour voir ce qui les intéresse, puis je fais le lien avec ce que je me vois dans l’industrie. Mon objectif est que le lecteur reparte avec des lignes directrices pratiques, pas seulement un concept.

J’essaie de toucher des publics différents selon le sujet. Parfois, il s’agit d’un article très technique, comme comment déployer un modèle dans un cloud à l’aide de Docker et FastAPI, et d’autres fois, il s’agit d’un article « d’ensemble » expliquant ce que « production » signifie réellement pour une entreprise. Il m’est plus difficile aujourd’hui d’écrire uniquement sur des outils spécifiques, car ils évoluent très rapidement. Au lieu de cela, j’essaie de partager des commentaires sur les choses qui m’ont ralenti ou sur les véritables défis auxquels je suis confronté dans la mise en œuvre d’un projet spécifique (comme mon article sur les systèmes RAG). Je veux que mon public apprenne de mes erreurs pour pouvoir aller plus vite.

Dans votre propre vie professionnelle, quel impact a eu l’essor des LLM et de l’IA agentique ? Pensez-vous que la tendance a été positive, négative ou quelque chose de plus nuancé ?

Au quotidien, j’utilise les LLM en tant que collègue expérimenté, quelqu’un avec qui réfléchir ou pour prototyper et déboguer rapidement un script. Avec le déploiement d’agents, je commence également à utiliser le codage dynamique et l’automatisation pour les tâches de base, mais pour les recherches approfondies, je suis beaucoup plus prudent. Je travaille actuellement avec des données médicales, où il n’y a littéralement aucune marge d’erreur. Je peux utiliser l’IA pour remodeler une pensée ou affiner ma méthodologie, mais pour les tâches complexes, je dois garder le contrôle total de mon code.

Je ne suis pas contre l’utilisation des LLM et de l’IA agentique, mais si vous laissez l’IA réfléchir, vous perdez votre intuition. Par exemple, lorsque je travaille avec l’imagerie cérébrale, je dois être ennuyeux et manuel avec ma logique de base, car un LLM ne comprend pas la pathologie que vous essayez de prédire. Chaque cerveau est différent ; l’anatomie humaine change d’un sujet à l’autre. Un agent IA voit une tendance, mais il ne comprend pas le « pourquoi » de la maladie.

Je constate également l’impact des agents IA sur le travail de mes stagiaires. Les agents d’IA améliorent considérablement leur productivité, mais ils peuvent être un désastre pour l’apprentissage humain. Ils peuvent générer en une après-midi une montagne de code qui prenait auparavant des mois, et il est difficile de maîtriser un sujet si l’on ne commet jamais les erreurs qui obligent à comprendre le système. Nous devons garder l’humain au centre de la logique, sinon nous construisons simplement des boîtes noires que nous ne contrôlons pas réellement.

Enfin, quels développements dans le domaine espérez-vous voir au cours de la prochaine année et quels sujets espérez-vous aborder ensuite dans vos écrits ?

J’aimerais vraiment voir la conversation s’éloigner de la recherche constante de nouveaux outils et s’orienter vers une meilleure science et des applications plus significatives de l’IA.

Nous sommes dans une phase où de nouveaux outils, cadres et modèles émergent très rapidement. Même si c’est passionnant, je pense que ce qui manque souvent, c’est la transparence et une plus grande concentration sur l’impact. J’aimerais voir davantage de travaux qui non seulement augmentent la productivité humaine, mais contribuent également de manière tangible à des domaines tels que les soins de santé, l’éducation et l’accessibilité.

Bien sûr, les LLM et l’IA agentique continueront d’évoluer, et je suis très intéressé à explorer ce que cela signifie réellement dans la pratique. Au-delà du battage médiatique, j’aimerais mieux comprendre et écrire sur des questions telles que :

Ces outils changent-ils vraiment notre façon de penser ou simplement la rapidité avec laquelle nous exécutons ?
Améliorent-ils réellement la qualité de notre travail ?
Quel type d’impact ont-ils dans différents domaines ?

Dans mes prochains écrits, j’aimerais me concentrer davantage sur ces réflexions combinant des perspectives techniques avec un examen plus approfondi de la façon dont l’IA façonne non seulement nos outils, mais aussi notre façon de travailler et de penser.

Pour en savoir plus sur le travail de Sabrine et rester au courant de ses derniers articles, vous pouvez la suivre sur TDS.

Certaines parties de ces questions et réponses ont été modifiées pour des raisons de longueur et de clarté.

Blog

Une carrière dans les données n’est pas toujours une ligne droite, et ce n’est pas grave

Comparaison de mesures explicites aux groupes de calcul dans des modèles tabulaires

Corrélation ne signifie pas causalité ! Mais qu’est-ce que cela signifie ?

Leave A Reply Annuler la réponse

Subscribe our Newsletter

Company

Links

Blog

Comparaison de mesures explicites aux groupes de calcul dans des modèles tabulaires

Corrélation ne signifie pas causalité ! Mais qu’est-ce que cela signifie ?

You may also like

Ensembles d’ensembles d’ensembles : un guide de l’empilement

4 fichiers YAML au lieu de PySpark : comment nous laissons les analystes créer des pipelines de données sans ingénieurs

Corrélation ne signifie pas causalité ! Mais qu’est-ce que cela signifie ?

Leave A Reply Annuler la réponse

Subscribe our Newsletter

Company

Links​

Login with your site account

Register a new account

Links