
Construire des systèmes qui survivent à la vie réelle
Dans la série Author Spotlight, les rédacteurs de TDS discutent avec les membres de notre communauté de leur parcours professionnel en science des données et en IA, de leurs écrits et de leurs sources d’inspiration. Aujourd’hui, nous sommes ravis de partager notre conversation avec Sara Nobrega.
Sara Nobrega est une ingénieure en IA avec une formation en physique et en astrophysique. Elle écrit sur les LLM, les séries chronologiques, la transition de carrière et les flux de travail pratiques d’IA.
Vous êtes titulaire d’un Master en Physique et Astrophysique. Comment votre expérience joue-t-elle dans votre travail en science des données et en ingénierie de l’IA ?
La physique m’a appris deux choses sur lesquelles je m’appuie tout le temps : comment rester calme quand je ne sais pas ce qui se passe et comment diviser un problème effrayant en petits morceaux jusqu’à ce qu’il ne soit plus effrayant. Aussi… la physique vous humilie vraiment. Vous apprenez vite qu’être « intelligent » n’a pas d’importance si vous ne pouvez pas expliquer votre réflexion ou reproduire vos résultats. Cet état d’esprit est probablement la chose la plus utile que j’ai apportée à la science et à l’ingénierie des données.
Vous avez récemment écrit un plongée profonde dans votre transition d’un data scientist à un ingénieur en IA. Dans votre travail quotidien chez GLS, quelle est la plus grande différence d’état d’esprit entre ces deux rôles ?
Pour moi, le plus grand changement est passé de « Ce modèle est-il bon ? » à « Ce système peut-il survivre à la vraie vie ? » Être ingénieur en IA ne consiste pas tant à trouver une réponse parfaite, mais plutôt à construire quelque chose de fiable. Et honnêtement, ce changement était inconfortable au début… mais il a rendu mon travail beaucoup plus utile.
Toi noté que même si un data scientist peut passer des semaines à peaufiner un modèle, un ingénieur en IA peut ne disposer que de trois jours pour le déployer. Comment concilier optimisation et rapidité ?
Si nous avons trois jours, je ne recherche pas de petites améliorations. Je recherche la confiance et la fiabilité. Je vais donc me concentrer sur une base de référence solide qui fonctionne déjà et sur un moyen simple de surveiller ce qui se passe après le lancement.
J’aime aussi expédier par petites étapes. Au lieu de penser « déployer la chose finale », je pense « déployer la plus petite version qui crée de la valeur sans provoquer le chaos ».
Comment pensez-vous que nous pourrions utiliser les LLM pour combler le fossé entre les data scientists et DevOps ? Pouvez-vous partager un exemple où cela a bien fonctionné pour vous ?
Les data scientists parlent d’expériences et de résultats, tandis que les DevOps parlent de fiabilité et de répétabilité. Je pense que les LLM peuvent aider les traducteurs de manière pratique. Par exemple, pour générer des tests et de la documentation afin que ce qui fonctionne sur ma machine devienne « ça fonctionne en production ».
Un exemple simple tiré de mon propre travail : lorsque je construis quelque chose comme un point de terminaison d’API ou un pipeline de traitement, j’utilise un LLM pour aider à rédiger les parties ennuyeuses mais importantes, comme les cas de test, les cas extrêmes et les messages d’erreur clairs. Cela accélère beaucoup le processus et maintient la motivation. Je pense que la clé est de traiter le LLM comme un junior rapide, utile et parfois erroné, il est donc important de tout revoir.
Vous avez recherche citée ce qui suggère une croissance massive des rôles en IA d’ici 2027. Si un jeune data scientist ne pouvait acquérir qu’une seule compétence en ingénierie cette année pour rester compétitif, laquelle devrait-elle être ?
Si je devais en choisir un, ce serait d’apprendre à expédier votre travail de manière reproductible ! Prenez un projet et faites-en quelque chose qui peut fonctionner de manière fiable sans que vous le surveilliez. Parce que dans le monde réel, le meilleur modèle ne sert à rien si personne ne peut l’utiliser. Et les gens qui se démarquent sont ceux qui peuvent transformer une idée d’un cahier en quelque chose de réel.
Vos travaux récents se sont fortement concentrés sur les LLM et les séries chronologiques. En ce qui concerne 2026, quel est le sujet émergent de l’IA sur lequel vous avez le plus hâte d’écrire ensuite ?
J’ai de plus en plus tendance à écrire sur les flux de travail pratiques de l’IA (comment passer d’une idée à quelque chose de fiable). De plus, si j’écris sur un sujet « brûlant », je veux que ce soit utile, pas seulement passionnant. Je veux écrire sur ce qui fonctionne, ce qui ne fonctionne pas… Le monde de la science des données et de l’IA est plein de compromis et d’ambiguïtés, et cela m’a beaucoup captivé.
Je suis également de plus en plus curieux de connaître l’IA en tant que système : comment les différentes pièces interagissent ensemble… restez à l’écoute pour les articles de cette année !
Pour en savoir plus sur le travail de Sara et rester au courant de ses derniers articles, vous pouvez la suivre sur TDS ou LinkedIn.



