3 compétences Claude dont chaque data scientist a besoin en 2026

en 2022, les choses étaient très différentes.

Les enfants d’aujourd’hui ne savent pas à quoi ça ressemble.

Je passais des heures :

Écrire du code Python et SQL à partir de zéro, ligne par ligne
Mémorisation des bibliothèques à importer et des fonctions qu’elles contenaient (depuis sklearn.metrics import r2_score)
Erreurs de code de débogage
Rédaction de la documentation pour mon code
Créer des tableaux de bord pour analyser de grands ensembles de données

Même au cours de la dernière année seulement, alors que les outils d’IA sont devenus de plus en plus avancés, mon travail de data scientist a changé. Je suis moins une machine à coder qu’un stratège. Quelqu’un qui comprend très bien les données de mon organisation et sait comment les présenter au mieux et en tirer des enseignements.

Claude change les choses encore plus vite

Claude est l’un de ces outils qui, je crois, transformeront l’industrie et cette carrière plus rapidement que quiconque ne peut l’imaginer. Je ne vais pas mentir, c’est un peu effrayant. Dans le même temps, il existe des moyens permettant aux data scientists de s’approprier cet outil, de le maîtriser et de continuer à garder une longueur d’avance.

Voici 3 compétences CRUCIALES que tout data scientist devrait s’efforcer de maîtriser dès maintenant :

1. Tableaux de bord Claude

J’avais l’habitude de passer une journée entière à créer un tableau de bord Tableau pour un client simplement pour explorer quelques questions sur un vaste ensemble de données qui pourraient ne plus jamais être examinées dans quelques mois.

Désormais, Claude peut générer en quelques minutes un tableau de bord interactif entièrement fonctionnel, comprenant :

Cartes métriques KPI
Graphiques linéaires
Graphiques à barres
Boutons d’exploration
Onglets
… et plus encore

Présentons un exemple simple utilisant le Ensemble de données énergétiques horaires AEP (licence CC0).

Claude Invite :

J’ai un ensemble de données de série chronologique de consommation d’énergie horaire (AEP_MW) avec une colonne datetime. Créez-moi un tableau de bord HTML interactif qui comprend :
1. Quatre cartes KPI indiquant la charge moyenne, la charge maximale, la charge minimale,
et comparaison été/hiver
2. Un graphique linéaire montrant la charge moyenne par heure de la journée, répartie entre les jours de la semaine et le week-end.
3. Un graphique à barres de la charge mensuelle moyenne avec les mois les plus élevés surlignés dans une couleur plus chaude
4. Un graphique à barres de la charge moyenne par jour de la semaine avec les week-ends dans une couleur différente. Utilisez un style épuré et minimal.

Le résultat ressemble à ceci :

Tableau de bord énergétique AEP généré par Claude. Capture d’écran par l’auteur

Quelques informations ressortent immédiatement du tableau de bord qu’il ne serait pas possible d’obtenir à partir d’un CSV brut :

La consommation en semaine culmine fortement vers 17h-18h, tandis que le week-end culmine plus tôt (vers 14h) et à un niveau globalement plus faible.
La consommation de juillet et août est nettement supérieure à celle des mois de printemps, confirmant la forte saisonnalité estivale due à la charge de la climatisation.
Les charges du samedi et du dimanche sont systématiquement inférieures d’environ 10 % à celles des jours de semaine

Ces types de tableaux de bord sont parfaits pour réaliser des EDA ainsi que pour produire des rapports ponctuels pour les parties prenantes qui souhaitent simplement savoir ce qui se passe à un moment donné. Vous pouvez également générer un tableau de bord selon un calendrier afin d’obtenir un nouveau rapport chaque semaine.

2. Claude Cowork pour la priorisation des tickets et des tâches Jira

Voici à quoi ressemblait pour moi un lundi matin typique : ouvrez Jira, cliquez sur 20 tickets ouverts, essayez de vous souvenir du contexte de chacun, déterminez ce qui bloque quoi et rédigez une liste approximative de priorités pour la semaine.

Claude Cowork est différent de Claude Chat dans la mesure où il se connecte réellement à votre bureau et peut lire/écrire des fichiers. Il peut se connecter à Jira (ou à une autre plateforme Scrum/Agile) et résumer vos priorités de la semaine. Voici un exemple :

Retirez tous mes tickets ouverts du sprint en cours. Pour chacun, donnez-moi : l’ID du ticket, un résumé en une phrase de ce qui doit se passer, l’état actuel et les éventuels bloqueurs. Classez-les par priorité et dites-moi ce que je devrais aborder en premier aujourd’hui.

Exemple de résumé de ticket Jira par Claude utilisant des données factices. Capture d’écran par l’auteur

Voici quelques autres invites que vous pouvez utiliser avec Cowork :

Écrire des tickets sur Jira

Voici mes notes de la réunion d’examen du modèle d’aujourd’hui : [paste notes – or link to the notes if your Cowork is connected to Google Drive]. Créez des tickets Jira pour chaque élément d’action du projet DS.
Pour chacun, écrivez un titre clair, une description en 2 phrases de ce
doit se produire et pourquoi, définir la priorité en fonction de l’urgence,
et attribuez-les au sprint en cours.

Préparation d’une réunion des parties prenantes

Lisez les 3 dernières semaines de commentaires sur les tickets étiquetés « déploiement de modèle » et écrivez-moi un résumé de l’état en 5 points que je pourrai partager avec le chef de l’équipe d’ingénierie. Gardez-le non technique.

Rédaction de documents à partir de zéro

Ouvrez le fichier preprocessing_pipeline.py dans mon dossier de projet et écrivez une section README expliquant ce que fait le pipeline, quelles entrées il attend et ce qu’il produit.

Rapport de fin de sprint

Sur la base des tickets clôturés de ce sprint, rédigez un résumé du sprint en 3 paragraphes pour mon responsable qui couvre ce que nous avons expédié, ce que nous avons appris et ce qui sera reporté au prochain sprint.

C’est un énorme gain de temps et vous permettra également de mieux vous organiser.

3. Débogage avec Claude Code

Claude Code est un outil de ligne de commande qui s’exécute dans votre terminal avec un accès complet à votre base de code. Ça peut:

Lire des fichiers dans votre projet
Exécuter des commandes
Exécuter des tests
Apporter des modifications sur plusieurs fichiers

Pour les data scientists, l’application la plus immédiatement utile est le débogage des pipelines.

Voici un scénario réel que j’ai rencontré récemment au travail avec dbt. Les noms des modèles et des fichiers ont été modifiés afin que je ne partage aucune information confidentielle sur l’entreprise.

L’Iran dbt run --select fct_energy_forecast et j’ai eu ça :
Database Error in model fct_energy_forecast column "meter_reading_mw" does not exist LINE 14: AVG(meter_reading_mw) AS avg_load_mw,

Le problème avec les modèles dbt est qu’une erreur de colonne dans un modèle de marché en aval ne vous le dit pas où la colonne s’est effectivement cassée. Il aurait pu être renommé dans la source brute, dans le modèle intermédiaire, dans une couche d’agrégation intermédiaire ou dans le marché lui-même. Pour trouver manuellement la cause première, vous devrez ouvrir chaque fichier de la chaîne de dépendances un par un, retracer le nom de la colonne à travers chaque transformation et déterminer où l’ancien nom n’a jamais été mis à jour. Sur un projet avec 24 modèles et 6 sources, cela pourrait prendre plus d’une heure de lecture, de réexécution et de reconstruction de modèles.

Je l’ai remis à Claude Code à la place :

Mon modèle dbt fct_energy_forecast échoue avec « la colonne meter_reading_mw n’existe pas ».
Trouver où cette colonne est définie en amont, tracer toutes les dépendances
modèles et fichiers sources, découvrez ce qui s’est passé et corrigez-le.

Claude a lu chaque fichier de la chaîne de dépendances et est revenu environ 40 secondes plus tard avec un diagnostic.

Il a ensuite appliqué le correctif sur les trois lignes, réexécuté le modèle et confirmé sa réussite.

Conclusion

À mesure que les outils évoluent, nos rôles évolueront également. Claude change le type de travail que les data scientists finiront par effectuer. Au lieu de passer 8 heures par jour à déboguer diverses erreurs dbt et Python, ces erreurs seront résolues en 2 minutes, ce qui nous laissera plus de temps pour approfondir nos données et poser des questions plus importantes. En tant que data scientists en 2026, il est important que nous développions continuellement nos compétences et restions à jour.

Il est également important de noter que même si Claude possède de nombreuses capacités, c’est toujours de l’IA et peut (et fait) des erreurs. Des data scientists maîtrisant Claude seront toujours nécessaires pour valider les données, améliorer les invites et les processus, et corriger Claude lorsqu’il est erroné.

Blog

3 compétences Claude dont chaque data scientist a besoin en 2026

en 2022, les choses étaient très différentes.

Claude change les choses encore plus vite

1. Tableaux de bord Claude

2. Claude Cowork pour la priorisation des tickets et des tâches Jira

3. Débogage avec Claude Code

Conclusion

Merci d’avoir lu

Les LLM peuvent-ils remplacer les répondants à l'enquête ?

Leave A Reply Annuler la réponse

Subscribe our Newsletter

Company

Links

Blog

en 2022, les choses étaient très différentes.

Claude change les choses encore plus vite

1. Tableaux de bord Claude

2. Claude Cowork pour la priorisation des tickets et des tâches Jira

3. Débogage avec Claude Code

Conclusion

Merci d’avoir lu

Les LLM peuvent-ils remplacer les répondants à l'enquête ?

You may also like

Les LLM peuvent-ils remplacer les répondants à l’enquête ?

Des modèles d’IA possibles aux modèles probables

Comment exécuter en toute sécurité des agents de codage

Leave A Reply Annuler la réponse

Subscribe our Newsletter

Company

Links​

Login with your site account

Register a new account

Links