
Les meilleurs data scientists apprennent toujours
est-il possible de maîtriser pleinement tous les sujets de la science des données ?
La science des données couvrant un si large éventail de domaines – statistiques, programmation, optimisation, conception expérimentale, narration de données, IA générative, pour n’en nommer que quelques-uns – personnellement, je ne le pense pas.
Voici une question plus précise. Est-il possible de pleinement maîtriser un seul sujet en science des données ? Bien sûr, vous pouvez devenir un expert dans certains domaines, mais pourrez-vous un jour atteindre un point où il n’y a plus rien à apprendre ? Encore une fois, je ne le pense vraiment pas.
Chaque data scientist a quelque chose à apprendre, même ceux qui possèdent une vaste expérience. Le but de mon article est de fournir quelques aperçus de mon parcours d’apprentissage qui, je l’espère, vous aideront dans le vôtre.
Il s’agit du premier volet d’une série en deux parties. Dans cet article, je couvrirai :
- Pourquoi devriez-vous continuellement apprendre en tant que data scientist
- Comment proposer des sujets à étudier
Allons-y !
1. Pourquoi apprendre continuellement en tant que data scientist ?
Les apprenants continus se différencient
Quand j’étais plus jeune, j’ai étudié l’espagnol en groupe. Quelque chose d’intéressant s’est produit une fois que le groupe est devenu conversationnel. De nombreux étudiants ont arrêté leurs études, ils étaient satisfaits de leur niveau de compétence. D’autres ont continué à étudier et à pratiquer quotidiennement.
Au début, il n’y avait pas beaucoup de différence entre les deux groupes. Mais au fil du temps, ceux qui ont continué à apprendre ont progressé. Leur maîtrise, leur vocabulaire et leur confiance se sont accrus, tandis que les autres ont stagné.
Malheureusement, la même chose peut arriver aux data scientists. Certains arrêtent d’apprendre après avoir développé suffisamment de compétences pour bien faire leur travail. À l’instar de la cohorte espagnole, en début de carrière, les apprenants continus et contenu les data scientists se ressembleront. Mais à mesure que le temps passe, ceux qui continuent d’apprendre commencent à se démarquer. Leurs connaissances s’enrichissent, leur jugement s’améliore et leur capacité à résoudre des problèmes complexes s’approfondit.
Apprenants continus et contenu Les data scientists se ressembleront au début de leur carrière. Mais à mesure que le temps passe, ceux qui continuent d’apprendre commenceront à se démarquer.
Les apprenants continus brillent car ils peuvent utiliser leurs connaissances pour trouver des solutions plus intelligentes aux problèmes. Ils auront une compréhension plus approfondie des outils de science des données et de la manière de les utiliser correctement dans leur travail.
L’apprentissage apporte l’épanouissement (pour la plupart)
C’est un peu moelleux, donc je vais être bref. Mais j’aime vraiment apprendre. Je ressens beaucoup d’épanouissement et de satisfaction en prenant le temps d’investir sur moi-même et de maîtriser de nouveaux sujets. Si vous aimez l’idée de l’apprentissage continu, vous en tirerez probablement aussi beaucoup de satisfaction !
2. Comment trouver des choses à étudier
Nous avons établi la valeur de l’apprentissage tout au long de la carrière dans la section précédente. Parlons de la manière de proposer des choses à étudier.
La meilleure chose à propos d’étudier seul est que personne ne vous dit quoi étudier. Le pire dans le fait d’étudier seul, c’est que personne ne te dit quoi étudier.
Tu n’es plus à l’école, ce qui est génial. Plus de délais, plus d’examens et, peut-être plus important encore, plus de frais de scolarité. Mais vous perdez également la liste organisée des sujets à étudier avec les supports, textes et conférences correspondants. Créer cela est votre travail maintenant ! La flexibilité de développer votre propre plan d’études est incroyable. Mais cet espace ambigu et non orienté peut être intimidant.
Au fil des années, j’ai développé trois approches pour proposer des sujets d’études qui me conviennent vraiment. Mon objectif est qu’ils puissent être un bon point de départ pour développer votre propre approche. En fin de compte, vous devrez trouver ce qui vous convient le mieux.
Passons aux trois approches.
Sujets de projets au travail
Si vous travaillez en tant que data scientist, vos projets vous offriront une riche offre de sujets d’étude « approfondis ». Cette approche est assez simple : étudiez des techniques/sujets pertinents pour votre travail. Accordez une attention particulière aux domaines dans lesquels votre compréhension est la plus faible.
Par exemple, si vous concevez une expérience, étudiez la conception expérimentale. Si vous résolvez un problème d’optimisation, étudiez l’optimisation.
L’un des grands avantages de cette approche est qu’elle vous rend immédiatement meilleur dans votre travail. Vous aurez une compréhension plus approfondie des problèmes auxquels vous êtes confrontés et vous pourrez appliquer cette compréhension immédiatement.
Suivre un « Web » de sujets
La science des données est un domaine d’étude si riche que vous pouvez toujours approfondir un sujet donné et que de nombreux sujets sont interdépendants.
Lorsque vous étudiez, vous trouverez de nombreux sujets « tangents » liés au sujet traité. Je prends souvent note de ces sujets et j’y reviens plus tard. J’appelle cela le « réseau de sujets ». C’est une excellente technique car vous construisez lentement un réseau de compréhension autour de groupes ou de sujets connexes. Cela donne une connaissance approfondie qui vous différenciera.
Voici un exemple d’un petit réseau de sujets autour de la régression logistique. Je n’ai inclus que quelques sujets pour l’illustration – je suis sûr que vous pourriez en proposer bien d’autres. Chacun des sujets du Web possède son propre site Web, créant ainsi un méga-web de sujets d’étude connexes.

Je pourrais continuer, mais vous comprenez. Tout sujet individuel aura un vaste réseau de sujets connexes. Gardez-en une liste quelque part et lorsque vous en aurez terminé avec le sujet actuel, vous aurez toujours un arriéré de sujets pertinents dans lesquels vous plonger !
Remarque : Votre réseau de sujets doit commencer quelque part. Si vous avez du mal à vous lancer, je vous recommande de lire « Les éléments de l’apprentissage statistique » ou « Introduction à l’apprentissage statistique » de Hastie, Tibshirani et Friedman. Ce sont des lectures fondamentales qui vous plongeront dans un vaste réseau de sujets d’étude.
Chaînes de découverte
Les projets de travail et les sites Web thématiques sont deux excellentes approches pour dresser une liste de sujets d’étude. Cependant, ces deux approches présentent un angle mort majeur. Si vous utilisez uniquement ces techniques, vous ne serez pas exposé à des sujets qui n’apparaissent pas au travail ou dans votre séquence naturelle d’études. Il y a probablement des sujets très importants qui ne seront pas abordés.
J’utilise des « canaux de découverte » pour aider à détecter des sujets importants qui ne sont pas abordés de manière organique. Une chaîne de découverte est toute source de contenu qui m’expose à des sujets indépendants de mes autres études. Ma principale source de chaînes de découverte sont Towards Data Science, les podcasts et les chaînes YouTube.

Lors du choix d’une chaîne de découverte, il est important de choisir une source qui couvre un large éventail de sujets. Si, par exemple, je suivais un podcast axé sur la conception expérimentale, je ne trouverais probablement pas un large éventail de sujets à étudier à partir de celui-ci. Cela pourrait être une excellente ressource pour les études du DOE, mais ce ne serait pas un bon canal de découverte.
Je consacre un pourcentage relativement faible de mes efforts globaux d’études aux canaux de découverte, mais ils jouent un rôle très important dans mes études.
L’emballer
J’espère que cet article vous motivera à commencer à étudier de manière indépendante si vous ne le faites pas déjà ou vous donnera une motivation supplémentaire pour continuer si vous étudiez déjà. J’espère également vous avoir donné quelques nouvelles idées sur la façon de proposer des choses à étudier.
Dans quelques semaines, je publierai la deuxième partie de cet article qui expliquera comment (1) éviter l’épuisement professionnel, (2) choisir des stratégies d’apprentissage et (3) tirer parti de la solitude pour consolider et approfondir vos connaissances – restez à l’écoute !



