Blog

28 février

Mise à l’échelle de l’inférence ML sur Databricks : liquide ou partitionné ? Salé ou pas ?

Posted by Knowlix
Categories Blog
Comments 0 comment

Introduction une variable continue pour quatre produits différents. Le pipeline d’apprentissage automatique a été construit dans Databricks et comporte deux composants principaux. Préparation des fonctionnalités en SQL avec calcul sans serveur. Inférence sur un ensemble de plusieurs centaines de modèles …

27 février

Arrêtez de demander si un modèle est interprétable

Posted by Knowlix
Categories Blog
Comments 0 comment

sur l’interprétabilité en IA, commencez par la mauvaise question. Les chercheurs, les praticiens et même les régulateurs se demandent souvent si un modèle est interprétable. Mais ce cadrage suppose que l’interprétabilité est une propriété qu’un modèle possède ou n’a pas. …

27 février

L’écart entre les data scientists débutants et seniors n’est pas du code

Posted by Knowlix
Categories Blog
Comments 0 comment

cinq minutes sur LinkedIn ou X, vous remarquerez un débat bruyant dans l’industrie de la science des données. Il est sorti depuis un moment maintenant, mais cette semaine, il a finalement retenu mon attention. Autant qu’on pourrait le penser, il …

26 février

Concevoir des systèmes de données et d’IA qui résistent en production

Posted by Knowlix
Categories Blog
Comments 0 comment

Dans la série Author Spotlight, les rédacteurs de TDS discutent avec les membres de notre communauté de leur parcours professionnel en science des données et en IA, de leurs écrits et de leurs sources d’inspiration. Aujourd’hui, nous sommes ravis de …

25 février

Briser le goulot d’étranglement de la mémoire hôte : comment Peer Direct a transformé les performances cloud de Gaudi

Posted by Knowlix
Categories Blog
Comments 0 comment

Après avoir introduit les accélérateurs Gaudi dans les instances EC2 DL1 d’Amazon, nous avons été confrontés à un défi qui menaçait l’ensemble du déploiement. Les chiffres de performance n’étaient pas seulement décevants ; ils ont été désastreux. Les modèles qui …

25 février

Comment définir la portée de modélisation d’un modèle de risque de crédit interne

Posted by Knowlix
Categories Blog
Comments 0 comment

traverse une profonde transformation portée par le progrès technologique. Ces changements touchent tous les secteurs, notamment le secteur bancaire. Les professionnels des données doivent s’adapter rapidement pour devenir plus efficaces, productifs et compétitifs. Pour les professionnels expérimentés possédant de solides …

24 février

IA dans plusieurs GPU : accumulation de gradient et parallélisme des données

Posted by Knowlix
Categories Blog
Comments 0 comment

fait partie d’une série sur l’IA distribuée sur plusieurs GPU : Introduction Le parallélisme des données distribuées (DDP) est la première méthode de parallélisation que nous examinerons. C’est l’approche de base qui est toujours utilisé dans les paramètres de formation distribuée, …

24 février

PySpark pour les utilisateurs Pandas | Vers la science des données

Posted by Knowlix
Categories Blog
Comments 0 comment

un réel problème lorsqu’il s’agit de très grands ensembles de données. Ce que j’entends par « très volumineux », ce sont les données qui dépassent la capacité de la RAM d’une seule machine. Certains des principaux points de friction auxquels …

24 février

Le marché du travail de l’IA et des données est-il mort ?

Posted by Knowlix
Categories Blog
Comments 0 comment

la science des données était en train de mourir il y a 7 mois ? Il était également en train de mourir il y a 2 ans. Et je suis mort il y a 3 ans. Et sans oublier qu’il …

23 février

Créez des outils internes efficaces avec Claude Code

Posted by Knowlix
Categories Blog
Comments 0 comment

est incroyablement efficace pour créer rapidement de nouvelles applications. Ceci est, bien sûr, très utile pour toute tâche de programmation, qu’il s’agisse de travailler sur une application existante ou sur une nouvelle base de code. Cependant, d’après mon expérience personnelle, …

Mise à l’échelle de l’inférence ML sur Databricks : liquide ou partitionné ? Salé ou pas ?

Arrêtez de demander si un modèle est interprétable

L’écart entre les data scientists débutants et seniors n’est pas du code

Concevoir des systèmes de données et d’IA qui résistent en production

Briser le goulot d’étranglement de la mémoire hôte : comment Peer Direct a transformé les performances cloud de Gaudi

Comment définir la portée de modélisation d’un modèle de risque de crédit interne

IA dans plusieurs GPU : accumulation de gradient et parallélisme des données

PySpark pour les utilisateurs Pandas | Vers la science des données

Le marché du travail de l’IA et des données est-il mort ?

Créez des outils internes efficaces avec Claude Code

Subscribe our Newsletter

Company

Links

Blog

Subscribe our Newsletter

Company

Links​

Login with your site account

Register a new account

Links