Blog

29 avril

Ensembles d’ensembles d’ensembles : un guide de l’empilement

Posted by Knowlix
Categories Blog
Comments 0 comment

l’apprentissage automatique est un jeu hypercompétitif d’ingénierie d’ensemble. La différence d’une légère amélioration du temps au tour ou des scores de défaite peut être mesurée en millions de dollars qu’une équipe rapporte lorsqu’elle fait ce qu’il faut pour être la …

29 avril

4 fichiers YAML au lieu de PySpark : comment nous laissons les analystes créer des pipelines de données sans ingénieurs

Posted by Knowlix
Categories Blog
Comments 0 comment

nous avons trois semaines pour expédier un seul pipeline de données. Aujourd’hui, un analyste sans expérience Python le fait en une journée. Voici comment nous y sommes arrivés. Je m’appelle Kiril Kazlou, ingénieur de données chez Mindbox. Notre équipe recalcule …

28 avril

Corrélation ne signifie pas causalité ! Mais qu’est-ce que cela signifie ?

Posted by Knowlix
Categories Blog
Comments 0 comment

Je suis entré dans la science des données, il y avait une phrase que nous avions tous entendue ; tout le monde le sait, petits et grands : « La corrélation n’implique pas la causalité. » C’est une phrase accrocheuse, et vous l’avez …

27 avril

Une carrière dans les données n’est pas toujours une ligne droite, et ce n’est pas grave

Posted by Knowlix
Categories Blog
Comments 0 comment

Dans la série Author Spotlight, les rédacteurs de TDS discutent avec les membres de notre communauté de leur parcours professionnel en science des données et en IA, de leurs écrits et de leurs sources d’inspiration. Aujourd’hui, nous sommes ravis de …

27 avril

Comparaison de mesures explicites aux groupes de calcul dans des modèles tabulaires

Posted by Knowlix
Categories Blog
Comments 0 comment

Avec l’avènement des UDF, nous devrions repenser la manière d’utiliser les groupes de calcul. Ces deux fonctionnalités sont essentielles pour simplifier un modèle sémantique en modularisant la logique et en réduisant la duplication de la logique métier. Alors que les …

24 avril

Comment améliorer les performances du code Claude avec des tests automatisés

Posted by Knowlix
Categories Blog
Comments 0 comment

Claude Code fonctionne plutôt bien. Vous pouvez saisir une série d’instructions et lui demander de produire du code ou une autre sortie pour vous. Cependant, vous pouvez faire certaines choses pour augmenter considérablement les performances de Claude Code, notamment en …

24 avril

J’ai construit un pipeline d’IA pour les points forts du Kindle

Posted by Knowlix
Categories Blog
Comments 0 comment

Je lis, j’aime surligner des choses (j’utilise un Kindle). J’ai l’impression qu’en lisant, je n’arrive pas à retenir plus de 10 % des informations que je consomme, mais c’est en relisant les points forts ou en résumant le livre que …

24 avril

Introduction aux méthodes de solutions approximatives pour l’apprentissage par renforcement

Posted by Knowlix
Categories Blog
Comments 0 comment

série sur l’apprentissage par renforcement (RL), faisant suite au célèbre livre de Sutton et Barto « Apprentissage par renforcement » [1]. Dans les articles précédents, nous avons fini de disséquer la première partie dudit livre, qui présente les techniques fondamentales de résolution …

24 avril

Comment sélectionner des variables de manière robuste dans un modèle de notation

Posted by Knowlix
Categories Blog
Comments 0 comment

échouer pour une raison : une mauvaise sélection de variable. Vous choisissez des variables qui fonctionnent sur vos données d’entraînement. Ils s’effondrent sur de nouvelles données. Le modèle a fière allure en développement et en pause de production. Il existe une …

23 avril

Vos données synthétiques ont réussi tous les tests et ont quand même brisé votre modèle

Posted by Knowlix
Categories Blog
Comments 0 comment

avait l’air solide. La divergence KL se situait bien dans des plages acceptables. Lors du test Train on Synthetic, Test on Real (TSTR), le modèle a atteint une précision de 91 % lorsqu’il était entraîné sur les données synthétiques et testé …

Ensembles d’ensembles d’ensembles : un guide de l’empilement

4 fichiers YAML au lieu de PySpark : comment nous laissons les analystes créer des pipelines de données sans ingénieurs

Corrélation ne signifie pas causalité ! Mais qu’est-ce que cela signifie ?

Une carrière dans les données n’est pas toujours une ligne droite, et ce n’est pas grave

Comparaison de mesures explicites aux groupes de calcul dans des modèles tabulaires

Comment améliorer les performances du code Claude avec des tests automatisés

J’ai construit un pipeline d’IA pour les points forts du Kindle

Introduction aux méthodes de solutions approximatives pour l’apprentissage par renforcement

Comment sélectionner des variables de manière robuste dans un modèle de notation

Vos données synthétiques ont réussi tous les tests et ont quand même brisé votre modèle

Subscribe our Newsletter

Company

Links

Blog

Subscribe our Newsletter

Company

Links​

Login with your site account

Register a new account

Links