Aller au contenu
Forum Parieur-Sportif.com

Recommended Posts

Posté(e)

Bonjour à tous,

J'ai commencé à rédiger quelques articles sur le machine learning et les courses hippiques.

Dans un premier temps, les articles vous montreront comment analyser les données. Par exemple, on verra les différents types de variables. Comment traiter.

Si vous avez votre propre base de données, vous commencez probablement à rencontrer quelques difficultés : vous vous rendez compte que votre ensemble de données est sale, qu'il manque beaucoup de valeurs, que certaines variables contiennent des étiquettes au lieu de chiffres, que d'autres ne correspondent pas aux hypothèses des modèles et, par-dessus tout, vous vous demandez si c'est la bonne façon de coder les choses.

Ce blog vous aidera ! Vous apprendrez une grande variété de techniques d'ingénierie utilisées dans le monde entier dans différentes organisations et dans des concours de science des données, pour nettoyer et transformer vos données et vos variables. Vous pourrez à terme analyser plus facilement les courses hippiques et peut-être trouver plus facilement les gagnants pour le quinté ou le jeu simple.

Qu'allez-vous apprendre ?
J'ai rassemblé une grande collection de techniques d'ingénierie des données, basée sur des articles scientifiques, des livres blancs, des concours de science des données et bien sûr sur ma propre expérience en tant que spécialiste des données.

Plus précisément, vous apprendrez :

• Comment imputer vos données manquantes
• Comment encoder vos variables catégorielles
• Comment transformer vos variables numériques pour qu'elles correspondent aux hypothèses du modèle ML
• Comment convertir vos variables numériques en intervalles discrets
• Comment éliminer les valeurs aberrantes
• Comment traiter les variables de date et d'heure
• Comment traiter les variables mixtes qui contiennent des chaînes de caractères et des chiffres

Tout au long des articles de ce blog, vous allez apprendre de multiples techniques pour chacune des tâches mentionnées, et vous apprendrez à mettre en œuvre ces techniques de manière élégante, efficace et professionnelle, en utilisant Python, NumPy, Scikit-learn, pandas etc…

Vous serez en mesure de mettre en œuvre toutes vos étapes d'ingénierie des fonctionnalités dans un pipeline unique et élégant, qui vous permettra de mettre en production vos modèles prédictifs pour les courses hippiques avec une efficacité maximale.

https://turf-ia.com/presentation-du-jeux-de-donnees-courses-hippiques/
N'hésitez pas à commenter ici ou sur le blog.

  • 2 weeks later...
  • 2 weeks later...
  • 2 weeks later...
Posté(e)

Caractéristiques des variables : La cardinalité

https://turf-ia.com/caracteristiques-des-variables-la-cardinalite/

Apprendre à quantifier la cardinalité
Voir des exemples de variables à cardinalité élevée et faible
Comprendre l’effet de la cardinalité lors de la préparation des trains et des jeux d’essai
Visualiser l’effet de la cardinalité sur les performances du modèle d’apprentissage machine

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Invité
Répondre à ce sujet…

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Chargement
×
×
  • Créer...