L’institut de science des données (ISDM) de Montpellier et la start-up Trustii s’associent pour proposer le 1er data challenge de l’ISDM.
Vous souhaitez construire un modèle prédictif par machine learning sur vos données ? Vous souhaiteriez explorer les possibilités du machine learning pour vos données ? Le data challenge de l’ISDM vous offre l’opportunité de diffuser ces données et la problématique associée auprès des étudiants de l’université de Montpellier. A l’issue de ce challenge, le modèle le plus performant vous sera mis à votre disposition, parmi les propositions de l’ensemble des étudiants participants.
Les données seront hébergées par la plateforme Trustii (https://www.trustii.io), à laquelle auront accès les étudiants candidats durant le challenge.
Quelles données et quels problèmes peuvent être proposés dans le cadre de ce challenge ?
Les méthodes visées sont de type “supervisées”. Les données devront être présentées sous la forme de fichiers .csv intégrant des attributs de description et la classe d’appartenance.
Exemple de la célèbre base iris :
sepal_length,sepal_width,petal_length,petal_width,species
5.1,3.5,1.4,0.2,1
7,3.2,4.7,1.4,2
6.4,3.2,4.5,1.5,2
7.7,2.6,6.9,2.3,3
Ces données serviront à entraîner des algorithmes permettant de reconnaître et prédire la catégorie (dans notre exemple, la variété d’iris donnée par 1, 2 ou 3).
Les données doivent être préparées pour être interprétées par machine learning. Les champs du fichier CSV doivent être des nombres réels et non vides. Trustii pourra aider à la vérification du format et de la cohérence des données et orienter le cas échéant vers des outils de transformation de vos données.