Météo-France présente MeteoNet : un jeu de données météorologiques conçu pour aider la recherche et l'innovation grâce à l'IA
26/02/2020Dans le domaine de la météorologie, les méthodes en intelligence artificielle qui ont été développées au cours des dix dernières années n'en sont pour la plupart qu'au stade de recherche. Pour innover dans ce domaine, l'accès à des jeux de données ouverts au grand public et à la communauté scientifique est primoridal. Afin de faciliter l'accès et l'exploitation des données météorologiques, Météo-France met à disposition, sur le site MeteoNet, un jeu de données météorologiques de référence. Ces données pourront également être utilisées dans d'autres domaines que la météorologie. Ce jeu de données a été préparé par le « Lab IA » créé en 2019.
L'objectif de MeteoNet est de faciliter l'accès à des données météorologiques d'archives produites par Météo-France, dans le cadre de ses missions de service public. Ces données ont été sélectionnées et formatées de manière à rendre leur exploitation aisée par des data scientists non experts en météorologie.
MeteoNet en bref, c'est :
• 3 ans de données de 2016 à 2018, sur deux zones géographiques de 550 x 550 km sur le nord-ouest et le sud-est de la France,
• des images radar de précipitations mesurées toutes les 5 minutes,
• les observations de 500 stations météorologiques toutes les 6 minutes,
• des prévisions de modèles météorologiques 2D et 3D issus des modèles météorologiques Arome et Arpege,
• des masques terre/mer et relief.
Cet extrait de la gigantesque archive de Météo-France a été choisi pour être représentatif des différents types de temps en France métropolitaine, et ainsi permettre de servir de jeu d'entraînement pour de l'apprentissage machine, tout en restant de taille raisonnable.
Un jeu de données adapté aux langages des data scientists
L'explosion des données numériques a permis à des spécialistes de la donnée, comme les data scientists, de découvrir de nouveaux algorithmes. Le data scientist s'appuie au quotidien sur des connaissances en data mining, machine learning, en statistiques et utilise des technologies comme le deep learning.
Afin de faciliter l'utilisation des données météorologiques, Météo-France a reformaté ces données. Elles sont ainsi facilement exploitables par les data scientists qui pourront les utiliser pour la recherche de nouveaux algorithmes, mais aussi pour améliorer des algorithmes, corriger des mesures, détecter des valeurs aberrantes, améliorer la prévision par croisement des sorties de modèle avec les données observées ou encore créer de nouvelles méthodes de prévision.
Pour accompagner et aider l'internaute dans l'exploitation des données, une boite à outils est disponible en open source sur la plateforme GitHub. Cela permet, par exemple, de visualiser les données avec des superpositions de cartes et de relief. Une documentation expliquant les spécificités des données météorologiques est également disponible en ligne.
Favoriser les applications des algorithmes
Les applications des algorithmes dans le domaine de la météorologie sont nombreuses et variées. Elles servent l'intérêt général afin de répondre au mieux aux enjeux sociétaux (crues, tempêtes, vents forts, aéronautique…). Le jeu de données ouvert au grand public et à la communauté scientifique pourra servir de référence pour la comparaison des performances de nouveaux algorithmes.
Le Lab IA
Créé en février 2019 grâce au soutien du Fonds de transformation de l'action publique , le Lab IA a pour but d'accompagner les équipes de Météo-France dans le déploiement de leurs projets d'IA. Le Lab IA accueille, pendant 3 ans, 6 data scientists qui travailleront en étroite collaboration avec des experts métier sur plusieurs sujets tels que la prévision immédiate de nébulosité, la création de nouveaux outils d'aide à la décision pour les gestionnaires de crise en croisant des données de Météo-France et de la Sécurité civile ou encore la détection de risques à partir des prévisions dites d'ensemble.
Une formation deep learning en libre accès et open source
Météo-France a conçu une formation d'initiation en deux jours au deep learning. Cette initiation étant adaptée à d'autres domaines d'application que la météorologie, Météo-France a choisi de publier sur la plateforme GitHub les supports de cours et les codes sources de travaux pratiques, en open source et en français, pour contribuer au développement des compétences en intelligence artificielle dans la communauté francophone. Météo-France invite par ailleurs les connaisseurs du domaine à améliorer ou compléter cette initiation : les propositions de modification peuvent être soumises directement sur GitHub.