Météo-France
Météo-France présente MeteoNet : un jeu de données météorologiques conçu pour aider la recherche et l'innovation grâce à l'IA
26/02/2020Dans le domaine de la météorologie, les méthodes en intelligence artificielle qui ont été développées au cours des dix dernières années n'en sont pour la plupart qu'au stade de recherche. Pour innover dans ce domaine, l'accès à des jeux de données ouverts au grand public et à la communauté scientifique est primoridal. Afin de faciliter l'accès et l'exploitation des données météorologiques, Météo-France met à disposition, sur le site MeteoNet, un jeu de données météorologiques de référence. Ces données pourront également être utilisées dans d'autres domaines que la météorologie. Ce jeu de données a été préparé par le « Lab IA » créé en 2019.
L'objectif de MeteoNet est de faciliter l'accès à des données météorologiques d'archives produites par Météo-France, dans le cadre de ses missions de service public. Ces données ont été sélectionnées et formatées de manière à rendre leur exploitation aisée par des experts en mégadonnées non experts en météorologie.
MeteoNet en bref, c'est :
• 3 ans de données de 2016 à 2018, sur deux zones géographiques de 550 x 550 km sur le nord-ouest et le sud-est de la France ;
• des images radar de précipitations mesurées toutes les 5 minutes ;
• les observations de 500 stations météorologiques toutes les 6 minutes ;
• des prévisions de modèles météorologiques 2D et 3D issus des modèles météorologiques Arome et Arpege ;
• des masques terre/mer et relief.
Cet extrait de la gigantesque archive de Météo-France a été choisi pour être représentatif des différents types de temps dans l'Hexagone, et ainsi permettre de servir de jeu d'entraînement pour de l'apprentissage machine, tout en restant de taille raisonnable.
Un jeu de données adapté aux langages des experts en mégadonnées
L'explosion des données numériques a permis à des spécialistes de la donnée, comme les experts en mégadonnées, de découvrir de nouveaux algorithmes. L'expert en mégadonnées s'appuie au quotidien sur des connaissances en exploration des données, apprentissage automatique, en statistiques et utilise des technologies comme l'apprentissage profond.
Afin de faciliter l'utilisation des données météorologiques, Météo-France a reformaté ces données. Elles sont ainsi facilement exploitables par les experts en mégadonnées qui pourront les utiliser pour la recherche de nouveaux algorithmes, mais aussi pour améliorer des algorithmes, corriger des mesures, détecter des valeurs aberrantes, améliorer la prévision par croisement des sorties de modèle avec les données observées ou encore créer de nouvelles méthodes de prévision.
Pour accompagner et aider l'internaute dans l'exploitation des données, une boîte à outils est disponible en logiciel libre sur la plateforme GitHub. Cela permet, par exemple, de visualiser les données avec des superpositions de cartes et de relief. Une documentation expliquant les spécificités des données météorologiques est également disponible en ligne.
Favoriser les applications des algorithmes
Les applications des algorithmes dans le domaine de la météorologie sont nombreuses et variées. Elles servent l'intérêt général afin de répondre au mieux aux enjeux sociétaux (crues, tempêtes, vents forts, aéronautique…). Le jeu de données ouvert au grand public et à la communauté scientifique pourra servir de référence pour la comparaison des performances de nouveaux algorithmes.
Le Lab IA
Créé en février 2019 grâce au soutien du Fonds de transformation de l'action publique, le Lab IA a pour but d'accompagner les équipes de Météo-France dans le déploiement de leurs projets d'IA. Le Lab IA accueille, pendant 3 ans, 6 experts en mégadonnées qui travailleront en étroite collaboration avec des experts métier sur plusieurs sujets tels que la prévision immédiate de nébulosité, la création de nouveaux outils d'aide à la décision pour les gestionnaires de crise en croisant des données de Météo-France et de la Sécurité civile ou encore la détection de risques à partir des prévisions dites d'ensemble.
Une formation en apprentissage profond en libre accès
Météo-France a conçu une formation d'initiation en deux jours à l'apprentissage profond. Cette initiation étant adaptée à d'autres domaines d'application que la météorologie, Météo-France a choisi de publier sur la plateforme GitHub les supports de cours et les codes sources de travaux pratiques, en accès libre et en français, pour contribuer au développement des compétences en intelligence artificielle dans la communauté francophone.