Incertitudes dans le big data: le cas des simulations climatiques
Dans ce projet, des simulations, basées sur des théories physiques, ont été combinées avec des analyses statistiques de grands volumes de données non structurées, afin d’élaborer des prévisions de tendance sur les intempéries et leurs conséquences. Les incertitudes liées à ces prévisions ont également été étudiées. Une collaboration avec MétéoSuisse a été établie pour développer un prototype de modèle sur l’impact des phénomènes météorologiques.
Portrait / description du projet (projet de recherche terminé)
La partie sciences naturelles du projet a étudié le recours au Big Data pour valider et calibrer des modèles météorologiques et climatiques et a vérifié si les incertitudes liées aux prévisions peuvent ainsi être réduites. En collaboration avec MétéoSuisse, le projet a examiné les obstacles qui se présentent lors de l’application concrète de tels modèles. La partie philosophique a analysé les arguments sur lesquels les prévisions de la partie sciences naturelles se basent, développé une typologie des incertitudes liées à ces prévisions et élaboré une classification systématique des conséquences des risques climatiques qui soit appropriée pour la communication mobile. La partie synthèse s’intéresse aux conditions nécessaires pour le transfert des résultats à d’autres domaines d’application des approches Big Data ainsi qu’à leurs conséquences sur le développement de la méthodologie scientifique.
Contexte
On estime communément que le Big Data est une nouvelle approche scientifique qui se passe de connaissances théoriques. Lors de l’examen des données, on utilise toutefois implicitement des théories sans que leurs fonctions pour l’organisation et l’évaluation des jeux de données aient jusqu’ici été analysées du point de vue philosophique. La recherche météorologique climatologique est un domaine de recherche approprié pour cela. Une comparaison concluante des avantages et inconvénients des modèles basés sur les processus par rapport aux méthodes statistiques n’existe pas encore en ce qui concerne les conséquences socioéconomiques des phénomènes météorologiques et climatiques. Le Big Data n’a pas encore été utilisé pour tester des modèles prenant à la fois en compte la météo, le climat et les décisions politiques.
Objectif
Les objectifs du projet étaient les suivants :
- développer un prototype de modèle de l’impact de la météo et du climat qui, à l’aide d’une approche Big Data, étudie le potentiel, les limites et les incertitudes d’événements actuels et de tendances futures concernant les intempéries et leurs conséquences ;
- développer une typologie des incertitudes qui apparaissent dans ce cadre et une analyse des arguments sur la base desquels des affirmations sur les tendances en matière de risques météo sont justifiées ;
- définir des critères quant à la transférabilité des résultats sur les risques climatiques à d’autres domaines d’application du Big Data, en particulier à des problématiques d’autres projets du PNR 75.
Importance / Application
La quantification des risques météorologiques et climatiques a une grande importance économique et sociale. Les dommages ne sont en général estimés qu’à posteriori. Les instruments pour effectuer des prévisions font encore défaut, bien qu’ils soient vraisemblablement réalisables techniquement. Le projet a fourni une meilleure compréhension des obstacles qui entravent l’application pratique d’un modèle prévisionnel. Des idées et des résultats ont été régulièrement échangés avec MétéoSuisse pour développer le côté opérationnel.
Résultats
Plusieurs études pionnières dans ce projet ont exploré les opportunités et les défis tant conceptuels que pratiques de l'utilisation d'outils Big Data et de données de qualité inconnue dans la modélisation climatique et les études d'impact, ouvrant la voie à de futures applications. Avec la disponibilité de beaucoup plus de données et de capacités de calcul, ce domaine se développe rapidement, mais d'importantes questions demeurent sur la façon de combiner le Big Data avec la compréhension des processus, et de progresser sur les méthodes d'apprentissage automatique interprétables. Dans les cas où une vérification répétée n'est pas possible, le processus d'établissement de la confiance est difficile et repose souvent sur la compréhension des processus et des moteurs pertinents. Les méthodes d'apprentissage automatique sont intrinsèquement limitées à cet égard, mais elles sont puissantes pour extraire des modèles d'information qui seraient autrement inaccessibles. La clé sera de combiner le meilleur des deux mondes, et ce projet a posé des bases importantes pour cela.
Titre original
Combining theory with Big Data? The case of uncertainty in prediction of trends in extreme weather and impacts