Éruptions solaires: prédiction de tempêtes géomagnétiques
Les missions d’observation astronomique collectent des quantités considérables de données qui ne peuvent être analysées qu’automatiquement. Ce projet a utilisé des méthodes d’apprentissage automatique dans le domaine de la recherche sur le Soleil afin de mieux comprendre et prévoir les éruptions solaires.
Portrait / description du projet (projet de recherche terminé)
La mission IRIS collecte depuis 2013 des données sur les différentes couches de l’atmosphère solaire. Le jeu de données ainsi créé approfondit notre compréhension de la physique du Soleil. Mais cela nécessite en premier lieu une automatisation de la caractérisation et de l’exploration de ces gros volumes de données. Nous développons des méthodes au moyen desquelles des ordinateurs apprennent à reconnaître des schémas dans l’archive d’IRIS et à caractériser le déroulement temporel des éruptions solaires observées. Sur cette base, nous souhaitons améliorer de manière déterminante la compréhension et les prévisions des éruptions solaires.
Contexte
Les éruptions qui se produisent régulièrement à la surface du Soleil peuvent provoquer des perturbations sur la Terre – par exemple dans les systèmes de localisation radio et GPS – mais également des pannes dans les réseaux d’électricité. Jusqu’ici, la science n’a pas été en mesure de comprendre les causes des éruptions solaires ni de les prévoir de manière fiable. Les éruptions se produisant dans des configurations spatiales et temporelles très variées, leur analyse systématique s’en trouve considérablement compliquée.
Objectif
L’objectif de ce projet était de mieux comprendre la physique du Soleil et de développer des méthodes de prévisions des éruptions solaires. Pour ce faire, nous avons utilisé la grande banque de données créée d’IRIS (Interface Region Imaging Spectrograph), le nouveau satellite solaire de la NASA, et nous avons élaboré des algorithmes d’apprentissage automatique qui évaluent les données en fonction des configurations spatiales et temporelles.
Importance / Application
Les éruptions solaires pouvant causer des perturbations de grande ampleur sur la Terre, leur prévision a une grande importance. Elle peut par exemple être utile pour la planification des vols ainsi que pour l’exploitation des satellites et des réseaux d’électricité, et ainsi réduire les dégâts éventuels dus aux éruptions. Les algorithmes et méthodes de traitement des images que nous avons développé peuvent par ailleurs être utilisés pour l’analyse d’autres jeux de données, dans la science ou l’industrie.
Résultats
Dans le cadre de ce projet, nous avons développé un certain nombre de méthodes pour atteindre notre objectif principal, à savoir l’étude de la physique fondamentale des éruptions solaires et la mise au point de capacités pour les prédire. À cet effet, les méthodes développées ont été appliquées aux données réelles de la mission IRIS de la NASA. Les principaux résultats ont été publiés dans sept ouvrages et présentés lors de onze conférences et ateliers internationaux.
L'objectif principal de notre étude était d'analyser les configurations spatiales et temporelles observées dans les données IRIS. Il convient de noter que le problème abordé constituait un défi majeur en raison des nombreux facteurs, tels que la dimensionnalité et le volume des données, la multimodalité des données, l'absence d’annotations et la représentation déséquilibrée des différents événements dans les données, par exemple les régions avec un soleil calme, des pré-éruptions et des éruptions. Le soleil calme représente une majorité dominante dans les données. Pour surmonter ces difficultés, nous avons dû adapter les approches existantes de l’apprentissage automatique, ce qui nous a permis d'acquérir de nouvelles connaissances sur la physique du Soleil.
Dans cette étude, nous avons abordé les principales questions de recherche suivantes:
- identifier les spectres d'éruption typiques Mg-II à l'aide de l'apprentissage automatique,
- explorer les informations mutuelles entre les lignes spectrales d’IRIS,
- prédire des éruptions en temps réel d’après la distinction entre les spectres d'éruption et de non-éruption des régions actives,
- détecter les éruptions solaires dans les données IRIS à l'aide d'un réseau tensoriel DCT,
- examiner la classification de l'activité solaire basée sur des spectres Mg-II compressés et
- classer les goulots d’étranglement d'information dans des systèmes extrêmement répartis.
Les résultats obtenus nous ont également amenés à élargir nos plans initiaux à de nouveaux modèles prédictifs, qui feront prochainement l’objet de plusieurs publications.
Titre original
Machine Learning based Analytics for Big Data in Astronomy