Le big data en pratique: sociologie, sciences des données et journalisme
Les sociologues devraient, en principe, contribuer dans une grande mesure aux analyses Big Data du monde social. La formation méthodologique de la plupart des sociologues de l’espace germanophone n’est toutefois pas adéquate pour traiter des mégadonnées. Ce projet a cherché à savoir comment combiner les méthodes, les outils et les compétences des champs de la sociologie, de la science des données et du journalisme de données pour améliorer la panoplie des outils sociologiques.
Portrait / description du projet (projet de recherche terminé)
Le projet s’est concentré sur une analyse approfondie des champs de la sociologie, de la science des données et du journalisme de données. Dans le cadre de trois sous-projets, on a examiné les méthodes, compétences et outils de chaque champ, avec une référence spécifique au Big Data. On a étudié aussi l’état actuel des cursus et des formations de chaque domaine et leur répercussion sur les perspectives de carrière. Enfin, on a mis en évidence des zones qui se recoupent et qui sont susceptibles d’être utilisées pour faire progresser la sociologie. Le projet a rassemblé des connaissances de la sociologie des sciences, de la sociologie des professions et de l’émergence de nouveaux champs organisationnels. La recherche dans les trois champs a combiné également des méthodes traditionnelles des sciences sociales avec de nouvelles méthodes computationnelles.
Contexte
L’augmentation des mégadonnées –nombreuses, diverses, souvent peu structurées et qui concernent tout un éventail de phénomènes – représente de nouveaux défis et offre de nouvelles opportunités pour les sciences sociales dans l’analyse et l’explication de la gamme complète des interactions sociales. Leur formation consistant à lier concepts théoriques et observations empiriques, les sociologues devraient être bien équipés pour de telles analyses. Mais leurs méthodes sont conçues pour des données et des paramètres différents (par ex. des échantillons représentatifs, des interviews) et sont moins adaptées aux mégadonnées que celles qu’utilisent la science des données et le journalisme des données.
Objectif
Les objectifs de ce projet étaient triples:
(1) le premier objectif était d’examiner systématiquement trois domaines d'analyse de données, à savoir la sociologie, la science des données et le journalisme de données, à propos des méthodes, des outils et des compétences actuellement utilisés.
(2) Un autre objectif était d’approfondir les connaissances sur les structures et les mécanismes impliqués dans le maintien et l’évolution des domaines de connaissances.
(3) Partant des deux objectifs précédents, le troisième objectif était d’extraire les méthodes, les outils et les compétences nécessaires à la sociologie pour analyser du Big Data. Et inversement, de savoir quels aspects la sociologie pourraient contribuer à d’autres domaines d’analyse des données.
Importance / Application
Le projet entend mettre en lumière les défis que les Big Data posent à la sociologie en matière de formation. Il fournit des connaissances sur les domaines professionnels de la science des données et du journalisme de données et rend compte des développements dans la discipline à un moment clé pour la sociologie. Le projet révèle la nécessité d'améliorer la manière d’appréhender les données, l'accès libre aux données et la transversalité des sciences des données. Il sensibilise également le public à l’utilisation du Big Data.
Résultats
Les résultats de la recherche dans le domaine de la sociologie démontrent que les méthodes et leur enseignement sont essentiels pour définir ce que cela signifie d’être sociologue dans le milieu universitaire germanophone. Les résultats démontrent aussi qu'une meilleure prise en compte et une plus grande importance accordée à la maîtrise des données, à la culture visuelle et à la pensée computationnelle dans les programmes de sociologie (et plus généralement des sciences sociales et humaines) au niveau Bachelor permettraient aux étudiant.e.s de mieux comprendre l’utilisation intensive des données dans les sciences, mais également au-delà. Il s'avère que le Big Data, qu’il provienne des médias sociaux ou des archives, fait rarement partie de la formation méthodologique actuelle, que ce soit sous forme de données ou de méthodes à utiliser pour les analyses. Les recherches sur les deux autres domaines d'analyse de données indiquent des approches qui pourraient profiter à la formation méthodologique en sociologie. En effet, une grande variété de sources et de types de données peut s’avérer pertinente pour les enquêtes sociologiques. Les données ne sont pas nécessairement des statistiques officielles ou des données numériques, il peut s’agir aussi de nouvelles données numériques ou d'anciennes données textuelles d'archives, de données d'images, de données transactionnelles ou de données de capteurs issues de différentes sources de données. La collecte, le traitement et la préparation des données sont des compétences nécessaires pour travailler avec des données numériques non structurées ou même numérisées. L’accès libre aux données est préférable. L'utilisation de données dans des logiciels open-source exige des connaissances sur les progiciels de programmation, les possibilités d'analyse, la pensée computationnelle et la manière d'aborder les flux de travail reproductibles. Les visualisations de données jouent un rôle de traduction important entre les données et les idées - leur création nécessite également une formation. Nos recherches sur les sciences des données démontrent aussi le rôle important de la pluralité des méthodes, des outils et des compétences pour l'existence de la transversalité et de l'innovation. Une pluralité méthodologique supplémentaire pourrait donc profiter à la formation méthodologique en sociologie. Parallèlement, les sciences des données et le journalisme de données peuvent aussi bénéficier des éléments fondamentaux de la sociologie. En sciences des données, les programmes actuels se réfèrent principalement aux traditions pédagogiques technico-scientifiques existantes. Les perspectives sociologiques peuvent aider à mieux comprendre les fondements sociaux, politiques et économiques ainsi que les conséquences d’une utilisation intensive des données dans divers domaines de la société. Après tout, de nombreux types de Big Data résultent d'interactions sociales et de comportements sociaux. Lors de la modélisation des données sociales, les connaissances sociologiques contribuent à construire de meilleurs modèles et à mieux interpréter les tendances obtenues.
Titre original
Facing Big Data: Methods and skills needed for a 21st century sociology