Dime Web

L’instrument Dime Web est une équipe de un à trois ingénieurs accompagnant des projets de recherche en Sciences Humaines et Sociales dans le développement et l’emploi de méthodes numériques afin d’exploiter le web comme terrain d’enquêtes. Cela permet notamment de collecter, d’enrichir, de nettoyer, de visualiser et d’analyser des données à partir des traces numériques accessibles sur Internet.

Objectifs

Dime Web vise à équiper le monde des Sciences Humaines et Sociales pour exploiter les traces numériques laissées sur le web. L’instrument s’adresse à différents publics et avec différents types d’approches et différentes temporalités : conseil dans le choix et l’usage de méthodes numériques, identification de sources disponibles sur la toile, développement intégral d’outils génériques libres et open source largement réutilisables, formations pédagogiques ou académiques, appui méthodologique, soutien ponctuel l’espace d’un atelier d’une après-midi, accompagnement tout au long d’un projet de recherche sur plusieurs années.

À ces fins, l’instrument développe et met à disposition de tous une palette d’outils sous la forme de logiciels libres open source, permettant de collecter des données, sur l’ensemble du web avec des crawlers comme Hyphe, ou sur des plateformes cibles comme par exemple Twitter avec le logiciel Gazouilloire, de les nettoyer, les enrichir et les catégoriser, ou encore de les visualiser, les explorer et les étudier, notamment sous l’angle de l’analyse de réseaux. Libres et open source, ces outils sont non seulement librement téléchargeables, installables et retouchables par des tiers, mais également pour une grande partie d’entre eux directement fonctionnels en ligne, à l’instar par exemple des utilitaires Table2Net, ScienceScape, CatWalk, ou encore SeeAlsology.

Le plus ambitieux de ces outils est le crawler Hyphe, qui permet de constituer simplement et qualitativement des corpus web de liens hypertextes entre acteurs agrégés quantitativement sur la toile. En combinant à la fois une haute technicité et une large utilisabilité, Hyphe offre aux étudiants et chercheurs en SHS une méthode exploratoire et quali-quantitative pour étudier les communautés d’intérêts autour de leurs sujets de recherche. Il est employé aujourd’hui par des chercheurs de plusieurs pays en Europe et outre Atlantique.

Positionnement

L’équipe de Dime Web se positionne à l’intersection des domaines de la recherche méthodologique et des méthodes numériques en SHS. En plus d’accompagner les chercheurs dans leur méthodologie, elle peut leur apporter ses compétences dans l’analyse de réseaux, l’archivage du web, ainsi que l’analyse des controverses suivant la théorie Acteur Réseau (ANT) de Bruno Latour. Les membres de l’équipe opérationnelle ont signé ou cosigné une quinzaine de publications académiques, dont un article sur PlosOne en 2015 sur l’algorithme ForceAtlas2 de spatialisation de réseaux mis en œuvre dans le logiciel Gephi, ainsi que divers articles présentant Hyphe, notamment aux conférences ICWSM 2016 et FOSDEM 2018.

Le lien avec l’environnement local de recherche et d’innovation se fait essentiellement par l’échange technologique. Les technologies libres et open source utilisées et/ou développées par Dime Web et plus largement au médialab sont également développées par un écosystème d’acteurs spécialistes des questions de réseau et de visualisation de données. Des acteurs du secteur privé sont ponctuellement intéressés par des formations à ces technologies.

Les domaines historiquement les plus réceptifs à ces travaux sont les web studies, l’analyse de réseaux sociaux et la cartographie des controverses. Naturellement disséminé dans la région parisienne, étant hébergé à Sciences Po, l’instrument trouve une vaste gamme d’utilisateurs académiques et universitaires en France mais aussi à l’étranger, et notamment dans plusieurs pays d’Europe où le médialab a tissé des liens au sein de la communauté des méthodes numériques : la Digital Methods Initiative de Richard Rogers à Amsterdam, le Tantlab à Copenhague, le King’s College à Londres… Ainsi depuis 2011, de nombreuses formations et communications, notamment sur Hyphe, ont été données dans différents pays d’Europe et au-delà, et les outils de Dime Web ont pu être déployés en interne dans diverses universités en Angleterre, au Danemark, aux États-Unis.

Fonctionnement

L’équipe opérationnelle de Dime Web s’est reposée essentiellement sur le recrutement de deux ingénieurs en 2011 et 2012, qui mutualisent leur temps de travail avec le médialab de Sciences Po, ce qui permet notamment d’accéder à des compétences plus variées issues de ce laboratoire (designers, développeurs experts en Javascript, chercheurs…).

L’accompagnement de projets de recherche recouvre des réalités différentes qui sont prises en compte par plusieurs niveaux d’implication de l’instrument. Les demandes d’aide ponctuelle, qui sont souvent aussi des demandes d’orientation, se font gratuitement pendant l’atelier portes-ouvertes mensuel de méthodes de Sciences Po initié au médialab. C’est souvent là également que s’effectue un premier contact qui pourra ensuite être développé jusqu’à une prestation payante. Dime Web donne également des formations à des groupes de chercheurs et doctorants, soit dans le cadre de l’accompagnement à un projet, soit indépendamment par exemple lors d’écoles d’été. À partir de 2014, l’accès à l’équipement pour de l’accompagnement, de la formation ou de la co-construction de recherches se fait uniquement de façon payante pour les membres internes comme externes du consortium de l’Equipex, et participe ainsi au financement du travail de développement des outils génériques.

Un Comité Scientifique et Technique (CST) spécifique à Dime Web assure le suivi de la sélection des projets et l’orientation de l’instrument, sur la base d’une réunion physique annuelle et d’échanges numériques. À partir de 2014, la sélection et le soutien des petits projets nécessitant une plus forte réactivité sans requérir de coûteux développements (au contraire des plus gros projets) ont été délégués à l’équipe opérationnelle et le CST a endossé un rôle de supervision annuelle.

Apports

L’instrument Web a depuis 2011 débouché sur la création de plusieurs outils numériques dédiés aux sciences sociales, le soutien direct d’une vingtaine de projets par de l’accompagnement et de la formation, et le soutien indirect d’une vaste gamme d’utilisateurs des outils en France et à l’international, dans les mondes académiques et pédagogiques, mais également journalistiques et associatifs. Les travaux de l’instrument ont également contribué à la recherche théorique sur les algorithmes de visualisation et la spatialisation de réseaux.

Les outils Dime Web et notamment Hyphe sont par ailleurs enseignés dans des classes de Master par des enseignants-chercheurs ainsi qu’en lycée au travers du programme pédagogique IDEFI FORCCAST de Sciences Po, lequel a financé le développement d’une interface utilisateurs complémentaire de Hyphe à visée plus pédagogique, afin de permettre aux étudiants d’utiliser Hyphe directement au sein d’un navigateur web dédié, le Hyphe-Browser.

La plupart des outils étant libres et open source, ils sont régulièrement utilisés, téléchargés et installés comme à UCLA (USA), King’s College (Royaume Uni), Aalborg University et ITU (Danemark), UNIL (Suisse), FMSH, EHESS, TGIR HumaNum, Universités de Lille 3, Rennes 2, Paris Nanterre, Paris Descartes et Paris-Est Marne La Vallée (France). S’ajoutent également plusieurs cas d’usage de Hyphe par des chercheurs isolés ou mêmes des acteurs hors du cadre académique : un chercheur allemand a par exemple publié dans une conférence une analyse de l’extrême droite dans son pays utilisant Hyphe, les activistes d’Utopies Concrètes ont réalisé une cartographie du monde associatif, une analyse des fake news avec Hyphe par un journaliste américain a été repérée sur Medium.

Perspectives

Le succès de Hyphe auprès de communautés tant académiques que pédagogiques permet d’envisager le développement d’une activité économique de mise à disposition de l’outil sous la forme de Software As A Service (SAAS) : bien qu’open source, Hyphe reste un logiciel difficile à installer sans un minimum de connaissances informatiques qui rebute souvent les utilisateurs et peut rapidement se révéler très gourmand en temps de calcul et de volume de stockage. Nous projetons donc d’adapter Hyphe afin de permettre un passage à l’échelle en automatisant son déploiement sur le cloud. Cette transformation devrait permettre un modèle économique différent basé sur une diffusion plus large et des opportunités de formation payantes plus nombreuses.

Par ailleurs, l’équipe Dime Web travaillera notamment sur la maintenance, la consolidation et la documentation du catalogue d’outils et méthodes open source afin de leur assurer la pérennité au-delà de l’Equipex. Par exemple en ajoutant à l’outil Gazouilloire des outils qualitatifs de sélection et de catégorisation, ou quantitatifs d’exploration visuelle.

La production d’outils libres et open source permettant la mise en œuvre de méthodes numériques dans le cadre des Sciences Humaines et Sociales se poursuivra enfin au delà de l’instrument Dime Web au sein du médialab de Sciences Po et de sa communauté d’utilisateurs et partenaires.