Projet Spinoza
Reporters sans frontières (RSF), avec l’Alliance de la presse d’information générale (l’Alliance) en France, initie et déploie l’un des premiers outils d'intelligence artificielle conçu pour les journalistes et avec les journalistes.
Le projet Spinoza vise, dans un premier temps, à créer un outil pour les journalistes fondé sur l’intelligence artificielle (IA) générative afin d’améliorer le traitement médiatique du changement climatique et de la transition écologique. Le tout en se basant sur des sources fiables.
Concrètement, le prototype permet à l’utilisateur journaliste d’accéder rapidement à des informations précises tirées de documents juridiques et scientifiques. L’outil va par exemple puiser ses informations dans des bases de données contenant des rapports du Groupe d'experts intergouvernemental sur l'évolution du climat (GIEC) ou ceux de la plateforme intergouvernementale scientifique et politique sur la biodiversité et les services écosystémiques (IPBES). Ou bien encore parmi des textes de loi français, des rapports de l’Agence de l'environnement et de la maîtrise de l'énergie (Ademe) ou des documents tirés de la stratégie nationale bas carbone (SNBC) du gouvernement français.
L’outil peut aussi accéder à une base de données de 12 000 articles de presse écrite issus des médias de la presse régionale ou nationale participant à l’expérimentation.
Tous les éléments transmis par l’outil sont sourcés, afin que le journaliste puisse les tracer et les vérifier.
Spinoza intègre les médias comme acteurs légitimes dans la conception des systèmes d’IA.
Spinoza est une réponse constructive aux risques que l'IA générative fait peser sur le journalisme et sur l'accès à une information fiable.
Le prototype développé dans le cadre du projet Spinoza permet aux journalistes de traiter le changement climatique à partir de très grands volumes d’informations fiables dans différents domaines.
Le projet Spinoza permet d'utiliser des outils d’IA respectueux de la propriété intellectuelle, qui citent systématiquement leurs sources.
Les éditeurs de l’Alliance, qui représentent près de 300 médias pour lesquels travaillent quelque 15 000 journalistes en France, ont souhaité s’engager dans ce projet initié par RSF en 2023 afin de défendre leur conception d’une utilisation fiable et respectueuse de la propriété intellectuelle des contenus de presse par l’IA générative.
Le premier prototype du projet Spinoza a été livré au début de l’année 2024 par la société Ekimetrics après une série d’ateliers de design thinking réalisés avec RSF et des médias partenaires membres de l’Alliance (Libération, groupe Sogémédia, groupe EBRA, etc.).
Les fonctionnalités de l'outil sont développées en collaboration avec des journalistes de différents médias membres de l'Alliance, pour s'assurer que le produit réponde véritablement à leurs besoins. Plusieurs ateliers de design thinking portant sur l’interface, sur les prompts – soit les instructions envoyées à l’IA générative – ou encore sur la hiérarchisation des sources, seront réalisés tout au long du projet.
L’outil est, à ce jour, mis à disposition des seuls journalistes des médias membres de l’Alliance ayant contribué aux ateliers. Cet accès pourra cependant être élargi progressivement, à mesure que de nouveaux partenaires rejoindront le projet.
Avant son déploiement dans les rédactions intéressées, le projet propose à partir de mai 2024 à une communauté de journalistes membres de médias partenaires du projet d’expérimenter cet outil pour le perfectionner.
Le projet Spinoza utilise le modèle de langage d’OpenAI GPT 3.5. Des expérimentations sont en cours pour tester également la performance d’algorithmes open source (avec un code accessible publiquement et gratuitement), préférables en termes de transparence et de réduction de la dépendance technologique.
Le modèle de langage utilisé dans le prototype produit par le projet Spinoza n’est pas sollicité pour restituer des connaissances tirées de sa base d’entraînement, mais pour synthétiser des informations contenues dans des documents fiables. Les instructions générales adressées au modèle de langage, le prompt, sont composées d’instructions très strictes sur la manière dont l’algorithme doit restituer et mettre en forme l’information. Par exemple, si l’outil ne peut pas formuler de réponse satisfaisante par manque de données, il précisera à l’utilisateur qu’il ne dispose pas de sources suffisantes pour répondre à sa question. Enfin, le fait que l’outil a été conçu pour citer systématiquement ses sources limite les risques d’hallucinations, à savoir une réponse fausse ou trompeuse.