ChatGPT : quels risques pour les bibliothèques ?

Amel Boudina, une consœur de la ville de Laval, a publié une tribune sur l’intelligence artificielle et plus précisément le phénomène ChatGPT d’OpenAI. Elle s’interroge sur les risques que peut faire planer cette techno sur les bibliothèques. Je vous invite à lire l’article, il y a plusieurs éléments que je partage mais je souhaitais poursuivre la réflexion en nuançant certains de ses propos. En effet, d’après Amel, le rôle des bibliothécaires n’est pas menacé par le développement de l’IA. Si l’avenir nous dira si elle avait raison, une chose est sûre, c’est que notre métier en est impacté et reconfiguré comme cela s’est déjà produit avec d’autres technologies de l’information et de la communication.

« Elles sont aussi un troisième lieu où les gens peuvent se rassembler, discuter et partager leurs idées. »

C’est devenu un lieu commun de le dire mais les bibliothèques ne sont plus uniquement des lieux dans lesquels on vient emprunter ou consulter des collections physiques. L’action culturelle est devenue un axe majeur des établissements. Aussi malin que puisse être en apparence ChatGPT, l’IA n’est pour le moment pas capable d’organiser des ateliers ou des rencontres. Bibliothèque 1 – ChatGPT 0

« Malgré tous les avantages que l’intelligence artificielle peut offrir aux bibliothèques, elle ne pourra jamais les remplacer. Non seulement les bibliothèques permettent d’avoir accès à des documents qui ne peuvent pas être trouvés en ligne, mais elles offrent aussi des programmes et services qui ne pourront jamais être automatisés, tels que l’accès à l’expertise d’un bibliothécaire.« 

L’assertion sur les documents qu’on ne trouverait que dans les bibliothèques est, à mon sens, de moins en moins vraie. (Sauf bien entendu pour ce qui concerne des collections patrimoniales ou liées à la recherche scientifique). Au regard de l’évolution des pratiques culturelles numériques et la montée en puissance du streaming, la valeur ajoutée des bibliothèques ne réside plus uniquement dans la capacité à fournir un accès à un document. Mais Amel a raison quand elle parle de l’expertise des bibliothécaires. Pour le moment, ChatGPT donne l’illusion d’exactitude. Or, en testant un peu l’IA, on réalise rapidement qu’elle peut apporter des réponses qui n’ont pas de sens.

J'ai demandé à ChatGPT la différence entre un rhinocéros et un mug de café. L'IA cherche à apporter une réponse structurée en comparant deux choses qui n'ont rien à voir.

Cependant, rappelons que ChatGPT a été ouvert massivement au public très récemment. Le fonctionnement de cette IA repose sur le machine learning et chaque question qu’on lui pose l’entraîne et l’améliore (Nous sommes toustes des travailleur-euses du clic). Attendons encore quelques mois ou années pour voir si l’IA peut être capable de développer une véritable expertise sur certains sujets. Enfin, OpenAI a annoncé réfléchir à mettre en place une offre payante avec plus de fonctionnalités. Cette offre sera peut-être moins artificielle et plus intelligente.

« Ces derniers offrent une assistance personnalisée et un savoir-faire qui ne peuvent être fournis par aucune technologie. Ils peuvent comprendre les intérêts et les besoins des lecteurs et leur fournir des recommandations et des conseils sur mesure, en plus d’aider à trouver des informations qui ne sont pas disponibles en ligne. »

Je ne sais pas quoi lire, Eurêkoi ou Le Guichet du savoir sont des services personnalisés qui s’adaptent à la personne qui sollicite le service. C’est d’ailleurs un argument utilisé par la BPI et Eurêkoi pour mettre en avant la recommandation humaine plutôt qu’une recommandation algorithmique qui serait moins capable d’identifier précisément les besoins informationnels ou documentaires d’un individu. Mais comme je l’évoquais précédemment, ChatGPT est encore jeune et manque d’entraînement pour proposer une recommandation sur mesure. Toutefois avant de vanter la supériorité de l’humain sur la machine, il ne faut pas oublier le contexte de la demande. Par exemple, pour le service Eurêkoi, l’usager-ère est invité-e à préciser le périmètre de sa demande : livre/film, plutôt roman ou BD, plutôt adulte ou enfant puis par un processus d’entonnoir, l’utilisateur-rice est amené-e à affiner sa demande de conseil pour aider les bibliothécaires à lui apporter une réponse personnalisée. Dans le cadre de ChatGPT, ces étapes intermédiaires ne sont pas définies en amont. Il faut préciser des éléments pour que l’IA puisse apporter une réponse. Mais dans le fond, dans les deux systèmes, il y a besoin de ces étapes intermédiaires pour pouvoir suggérer un contenu adapté et personnalisé. Mais je crois qu’on a tendance à fantasmer l’IA en lui attribuant des supers pouvoirs qu’elle n’a pas, peut-être à cause de la SF qui présente des dispositifs totalement autonomes : de KITT dans K2000 à Jarvis dans Iron Man en passant par HAL9000 dans Odyssées de l’espace.

« Enfin, les bibliothécaires peuvent aider les lecteurs à naviguer à travers la confusion et les informations contradictoires trouvées sur internet et fournir des informations fiables et précises. »

Ici, Amel pointe un élément très important qui fait écho aux missions d’éducation aux médias et à l’information des bibliothèques. Depuis quelques temps, les bibliothécaires se sont engagé-es dans la lutte contre la désinformation et accompagnent les usager-ères afin de les aider à acquérir les compétences informationnelles nécessaires pour identifier une fake news. Entre les deep fake et des agents conversationnels comme ChatGPT, les acteurs de la désinformation disposent d’un boulevard pour diffuser des infox. Plutôt que de représenter une menace pour nous, l’IA devient au contraire un moyen de mettre en avant nos compétences en matière de sélection et de validation de l’information. L’enjeu majeur actuellement, et qui inquiète notamment le milieu de l’enseignement, est de parvenir à savoir si un texte a été écrit par une IA ou par un humain. Bien que ChatGPT ne soit pas parfait et qu’on puisse identifier des incohérences, des redondances ou des contresens qu’une personne ne ferait pas, les outils de détection automatisée sont encore insuffisants pour détecter un faux texte produit par une IA.

« Quoi qu’il en soit, «aucune méthode, ni aucun modèle de détection [automatisé] ne sera fiable à 100%», juge Irene Solaiman. Raison pour laquelle elle «recommande toujours d’utiliser un cocktail de méthodes de détection, et non une seule.»

Libération, Comment détecter qu’un texte a été écrit par une IA ?

« L’intelligence artificielle peut aussi servir à trier et à classer les livres, administrer les demandes, fournir des informations aux usagers tout en améliorant le système de recherche, organiser le système de catalogage, ainsi qu’à fournir des recommandations personnalisées aux utilisateurs, dans la mesure de ses capacités. »

Je pense que ce point est un peu prématuré. D’une part, certaines IA reposent sur l’apprentissage profond (deep learning) et l’apprentissage automatique (machine learning). Grosso modo, elles ont besoin d’être alimenté par une quantité gigantesque de données pour pouvoir apprendre et évoluer. Pour comprendre qu’un chat est un chat, il faut des millions de photos de chats sous des angles différents pour que l’IA qui fait tourner Dall-E, Midjourney ou Stable Diffusion comprenne ce qu’est un chat. D’autre part, et cela rejoint le point précédent, en bibliothèque nous n’atteignons pas la masse critique suffisante de données et d’utilisateur-rices pour entraîner une IA qui pourrait améliorer le système de « recherche et organiser le système de catalogage et fournir des recommandations personnalisés aux utilisateur-rices ». Enfin, pour pouvoir proposer ce genre de services, il faudrait que nos prestataires implémentent ces technologies dans leurs produits. Au regard des coûts que cela représente et de la puissance de calcul nécessaire pour faire tourner une IA, est-ce que les entreprises du secteur seront prêtes à consentir à cet investissement ?

« L’IA ne peut pas offrir une assistance personnalisée aux usagers. Elle ne peut pas aider les lecteurs à trouver des informations spécifiques au contexte de leur demande et leur donner des conseils et des suggestions adaptés à leurs exigences particulières. Cela demande une subtilité détenue seulement par les humains. »

La question de la qualité de la réponse délivrée par une IA est à relativiser. En effet, si on prend l’exemple des moteurs de recherche et en particulier de Google, on constate que ce sont les premières réponses apportées par le moteur de recherche qui génèrent un engagement de la part de l’internaute qui clique sur les premiers résultats. Sont-ce les meilleures réponses ou les plus pertinentes ? Non, ce sont celles qui bénéficient du meilleur référencement par le moteur de recherche. Pire, Google est passé du statut de moteur de recherche à moteur de résultats. En saisissant une requête dans la barre de recherche, Google délivre une réponse immédiatement en reprenant des éléments d’un site dont il trouve la réponse la plus adaptée. Mais sur quels critères l’algorithme de Google s’appuie-t-il pour délivrer cette réponse ? Pour reprendre les mots d’Amel, il ne donne ni de conseils ni de suggestions adaptés aux exigences particulières des usager-ères qui pourtant se contentent, globalement, des éléments de réponse apportés.

Je pense que la situation est un peu prématurée pour préjuger de l’impact réel de ChatGPT. Il faut également souligner que pour le moment, l’IA d’OpenAI n’est pas tellement intégrée à d’autres écosystèmes numériques. Cela se met en place progressivement. Notons que Microsoft prévoit d’intégrer ChatGPT à son moteur de recherche Bing. Cette intégration qui est directement orientée contre Google vise à « répondre de façon ciblée à l’internaute » et en apportant des réponses à partir de données postérieures à 2021 (pour l’instant ChatGPT ne s’appuie que sur des informations publiées en ligne avant 2021). Il existe également un client desktop pour Windows, MacOS et Linux ou même une extension pour le navigateur Chrome qui propose des résultats de recherche fournis par ChatGPT. Enfin, la dernière étape consisterait à implémenter ChatGPT dans d’autres écosystèmes comme celui des applications que nous utilisons massivement au quotidien. (Edit du 16/01 : les choses semblent s’accélérer du côté des iPhone.) En d’autres termes, plus les internautes seront soumis à des expériences dans lesquelles interviennent ChatGPT, plus l’IA s’améliorera et plus ielles s’adapteront aux réponses fournies.

Pour conclure, je ne pense pas que chatGPT représente une menace pour les bibliothèques. Si ChatGPT n’est pas intégré à d’autres écosystèmes, ce ne sera qu’un épiphénomène dont la hype laissera la place à un autre outil disruptif qui fera à son tour couler de l’encre. En revanche, si les entreprises du web l’intègrent à leurs propres outils, cela pourra reconfigurer le domaine de la recherche d’informations. En partant du principe que les internautes développent des pratiques cumulatives, ce n’est pas exagéré de penser que nous pourrons coexister à côté de ce genre d’outil. De plus, ces IA sont le fruit d’un long processus de développement et l’aboutissement d’un travail humain qui peut comporter des biais, qui interroge sur les modalités de sélection de l’information par l’IA et donc qui invite à s’inscrire dans une démarche d’éducation critique de recherche de l’information. Nous ne sommes donc pas menacé-es par ChatGPT. La véritable menace pour nous, à court ou long terme, c’est plutôt les réductions budgétaires et les postes non renouvelés qui ne nous permettent pas de pouvoir poursuivre nos missions et intégrer de nouveaux services afin d’être en phase avec les usages actuels et les problématiques contemporaines de la société. Mais ça, c’est un autre sujet. 

5 commentaires à propos de “ChatGPT : quels risques pour les bibliothèques ?”

  1. Une remarque : ChatGPT serait donc utile pour la recherche documentaire.
    Hors, la recherche documentaire aidée par bibliothécaire, c’est quoi ? 10 % des demandes en BM ?
    Jexagère un peu mais à titre perso/pro, ça ne représente pas plus et je ne pense pas que mes autres tâches disparaissent.
    Heureusement qu’une BM ne sert pas qu’à ça.
    Troisième lieu toussa.

  2. Libraries face various risks, including:
    1. Digital obsolescence: As technology advances, digital collections may become inaccessible.
    2. Cybersecurity threats: Libraries’ online resources and patron data are vulnerable to cyberattacks.

    How does VPN work and what are its benefits? Complete information for you. A VPN connection starts by linking your device to a server location. The VPN client encrypts your internet traffic, converting it into secure data decipherable only by the server Best vpn to use

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*