Comment l’IA générative bouleverse les codes de la gestion documentaire ?
Décryptage de Laurent Rousset, directeur du digital chez EVERIAL.
La transition des modèles traditionnels de data science vers les nouvelles IA génératives représente une transformation notable dans la façon d’aborder le traitement informationnel.
Les nouvelles IA ne nous obligent plus à s’intéresser uniquement à la structuration de la donnée avant traitement, mais nous permettent d’interroger des grandes masses de documents au sein des entreprises, pour en extraire des informations pertinentes, même sur du “vrac numérique”.
Une nouvelle approche dans la gestion documentaire, qui nécessite néanmoins que les logiciels soient bien adaptés à des cas d’usage précis, pour ne pas produire de réponses biaisées.
Qu’est-ce que l’IA générative a transformé en matière de gestion documentaire ?
L’IA générative représente un tournant significatif dans la gestion documentaire. Elle permet de se concentrer sur l’information contenue dans des masses de documents au sein des entreprises et d’en extraire des éléments pertinents rapidement. On passe donc d’une gestion documentaire à une gestion de l’information, sans avoir besoin d’une structuration forte de la donnée. Car les IA génératives proposent une compréhension sémantique du document. On s’intéresse à la fois à la forme et au fond.
Nous avons atteint aujourd’hui un cycle de maturité technologique avec les IA génératives qui rebat les cartes grâce à des « moteurs » très développés et qui gagnent en maturité chaque jour appelés LLM (grands modèles de langage). Ces “moteurs” qui se déclinent en vLLM, SLM, PLM, … pour pouvoir adresser différents besoins de puissance de calcul, se spécialisent aussi et sont capables de comprendre et de générer des textes en langage humain, mais aussi maintenant des images, des vidéo, la voix, …
Comment cela fonctionne concrètement ?
Ces nouvelles Intelligences Artificielles sont entrainées pour comprendre le fond et la forme d’un média. On peut donc les questionner de manière très précise sur le contenu d’un document texte, mais aussi sur le contenu d’une image ou même d’une vidéo. Et c’est dans la précision de ce questionnement que réside le savoir-faire technologique à mettre en place, afin d’obtenir la réponse la plus adaptée.
Comme pour un humain, pour s’assurer de la bonne réponse on va fournir au moteur d’IA le contexte de la question. Par exemple : quel est le périmètre métier dans lequel s’inscrit la question ? Les types de réponses attendues par un expert-comptable ou un assureur ne sont pas les mêmes, même si les types de documents manipulés peuvent être les mêmes. On va aussi fournir les historiques des questions et réponses posées avant. Et bien sûr on va fournir à l’IA un corpus documentaire le plus précis possible pour comprendre et formuler sa réponse. Ainsi, plus nous sommes précis plus le moteur va être intelligent.
C’est pourquoi aujourd’hui on associe aux LLM des RAG (retrieval augmented generation, génération augmentée de récupération), qui vont permettre aux moteurs d’IA génératives d’exploiter des ressources de données supplémentaires sans réentraînement. Tous ces éléments permettant de “cadrer” la réponse du moteur d’IA et d’éviter ainsi les hallucinations.
Quelles sont les perspectives pour la gestion documentaire des entreprises ?
Nous constatons aujourd’hui, malgré ces progrès, qu’il n’y a pas de baguette magique. Au-delà des IA génératives généralistes et grand public, la gestion documentaire nécessite de travailler finement sur des cas d’usages précis. Que l’on souhaite extraire des informations simples d’un ensemble documentaire (“Quelle est la valeur de la dernière commande du client X ?”), ou que l’on souhaite obtenir une comparaison entre deux contrats d’assurance, ou encore obtenir le résumé d’une thèse, nous pourrons utiliser les mêmes sous-jacents technologiques (LLM, RAG, …), mais adaptés précisément à chaque cas d’usages. Il n’y a pas vraiment de “One Size Fits All”.
Ceux qui vont faire la différence, sont ceux qui vont savoir utiliser ces outils dans les bons cas d’usages. Ainsi nous allons progressivement intégrer ces IA génératives dans nos logiciels, nos processus et dans nos métiers de manière ciblée et incrémentale avec des logiciels qui vont s’améliorer, s’optimiser et devenir plus performants. Nous allons vers une génération “d’agents IA” qui vont être spécialisés pour tel ou tel cas d’usages, mais aussi capables de communiquer entre eux.
La principale question qui se dessine à court terme est de savoir tout ce que nous pouvons faire avec ces nouvelles technologies. En effet, c’est un processus itératif car nous ne maitrisons pas quelles sont les limites de ces intelligences artificielles et que nous avons encore aujourd’hui une réflexion très standard et un usage classique des logiciels. Nous n’imaginons pas tout ce que les IA génératives peuvent produire car cela n’est pas naturellement ancré dans nos propres fonctionnements. Traditionnellement, les spécifications d’un logiciel induisaient la technologie à utiliser, aujourd’hui c’est l’inverse, c’est la technologie qui “drive” les spécifications et la façon de repenser les processus. Les processus de gestion eux-mêmes vont donc être remis en cause en laissant plus de place à la capacité cognitive de l’IA.
Enfin, il faut prendre en compte le fait que l’IA générative ne doit pas tout faire et ne fera pas tout et qu’il existe encore des zones d’ombre. Par exemple l’intelligence artificielle peut-être facilement biaisée par un apprentissage défaillant, volontairement ou non. Au-delà des enjeux énergétiques associés à la consommation électriques des datacenters qui hébergent les serveurs, il y a surtout un réel sujet d’éthique autour des LLM, de leur conception, à leurs jeux de données d’entrainement pour garantir le minimum de “biais cognitif”. La souveraineté des IA génératives va devenir un enjeu crucial, car demain tous ces “agents IA” vont prendre des décisions à notre place et seront notre source d’informations.
En conclusion, l’IA générative révolutionne la gestion documentaire en permettant aux entreprises d’interroger de grandes bases documentaires multi-média, afin d’obtenir des informations pertinentes sans avoir à organiser les données au préalable. Une évolution qui a indéniablement des répercussions sur les compétences métiers requises, avec des data scientist qui deviennent des « information scientist » experts en gestion de l’information s’appuyant sur des “agents IA” de plus en plus spécialisés.