Un processus de création formateur
Amateur de nouvelles technologies, Guillaume Frat se désigne volontaire pour concrétiser ce projet teinté de numérique aussi bien dans le fond que dans la forme. Objectif : créer un podcast audio entre 2 et 3 minutes, accompagné d’une vidéo animée par un avatar qui explique, en mouvements, le mot du jour. Pour parvenir à ce résultat, l’intelligence artificielle générative infuse chaque étape de la production d’un épisode de Lex.IA :
- Choix du terme à définir ;
- Génération du script en fonction du terme choisi ;
- Génération de l’avatar et de l’audio (choix de son apparence et de sa voix) ;
- Génération de l’image de fond utilisée dans la vidéo ;
- Génération du post qui annonce la sortie du nouvel épisode sur les réseaux sociaux.
Parmi les outils utilisés, les grands modèles de langage, ou Large Language Models (LLM), sont essentiels. ChatGPT4 est spécialement mis à disposition des collaboratrices et collaborateurs de Docaposte sur une structure technique en propre afin de garantir la sécurité des données, dans le respect des principes de la charte Data & IA du groupe La Poste, dont Docaposte est la filiale numérique. Son usage permet non seulement de choisir une définition pertinente mais aussi de rédiger un script ou encore un post pour les réseaux sociaux en quelques minutes… et quelques prompts ! « Écrire un prompt n’est pas si simple et ce projet de podcast m’a permis de monter en compétences sur la façon d’interagir avec une IA générative pour obtenir un résultat optimisé », se réjouit Guillaume Frat, avant d’ajouter : « Mes compétences techniques se sont vites renforcées, au rythme des évolutions constantes des outils d’IA. » Il donne l’exemple du second outil qu’il utilise, HeyGen, pour la création d’un épisode de Lex.IA. HeyGen est un générateur de vidéos et de voix par IA avec des avatars animés dont les mouvements labiaux sont synchronisés avec le discours prononcé. « À chaque fois que je me connectais à HeyGen, l’interface avait été mise à jour et proposait de nouvelles fonctionnalités. Les dysfonctionnements ont rapidement été corrigés, comme celui de l’accent étrange qui se superposait automatiquement aux voix sélectionnées lorsque le texte était trop long ! »
L’humain derrière l’IA, pour un contenu de qualité
Si Lex.IA est 100% créé par l’IA générative, l’ensemble du “produit fini” est 100% validé par l’équipe du Lab Inno ainsi que par les experts de Docaposte référents sur les sujets définis. La validation du script puis du résultat final est en effet collaborative. « C’est parce que nous sommes responsables du contenu final qu’il est de qualité. Nous vérifions systématiquement que celui-ci est véridique, de bonne facture, et qu’il apporte une véritable valeur ajoutée tout en respectant l’ADN de Docaposte », tient à souligner Charlotte Grandjean, Cheffe de projet communication et membre du Lab Inno aux côtés de Guillaume Frat et Benjamin Kaminski. Ce dernier tient pour sa part à mettre en lumière les bénéfices de l’IA pour ses utilisateurs. À commencer par l’industrialisation du processus qui permet un gain de temps certain. « En comparaison à la production d’un épisode du podcast D.Clic qui demandait plus de 8h par mois en 2022, celle d’un épisode de Lex.IA nécessite d’y consacrer à peine plus de 2h par mois. » Pour Guillaume, l’autonomie et l’inspiration insufflées au fil des tests et des déclinaisons sont aussi intéressantes.
Et ensuite ? « Les collaborateurs pourraient devenir les prochains avatars », imagine Benjamin Kaminski. Les intelligences artificielles peuvent aujourd’hui cloner des visages au même titre qu'une voix. L'IA pourrait aussi servir les ambitions de Docaposte à l'international en traduisant par exemple les épisodes de Lex.IA dans d'autres langues ou en doublant ceux de Tendances Inno, un autre podcast de Docaposte, pour impliquer ses clients, prospects ou futurs talents aux quatre coins du monde. Et cela, sans avoir besoin que les collaborateurs animateurs ou interviewés ne soient bilingues !