L'IA, ça fonctionne pas - épisode 2 - Blyst

Les technologies d’IA les plus célèbres de nos jours sont les LLM (Large Language Model), plus connus sous leurs noms: ChatGPT, Gemini, Claude ou encore Mistral. La liste de LLM existante aujourd’hui est très longue. Ces LLMs sont aussi communément appelés « modèles », ces termes sont interchangeables dans la plupart de la littérature sur le sujet, j’en ferais donc de même ici.

Ces LLMs sont basés sur un principe fondamental : pour générer un flux de sortie (texte, audio, vidéo), le modèle prédit le mot suivant. Ils sont ainsi capables de comprendre un contexte et de proposer une réponse appropriée à la demande initiale. Ils maîtrisent la compréhension de plusieurs langages et peuvent écrire de grande quantité de texte instantanément. Ils sont également entrainés grâce à une quantité massive de données, ce qui peut en faire de formidable outils de recherche.

Nous pouvons donc facilement interagir avec le modèle, les réponses sont le plus souvent pertinentes. Ce qui explique selon moi leur célébrité et l’explosion de l’utilisation du terme « IA ».

Mais comment exploiter ces technologies ? Suis-je simplement réduit à dialoguer avec un ordinateur, en utilisant une interface ? Il me fallait trouver une autre façon de procéder. C’est là que je découvris l’étendu des outils à disposition pour exploiter ces modèles d’IA.

Pour commencer, il me fallait choisir un langage de programmation, plusieurs noms sortaient de mes recherches, Python, Javascript/NodeJS, Java ou encore R, chacun avec ces forces et ces faiblesses. Je choisi Python pour sa simplicité, sa popularité ainsi que ses vastes bibliothèques de fonctionnalités. Ces bibliothèques ou framework étaient d’ores et déjà disponibles pour construire un premier prototype d’application.

Puis il me fallait un environnement de développement, Jupyter Notebook, Visual Studio Code ou PyCharm, les choix ne manquaient pas, et se révélaient similaires, j’utilisais donc tous ces outils. Il ne me restait qu’un seul élément : quel modèle choisir ?

Tous les modèles ne se valent pas, il y a une balance à trouver entre performance et coût. Je faisais alors le choix d’utiliser ChatGPT, qui venait de sortir leur nouveau modèles gpt-4o et notamment leur version « mini » « gpt-4o-mini », performant et surtout très bon marché avec un usage classique de traitement de texte.

(Huggingface, site de référence pour l’IA et le ML, propose certains comparatif comme ici: The Big Benchmarks Collection – a open-llm-leaderboard Collection) ou encore (LLM Leaderboard – Compare GPT-4o, Llama 3, Mistral, Gemini & other models | Artificial Analysis)

C’est avec tous ces éléments que je m’apprêtais à me lancer dans l’aventure.

Premier obstacle évident, l’apprentissage du langage de programmation. J’avais gardé certains réflexes de mes anciens jours de programmation et de « scripting », mais il me fallait fatalement replonger dans cet univers. Je reparti donc de cours et de vidéos d’initiation sur le langage , ce qui m’a permis d’apprendre les bases de Python et de revoir certains concepts.

Dans le même temps, je mettais en pratique la construction de mon prototype. L’accès à ChatGPT fut également d’une grande aide car je pouvais lui demander de traduire le Français en Python. Mais ces réponses n’étaient pas toujours justes, je ne regrettais donc pas d’avoir passé du temps à apprendre le langage. Quoi qu’il en soit, il me fallut quelques jours pour être capable d’avancer sur mon prototype.

Ce projet était très simple, être capable de lire des emails de ma boite mail, de pouvoir « échanger » avec eux en utilisant ChatGPT. Mais ChatGPT n’est pas capable de lire des données privées me diriez-vous, vous auriez eu en parti raison.

Pour que cela fonctionne, il faut faire appel à un concept, nommé « RAG » pour Retrieval Augmented Generation, que je détaillerai au prochain épisode !

L’IA, ça fonctionne pas – épisode 2

Nos autres articles de blog

L’IA, ça fonctionne pas – épisode 4

L’IA, ça fonctionne pas – épisode 3