Quand un éditeur vous propose une "solution IA" pour votre entreprise, la première question à poser n'est pas son prix. C'est : qu'y a-t-il dans la boîte ? Parce que sous le même mot, on trouve des architectures techniques très différentes, qui produisent des résultats très différents. Cet article décortique les quatre briques qui composent un véritable agent IA métier, avec les définitions précises des termes que vous croiserez en rendez-vous : LLM, RAG, function calling, MCP, orchestrateur.

À la fin de la lecture, vous saurez ce qu'il y a vraiment sous le capot, vous pourrez poser les bonnes questions à n'importe quel prestataire, et vous repérerez les solutions qui sont vendues comme "agents IA" mais qui n'en sont pas.

Si vous cherchez plutôt à comparer les usages d'un chatbot et d'un agent IA pour décider lequel choisir, nous avons un article dédié à cette question business : Agent IA vs chatbot : quelles différences pour l'entreprise. Ici, on plonge dans l'architecture.

Les 4 briques d'un agent IA métier

Un agent IA repose sur quatre briques. Pas une de moins. C'est l'assemblage des quatre qui transforme un modèle de langage en quelque chose d'utile en entreprise.

Brique 1 — Le LLM (modèle de langage)

Définition. Un LLM (Large Language Model, ou grand modèle de langage) est un programme entraîné sur d'immenses corpus de texte pour comprendre et générer du langage naturel. Claude, GPT-4, Gemini, Mistral, LLaMA sont des LLM. Quand vous écrivez "Mon VPN ne se connecte pas", le LLM interprète l'intention derrière la phrase et formule une réponse en français cohérent.

Ce qu'il apporte. Deux capacités que les chatbots traditionnels n'avaient pas. La compréhension du langage naturel sans qu'il faille deviner les mots-clés exacts attendus. Et la génération d'une réponse adaptée au registre, au contexte et à la demande.

Sa limite. Un LLM seul ne sait rien de votre entreprise. Il a été entraîné sur des données générales, pas sur votre catalogue produits, vos contrats ou votre annuaire utilisateur. Si vous lui demandez "qui est responsable du dossier Dupont chez nous ?", il répondra qu'il ne sait pas, ou pire, inventera une réponse plausible mais fausse. C'est ce qu'on appelle une hallucination.

Voilà pourquoi un LLM brut n'est pas un agent IA. C'est un assistant général, utile pour rédiger ou synthétiser, mais aveugle à votre contexte. Il faut au minimum lui donner accès à vos données : c'est le rôle de la deuxième brique.

Brique 2 — Le RAG (Retrieval Augmented Generation)

Définition. Le RAG, pour Retrieval Augmented Generation (génération augmentée par récupération), est une technique qui consiste à brancher un LLM sur une base de connaissances qui lui est propre. Vos documents internes, vos procédures, votre historique de tickets, vos contrats : tout ce que l'agent doit "savoir" pour bien faire son travail.

Comment ça marche. Vos documents sont indexés dans une base vectorielle, une base de données spéciale qui ne cherche pas par mots-clés mais par sens. Concrètement, chaque document est transformé en un vecteur numérique qui représente son contenu sémantique. Quand une question arrive, elle est elle-même transformée en vecteur, et le système retrouve les passages les plus proches dans votre base. Ces passages pertinents sont transmis au LLM en même temps que la question, qui s'en sert pour formuler une réponse précise et ancrée.

Ce qu'il apporte. Deux choses essentielles. D'abord, il ancre les réponses dans vos données, ce qui réduit drastiquement les hallucinations. Ensuite, il permet à l'agent d'évoluer sans le réentraîner : il suffit d'ajouter ou de modifier un document dans la base, et l'agent en tient compte immédiatement.

Sans RAG, vous avez un LLM qui parle bien mais qui ne connaît rien à votre métier. Avec un bon RAG, vous avez un agent qui répond avec la précision d'un collaborateur expérimenté qui aurait votre documentation sous les yeux.

Brique 3 — Les outils (function calling)

Définition. Les outils, dans le langage des agents IA, sont des fonctions auxquelles le LLM peut faire appel pour exécuter des actions dans votre système d'information. La technique qui permet cela s'appelle le function calling (appel de fonctions). Un outil, c'est par exemple "vérifier les droits d'un utilisateur dans l'Active Directory", "ouvrir un ticket dans ServiceNow", "rechercher un client dans le CRM", "réinitialiser un mot de passe", "envoyer un email", "lire le statut d'une commande dans l'ERP".

Comment ça marche. Quand l'agent comprend qu'une demande nécessite une action et pas seulement une réponse texte, il sélectionne le bon outil dans son catalogue, fournit les paramètres nécessaires, et déclenche l'appel. La réponse de l'outil revient à l'agent, qui peut alors formuler une réponse finale à l'utilisateur ou enchaîner sur une autre action.

Ce qu'ils apportent. C'est la brique qui change tout. Sans outils, l'agent est limité au texte : il peut décrire la procédure pour réinitialiser un mot de passe, mais il ne peut pas le faire. Avec des outils bien intégrés, il agit directement, et ce qu'il livre à l'utilisateur n'est plus de l'information, c'est un résultat. C'est la frontière exacte entre informer et résoudre.

Brique 4 — L'orchestrateur

Définition. L'orchestrateur est la logique qui décide à chaque tour quoi faire : interroger le LLM, chercher dans le RAG, appeler un outil, demander une validation à un humain, ou répondre directement à l'utilisateur. Sans orchestrateur, les trois briques précédentes ne savent pas dialoguer entre elles.

Ce qu'il apporte. Trois fonctions clés. D'abord, il gère la mémoire de la conversation : quand un utilisateur dit "et pour Dupont, c'est pareil ?", l'orchestrateur sait que "Dupont" fait référence à un échange précédent, et fournit ce contexte au LLM. Ensuite, il arbitre entre les briques : RAG d'abord, puis outils si besoin, puis réponse. Enfin, il escalade vers un humain quand la demande est trop complexe, trop sensible ou hors périmètre, avec tout le contexte déjà collecté. C'est ce qui fait la différence entre un agent qui rend service et un agent qui prend des décisions hasardeuses à votre place.

MCP : le standard qui change l'industrie en 2026

Vous croiserez de plus en plus l'acronyme MCP dans les conversations sur les agents IA. Voici ce que c'est et pourquoi ça compte.

Définition. MCP, pour Model Context Protocol, est un standard ouvert qui simplifie la connexion entre un modèle de langage et des outils externes. Introduit fin 2024 et largement adopté en 2026, il standardise la manière dont un LLM "parle" à un CRM, un ITSM, une base de données ou n'importe quel système d'information.

Ce que ça change. Avant MCP, chaque intégration entre un LLM et un système demandait un développement spécifique, propriétaire, non réutilisable. Avec MCP, ces connexions deviennent standardisées : ajouter un nouvel outil à un agent prend quelques heures plutôt que quelques jours. Et un connecteur écrit pour un LLM fonctionne avec les autres LLM compatibles. C'est l'un des facteurs qui ont rendu les agents IA beaucoup plus rapides à déployer en 2026, et qui les rendent moins dépendants d'un éditeur unique.

Pour un dirigeant, MCP est l'équivalent de ce qu'a été USB en son temps pour les périphériques : un standard qui ouvre l'écosystème et baisse les coûts d'intégration.

Les 4 briques en action : exemple concret

Voyons comment l'ensemble fonctionne sur un cas réel. Imaginez un utilisateur qui écrit à un agent IA de helpdesk : "Bonjour, je n'arrive plus à me connecter au VPN depuis ce matin."

Étape 1. L'orchestrateur reçoit le message et le transmet au LLM, qui identifie l'intention : problème d'accès VPN, probablement résoluble en niveau 1.

Étape 2. L'orchestrateur déclenche une recherche RAG dans la base de connaissances interne. Le système remonte les procédures liées aux problèmes VPN, l'historique récent de tickets similaires, et les éventuels incidents en cours.

Étape 3. Le LLM, enrichi de ce contexte, identifie la cause la plus probable : un mot de passe expiré (90 % des cas selon l'historique).

Étape 4. L'orchestrateur appelle un outil : "vérifier le statut du mot de passe de cet utilisateur dans l'Active Directory". L'outil confirme : mot de passe expiré.

Étape 5. L'orchestrateur propose une action à l'utilisateur : "Votre mot de passe a expiré. Voulez-vous que je lance la procédure de renouvellement maintenant ?" Sur les actions sensibles, l'humain valide. L'utilisateur confirme.

Étape 6. L'orchestrateur déclenche le bon outil pour initier le reset, et notifie l'utilisateur quand c'est fait.

L'ensemble prend quelques secondes. À aucun moment un technicien humain n'est intervenu, et pourtant l'utilisateur a reçu un résultat, exécuté dans le vrai système, tracé comme un ticket normal.

C'est exactement ce qui se passe sur notre helpdesk interne avec Helpy. Cela nous a permis de passer de 270 heures de support de niveau 1 par mois à 141, avec 65 % des tickets résolus en autonomie. Le détail du retour d'expérience est dans l'étude de cas Helpy, et la version produit dans notre page solution helpdesk IA.

Les 5 questions à poser à un prestataire IA

Maintenant que vous connaissez l'architecture, voici les cinq questions concrètes qui révèlent immédiatement si on vous propose un vrai agent ou un montage léger.

1. Quel LLM utilisez-vous, et puis-je en changer ? Un bon prestataire vous explique son choix de LLM (Claude, GPT, Mistral, Gemini selon les cas) et vous permet d'en changer, plutôt que de vous enfermer dans une seule technologie.

2. Comment l'agent accède-t-il à mes données spécifiques ? Si la réponse est "il s'appuie sur ses connaissances générales" ou "vous lui copierez les informations", il n'y a pas de RAG, et ce n'est pas un agent métier.

3. Quels outils l'agent peut-il concrètement exécuter dans mon SI ? Demandez la liste exacte : Active Directory, ITSM, CRM, ERP, messagerie. Si la réponse est "il oriente l'utilisateur vers le bon formulaire", il n'y a pas de function calling.

4. Comment l'agent gère-t-il les actions sensibles ? Un agent IA bien conçu propose et laisse un humain valider les actions à risque. S'il agit sans garde-fou, vous prenez un risque opérationnel et juridique.

5. À qui appartiennent ma base de connaissances, mes prompts, mes données ? La réponse devrait être "à vous". Si le prestataire reste propriétaire, vous êtes en situation de dépendance.

Ces cinq questions, posées en début de discussion, vous évitent l'essentiel des erreurs d'achat sur le marché IA en 2026.

L'essentiel

Un agent IA métier est une architecture composée de quatre briques : un LLM qui comprend et formule, un RAG qui l'ancre dans vos données, des outils qui lui permettent d'agir dans vos systèmes, et un orchestrateur qui fait dialoguer le tout. Avec MCP comme standard d'intégration en train de devenir la norme, ces architectures se déploient plus vite et plus proprement que jamais.

Retirez une brique, et vous retombez sur un outil qui décrit au lieu d'agir, qui parle au lieu de résoudre. La distinction n'est pas théorique : elle se voit dans les résultats, et elle se vérifie en quelques questions ciblées en début de projet.

Pour comprendre quel type de projet IA correspond à votre besoin (outil sur étagère, agent métier, ou projet structurant), notre article pilier détaille les trois niveaux de projets IA en entreprise. Et pour les coûts précis selon le niveau, voir Combien coûte un agent IA en entreprise.

Questions fréquentes

Qu'est-ce qu'un LLM ?

Un LLM (Large Language Model, ou grand modèle de langage) est un programme entraîné à comprendre et générer du texte en langage naturel. Claude, GPT-4, Gemini ou Mistral sont des exemples de LLM. Dans un agent IA, le LLM interprète les demandes et formule les réponses. Mais seul, il n'a accès qu'à ses connaissances générales : il faut le brancher à un RAG et à des outils pour qu'il devienne un véritable agent métier.

Qu'est-ce que le RAG ?

RAG signifie Retrieval Augmented Generation (génération augmentée par récupération). C'est une technique qui consiste à enrichir un modèle de langage avec des données qui lui sont propres, stockées dans une base vectorielle. Quand une question arrive, le système va chercher les passages pertinents dans cette base et les transmet au modèle, qui répond en s'appuyant sur ces informations précises plutôt que sur ses connaissances générales. C'est ce qui ancre l'agent dans votre contexte et réduit drastiquement les hallucinations.

Qu'est-ce qu'une hallucination en IA ?

Une hallucination est une réponse plausible mais fausse produite par un modèle de langage. Elle survient quand le LLM ne dispose pas de l'information demandée et l'invente plutôt que de reconnaître son ignorance. Les hallucinations sont l'un des principaux problèmes des LLM utilisés seuls. Un agent IA bien conçu les évite grâce à trois mécanismes : le RAG, qui ancre les réponses dans vos vraies données ; des outils qui vérifient l'information en temps réel ; et un orchestrateur qui sait reconnaître les cas où l'agent doit escalader vers un humain plutôt que d'inventer.

Qu'est-ce que le function calling ?

Le function calling (appel de fonctions) est la technique qui permet à un LLM d'exécuter des fonctions extérieures, c'est-à-dire d'agir dans un système d'information plutôt que de seulement répondre par du texte. Concrètement, le LLM reçoit la description des fonctions disponibles (vérifier un droit, ouvrir un ticket, envoyer un email), et il décide lui-même quand les appeler et avec quels paramètres. C'est ce qui transforme un LLM en agent capable d'agir.

Qu'est-ce que MCP en IA ?

MCP, pour Model Context Protocol, est un standard ouvert introduit fin 2024 qui simplifie la connexion entre un modèle de langage et des outils externes. Il standardise la manière dont un LLM "parle" à un CRM, un ITSM, une base de données ou n'importe quel système. Conséquence : ajouter un nouvel outil à un agent prend quelques heures plutôt que quelques jours, et les connecteurs deviennent réutilisables entre différents LLM. C'est un des facteurs qui ont accéléré le déploiement des agents IA en 2026.

Qu'est-ce qu'une base vectorielle ?

Une base vectorielle (ou vector database) est une base de données spécialisée qui stocke des informations sous forme de vecteurs numériques représentant leur contenu sémantique. Elle ne cherche pas par mots-clés mais par proximité de sens : deux phrases qui veulent dire la même chose avec des mots différents seront identifiées comme proches. C'est le composant qui permet au RAG de retrouver les passages pertinents dans votre documentation, même quand l'utilisateur formule sa question avec des mots différents de ceux utilisés dans vos documents.

Quelle est la différence entre un LLM et un agent IA ?

Un LLM est un composant : le modèle de langage qui comprend et génère du texte. Un agent IA est une architecture complète qui combine un LLM avec trois autres briques essentielles : un RAG pour accéder à vos données spécifiques, des outils pour exécuter des actions dans vos systèmes, et un orchestrateur pour coordonner l'ensemble. Le LLM seul est un assistant général, l'agent IA est un système qui prend en charge un processus métier de bout en bout.

Combien de temps faut-il pour déployer un agent IA ?

Un agent IA métier sur un cas d'usage précis se déploie typiquement en quatre à douze semaines selon la complexité. Le facteur déterminant n'est pas la technologie mais l'état de votre base de connaissances de départ et l'accès propre à vos systèmes. Les détails de coût et de délai sont dans notre article Combien coûte un agent IA en entreprise.

La prochaine étape

Vous voulez situer un projet IA dans votre contexte, ou évaluer une solution qu'un prestataire vous propose ? Notre audit express en 30 minutes vous donne une lecture claire de votre besoin, situé sur les trois niveaux de projets IA, avec une recommandation chiffrée. Gratuit, sans engagement.

Réserver mon audit express 30 minutes · gratuit · sans engagement

‍