Skip to content
· 6 min de lecture

Substrats de contexte pour les agents à longue durée

Les agents en production fonctionnent souvent mieux avec une récupération de contexte fiable entre les sessions qu'avec une mémoire persistante. Voici la taxonomie en deux camps qui sépare les deux marchés, avec les signaux publics que la plupart des acheteurs ignorent.

AI AgentsAIBusiness StrategyProcess
Partager

Les agents en production fonctionnent souvent mieux avec une récupération de contexte fiable entre les sessions qu'avec une mémoire persistante. Ce sont deux produits distincts.

Si vous avez évalué Zep, Mem0 ou Letta cette année, vous explorez un marché qui a fusionné deux produits différents sous un seul mot.

Vouloir que vos agents progressent d'une session à l'autre est légitime. Le problème : la moitié des outils sur votre liste ont été conçus pour résoudre un problème différent, à savoir la mémorisation de faits au sein d'une conversation unique, et non l'accumulation de connaissances sur des mois de travail. Cet article distingue les deux camps, montre lequel correspond réellement à vos besoins, et signale les indicateurs de marché que la plupart des acheteurs négligent.

  • Le marché est en réalité deux marchés. Le camp 1 optimise le *rappel*. Le camp 2 optimise *l'accumulation*. La plupart des acheteurs les confondent.
  • Zep a changé de positionnement. En 2026, l'entreprise est passée de «mémoire» à «context engineering». C'est le signal public le plus clair du secteur.
  • Zilliz a lancé MemSearch. Un éditeur de bases de données vectorielles a livré un système où des fichiers markdown sont en amont de sa propre base vectorielle.
  • Les agents cumulatifs relèvent du camp 2. Si votre agent doit améliorer son travail sur des semaines et des mois, l'infrastructure de rappel n'en est qu'un composant.
  • Empiler les deux est coûteux. Deux systèmes aux chemins d'écriture qui se chevauchent produisent des mémoires contradictoires qui se corrompent mutuellement.

Le marché vend du rappel. Vos agents ont probablement besoin d'accumulation.

Parcourez GitHub : plus de 450 dépôts sont étiquetés `agent-memory` et plus de 460 sont étiquetés `context-management`. Presque aucun ne trace de frontière claire entre les deux.

Cette confusion est le problème central du marché. La mémoire semble désigner une chose unique, donc les acheteurs la traitent comme telle, et les éditeurs la vendent comme telle. Résultat : les équipes paient une infrastructure vectorielle qu'elles doivent de toute façon reconstruire en markdown.

Cette distinction change ce que vous achetez. Le camp 1 pose la question *que doit retenir l'IA ?* et livre une base de données. Le camp 2 pose la question *dans quel contexte doit travailler l'IA ?* et livre un substrat. Les deux sont utiles. Ils résolvent des problèmes différents.

Si vous choisissez une infrastructure d'agent pour une activité qui repose sur la progression réelle de l'agent sur des mois de travail, webvise peut vous aider à définir la bonne couche avant de signer un contrat annuel.

Camp 1 : les backends de mémoire (optimisés pour le rappel)

Les outils du camp 1 excellent dans une seule tâche. Ils analysent une conversation, extraient les faits pertinents, les stockent dans une base de données vectorielle et les restituent quand la conversation suivante en a besoin. La boucle est simple.

C'est ce que la plupart des gens entendent par «mémoire d'agent». Ce camp domine en nombre d'étoiles GitHub, et c'est vers lui que la majorité des acheteurs se tournent par défaut, car l'argumentaire est limpide : votre chatbot se souviendra que l'utilisateur habite à San Francisco.

ProduitÉtoilesPoints forts
Mem053.1KQuatre opérations : ajout, recherche, mise à jour, suppression. Agnostique au modèle.
MemPalace46.2KStockage verbatim local-first. 96,6 % de rappel de récupération sur LongMemEval.
Supermemory21.8KConscience temporelle. Remplace les faits obsolètes quand les utilisateurs les mettent à jour.
Cognee15.4KRecherche vectorielle combinée à une base de données graphe pour le raisonnement relationnel.
Honcho2.4KService asynchrone qui construit un modèle psychologique de chaque utilisateur.

Le camp 1 est la bonne réponse pour les chatbots, la persistance des préférences utilisateur et le rappel de faits avec une latence sub-200ms. Ce n'est pas la bonne réponse pour des agents qui doivent comprendre l'*état* d'un travail en cours sur cinq projets, trois outils et deux mois d'activité.

La limite est architecturale, pas technique. Une base de données vectorielle indique la correspondance la plus proche pour une requête. Elle ne dit pas ce qui a changé depuis la semaine dernière, ni pourquoi, ni en quoi cela influe sur la décision à prendre.

Camp 2 : les substrats de contexte (optimisés pour l'accumulation)

Le camp 2 inverse la boucle. Plutôt que d'extraire des faits depuis les conversations vers une base de données, l'agent lit des fichiers de contexte structurés et lisibles par des humains, travaille à l'intérieur de ces fichiers, puis y réécrit ses résultats. À la session suivante, le contexte est plus riche. Rien n'est «extrait».

C'est le schéma décrit par Andrej Karpathy sous le terme LLM Wiki : une base de connaissances personnelle que le modèle constitue une fois et maintient à jour, au lieu de redériver les réponses depuis des fragments à chaque requête. La propriété clé est l'accumulation. Le contexte s'améliore à l'usage.

ProduitÉtoilesPoints forts
OpenClaw358KMémoire en markdown simple (MEMORY.md, notes quotidiennes). La consolidation en arrière-plan fait progresser les schémas durables vers la mémoire à long terme.
Zep4.4KGraphe de connaissances temporel avec horodatages `valid_at` et `invalid_at`. Récupération en sub-200ms, conforme SOC2 et HIPAA.
TrustGraph2.0K«Context Cores» portables : paquets versionnés de schémas de domaine, de graphes de connaissances et de politiques de récupération. Versionnez le contexte comme du code.
MemSearch1.2KApproche markdown-first. Lancé par Zilliz avec leur propre base vectorielle Milvus positionnée comme couche d'accès au-dessus des fichiers.
Thoth145Architecture approfondie : 10 types d'entités, 67 relations typées, consolidation nocturne avec décroissance de confiance sur les relations anciennes.

Le camp 2 est la bonne réponse quand un agent fonctionne en continu, quand plusieurs outils ou plusieurs agents écrivent dans la même base de connaissances, ou quand le système doit s'améliorer de façon mesurable sur des semaines et des mois sans reconstruire le pipeline à chaque fois.

Le test le plus simple : votre agent a-t-il besoin de savoir ce qui s'est passé mardi dernier, ou de connaître la *forme actuelle* de votre activité ? La seconde question relève du camp 2.

Le changement de positionnement qui dit tout

Le signal de marché est assez clair. Deux mouvements publics, tous deux émanant d'entreprises qui vendent de la mémoire, indiquent quel camp est en train de s'imposer.

Zep se présentait autrefois comme une entreprise de mémoire. En 2026, son positionnement a évolué vers le context engineering. Une entreprise financée dans ce secteur ne change pas de positionnement pour le plaisir. Ce changement traduit le fait que les acheteurs les plus solvables avaient cessé de demander de la mémoire pour demander un contexte qui s'accumule.

Zilliz, l'entreprise derrière Milvus, a lancé MemSearch. MemSearch est un système où des fichiers markdown constituent la source de vérité et où la propre base de données vectorielle de Zilliz se positionne en aval comme couche d'accès. C'est un éditeur de bases vectorielles qui reconnaît publiquement que le markdown appartient en amont des vecteurs.

Le terme «context engineering» devrait s'imposer comme désignation standard de cette couche d'infrastructure pour les agents au cours de l'année à venir. Relisez les pages produits en faisant cette substitution mentale, et le vrai positionnement devient évident.

Comment déterminer le camp dont vous avez réellement besoin

Voici le cadre de décision, ramené à des règles pratiques.

Vous avez besoin du camp 1 (backend de mémoire) si...Vous avez besoin du camp 2 (substrat de contexte) si...
Votre agent est un chatbot dont les utilisateurs attendent qu'il mémorise leurs préférences.Votre agent fonctionne en continu ou sur plusieurs sessions portant sur le même corpus de travail.
Vous avez besoin d'une récupération de faits en sub-200ms avec un SDK propre.Plusieurs outils ou plusieurs agents écrivent dans la même base de connaissances.
L'objectif est de répondre aux questions des utilisateurs, pas de progresser dans la tâche au fil du temps.Vous souhaitez une amélioration mesurable sur des semaines et des mois sans reconstruire le pipeline.
Une base de données verrouillée chez un éditeur convient comme source de vérité.La portabilité compte. Le substrat doit survivre à un changement d'éditeur.

La plupart des agents orientés métier relèvent du camp 2. Si votre agent traite la prospection commerciale, la gestion de comptes clients, les opérations éditoriales, ou tout ce où le résultat doit s'affiner au fil du temps, vous achetez le camp 1 au mieux comme composant, pas comme système.

L'erreur coûteuse est l'inverse. Un bot de support client construit sur un substrat lourd du camp 2 paraîtra lent et surdimensionné. Adaptez le camp à la tâche, pas l'inverse.

Critères de décision d'achat

Trois recommandations concrètes avant de signer un contrat.

  • Prototypez d'abord en markdown. Avant d'acheter un produit de mémoire, prototypez le cas d'usage sur un substrat markdown simple accompagné d'une couche de récupération. Si ce prototype résout votre problème, vous n'aviez pas besoin du camp 1.
  • Évaluez les éditeurs sur l'accumulation, pas sur le rappel. Les benchmarks de rappel (LongMemEval et équivalents) mesurent le camp 1. Ils ne disent pas si le système est plus performant en semaine 12 qu'en semaine 1. Concevez des évaluations qui mesurent cela directement.
  • Choisissez un seul chemin d'écriture. Si vous combinez camp 1 et camp 2, définissez quelle couche gère les écritures. Deux systèmes aux chemins d'écriture qui se chevauchent, c'est la garantie de faits contradictoires qui se corrompent mutuellement.

La couche de connaissance IA est l'infrastructure sur laquelle tout cela repose, et la plupart des entreprises n'ont pas besoin d'une nouvelle base de données vectorielle pour y accéder. Il leur faut le bon substrat, le bon schéma, et la discipline de le laisser s'accumuler.

Si vous planifiez une infrastructure d'agent et souhaitez un second avis avant de signer, webvise aide les entreprises à définir des couches de connaissance d'agents qui s'accumulent. Prenez contact avant de choisir un camp.

Les pratiques de webvise sont alignées sur les normes ISO 27001 et ISO 42001.