Warstwy kontekstu dla długo działających agentów

Wielu agentów produkcyjnych nie potrzebuje trwałej pamięci w ścisłym sensie; potrzebuje niezawodnego pobierania kontekstu między sesjami, a te dwie rzeczy to nie to samo.

Jeśli w tym roku oceniają Państwo Zep, Mem0 lub Letta, robią Państwo zakupy na rynku, który połączył dwa różne produkty pod jedną nazwą.

Słusznie zależy Państwu na tym, żeby agenty stawały się mądrzejsze z każdą sesją. Problem polega na tym, że połowa narzędzi z listy kandydatów została zbudowana z myślą o innym problemie: przywoływaniu faktów w ramach pojedynczej rozmowy, a nie o gromadzeniu wiedzy przez miesiące pracy. Ten artykuł rozdziela oba obozy, pokazuje, który z nich faktycznie potrzebuje dany agent, i wskazuje sygnały rynkowe, które większość kupujących pomija.

Rynek to dwa rynki. Camp 1 optymalizuje pod kątem *przywoływania*. Camp 2 optymalizuje pod kątem *kumulowania*. Większość kupujących myli je ze sobą.
Zep zmienił pozycjonowanie. W 2026 roku firma zmieniła swój przekaz z "memory" na context engineering. To najwyraźniejszy publiczny sygnał w tej przestrzeni.
Zilliz wypuścił MemSearch. Firma zajmująca się bazami wektorowymi dostarczyła system, w którym pliki markdown są upstream względem ich własnej bazy wektorowej.
Agenty budujące kontekst potrzebują Camp 2. Jeśli agent ma poprawiać swoją pracę przez tygodnie i miesiące, infrastruktura recall jest tylko jednym komponentem.
Łączenie obu jest kosztowne. Dwa systemy z nakładającymi się ścieżkami zapisu produkują sprzeczne dane, które się wzajemnie korumpują.

Rynek sprzedaje przywoływanie. Agenty prawdopodobnie potrzebują kumulowania.

Przejrzyj GitHub. Jest ponad 450 repozytoriów oznaczonych tagiem `agent-memory` i ponad 460 oznaczonych `context-management`. Prawie żadne z nich nie przeprowadza wyraźnej granicy między tymi dwoma pojęciami.

Ta rozmytość to podstawowy problem rynku. Pamięć brzmi jak jedna rzecz, więc kupujący traktują ją jak jedną rzecz, więc dostawcy sprzedają ją jako jedną rzecz. Efekt: twórcy płacą za infrastrukturę wektorową, którą i tak muszą potem odbudować w markdownie.

Podział zmienia to, co warto kupić. Camp 1 pyta: *co AI powinno zapamiętać?* i dostarcza bazę danych. Camp 2 pyta: *w jakim kontekście AI powinno pracować?* i dostarcza substrat. Oba są przydatne. Rozwiązują różne problemy.

Jeśli poszukują Państwo infrastruktury agentowej dla firmy, która liczy na to, że agent faktycznie stanie się mądrzejszy przez miesiące pracy, webvise pomoże określić właściwą warstwę zanim zostanie podpisany roczny kontrakt.

Camp 1: Backendy pamięci (zoptymalizowane pod kątem przywoływania)

Narzędzia Camp 1 robią jedną rzecz dobrze. Pobierają rozmowę, wyciągają istotne fakty, przechowują je w bazie wektorowej i pobierają je, gdy następna rozmowa ich potrzebuje. Pętla jest prosta.

To właśnie większość ludzi ma na myśli, mówiąc o "pamięci agenta". To największy obóz pod względem gwiazdek na GitHubie i obóz, do którego większość kupujących domyślnie się kieruje, bo pitch jest prosty: chatbot zapamięta, że użytkownik mieszka w San Francisco.

Produkt	Gwiazdki	Co robi dobrze
Mem0	53.1K	Cztery operacje: dodaj, wyszukaj, zaktualizuj, usuń. Niezależny od modelu.
MemPalace	46.2K	Lokalne verbatim storage. 96,6% recall na LongMemEval.
Supermemory	21.8K	Świadomość temporalna. Nadpisuje nieaktualne fakty, gdy użytkownicy je aktualizują.
Cognee	15.4K	Wyszukiwanie wektorowe plus baza grafowa do rozumowania relacyjnego.
Honcho	2.4K	Asynchroniczny serwis budujący psychologiczny model każdego użytkownika.

Camp 1 to właściwa odpowiedź dla chatbotów, przechowywania preferencji użytkownika i przywoływania faktów z opóźnieniem poniżej 200 ms. To niewłaściwa odpowiedź dla agentów, które muszą rozumieć *stan* trwających prac w pięciu projektach, trzech narzędziach i przez dwa miesiące.

Ograniczenie jest architektoniczne, nie implementacyjne. Baza wektorowa wskazuje najbliższe dopasowanie do zapytania. Nie mówi, co zmieniło się od zeszłego tygodnia, dlaczego ani jak to wpływa na decyzję, którą właśnie trzeba podjąć.

Camp 2: Substraty kontekstu (zoptymalizowane pod kątem kumulowania)

Camp 2 odwraca pętlę. Zamiast wyciągać fakty z rozmów do bazy danych, agent czyta ustrukturyzowane, czytelne dla człowieka pliki kontekstowe, wykonuje w nich swoją pracę i zapisuje z powrotem. W kolejnej sesji kontekst jest bogatszy. Nic nie jest "wyciągane".

To wzorzec, który Andrej Karpathy opisał jako LLM Wiki: osobista baza wiedzy, którą model kompiluje raz i na bieżąco aktualizuje, zamiast ponownie wyprowadzać odpowiedzi z fragmentów przy każdym zapytaniu. Kluczową właściwością jest kumulowanie. Kontekst staje się lepszy w miarę użytkowania.

Produkt	Gwiazdki	Co robi dobrze
OpenClaw	358K	Zwykła pamięć markdown (MEMORY.md, dzienne notatki). Konsolidacja w tle promuje trwałe wzorce do pamięci długoterminowej.
Zep	4.4K	Temporalny graf wiedzy ze znacznikami `valid_at` i `invalid_at`. Pobieranie poniżej 200 ms, zgodność z SOC2 i HIPAA.
TrustGraph	2.0K	Przenośne "Context Cores": wersjonowane pakiety schematów domenowych, grafów wiedzy i polityk pobierania. Kontekst wersjonowany jak kod.
MemSearch	1.2K	Markdown-first. Dostarczony przez Zilliz z ich własną bazą wektorową Milvus jako warstwa dostępu ponad plikami.
Thoth	145	Głęboka architektura: 10 typów encji, 67 typizowanych relacji, nocna konsolidacja z decay zaufania do starych relacji.

Camp 2 to właściwa odpowiedź, gdy agent działa ciągle, gdy wiele narzędzi lub wiele agentów zapisuje do tej samej bazy wiedzy, albo gdy wymagana jest mierzalna poprawa przez tygodnie i miesiące bez przebudowywania pipeline'u za każdym razem.

Najprostszy test: czy agent musi wiedzieć, co wydarzyło się w ostatni wtorek, czy musi znać *kształt* danego biznesu w tej chwili? To drugie to problem dla Camp 2.

Rebrand, który mówi wszystko

Sygnał rynkowy jest tu dość wyraźny. Dwa publiczne ruchy, oba ze strony firm sprzedających pamięć, wyjaśniają, który obóz wygrywa.

Zep nazywał się kiedyś firmą memory. W 2026 roku zmienił to pozycjonowanie na context engineering. Finansowana firma w tej przestrzeni nie rebranduje się dla zabawy. Zrobiła to dlatego, że kupujący płacący najwięcej przestali pytać o pamięć i zaczęli pytać o kontekst, który się kumuluje.

Zilliz, firma stojąca za Milvus, wypuściła MemSearch. MemSearch to system, w którym pliki markdown są źródłem prawdy, a własna baza wektorowa Zilliz siedzi downstream jako warstwa dostępu. To firma zajmująca się bazami wektorowymi, która publicznie przyznaje, że markdown należy upstream względem wektorów.

Context engineering ma szanse stać się domyślnym terminem dla tej warstwy infrastruktury agentowej w ciągu najbliższego roku. Warto czytać strony produktów z tym podstawieniem w głowie, a rzeczywiste pozycjonowanie staje się oczywiste.

Jak ustalić, którego obozu faktycznie potrzeba

Oto framework decyzyjny sprowadzony do praktycznych reguł.

Camp 1 (Memory Backend) jest właściwy, gdy...	Camp 2 (Context Substrate) jest właściwy, gdy...
Agent to chatbot, którego użytkownicy oczekują zapamiętywania ich preferencji.	Agent działa ciągle lub przez wiele sesji nad tym samym zakresem pracy.
Wymagane jest przywoływanie faktów poniżej 200 ms z czystym SDK.	Wiele narzędzi lub wiele agentów zapisuje do tej samej bazy wiedzy.
Zadaniem jest odpowiadanie na pytania użytkowników, a nie stawanie się lepszym w pracy z czasem.	Wymagana jest mierzalna poprawa przez tygodnie i miesiące bez przebudowywania pipeline'u.
Baza danych zablokowana u dostawcy jest akceptowalnym źródłem prawdy.	Przenośność ma znaczenie. Substrat powinien przeżyć zmianę dostawcy.

Większość agentów biznesowych ląduje w Camp 2. Jeśli agent obsługuje badania sprzedażowe, obsługę klientów, operacje contentowe lub cokolwiek, gdzie wynik powinien się wyostrzać z czasem, Camp 1 jest co najwyżej komponentem, a nie całym systemem.

Kosztownym błędem jest odwrót tej sytuacji. Bot obsługi klienta zbudowany na ciężkim substracie Camp 2 będzie powolny i przebudowany. Obóz powinien być dopasowany do zadania, nie na odwrót.

Kryteria decyzji zakupowej

Trzy konkretne rekomendacje przed podpisaniem kontraktu.

Prototyp najpierw na markdownie. Zanim zostanie wybrany jakikolwiek produkt memory, warto przetestować przypadek użycia na prostym substracie markdown z warstwą pobierania. Jeśli ten prototyp rozwiązuje problem, Camp 1 nie był potrzebny.
Oceniaj dostawców pod kątem kumulowania, nie przywoływania. Benchmarki recall (LongMemEval i podobne) mówią o Camp 1. Nie mówią, czy system jest mądrzejszy w 12. tygodniu niż w 1. Warto zaprojektować ewaluacje, które mierzą to bezpośrednio.
Wybierz jedną ścieżkę zapisu. Jeśli Camp 1 i Camp 2 są łączone, należy zdecydować, która warstwa jest właścicielem zapisów. Dwa systemy z nakładającymi się zapisami to przepis na sprzeczne fakty, które korumpują się nawzajem.

Warstwa wiedzy AI to infrastruktura, na której to wszystko siedzi, a większość firm nie potrzebuje nowej bazy wektorowej, żeby ją zbudować. Potrzeba właściwego substratu, właściwego schematu i dyscypliny, żeby pozwolić mu się kumulować.

Jeśli planowana jest infrastruktura agentowa i potrzebna jest druga opinia przed podpisaniem umowy, webvise pomaga określić warstwy wiedzy agentów, które się kumulują. Warto skontaktować się przed wyborem obozu.

Praktyki webvise są zgodne z normami ISO 27001 i ISO 42001.