Попробуйте прямо сейчас. Откройте браузер, напишите ассистенту: «Меня зовут [ваше имя]». Закройте вкладку. Откройте снова. Спросите: «Как меня зовут?»
Он не знает.
Не потому что плохой. Потому что каждый запрос к языковой модели — отдельный. Изолированный. Модель не хранит предыдущие сообщения. Для неё каждый разговор начинается с чистого листа.
Это как звонок в банк где каждый раз другой оператор. Вы снова называете имя, номер договора, объясняете по какому вопросу. Оператор вежлив и профессионален — но ничего не знает о прошлых звонках.
Именно так работает ваш ассистент без памяти.
Решение простое: передавать весь диалог с каждым новым запросом. Модель видит всю цепочку — и отвечает в контексте.
Запрос 1: [системный промпт] + [вопрос 1] Запрос 2: [системный промпт] + [вопрос 1] + [ответ 1] + [вопрос 2] Запрос 3: … + [вопрос 2] + [ответ 2] + [вопрос 3]
С каждым сообщением цепочка растёт — ассистент помнит что вы говорили раньше.
У языковой модели есть контекстное окно — лимит на сколько текста она может обработать за раз. Передавать весь разговор за год невозможно.
Поэтому берём последние 10 сообщений — это примерно пять ваших вопросов и пять ответов ассистента. Достаточно чтобы держать нить разговора, но не перегружать запрос. Для большинства задач этого хватает — человек обычно ориентируется на последние несколько реплик, не на разговор недельной давности.
В localStorage — хранилище вашего браузера. Это не облако — данные живут именно в этом браузере на этом устройстве. Не теряются при закрытии вкладки или перезагрузке страницы, но существуют только здесь.
Ограничение одно: откроете на другом устройстве — там новый разговор, потому что localStorage телефона и компьютера не связаны между собой.
За пять дней вы собрали рабочего ассистента. Это факт. И у него есть границы — важно их понимать:
Это граница того, что имеет смысл объяснять за пять вечеров. За этой границей — следующий шаг.
История сообщений — массив пар «вопрос / ответ», который передаётся в каждый запрос к модели. Даёт ассистенту контекст разговора.
Контекстное окно — лимит токенов за один запрос. Поэтому берём не весь разговор, а последние N сообщений.
localStorage — хранилище браузера. Данные не теряются при закрытии вкладки, но привязаны к одному устройству.
За пять дней вы собрали ассистента с нуля: страница, языковая модель, системный промпт, чат-интерфейс, память. Каждый из этих шагов — одним промптом к WorkAI.
В видео — последний кусок: подключаем память и смотрим как ассистент начинает помнить разговор. В задании — закрепляете и показываете результат.
После сдачи задания платформа покажет итог марафона и что можно сделать дальше.
У всех разные задачи — поэтому ограничения бьют по-разному. Напишите в комментариях: из трёх — работает только в браузере, не читает файлы, не делает действия — какое мешает для вашей задачи больше всего?