Как работают нейросети (LLM): просто и без формул
Как работают нейросети простыми словами: токены, контекстное окно и предсказание следующего кусочка — три идеи, которые объясняют вообще всё.
Большая языковая модель предсказывает самый подходящий следующий кусочек текста, выучив закономерности на огромном срезе того, что написали люди. Вот и весь движок. Мощь появилась из масштаба, а не из какой-то тайной искры.
Что такое токены и контекстное окно?
Две механики объясняют все её причуды: она читает токенами (кусочками, а не буквами) и может рассуждать только над тем, что есть в её текущем контекстном окне (это её рабочий стол). Новый чат — стол вытерт начисто.
Как нейросеть работает в ChatGPT и Claude?
ChatGPT и Claude — это дружелюбные интерфейсы, обёрнутые вокруг LLM. Каждый раз, когда ты отправляешь сообщение, вся видимая переписка упаковывается в контекстное окно, и модель предсказывает ответ — кусочек за кусочком. Поэтому длинные чаты «плывут» (старые детали падают со стола), и поэтому новый чат — это каждый раз знакомство с моделью заново.

Автор
Евгений Арсентьев
PhD · Директор по продукту (CPO) в healthtech-компании
▌ Чтение — это синяя пилюля
Хочешь реально это построить?
Гайды объясняют. Бесплатный курс превращает — персонально, с геймификацией и заточенный на быстрый запуск.
◉ Принять красную пилюлю →