Магазин
О сервисе
Услуги
Конкурсы
Авторам
Новости
Акции
Помощь
8 800 500 11 67
RUB
Сменить валюту
Войти
Поиск
Все книги
Импринты
Бестселлеры
Бесплатные
Скидки
Подборки
Книги людям
18+
Все
Информационные технологии
Информационные технологии: общее
Оглавление - Инжиниринг искусственного интеллекта
Книги 1—2
Сергей Дегтев
Электронная
396 ₽
Печатная
2 285 ₽
Читать фрагмент
Купить
Объем: 480 бумажных стр.
Формат: epub, fb2, pdfRead, mobi
Подробнее
0.0
0
Оценить
Пожаловаться
О книге
отзывы
Оглавление
Читать фрагмент
Аннотация
Инжиниринг искусственного интеллекта
СТАРТОВАЯ КАРТА
ВАЖНОЕ ПРЕДУПРЕЖДЕНИЕ ДЛЯ ЧИТАТЕЛЯ
ОБРАТИТЕ ВНИМАНИЕ
КНИГА 1. Инженерия LLM: от токена до двойника
ПРЕДИСЛОВИЕ
ВВЕДЕНИЕ
ГЛАВА 1. КАК РАБОТАЕТ ГЕНЕРАТИВНАЯ ЯЗЫКОВАЯ МОДЕЛЬ: ОТ ЗАПРОСА К ОТВЕТУ
1.1 Токен
1.2 Эмбеддинги
1.3 Позиционное кодирование (Positional Encoding)
1.4 Механизм самовнимания (Self-Attention)
1.5 Трансформерные блоки (Transformer Blocks)
1.6 Выходной слой и генерация
1.7 Галлюцинации: когда модель уверенно врёт
1.8 RAG: как модель не выдумывает факты
РЕЗЮМЕ ГЛАВЫ 1
Вопросы для самопроверки
ГЛАВА 2. ТИПЫ АРХИТЕКТУР НЕЙРОСЕТЕЙ
2.1 CNN Convolutional Neural Network / Свёрточная нейросеть
2.2 RNN (Recurrent Neural Network / Рекуррентная нейросеть)
2.3 LSTM (Long Short-Term Memory / Долгая краткосрочная память)
2.4 GRU (Gated Recurrent Unit / Рекуррентный блок с вентилями)
2.5 Трансформер (Transformer)
2.6 MoE (Mixture of Experts / Коллектив экспертов)
2.7 Diffusion Models (Диффузионные модели)
2.8 За рамками текста: как трансформеры научились видеть
РЕЗЮМЕ ГЛАВЫ 2
Вопросы для самопроверки
ГЛАВА 3. ОБУЧЕНИЕ МОДЕЛЕЙ
3.1 Pre-training (Предварительное обучение)
3.2 SFT — Supervised Fine-Tuning (Дообучение с учителем)
3.3 RLHF — Reinforcement Learning from Human Feedback (Обучение с подкреплением на основе обратной связи от человека)
3.4 Этика и «красные линии»: чью мораль вшивают в модель?
РЕЗЮМЕ ГЛАВЫ 3
Вопросы для самопроверки
ГЛАВА 4. КЛЮЧЕВЫЕ ОПТИМИЗАЦИИ СОВРЕМЕННЫХ МОДЕЛЕЙ
4.1 KV-Cache (Кэш ключей и значений)
4.2 GQA — Grouped Query Attention (Групповое внимание по запросам)
4.3 MLA — Multi-head Latent Attention (Латентное многоголовое внимание)
4.4 MTP — Multi-Token Prediction (Предсказание нескольких токенов)
4.5 Sliding Window Attention (Внимание со скользящим окном)
4.6 Sparse Attention (Разреженное внимание)
4.7 Квантизация: как сжать модель без убийства качества
4.8 FlashAttention: как ускорить внимание без потери качества
РЕЗЮМЕ К ГЛАВЕ 4
Вопросы для самопроверки
ГЛАВА 5. КАК ВЫБИРАТЬ МОДЕЛИ И ПОДРУЖИТЬ ИХ С ВАШИМИ ДАННЫМИ
5.1 СРАВНЕНИЕ СОВРЕМЕННЫХ (2024—2025) МОДЕЛЕЙ
5.2 Выводы: как выбирать модель
5.3 TCO: сколько на самом деле стоит владение моделью?
5.4 Вычислительная инфраструктура: почему LLM «едят» память, а не процессор
5.5 MLOps: как превратить модель в работающий сервис
5.6 Безопасность LLM: как не выпустить джинна из бутылки
РЕЗЮМЕ К ГЛАВЕ 5
Вопросы для самопроверки
ГЛАВА 6. ПЕРСПЕКТИВНЫЕ АРХИТЕКТУРЫ: ОТ МОНОЛИТА К ОРКЕСТРУ
6.1 Проблема одной модели
6.2 Роутинг моделей (Model Routing)
6.3 Аналогия с микросервисной архитектурой
6.4 Единая шина для обмена контекстом
6.5 RLM — Recursive Language Models (Рекурсивные языковые модели)
6.6 Агентные системы
6.7 Переключение по длине контекста
6.8 DWH (Data Warehouse) и ИИ: как подружить бухгалтера и художника
РЕЗЮМЕ К ГЛАВЕ 6
Вопросы для самопроверки
ГЛАВА 7. ЦИФРОВОЙ ДВОЙНИК ЧЕЛОВЕКА: ЕДИНОЕ ОКНО В ЦИФРОВОЙ МИР
7.1 Проблема: человек как узкое горлышко
7.2 Идея: цифровой двойник как единое окно
7.3 Архитектура двойника (три уровня)
7.4 Сценарий: утро с двойником
7.5 Техническая архитектура
7.6 Проблемы и прогноз
РЕЗЮМЕ К ГЛАВЕ 7
Вопросы для самопроверки
ЧТО ДЕЛАТЬ ДАЛЬШЕ?
ПРИЛОЖЕНИЯ
1. КАК ТРАНСФОРМЕР ПОНИМАЕТ НАЧАЛО
2. КЛЮЧЕВЫЕ МЫСЛИ КНИГИ 1
3. ИСТОРИЯ РАЗВИТИЯ НЕЙРОСЕТЕЙ: ОТ МЕЧТЫ К ПОВСЕДНЕВНОСТИ
4. МНОГОЯЗЫЧНЫЕ МОДЕЛИ: КАК ОДИН ТРАНСФОРМЕР МОЖЕТ ГОВОРИТЬ НА ВСЕХ ЯЗЫКАХ
5. ПРАКТИЧЕСКИЕ ПРИМЕРЫ: (псевдо-) КОД И ИНСТРУКЦИИ
6. ГЛУБИННЫЕ ВОПРОСЫ: то, что осталось за кадром
ГЛОССАРИЙ
ЗАКЛЮЧЕНИЕ
КНИГА 2. От инструмента к двойнику: экономика, тестирование и границы ИИ
ВВЕДЕНИЕ
ГЛАВА А. AI-АГЕНТЫ: ОТ ПРОТОТИПА К PRODUCTION
А.1 Определение и эволюция: LLM vs AI, Agent vs Workflow
А.2 Архитектурные паттерны агентов
А.3 Инструментарий разработчика
А.4 Управление состоянием и памятью
А.5 Надежность, безопасность и будущее агентов (сводная глава)
РЕЗЮМЕ К ГЛАВЕ А
Вопросы для самопроверки
ГЛАВА Б. ИНЖЕНЕРНЫЙ АРСЕНАЛ LLM: ОТ КВАНТИЗАЦИИ ДО ДАТАСЕТОВ
Б.1 Квантизация и сжатие моделей
Б.2 Распределённый тренинг
Б.3 Системы RAG (Retrieval-Augmented Generation)
Б.4 Промпт-инжиниринг и структурированные выходы
Б.5 Оценка и бенчмаркинг LLM
Б.6 Fine — tuning на практике
Б.7 Инференс и сервинг
Б.8 Модальности: мультимодальные модели
Б.9 Безопасность и выравнивание (Alignment)
Б.10 Инжиниринг данных для LLM
Б.11 No — code / low — code платформы для оркестрации ИИ
РЕЗЮМЕ К ГЛАВЕ Б
Вопросы для самопроверки
ГЛАВА В. КАРТА КОМПЕТЕНЦИЙ AI-ПРОДАКТА
B.1 Природа ИИ (Ментальная модель)
B.2 Технический цикл жизни модели (MLLC): Почему код — это не главное
B.3 Техническая грамотность (без углубления в код)
B.4 Безопасность, право и этика
B.5 Бизнес и управление изменениями
B.6 Управление ИИ-продуктом (AI PDLC): Как организовать команду и процесс
B.7 Ключевые метрики успеха AI-проекта (KPI для продакта)
B.8 Чек-лист готовности AI-продукта к продакшену
РЕЗЮМЕ К ГЛАВЕ B (для продакта и тимлида)
Вопросы для самопроверки
ГЛАВА Г. МУЛЬТИМОДАЛЬНЫЕ МОДЕЛИ: КОГДА LLM ВИДИТ И СЛЫШИТ
Г.1 Проблема: текст — это только вершина айсберга
Г.2 От текста к картинкам: Vision Transformer (ViT)
Г.3 CLIP: как научить модель понимать, что на картинке
Г.4 Как устроены мультимодальные LLM (LLaVA, GPT-4V, Gemini)
Г.5 Глубже: как модели понимают видео и аудио
Г.6 Практические возможности и ограничения
Г.7 Риски и безопасность мультимодальных моделей
Г.8 Архитектурные паттерны для мультимодальных приложений
Г.9 Будущее мультимодальных моделей
РЕЗЮМЕ К ГЛАВЕ Г (для инженера)
Вопросы для самопроверки
ГЛАВА Д. ГОЛОСОВЫЕ АССИСТЕНТЫ: ASR, TTS И КОНВЕЙЕРЫ
Д.1 Чем голосовой ассистент отличается от чат-бота
Д.2 ASR: как компьютер слышит
Д.3 От ASR к пониманию: NLU для голоса
Д.4 TTS: как компьютер говорит
Д.5 Единые мультимодальные модели: конвейер уходит в прошлое?
Д.6 Латентность и интерактивность: почему 5 секунд — это много
Д.7 Практические рекомендации для инженера
Д.8 Будущее голосовых ассистентов
РЕЗЮМЕ К ГЛАВЕ Д
Вопросы для самопроверки
ГЛАВА Е. КАК ТЕСТИРОВАТЬ ТО, ЧТО НЕЛЬЗЯ ЗААССЕРТИТЬ
Е.1 Проблема: нейросеть не возвращает 2+2
Е.2 Три слоя тестирования (Пирамида для LLM)
Е.3 LLM-as-a-Judge: когда модель проверяет модель
Е.4 Метрики надежности: как измерить «качество агента»
Е.5 Регрессионное тестирование: библиотека nightmare
РЕЗЮМЕ К ГЛАВЕ Е
Вопросы для самопроверки
ГЛАВА Ж. ЦИФРОВАЯ ЛОВУШКА: КАК ИИ УГЛУБЛЯЕТ САМООБМАН
Ж.1 Проблема: зеркало, которое льстит
Ж.2 Механизм самообмана: пошаговая анатомия
Ж.3 Подмена реальности: как ИИ становится соучастником
Ж.4 «А если я пошутил?» Почему модель не отличает комплимент от насмешки
Ж.5 Почему это особенно опасно с ИИ
Ж.6 Что делают ответственные модели, чтобы этого избежать?
Ж.7 Практический кейс: как выглядит честный диалог
Ж.8 Что это значит для инженера (строящего такие системы)
Ж.9 Что это значит для пользователя (читающего книгу)
Ж.10 Границы и ограничения: что эта глава НЕ утверждает
РЕЗЮМЕ К ГЛАВЕ Ж
Вопросы для самопроверки
РЕЗЮМЕ КНИГИ 2. 20 ГЛАВНЫХ ИДЕЙ
БЛОК А. АГЕНТЫ
БЛОК Б. ИНЖЕНЕРНЫЙ АРСЕНАЛ
БЛОК В. КАРТА КОМПЕТЕНЦИЙ AI-ПРОДАКТА
БЛОК Г. МУЛЬТИМОДАЛЬНЫЕ МОДЕЛИ
БЛОК Д. ГОЛОСОВЫЕ АССИСТЕНТЫ
БЛОК Е. ТЕСТИРОВАНИЕ И ЭВАЛЮАЦИЯ
ЭТИКА И ПОСЛЕСЛОВИЕ
ПРИЛОЖЕНИЯ
1. ЕСЛИ ЕСТЬ ТОЛЬКО 10—20 МИНУТ, ТО…
2. КАК ОТЛИЧИТЬ ТЕКСТ, СГЕНЕРИРОВАННЫЙ LLM, ОТ ЧЕЛОВЕЧЕСКОГО
3. ГЛУБИННЫЕ ВОПРОСЫ ЮРИСТА: КТО ОТВЕЧАЕТ, КОГДА ИИ ОШИБАЕТСЯ
4. КАК ВНЕДРИТЬ LLM В БИЗНЕСЕ: ЧЕК-ЛИСТ ДЛЯ ДИРЕКТОРА ПРОЕКТА
5. ENTERPRISE-ПЛАТФОРМЫ ДЛЯ ИИ: ГОТОВЫЙ «МОЗГ ПОД КЛЮЧ»
6. EDGE LLM: КОГДА ИИ ЖИВЁТ У ВАС В КАРМАНЕ
ГЛОССАРИЙ
ЗАКЛЮЧЕНИЕ
ПОСЛЕСЛОВИЕ. ЛИЦЕНЗИЯ НА ИИ: ОТ УТОПИИ К НЕИЗБЕЖНОСТИ