Open LLM модели GPT-OSS от OpenAI и не только

Август 2025 года ознаменовался выходом нескольких значимых обновлений и совершенно новых моделей в области искусственного интеллекта, которые обещают существенно изменить ландшафт ИИ. Anthropic, Google DeepMind и OpenAI представили свои последние достижения, демонстрируя прогресс в агентных задачах, генерации миров и открытых языковых моделях. Давайте рассмотрим эти релизы.

Открытые Модели GPT-OSS от OpenAI

OpenAI наконец-то открыли свои модели, выпустив GPT-OSSсемейство открытых моделей, предназначенных для мощного рассуждения, агентных задач и универсальных сценариев использования для разработчиков. В рамках этой серии представлены две модели:

  • gpt-oss-120b: Большая модель со 117 миллиардами общих параметров (и 5.1 миллиардами активных), предназначенная для производственных, общих и высокорассуждающих случаев использования, которая помещается на одной H100 GPU (80 ГБ).
  • gpt-oss-20b: Меньшая модель с 21 миллиардом общих параметров (и 3.6 миллиардами активных), предназначенная для снижения задержки, локального или специализированного использования, которая работает в пределах 16 ГБ памяти, идеально подходя для потребительского оборудования.

Читать далее

Что такое Llms.txt? Структура llms.txt файла

Что такое llms.txt файл

Llms.txt — это специальный текстовый файл , который позволяет сайтам быть более эффективно понятыми системами искусственного интеллекта и большими языковыми моделями. Файл размещается в корневой директории сайта и помогает ИИ-системам вроде ChatGPT, Google Gemini, Claude и Perplexity более точно обрабатывать контент.

Происхождение и цель

Формат llms.txt был предложен Джереми Ховардом в сентябре 2024 года как решение проблемы сложности HTML-структур для ИИ-систем. Веб-контент часто содержит сложные структуры, навигационные меню, рекламу и JavaScript, что затрудняет понимание содержимого языковыми моделями.

Читать далее

Retrieval-Augmented Generation (RAG): Последние Исследования и Вызовы

В современном мире AI-технологий Retrieval-Augmented Generation (RAG) становится все более значимым подходом, сочетающим возможности информационного поиска с генеративными способностями больших языковых моделей (LLM). Это позволяет преодолеть ряд ограничений, с которыми сталкиваются традиционные LLM, и обеспечить более точные и основанные на фактах ответы.

Что такое RAG?

RAG — это не отдельная технология, а целый «зонтик» различных компонентов, дизайнерских решений и адаптаций для конкретных доменов. Типичная RAG-система включает:

  1. Компонент приема данных: где данные обрабатываются, встраиваются и сохраняются как контекстные документы в векторной базе данных
  2. Компонент извлечения: где контекстные документы извлекаются и ранжируются по релевантности запросу
  3. Компонент запроса: где промпт с запросом комбинируется с результатами поиска и отправляется в LLM

Читать далее

Как ускорить LLM и снизить затраты. Edge модели

RouteLLM снижает ваши расходы на использование LLM в 3,6 раз.

Он выбирает, использовать ли сильную или слабую модель LLM, в зависимости от сложности пользовательского запроса. Это оптимизирует баланс между стоимостью и качеством ответа.

Библиотека на Python позволяет использовать этот подход напрямую.

import os
from routellm.controller import Controller

os.environ["OPENAI_API_KEY"] = "sk-XXXXXX"
# Replace with your model provider, we use Anyscale's Mixtral here.
os.environ["ANYSCALE_API_KEY"] = "esecret_XXXXXX"

client = Controller(
  routers=["mf"],
  strong_model="gpt-4-1106-preview",
  weak_model="anyscale/mistralai/Mixtral-8x7B-Instruct-v0.1",
)

Читать далее

Курс Управление AI и ML продуктами

AI и машинное обучение внедряются повсюду. Это мощная тенденция, трансформирующая цифровые продукты сегодня. Если вы хотите оставаться конкурентоспособными на рынке будущего, вам нужно научиться работать с AI.

Алгоритмы машинного обучения могут использоваться для выявления аномалий на медицинских изображениях, для распознавания лиц и в других областях. Машинное обучение также активно используется в рекомендательных системах, чат-ботах и беспилотных автомобилях.

По мере распространения и внедрения машинного обучения в компаниях, потребность в управлении продуктом компетентными в AI менеджерами будет неуклонно расти.

Уровень подготовки: Начинающий 🟢 ⚪ ⚪

Алимбеков Ренат

Руководитель в сфере анализа больших данных и машинном обучении. Проектирует и разрабатывает AI сервисы Участвовал в запуске ряда успешных продуктов сфере MedTech и биометрии 🚀

Опыт работы в Fintech, MedTech, AdTech и EduTech направлениях 👩‍💻

Читать далее