Как llms.txt увеличил трафик с AI-чатов на 23%

Четыре месяца назад я добавил на блог файлы llms.txt и llms-full.txt. Пора посмотреть, что это дало в цифрах.

Коротко о llms.txt

Это robots.txt для языковых моделей. Файл в корне сайта помогает AI-системам — ChatGPT, Perplexity, Claude, Gemini — лучше понимать структуру и содержание контента. Подробнее писал в отдельном посте.

Методология

Сравнил два периода по 4 месяца:

ПериодДатыСтатус
До18 марта — 17 июля 2024без llms.txt
После18 июля — 18 ноября 2024с llms.txt

Источник — Яндекс.Метрика, отчёт «Переходы по ссылкам на сайтах».

Отфильтровал домены AI-чатов: chatgpt.com, perplexity.ai, chat.deepseek.com, gemini.google.com, chat.qwen.ai, copilot.microsoft.com, alice.yandex.ru.

Читать далее

Pandas для Data Science

Этой заметкой открываю серию статей для начинающих вкатываться в Data Sciеnce и Machine Learning и начнем мы с изучения Pandas. В интернете много статей по Pandas, поэтому хотел бы в этой заметки описать практические приемы для работы с Pandas в Data Sciеnce проектах и для построения моделей.

В качестве датасета будем использовать German Credit Risk на Kaggle

Датасет содержит информацию о кредитных данных:

  • Age (возраст)
  • Sex (пол)
  • Job (работа)
  • Housing (тип жилья)
  • Saving accounts (сберегательные счета)
  • Checking account (расчетный счет)
  • Credit amount (сумма кредита)
  • Duration (продолжительность кредита)
  • Purpose (цель кредита)
Pandas для Data Science

Читать далее

Способы регистрации обращений клиентов

Наиболее предпочтительным для пользователей и наиболее быстрым способом регистрации обращений является телефонная связь, рассмотрим 2 метода организации приема и маршрутизации обращений, поступающих посредством телефонных звонков.

Суть первого метода заключается в регистрации и разрешении 70% обращений без маршрутизации (эскалации) на вторую линию, при обеспечении максимальной доступности операторов и полноты информации, необходимой для обработки обращений на второй линии.

Для реализации данного метода необходимо наличие на первой линии высококвалифицированных специалистов, способных разрешать поступающие обращения с высокой скоростью. Для определения необходимого количества операторов первой линии применялись расчеты методом Эрланга (данный метод позволяет определить количество операторов с учетом пиковых нагрузок).

Читать далее

Расчет Monthly Recurring Revenue (MRR) в Python

Что такое Monthly Recurring Revenue?

Monthly Recurring Revenue — регулярный месячный доход. Эта метрика применяется в основном в подписных моделях. При этом сам доход нужно привести к месяцам.

Почему это ценно?

Если у нас есть подписной сервис мы имеем регулярныее или периодические платежи, то мы можем понять сколько денег мы заработаем и насколько наш бизнес эффективен. Далее, мы можем увеличить MRR за счет перехода клиентов на более дорогой тариф или попробовать снизить отток клиентов.

Читать далее

Когортный анализ в Python

Когортный анализ
Когортный анализ

Что такое когортный анализ?

Когортный анализ заключается в исследовании характеристик когорт/винтажей/поколений, объединенных по общим временным признакам.

Когорта/винтаж/поколение — это группа, сформированная особым образом по временному признаку: например, месяцу регистрации, месяцу первой транзакции или первого посещения сайта. Когорты очень похожи на сегменты с тем отличием, что когорта объединяет группы определенного промежутка времени, в то время как сегмент может быть основан на любых других характеристиках.

Почему это ценно?

Такой анализ может быть полезен, когда речь заходит о понимании здоровья вашего бизнеса и «липкости» — лояльности ваших клиентов. «Липкость» имеет решающее значение, так как гораздо дешевле и проще удерживать клиента, чем приобретать новых. Кроме того, ваш продукт развивается с течением времени. Новые функции добавляются и удаляются, изменяется дизайн и т. д. Наблюдение отдельных групп с течением времени является отправной точкой для понимания того, как эти изменения влияют на поведение пользователя/группы.

Читать далее