Инструкция

Как создать llms.txt для сайта на 1С-Битрикс

Пошаговая инструкция по созданию и размещению файла llms.txt на сайте под управлением 1С-Битрикс. llms.txt — предложенный стандарт, который помогает AI-системам (ChatGPT, Perplexity, Claude) быстро находить ключевой контент сайта. Разбираю формат файла по спецификации, особенности размещения в корне Битрикса, автоматическую генерацию через PHP и проверку результата.

llms.txt — предложенный в 2024 году стандарт для размещения в корне сайта файла в формате Markdown, который помогает AI-системам быстро находить и понимать ключевой контент. Файл работает как структурированная карта сайта, оптимизированная для LLM: вместо того чтобы парсить сложный HTML с навигацией, скриптами и рекламой, нейросеть получает чистый Markdown с описанием сайта и ссылками на важные страницы.

В этом туториале я покажу, как создать llms.txt для сайта на 1С-Битрикс — от структуры файла до автоматической генерации через PHP. Весь процесс занимает 30–60 минут.

Что получится в итоге

После выполнения всех шагов по адресу https://your-site.ru/llms.txt будет доступен файл в формате Markdown, содержащий описание сайта, ссылки на ключевые страницы и экспертные материалы. AI-системы (ChatGPT, Perplexity, Claude, Gemini) смогут использовать этот файл для быстрого понимания структуры и содержания сайта при формировании ответов.

Пример файла llms.txt, открытого в браузере по адресу site.ru/llms.txt
Готовый llms.txt доступен по прямому URL и содержит структурированное описание сайта

Что понадобится

  • Доступ к файловой системе сайта (FTP, SSH или файловый менеджер в админке Битрикса)
  • Сайт на 1С-Битрикс любой редакции (Старт, Стандарт, Малый бизнес, Бизнес)
  • Понимание структуры своего сайта: какие разделы и страницы наиболее важны
  • Текстовый редактор (VS Code, Notepad++, или встроенный редактор Битрикса)

Шаг 1. Определите ключевые страницы сайта

Прежде чем создавать файл, нужно решить, какие страницы включить. llms.txt — не sitemap. Цель — не перечислить все URL, а показать AI-системе самый важный контент.

Какие страницы включать:

  • Страница «О компании» — кто вы, чем занимаетесь, в чём экспертиза
  • Ключевые услуги или товарные категории — не весь каталог, а 3–10 самых важных страниц
  • Экспертные материалы — pillar-гайды, ключевые статьи блога, исследования
  • Глоссарий (если есть) — определения терминов идеально подходят для цитирования AI
  • Контакты — для локального бизнеса
  • Документация / FAQ — если это SaaS или техпродукт

Какие страницы не включать:

  • Технические страницы (корзина, личный кабинет, страницы авторизации)
  • Страницы с noindex
  • Устаревший контент, который планируете удалить
  • Все страницы каталога — сотни товарных карточек перегрузят файл

Составьте список из 10–30 URL. Для небольшого сайта хватит 10–15, для крупного портала — до 30.

Шаг 2. Создайте файл llms.txt по спецификации

Формат файла определён спецификацией на llmstxt.org. Файл пишется на Markdown и имеет строгую структуру.

Обязательные элементы

  • H1 (заголовок) — название сайта или проекта. Единственный обязательный элемент
  • Blockquote — краткое описание (1–3 предложения): что делает компания, в чём ключевая экспертиза

Опциональные элементы

  • Текст после blockquote — дополнительная информация, особенности, ограничения
  • Секции с H2 — группы ссылок на страницы сайта. Каждая ссылка — в формате Markdown: [Название](URL): Описание
  • Секция ## Optional — особая секция. Ссылки из неё можно пропустить, если контекстное окно LLM ограничено

Шаблон llms.txt для типового сайта компании

# Название компании

> Краткое описание: чем занимается компания,
> ключевая экспертиза, основная аудитория.

Дополнительная информация: стек технологий,
география, год основания, ключевые отличия.

## Основные страницы

- [О компании](https://site.ru/about/): Кто мы, команда, миссия
- [Услуги](https://site.ru/services/): Полный список услуг с описанием
- [Контакты](https://site.ru/contacts/): Адрес, телефон, форма связи

## Экспертные материалы

- [Название гайда](https://site.ru/guides/slug/): Краткое описание
- [Название статьи](https://site.ru/blog/slug/): Краткое описание

## Глоссарий

- [Термин 1](https://site.ru/glossary/term-1/): Определение
- [Термин 2](https://site.ru/glossary/term-2/): Определение

## Optional

- [Блог](https://site.ru/blog/): Все статьи блога
- [Портфолио](https://site.ru/portfolio/): Примеры работ

Пример для реального сайта

Вот как выглядит llms.txt для сайта веб-студии:

# m.ai — веб-разработка, усиленная маркетингом и AI

> m.ai — IT-компания, которая создаёт сайты,
> которые окупаются. Соединяем веб-разработку,
> маркетинговую аналитику и AI для поиска
> точек роста в бизнесе клиентов.

Основатель — Валентина Меланина (15 лет в маркетинге,
MBA, опыт в Data Science и веб-разработке).
Стек: Astro, 1С-Битрикс, headless CMS.
Работа с клиентами из РФ и СНГ.

## Услуги

- [Разработка сайтов](https://melanina.ru/services/web-dev/): Корпоративные сайты, каталоги, лендинги на Astro и 1С-Битрикс
- [UX-аудит](https://melanina.ru/services/ux-audit/): Поиск точек потерь конверсии с рекомендациями
- [Маркетинговая аналитика](https://melanina.ru/services/analytics/): GA4, Метрика, атрибуция, A/B-тесты

## Гайды

- [Оптимизация сайта под AI-поиск](https://melanina.ru/guides/optimizaciya-sajta-pod-ai-poisk/): Полное руководство по GEO
- [Schema.org для AI-поиска](https://melanina.ru/guides/schema-org-ai-poisk/): Структурированные данные для цитирования нейросетями

## Глоссарий

- [GEO](https://melanina.ru/glossary/geo/): Generative Engine Optimization — оптимизация контента под генеративные поисковые системы
- [llms.txt](https://melanina.ru/glossary/llms-txt/): Стандарт файла для взаимодействия сайта с LLM
- [ЭПОС](https://melanina.ru/glossary/epos/): Критерии Яндекса для отбора страниц в нейроответы Алисы AI

## Optional

- [Блог](https://melanina.ru/blog/): Статьи по разработке, маркетингу и аналитике
- [О Валентине Меланиной](https://melanina.ru/about/): Опыт, образование, подход к работе

Обратите внимание: каждая ссылка содержит краткое описание после двоеточия. Это помогает AI-системе понять содержание страницы, не переходя по ссылке.

Шаг 3. Разместите файл в корне сайта на 1С-Битрикс

Файл llms.txt должен быть доступен по адресу https://your-site.ru/llms.txt. В 1С-Битрикс есть особенность: система обработки адресов (urlrewrite) перехватывает все запросы к несуществующим файлам. Но если файл физически существует в корне — Apache отдаёт его напрямую, минуя Битрикс.

Это определяется правилом в .htaccess:

RewriteCond %{REQUEST_FILENAME} !-f

Условие !-f означает: «если файл НЕ существует физически». Если файл есть — правило не срабатывает, и веб-сервер отдаёт файл как есть. Размещение llms.txt в корне Битрикса работает из коробки — никаких дополнительных настроек urlrewrite или .htaccess не нужно.

Способ А: через файловый менеджер Битрикса

  1. Откройте админку: Контент → Структура сайта → Файлы и папки
  2. Перейдите в корень сайта (папка /)
  3. Нажмите «Создать файл»
  4. Имя файла: llms.txt
  5. Тип файла: выберите «Текстовый файл» (не PHP-страницу)
  6. Вставьте содержимое файла из шага 2
  7. Сохраните

Важно: в Битриксе при создании файла через админку может добавляться PHP-обёртка с подключением ядра. Убедитесь, что файл содержит только текст Markdown без PHP-кода. Если файловый менеджер добавляет PHP-код автоматически — используйте FTP/SSH.

Способ Б: через FTP или SSH

  1. Подключитесь к серверу по FTP (FileZilla, WinSCP) или SSH
  2. Перейдите в корень сайта (обычно /home/bitrix/www/ или /public_html/)
  3. Загрузите файл llms.txt с содержимым из шага 2
  4. Проверьте права: файл должен иметь права 644 (чтение для всех)

Способ В: через SSH одной командой

# Подключитесь к серверу
ssh user@your-server.ru

# Перейдите в корень сайта
cd /home/bitrix/www/

# Создайте файл
cat > llms.txt << 'EOF'
# Название компании

> Краткое описание компании.

## Основные страницы

- [О компании](https://site.ru/about/): Описание
EOF

# Проверьте права
chmod 644 llms.txt

Шаг 4. Проверьте доступность файла

После размещения выполните три проверки:

Проверка 1: браузер

Откройте https://your-site.ru/llms.txt в браузере. Вы должны увидеть текст файла в формате Markdown. Если вместо этого открывается страница 404 Битрикса — файл не найден в корне. Если открывается PHP-страница с шаблоном сайта — файл был создан как PHP, а не как текстовый.

Проверка 2: curl

curl -I https://your-site.ru/llms.txt

В ответе должно быть:

HTTP/2 200
content-type: text/plain

Если content-type отличается (например, text/html) — веб-сервер неправильно определяет MIME-тип. Добавьте в .htaccess:

<FilesMatch "llms\.txt$">
  ForceType text/plain
</FilesMatch>

Проверка 3: валидатор

Проверьте структуру файла на соответствие спецификации. Убедитесь в наличии обязательного H1, корректности Markdown-разметки и формата ссылок.

Шаг 5. Настройте автоматическую генерацию (опционально)

Для сайтов с динамическим контентом (блог, каталог, глоссарий) имеет смысл генерировать llms.txt автоматически — чтобы новые материалы попадали в файл без ручного обновления.

PHP-скрипт для автогенерации из инфоблоков

Создайте файл /home/bitrix/www/llms_generate.php:

<?php
require_once($_SERVER['DOCUMENT_ROOT']
    . '/bitrix/modules/main/include/prolog_before.php');

use Bitrix\Main\Loader;
Loader::includeModule('iblock');

$siteUrl = 'https://site.ru';
$output  = "";

// === Заголовок и описание ===
$output .= "# Название компании\n\n";
$output .= "> Краткое описание компании\n";
$output .= "> и её ключевой экспертизы.\n\n";

// === Статические страницы ===
$output .= "## Основные страницы\n\n";
$output .= "- [О компании]({$siteUrl}/about/): "
    . "Команда, экспертиза, подход\n";
$output .= "- [Услуги]({$siteUrl}/services/): "
    . "Разработка, аналитика, AI\n";
$output .= "- [Контакты]({$siteUrl}/contacts/): "
    . "Адрес, телефон, форма связи\n\n";

// === Гайды из инфоблока ===
$output .= "## Экспертные материалы\n\n";

$res = CIBlockElement::GetList(
    ['SORT' => 'ASC', 'DATE_CREATE' => 'DESC'],
    [
        'IBLOCK_ID' => 5,  // ID инфоблока гайдов
        'ACTIVE'    => 'Y',
    ],
    false,
    ['nTopCount' => 20],
    ['ID', 'NAME', 'CODE', 'PREVIEW_TEXT']
);
while ($item = $res->Fetch()) {
    $url  = $siteUrl . '/guides/' . $item['CODE'] . '/';
    $desc = mb_substr(
        strip_tags($item['PREVIEW_TEXT']), 0, 120
    );
    $output .= "- [{$item['NAME']}]({$url}): {$desc}\n";
}

// === Глоссарий из инфоблока ===
$output .= "\n## Глоссарий\n\n";

$res2 = CIBlockElement::GetList(
    ['NAME' => 'ASC'],
    [
        'IBLOCK_ID' => 6,  // ID инфоблока глоссария
        'ACTIVE'    => 'Y',
    ],
    false,
    ['nTopCount' => 30],
    ['ID', 'NAME', 'CODE', 'PREVIEW_TEXT']
);
while ($item = $res2->Fetch()) {
    $url  = $siteUrl . '/glossary/' . $item['CODE'] . '/';
    $desc = mb_substr(
        strip_tags($item['PREVIEW_TEXT']), 0, 120
    );
    $output .= "- [{$item['NAME']}]({$url}): {$desc}\n";
}

// === Optional ===
$output .= "\n## Optional\n\n";
$output .= "- [Блог]({$siteUrl}/blog/): Все статьи\n";

// === Сохраняем файл ===
file_put_contents(
    $_SERVER['DOCUMENT_ROOT'] . '/llms.txt',
    $output
);

echo "llms.txt updated: " . date('Y-m-d H:i:s')
    . " | Size: " . strlen($output) . " bytes\n";
?>

Замените ID инфоблоков (5 и 6 в примере) на ваши. ID инфоблока можно посмотреть в админке: Контент → Инфоблоки → Типы инфоблоков.

Настройка автозапуска через cron

Добавьте задание в cron для периодического обновления:

# Обновлять llms.txt раз в сутки в 3:00
0 3 * * * /usr/bin/php /home/bitrix/www/llms_generate.php

Частота обновления зависит от того, как часто меняется контент. Для большинства сайтов достаточно одного раза в сутки. Для новостных — каждые 4–6 часов.

Важно: скрипт llms_generate.php не должен быть доступен извне. После настройки cron ограничьте доступ через .htaccess или переместите файл за пределы document root.

Шаг 6. Добавьте ссылку на llms.txt в robots.txt (рекомендация)

Хотя спецификация не требует этого, полезно указать ссылку на llms.txt в robots.txt — по аналогии с тем, как указывается sitemap:

# В конце robots.txt добавьте:
Sitemap: https://site.ru/sitemap.xml

# Ссылка на llms.txt (рекомендация)
# LLMs-txt: https://site.ru/llms.txt

Эта практика пока не стандартизирована, но может помочь AI-краулерам обнаружить файл.

Проверка результата

После размещения файла проверьте полный цикл:

  1. Файл доступен по https://your-site.ru/llms.txt — открывается как текст, не как PHP-страница
  2. Content-Type в заголовках — text/plain
  3. Структура корректна: есть H1, blockquote, секции с ссылками
  4. Все URL в файле рабочие (нет 404)
  5. Файл не заблокирован в robots.txt
  6. Кодировка — UTF-8 (кириллица отображается корректно)

Через 1–2 недели после размещения можно проверить логи сервера на обращения к /llms.txt от GPTBot, ClaudeBot, PerplexityBot. По состоянию на апрель 2026 года крупные AI-провайдеры не подтвердили автоматическое использование llms.txt при обходе сайтов, но файл уже полезен при ручном использовании AI-агентами и разработчиками.

Частые проблемы

  • Файл открывается как PHP-страница с шаблоном Битрикса. Файл был создан через Битрикс как PHP-страница, а не как текстовый файл. Решение: пересоздайте через FTP/SSH как чистый текстовый файл без PHP-обёртки.
  • 404 при обращении к /llms.txt. Файл не существует в корне сайта, или путь к корню отличается от ожидаемого. Проверьте, что файл лежит в той же директории, что и .htaccess, robots.txt и sitemap.xml.
  • Content-Type: text/html вместо text/plain. Веб-сервер не определяет MIME-тип для .txt. Добавьте правило ForceType в .htaccess (пример в шаге 4).
  • Кириллица отображается как кракозябры. Файл сохранён не в UTF-8. Пересохраните в UTF-8 без BOM.
  • Битрикс перезаписывает файл при обновлении. Этого не произойдёт — Битрикс не трогает пользовательские статические файлы в корне при обновлении.

Частые вопросы

Что такое llms.txt?

llms.txt — предложенный стандарт файла в формате Markdown, который размещается в корне сайта и помогает AI-системам (ChatGPT, Perplexity, Claude) быстро понять структуру и ключевой контент сайта.

Поддерживает ли 1С-Битрикс llms.txt из коробки?

Специальной поддержки нет, но она и не нужна. llms.txt — обычный текстовый файл в корне сайта. В Битриксе статические файлы отдаются веб-сервером напрямую, минуя систему urlrewrite.

Используют ли AI-краулеры llms.txt прямо сейчас?

По состоянию на апрель 2026 года ни OpenAI, ни Google, ни Anthropic не подтвердили автоматическое использование llms.txt при обходе сайтов. Стандарт набирает популярность, внедрение стоит дёшево — рекомендуется как инвестиция.

Чем llms.txt отличается от sitemap.xml?

sitemap.xml перечисляет все индексируемые страницы для поисковых роботов. llms.txt — курированный список ключевых страниц с описаниями, оптимизированный для LLM. В llms.txt обычно 10–30 ссылок, в sitemap — сотни или тысячи.

Чем llms.txt отличается от robots.txt?

robots.txt управляет доступом — разрешает или запрещает обход. llms.txt не запрещает ничего — он подсказывает AI, какие страницы наиболее важны.

Нужно ли обновлять llms.txt при добавлении новых страниц?

Да. Для динамических сайтов рекомендуется автоматическая генерация через PHP-скрипт и cron — новые материалы будут попадать в файл автоматически.

Может ли Битрикс перезаписать мой llms.txt при обновлении CMS?

Нет. Битрикс при обновлении не трогает пользовательские файлы в корне сайта. llms.txt не входит в стандартную структуру CMS и полностью безопасен.

Что читать дальше

Валентина Меланина

Хотите обсудить свой проект?

Помогу с разработкой, аналитикой и AI-видимостью вашего сайта

Если у вас есть задача — от внедрения разметки и аналитики до полной переработки сайта — напишите, обсудим объём и подход.