Как закрыть сайт от индексации в поисковых системах

24.02.2022

9584

Основное управление индексацией сайта в поисковых систем осуществляется с помощью текстового файла robots.txt, расположенного в корне сайта.

Описание директив robots.txt на Яндексе и Google.

Запретить индексирование сайта в robots.txt

Закрыть от индексации весь сайт:

User-agent: *
Disallow: /

TEXT

Закрыть весь сайт, кроме главной страницы:

User-agent: *
Disallow: /
Allow: /$

TEXT

Запретить индексирование одной страницы:

User-agent: *
Disallow: /page.html

TEXT

Запретить индексировать каталог и всё его содержимое:

User-agent: *
Disallow: /path$
Disallow: /path/

TEXT

Результат проверки:

Запретить индексировать каталог и всё его содержимое в robots.txt

Запрет индексировать каталог, но оставить его содержимое:

User-agent: *
Disallow: /path$
Disallow: /path/$

TEXT

Результат проверки:

Запрет индексировать каталог, но оставить его содержимое в robots.txt

Закрыть всё, корме одной категории:

User-agent: *
Disallow: /
Allow: /path/$

TEXT

Результат проверки:

Закрыть всё, корме одной категории в robots.txt

Запрет индексировать изображения

Запретить индексировать картинки можно по расширению файлов:

User-agent: *
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.webp$

TEXT

Запретить только для Яндекса можно по имени бота:

User-agent: YandexImages
Disallow: /

TEXT

Запретить индексацию изображений только для Google:

User-agent: Googlebot-Image
Disallow: /

TEXT

Запрет индексирование файлов

По расширению файла:

User-agent: *
Disallow: /*.doc$
Disallow: /*.docx$
Disallow: /*.xls$
Disallow: /*.xlsx$
Disallow: /*.pdf$

TEXT

Запретить все расширения, кроме pdf:

User-agent: *
Disallow: *.*$
Allow: *.pdf$

TEXT

Результат проверки:

Если в адресах сайта используется приписка .htm, .html и .xml, то их необходимо тоже разрешить.

Запрет индексирования GET-параметров

Яндекс поддерживает директиву Clean-param и рекомендуется использовать её, в Google такой поддержки нет, поэтому GET-параметры всё равно придется закрывать дрективани Disallow/Allow.

Запретить все GET-параметры:

User-agent: *
Disallow: /*?*

TEXT

Запретить определенный GET-параметр:

User-agent: *
Disallow: /*?sort=
Disallow: /*&sort=

TEXT

Результат проверки:

Запретить все GET-параметры, кроме:

User-agent: *
Disallow: /*?*
Allow: /*?id=
Allow: /*&id=

TEXT

Запретить все GET-параметры c исключением в robots.txt

Запрет индексирования мета-тегами

Запретить обход поисковыми роботами определенных страниц можно метатегом robots, достаточно поместить его в <head> страницы:

<!doctype html>
<html lang="en">
<head>
	<meta name="robots" content="noindex">
</head>
<body>
	...
</body>
</html>

HTML

Метатег robots только для Яндекса:

<meta name="yandex" content="noindex, nofollow" />

HTML

Метатег robots только для Google:

<meta name="googlebot" content="noindex">

HTML

Запрет индексирования HTTP-заголовками

Оба поисковика поддерживают управление индексированием с помощью заголовка «X-Robots-Tag». Например в PHP:

Пример в PHP:

header("X-Robots-Tag: noindex");

PHP

В .htaccess:

Header Set X-Robots-Tag "noindex"

htaccess

Не переходить по ссылкам

Запретить поисковикам переходить по ссылке можно с помощью атрибута rel="nofollow", например:

<a href="https://example.com" rel="nofollow">Ссылка</a>

HTML

`rel="nofollow"`	Робот будет игнорировать ссылку.
`rel="ugc"`	Для ссылок, опубликованных пользователями, например в комментарии или записи на форуме.
`rel="sponsored"`	Если ссылка носит рекламный характер, указывает на рекламное место или размещение в рамках партнерской программы с другим сайтом.

Можно указать несколько значений через запятую или пробел:

<a href="https://example.com" rel="ugc nofollow">Ссылка</a>
<a href="https://example.com" rel="ugc,nofollow">Ссылка</a>

HTML

У атрибута «rel» есть другие значения:

`rel="noreferrer"`	В Google Analytics трафик, приходящий по ссылкам, будет отображаться как прямой трафик вместо указания источника.
`rel="noopener"`	Препятствует тому, чтобы страница назначения могла получить доступ к исходной странице.

Запрет индексировать часть контента

Закрыть часть контента можно только для Яндекса, элементом <noindex>:

<noindex>текст, индексирование которого нужно запретить</noindex>

HTML

Или валидный вариант:

<!--noindex-->текст, индексирование которого нужно запретить<!--/noindex-->

HTML

24.02.2022, обновлено 31.01.2025

9584

#Google #SEO #Поиск #Яндекс

12 17

Предыдущая запись Виртуальные коды клавиш (Virtual-Key Codes)

Следующая запись Замена регистра в строках PHP

Комментарии 1

Степан Благодетелев

26 июня 2025 в 18:30

Спасибо! Нужно было закрыть от индексации фотографии внутри фотогалереи, а саму фотогалерею оставить доступной к индексации. Ваша статья помогла!

Ответить

Авторизуйтесь, чтобы добавить комментарий.

Как закрыть сайт от индексации в поисковых системах

Запретить индексирование сайта в robots.txt

Закрыть от индексации весь сайт:

Закрыть весь сайт, кроме главной страницы:

Запретить индексирование одной страницы:

Запретить индексировать каталог и всё его содержимое:

Результат проверки:

Запрет индексировать каталог, но оставить его содержимое:

Результат проверки:

Закрыть всё, корме одной категории:

Результат проверки:

Запрет индексировать изображения

Запрет индексирование файлов

По расширению файла:

Запретить все расширения, кроме pdf:

Результат проверки:

Запрет индексирования GET-параметров

Запретить все GET-параметры:

Запретить определенный GET-параметр:

Результат проверки:

Запретить все GET-параметры, кроме:

Запрет индексирования мета-тегами

Метатег robots только для Яндекса:

Метатег robots только для Google:

Запрет индексирования HTTP-заголовками

Пример в PHP:

В .htaccess:

Не переходить по ссылкам

Запрет индексировать часть контента

Комментарии 1

Другие публикации