XML-карта – что это?
Карта сайта (Sitemap.xml), которая в формате XML содержит список всех страниц ресурса, необходима, чтобы боты поисковиков быстро их находили, а поисковые система эффективно индексировали.
Существует два типа Sitemap.xml: обычная и индексная
Вес обычной XML-карты не превышает 50 Мб и охватывает 50 тысяч страниц, не более.
Индексная Sitemap объединяет несколько обычных XML-карт и создается для больших мультиязычных сайтов. Емкость таких файлов не превышает 50 тысяч URL-адресов.
Как найти XML-Sitemap
Несколько способов просмотра карты сайта:
1. В файле robots.txt укажите в адресной строке: https:/site.com/robots.txt. Сам файл может содержать подсказку XML-Sitemap в следующем формате: Карта сайта: HTTPS:/site.com/sitemap/sitemaxml
2. Если вы не можете найти ссылку на файл в robots.txt, введите следующий запрос в адресной строке: https:/site.com/sitemap.xml
Если формат URL файла robots.txt строго требуется - /robots.txt, то URL файла sitemap.xml может быть любым.
/sitemap.xml - это просто более популярное имя XML-карты, но оно может быть другим, например, / sitemap-categories.xml, / sitemap-en.xml и так далее.
З. Вы также можете искать в поисковой системе с помощью поисковых систем. Вам нужно использовать два оператора:
- Сайт: Ищите точный адрес.
- FileType: поиск требуемого типа файла.
Для поиска XML-файла необходимо создать поисковый запрос:
- Сайт: сайт.сом FileType:xml
- Элементы XML-карты_сайта
Нам уже известно, карта сайта (sitemap) может быть как обычной, так и индексной. Вот обязательные и не очень элементы для каждого типа.
Карта сайта обычная: элементы
Обязательно нужны:
- XML-версия указывается в первой же строке плюс UTF-8_кодировка;
- Tag: urlset - родительский для тегов, которые мы укажем ниже, Это стандарт для текущего протокола;
- Tag: url - используется при каждом введении адреса URL. Он – родительский для тегов ниже и дочерний для tag: urlset;
- Tag: loc - указывает, что адрес страницы (URL) точный. Он дочерний к tag: url.
Нужны, но не обязательно:
- Tag: lastmod - показывает, когда страница обновлялась последний раз. Это дочерний tag для тэга url. Google поисковик обращает «внимание» на него при совпадении сроков обновления страницы последний раз. Тут используется W3C Datetime-формат при указании даты, которую нужно прописовать в таком виде и только: YYYY-MM-DDThh:mm:ss+TZD. К примеру: 2023-03-16T20:25:40+02:00;
- Tag: changefreq - показывает, как часто обновляется страница в диапазоне значений от always до never;
- Tag: priority- как следует из название показывает, что та или иная страница является приоритетной. Диапазон данного значения 0,0 – 1,0.
«Свежая» информации Google Поиска – система перестала учитывать значимость tags:changefreqи priority.
Карта сайта индексная: элементы
Обязательно нужны:
- В первой строке указывается версия XML и обязательная для файлов карты сайта кодировка - UTF-8;
- Tag: sitemapindex - родительский, обязателен для всех tags ниже. Это стандарт;
- Tag; sitemap - без него нельзя обойтись, так как в нем вся информация о каждом файле. Дочерний для tag: sitemapindeх;
- Tag: loc - это координаты файла с системе. Дочерний для tag: sitemap.
Нужны, но не обязательно:
- Tag: lastmod - прописывается для уточнения, когда было последнее обновление файла карты. Важно! Речь идет в целом sitemap_файле. Дочерний для tag: sitemap.
Способы создания Sitemap
Существует 4 способа создания Sitemap. Расскажем о них вкратце.
- Посредством CMS. Системы управления контентом WordPress и Wix автоматически генерируют Sitemap.
- Самостоятельно (вручную). Это не составляет труда, когда у вас сайт-одностраничник или не очень большой ресурс. Нужен текстовый редактор и ваша грамотность, включительно синтаксическая.
- Сторонние сервисы-генераторы. К примеру: mysitemapgenerator.com; smallseotools.com (есть бесплатная версия); xml-sitemaps.com.
- Netpeak Spider. Для работы на этом ресурсе нужно четко следовать правилам и установленному алгоритму: отсканировать URL (сколько нужно) – запустить автоматgeneratorSitemap- настроить параметры – нажать«кнопку» «сгенерировать» - сохранить.
Sitemap: Google рекомендует
Самый большой поисковик рекомендует соблюдать следующие принципы, чтобы ваш сайт максимально индексировался:
- Точность и правильность написания URL-адресов.
- URL-адреса должны относиться исключительно к указанному домену (!).
- Sitemap важно поместить в корень (корневой каталог) сайта.
- Использовать только UTF-8_кодировку. Все другие символы экранировать (если пишите карту вручную.)
- Поисковик не сканирует каждый ваш URL-адрес в Sitemap и игнорирует порядок их расположения.
- Чтобы адреса были проиндексированы, они не должны содержать mega_tag NOINDEX.
- Sitemap должна регулярно обновляться в автоматическом режиме, когда добавляются/удаляются/открываются/закрываются для индексации запрошенные страницы.
Sitemap: Bing рекомендует
Рекомендации Bing практически идентичны Google, лишь несколько перефразированы.
Sitemap для мультиязычных сайтов
Чтобы поисковик не счёл языковые версии сайта дублями, существует 3 способа:
- Прописать в коде странице атрибут rel=”alternate” hreflang=”x” (это самый распространенный и удобный).
- Посредством XML-Sitemap (в случае, если сайт большой).
- С использованием заголовков HTTP.
Sitemap для стационарных изображений
Иногда поисковик не может отсканировать на сайте картинки. Часто это бывает, когда изображение загружается посредством JavaScript.
Для решения проблемы существует два способа: ссылку указать в обычной Sitemap или создать отдельную Sitemap для изображений.
Оба случая предусматривают обязательное создание пространства xml-имен, где будут прописаны теги для картинок: image:image и image:loc.
Следующие тэги также можно использовать, но они не обязательны (поисковик их не учитывает). Например: image:caption, image:geo_location, image:title, image:license.
Важно! Sitemap для изображений должен использовать только UTF-8_кодировку, и для каждого url-адреса может быть не больше 1 тыс картинок. Регулярное обновление обязательно!
Sitemap для видеоизображений
Подход и требования при создании Sitemap для видеоконтента подобен вышеуказанному для картинок. Создавая карту сайта, мы сообщает поисковику, что на нашем ресурсе есть видео. Это важно, особенно тогда, когда видео размещено недавно.
Google дает рекомендации по созданию Sitemap для видеоизображений. Вот главные из них:
- Обязательна UTF-8_кодировка.
- Объем Sitemap для видео – не более 50 мегабайт и 50 тысяч видео единиц. Все что больше этого требует создания индексного видеофайла Sitemap.
- Sitemap для видеоконтента не гарантирует его индексацию.
- Все страницы должны давать ответный код 200.
- Ссылка в обязательном порядке размещается на robots.txt.
- Требуется регулярное автоматическое обновление.
Первое, что нужно сделать при создании Sitemap для видеоизображений – определить пространство для tags.
А затем прописать и сами тэги. Индексируемых свыше двадцати.
Три родительских: urlset, url (является дочерним для urlset) и video:video;
Остальные относятся к ссылочной массе и описанию: video:thumbnail_loc, video:title, video:description, video:content_loc, video:player_loc.
Приветствуются поисковиками и следующие тэги: video:duration и video:expiration_date.
Остальные тэги, указывающие на рейтинг, просмотры, запрет/доступ и другие данные – не обязательны.
Sitemap для новостного сайта
В идеале новостные сайты требуют создания отдельной sitemap, которая будет ежедневно автоматически обновляться. Это нужно для включения ресурса в каталог Google Новостей.
Ёмкость такой sitemap – 1 тысяча url-адресов. Google настоятельно советует делать регулярное обновление карты, особенно, если в течение дня публикуется несколько десятков новостей. Sitemap новостного ресурса нужно размещать либо в тематической категории «Новости» или «Лента новостей» или в корне сайта.
Важно! В файл должны заносится только данные статей за последние двое суток, остальное нужно удалять. В Google Новостях при этом они будут индексироваться еще 30 дней.
Вот тэги, которые обязательны для sitemap новостей: Основные элементы sitemap для новостей:
Два родительскиъ тэга: news:news и news:publication , у которого два дочерних тэга: news:name и news:language (формат ISO 639-1 ).
Важны также тэги news:publication_date и news:title .
Способы внедрения Sitemap
Чтобы поисковик нашел XML-Sitemap можно использовать несколько способов:
- посредством Google Search Console;
- через ping, отправив GET-запрос и, указав url-адрес вашей Sitemap;
- url-адрес sitemap вашего сайта разместить в robots.txt.
XML-Sitemap анализируется только при первом обнаружении, а не при каждом сканировании сайта. Если вы внесли в файл изменения, сообщите об этом поисковой системе с помощью запроса ping.
Sitemap: как обнаружить ошибки
Если вы сделали все правильно (по инструкции), то больших ошибок не должно быть. Проверить на наличие ошибок помогут следующее ресусы:
- Google Search Console, пункт «Файлы Sitemap».
- Netpeak Spider. «Инструменты» - «Валидатор» работает в автоматическом режиме.
Совет! Если ваш сайт, несмотря на точное следование инструкциям и отсутствии ошибок, плохо индексируется, то можно разбить sitemap вашего сайта на составные мелкие часты и отправить на индексацию. Но не переусердствуйте. Дробить слишком мелко е следует, это может привести к другой проблеме – неполучения данных из GSC.