Карта сайта – это специальный html/xml файл, в котором содержатся ссылки на все «важные» страницы сайта. «Важные» страницы – доступные для индексирования поисковыми роботами.
Xml карта сайта, в отличии от ее html представления, предназначена для поисковых машин и подсказывает им о последних изменения на сайте. Что касается характерных особенностей карты, то допускается размещать до 50000 ссылок на страницы, а также относительный приоритет и частоту обновления страницы.
Стоит отметить, что xml карта сайта это лишь рекомендация для поисковой системы, а не строгая команда по индексации.
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://site.com/</loc>
<lastmod>2014-09-18T18:54:13+04:00</lastmod>
<сhangefreq>always</changefreq>
<рriority>1.0</priority>
<url>
<loc>http://site.com/articles/</loc>
<lastmod>2014-09-18T18:57:09+04:00</lastmod>
<сhangefreq>hourly</changefreq>
<рriority>0.8</priority>
</url>
Важно! Карта сайта должна быть обязательно в кодировке UTF-8.
Тег urlset – родительский, в него заключаются все url страниц вашего сайта;
Тег url – в нем указывается вся информация, о конкретной странице сайта;
Тег loc – в нем указывает url на страницу.
Последующие теги необязательны для заполнения, но я всегда стараюсь указывать полную информацию:
Наверняка, вы обратили внимание на ограничение в 50000 страниц. На самом деле это не предел, а скорее дополнительная рекомендация. Если количество страниц карты сайта составляет >50 тыс. или же объем файла близок к 10 Мб, то рекомендуется разбить карту сайта на части:
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://site.com/sitemaps/sitemap1.xml</loc>
<lastmod>2014-09-18T18:54:13+04:00</lastmod>
</sitemap>
< sitemap>
<loc>http://site.ru/sitemaps/sitemap2.xml</loc>
<lastmod>2014-09-18T18:54:13+04:00</lastmod>
</sitemap>
Тег sitemapindex – родительский, для обертки частей нескольких карт.
Тег sitemap – для размещения каждой отдельной части карты сайта.
Как я уже писал, в файле должны быть указаны ссылки на важные разделы и страницы сайта. Это означает, что если вы исключили какие то странице из индекса, запретив их индексировать в файле robots.txt или любым другим образом, то нет необходимости ссылаться на эту страницу в карте. Данные в файле должны быть актуальны, поэтому я рекомендую использовать динамическую карту сайта, которая формируется в момент обращения к ней. При этом не забудьте указать ссылку на нее в файле robots.txt:
Sitemap: http://site.com/sitemap.xml
Дополнительно укажите ссылку на карту сайта в панелях «вебмастерс» поисковых систем. Там же можно проверить карту сайта на корректность.
Что касается создания карты сайта, то здесь можно пойти различными путями:
При правильном подходе, исключении муссорных страниц из файла sitemap.xml, актуальности файла можно добиться хороших результатов и как следствие ускорить индексацию сайта в разы. Это особенно актуально, для информационных сайтов с большим количеством страниц и высокой частотой обновления контента, интернет-магазинов и блогов. Но я рекомендую не брезговать данным инструментом в любом случае.
Будь в курсе!
Введите Ваш Email и имя.
Чтобы отписаться нажмите сюда ».