Canonical URL vs Link Trade
Canonical URL, о которых всю неделю нам рассказывает передовая пресса, это такая недодуманная палка о двух концах. С одной стороны, это метод борьбы с индексацией дублированного контента в пределах одного сайта.
Да, у идеального сайта в вакууме есть главная с урезанными версиями (1-2 абзаца) последних материалов и ссылками на полную версию, страницы подразделов (с теми же урезанными парой абзацев), страницы тегов (технически - копии предыдущих, но с более тонкой детализацией) и наконец сами страницы документов с уникальным адресом. Для такого сайта никакие дополнительные теги, указывающие на каноничность документа по большому счету не нужны. Но это в идеале, посмотрим что на практике.
На моём блоге все несколько хуже, по единственной причине: я выдаю сразу полную версию поста - и на главной, и на страницах разделов (на страницах тегов таки порезал), у меня довольно постоянная аудитория и обычно средних размеров публикации - таким нехитрым образом я экономлю 1 клик мышкой своим посетителям, зачастую на главной в 5 постах умещается всё, что я написал за месяц. Выдавать кастрированные версии - значит заставить человека делать с главной 5 кликов и открывать 5 окон, кому это нужно? Переход на single-version этого же документа посетитель сделает с одной целью: почитать комментарии к посту и добавить свои, если захочет, насильно принуждать его к такой деятельности я не собираюсь. А движки, у которых один и тот же документ (заметьте, уникальный документ, а не список чего-либо на сайте) может быть найден по целому ряду адресов, считаю изначально ущербными. Исключение - на сайтах типа моего, где некий документ является единственным в своём подразделе - тогда путь к документу и путь к подразделу не будут совпадать, а содержимое будет практически идентичным, - но это ситуация временная, раздел со временем пополняется и документ не будет долго в одиночестве.
С другой стороны, давайте посмотрим, как работают системы продажи ссылок. Вебмастер предлагает к продаже определенную страницу и указывает канонический (sic!) URL. И продажные ссылки показываются только если запрошен именно этот адрес, стоит к пути в адресной строке
www.site.com/index.php
добавить что-нибудь типа
www.site.com/index.php?test=test
- URL перестает быть каноническим, и та же sape.ru уже не выводит на нём проданные ссылки. Это же является самым простым способом палева для поисковиков - добавить левый параметр и посмотреть - не исчезло ли некоторое количество ссылок? Замигали ссылочки: ататат, противный, PR->0 и вечное забвение.
И вот теперь Google (и Яша и мелкомягкие в едином порыве) подсказывает, просто таки всучивает я бы сказал вебмастерам способ, как не спалиться - та же сапа, для вывода кода будет анализировать не только URL, но и значение canonical в заголовке. Дальше объяснять не нужно, надеюсь? Ждем официальной поддержки этого благородного и бестолкового почина Яндексом, и go, honey, go!
Откровенно говоря, никак не ожидал такого слабого и беззубого решения, последние пару лет гораздо большей проблемой является кража контента и проблема определения первоисточника продублированного материала. Соответственно, я давно уже подспудно ждал каких-то шагов от поисков в этом направлении. А подумав, пришел к выводу, что поисковикам эта проблема как раз глубоко по барабану, сами посудите: ну какая разница, на сайт Васи отправить посетителя или на сайт Пети, и кто из них истинный автор контента? Ведь посетитель ищет информацию, а не её автора. Так что защита недавно обкраденного гражданина Шпака - в руках самого Шпака, остальным до этого дела нет, мотайте на ус, вебмастера!
При поддержке: компьютерная защита - это не только потрусить начальство и купить лицензии программ, тут еще бы мозгов чуток...