http://m.megamozg.ru/post/18126/
Я заметил ошибку в выдаче Яндекс-поиска.
Как проверял.
Беру фразу (10-20 слов) из 100% оригинальной статьи на своем сайте. Например, написанной и опубликованной в 1998-2000г. (Яндекс позволяет использовать фразы до 40 слов).
Ввожу в поиск.
Обнаруживаю, что страницы нет в выдаче.
Я не специалист в IT. Я лишь автор контента. Могу в чем-то ошибаться. Однако в 2011 году мои сайты, мой оригинальный контент, создававшийся с 1998г. был в выдаче Яндекса на первом месте.
Страницы с копиями статей были ниже. Копий было много, десятки. Максимальное количество не выяснял, но до 70 сайтов на каждую статью, с помощью того же Яндекса, находил.
В 2012 году посещаемость сайта начала снижаться. Начал искать причину и обнаружил, что статьи просто выпали из выдачи.
70 страниц с копиями есть, а сайта источника – нет.
Возможно, комментарии специалистов помогут мне найти решение этой проблемы.
В правилах Яндекса написано, что первоисточник в выдаче должен быть выше копий. (Правила Яндекса: help.yandex.ru/webmaster/yandex-indexing/webmaster-advice.xml)
Санкции: «Исключение из поиска страниц сайта, понижение в результатах поиска…» если «Сайты… содержат не оригинальный, вторичный, малополезный контент, а также сайты, создаваемые для продажи ссылок и заработка на рекламе».
Чтобы определить «не оригинальный, вторичный» контент, Яндексу необходимо найти «оригинальный», найти первоисточник.
И раньше, в 2010-2011 году Яндекс определял источник хорошо.
Тем не менее, в выдаче, с 2012 года – копии, а не оригиналы.
Начал переписку с Яндексом.
Отправил в Яндекс:
1. Скриншот выдачи
2. Поисковую фразу
3. URL страницы, на которой есть искомая фраза.
4. Ссылку на Internet Archive, как подтверждение авторства, оригинальности и первичности контента.
Получаю, после довольно долгой переписки, сообщение.
«К сожалению, есть ошибки со стороны алгоритмов, из-за которых страницы Вашего сайта частично отсутствуют в поиске. Мы уже исправляем эти ошибки, но поскольку мы не правим выдачу по конкретным запросам или под конкретные сайты, а меняем алгоритмы в целом, чтобы подобные ошибки не возникали в будущем, это занимает достаточно много времени.
С другой стороны, нет необходимости присылать нам дополнительные примеры запросов, по которым Ваш сайт отсутствует в поиске, так как присланных ранее достаточно для выявления ошибок алгоритмов.
Пожалуйста, дождитесь окончания наших корректировок».
Это было в декабре 2013 года.
Жду. 2013, 2014, 2015 год… Количество моих оригинальных страниц в выдаче неуклонно снижается.
Сначала выпало процентов 10, на сегодня – более 60%.
Можно было бы возразить, что большими цитатами никто не ищет, но это не так. Таким образом, люди ищут: цитаты, афоризмы, стихи, песни, кинофильмы.
Кроме этого, роботу все равно какой набор слов искать (до 40 шт. по правилам Яндекса).
Важно, что в Google такой ошибки нет.
Кроме банального авторства, определение первоисточника важно не только Яндексу, но и пользователям, например, журналистам. Таким образом определение первоисточника — это качество поискового сервиса для пользователей. Это гораздо важнее, чем моя частная проблема.
Опять пишу в Яндекс (через пару лет) и получаю в ответ… «Мы действительно не определяем первоисточник».
Но как тогда определить вторичность, если не определять первичность?
Не определив первоисточник, невозможно определить, что не оригинально и вторично.
Перепроверил несколько других своих или посторонних сайтов (где помнил оригинальные публикации до 2000г.) — результат тот же. Где-то 10% оригинального контента выпало из выдачи, где-то половина и больше.
Т.е. что-то сломалось в алгоритме выдачи довольно масштабно.
Недавно написал в Яндекс опять.
Получил ответ:
«Да, мы в курсе всего этого.
Мы работаем с Вашими примерами, но не можем обещать, что ситуация кардинально изменится в ближайшее время».
И что теперь делать?
/// Пользующимся Яндексом следует иметь это ввиду.