Ищем дубли страниц - опубликована видеозапись вебинара

Страницы форма, как правило, не будут конкурировать между собой по запросам пользователей. А вот страницы пагинации в каталоге - будут, что может привести к печальным последствиям, о которых говорили на вебинаре.

Иван

29 июля 2017, 07:39

Вот не могу понять, с чего это страницы с разным товаром должны считаться дублями?
У гугла есть prev next и хоть тысячу страниц пагинации делай, это не приведет к печальным последствиям.
Яндексу гордость не позволяет использовать эти теги?

Елена Першина

Сотрудник Яндекса30 июля 2017, 14:26

Иван,

Нет, простота. Если есть другие способы что-то точно указать, мы стараемся вводить новые теги.

Иван

31 июля 2017, 12:18

вы понимаете, что гугл этими тегами дает возможность объединить тысячу страниц в одну, при этом все товары индексируются и нет дублей.
Зачем изобретать велосипед? Возьмите готовое решение, получится стандарт, который избавит ВМов от необходимости подстраиваться под разные ПС.

Елена Першина

Сотрудник Яндекса31 июля 2017, 13:29

Иван,

Вы не поверите, но canonical делает тоже самое, при этом не только для страниц с пагинацией (это частный случай). Возьмите готовое решение из уже имеющегося стандарта.

Иван

31 июля 2017, 13:56

Так Гугл будет считать контент дублем если указать canonical, т.е доступным по разным адресам.
А если на второй странице пагинации находится ДРУГОЙ товар, то как я могу ставить на ней canonical, товар то не дубль!

https://yandex.ru/blog/platon/2878
platon 16 марта 2016, 13:11 :
watsonia, Прошу прощения, что так долго не отвечал. Если страницы со всеми товарами нет, на страницах пагинации атрибут rel="canonical" можно не устанавливать.

Платон одно говорит, вы другое))) Возьмите гугловские prev next и не морочьте нам голову ;)

Елена Першина

Сотрудник Яндекса31 июля 2017, 18:00

Иван,

Зачем вам в выдаче 20 страниц пагинации? Платон говорит то же, что и я - я же вижу переписку полностью. Не хотите ставить - не ставьте, ваше право. Мы тут можем только озвучить наши рекомендации.

Иван

1 августа 2017, 09:34

https://yandex.ru/blog/platon/2878 platon 16 марта 2016, 13:11

Платон говорит можете не ставить на страницах пагинации "canonical", вы говорите, что если не ставить, то это может привести к печальным последствиям.
Кто прав?

Контент не дубль, товар разный, зачем нужен каноникал?
Если его поставить, то гугл будет считать контент дублем.

Вы даете советы, которые могут повлиять не только на выдачу в Яндексе.

1 августа 2017, 12:57

Елена, тут похоже вебмастер сломался, какие-то проблемы с авторизацией

Елена Першина

Сотрудник Яндекса2 августа 2017, 18:10

yc,

Да, проблема была, постарались исправить её максимально быстро.

Обновлено 2 августа 2017, 18:31

igor-sektgmail-com

24 сентября 2021, 20:34

Привет что делать если у меня не открывается файл

platon

Сотрудник Яндекса25 сентября 2021, 01:49

igor-sektgmail-com,

уточните, пожалуйста, о каком именно файле идет речь?
--
Пожалуйста, оцените наш ответ

Артём

26 июля 2017, 13:54

Вчера Яндекс.Вебмастер нашел у меня дубль страницы. Да, правда, я изменил УРЛ странички для внутреннего упорядочивания контента.
Было
https://www.vodoparad.ru/result/vstraivaemie-akrilovye-vanny.html
Стало
https://www.vodoparad.ru/result/akrilovye-vanny-vstraivaemie.html

Так вот, Вебмастер сказал что переименованная страница является дублем старой несуществующей страницы (т.е. роботу пофигу, что она не отдает 200 статус-код) и выкинул её из поиска, вместо этого, поместив в выдачу устаревший URL.

Прокомментируете?

Обновлено 26 июля 2017, 13:56

HA-CEHE

26 июля 2017, 14:40

Можно ли как-то предупреждать перед тем, как сайт обрушите в поисковом индексе из-за дублей? Не придавал значения дублям. Тут грохнули, - неожиданностью стало. И сразу ваш вебинар по дублям вышел.

Елена Першина

Сотрудник Яндекса26 июля 2017, 17:53

Это не связанные вещи. Уверены, что проблема именно в дублях?

HA-CEHE

26 июля 2017, 18:20

Единовременно было удалено из индекса большое количество страниц 24 июля: по причине дубля половина, вторая половина якобы недостаточно качественная, притянуто за уши. В итоге в исключенных оказалась половина контента и просадка по посещаемости весьма существенная.

валдик г.

26 июля 2017, 19:35

Такая же ситуация, как быть?

Артём

27 июля 2017, 08:53

такая же ситуация и у меня с индексом. Полезные страницы с товарами, вылетают из индекса, как "недостаточно качественные". Я знаю, что на этих страницах каталога нет текста, есть только товары. Почему Яндекс считает страницы подкатегорий некачественными? Просто потому что на них нет seo-текстов?

Елена Першина

Сотрудник Яндекса27 июля 2017, 11:37

Артём,

тут так:
1) Некачественные страницы, это те, которые почти не имеют шансов попасть в результаты поиска - не конкурентноспособны на фоне ответов других сайтов.
2) Если такие страницы удаляются, сайт обычно поисковый трафик не теряет вообще - так как эти страницы и так в поиске не показывались.
3) Если вдруг у вас реально пропали страницы, которые генерировали трафик (например, это видно по Вебмастеру и Метрике) - напишите в нашу поддержку, проверим, почему такое могло произойти.

Соловьев Алексей Юрьевич

31 июля 2017, 21:33

Потерял 24 июля 83 страница с товарами и из блога. Очевидно 24.07 была какая-то внутренняя проблема. Статус исключенных страниц был "Недостаточно качественная информация". Ну я не буду зудеть, про то что Яндекс вообще пилювать хотел на классику русской журналистики, коль скоро мы все живем в век АЛГОРИТМОВ. После обращения в поддержку за разъяснениями, мне отразили исключенные страницы задним числом, начиная с 11 июня. Такая вот ерунда

HA-CEHE

2 октября 2017, 21:04

Здравствуйте! В какую техподдержку обратиться, если на графике Индексирование - Страницы в поиске исключена по Clean-param резкий скачок вниз и обратно вверх на те же позиции в течение двух дней 23, 24 сентября. Но после этого скачка произошло явное уменьшение посещаемости, просадка трафика, в меньших масштабах, чем 26 июля я писал.

Елена Першина

Сотрудник Яндекса3 октября 2017, 14:25

Не очень поняла вопрос, но вообще подобное поддержка Вебмастера разбирает.
Нет ничего плохого в том, что по Clean-param были исключены страницы - если сам Clean-param был настроен корректно.

HA-CEHE

3 октября 2017, 18:57

В поддержке вебмастера нет наводящей проблемы про исключенные страницы - что делать, если из-за исключенных страниц сайт теряет трафик. А еще конкретнее, скачок графика Clean-param, когда количество исключенных по Clean-param резко уменьшается, потом так же резко возвращается на прежний уровень (растет), - а результат - уменьшение трафика. Как я подозреваю, ваш робот считает резкое увеличение страниц по Clean-param негативом и пессимизирует.

HA-CEHE

3 октября 2017, 19:05

Clean-param настроен правильно (прошлого раза с меня хватило). Тут "технический" скачок графика вниз-вверх.

Елена Першина

Сотрудник Яндекса3 октября 2017, 19:44

Тогда так и спросите у поддержки - почему выпали, а потом вернулись страницы при правильно настроенном Clean-param (если это правда так).

HA-CEHE

3 октября 2017, 21:03

Куда спросить? https://yandex.ru/support/webmaster-troubleshooting/index.html здесь нет нормальной формы

Елена Першина

Сотрудник Яндекса3 октября 2017, 21:16

Есть, в разделе индексирование по вашему вопросу.

HA-CEHE

3 октября 2017, 21:28

Спасибо!

lp-up

26 июля 2017, 21:43

Как бороться с ситуацией, когда существуют страницы типа site/?param1&param2, а робот видит каким то образом страницы site/?param2&param1. Причем параметров может быть более 2-х.

Елена Першина

Сотрудник Яндекса26 июля 2017, 22:07

lp-up,

Каноникал должен помочь.

lp-up

26 июля 2017, 22:27

спасибо

anton.savajik

3 августа 2017, 12:12

ЛОЛ! То есть Вы не знаете , но советуете?!? Отлично.

Елена Першина

Сотрудник Яндекса3 августа 2017, 17:13

anton.savajik,

То есть мы знаем и советуем.

dmspoli

9 августа 2017, 01:10

anton.savajik,

посмотрите ниже, я им на это указывал еще 2 года назад. Теперь они ссылаются на некоторые международные стандарты, при это не признают, что генерируют этот бред сами. Сначала они уверяли меня, что индексируют только те урлы на которые есть ссылки, теперь об этом даже не говорят

tigrushkii

26 июля 2017, 22:49

Для дублирующих страниц товара типа site.ru/игрушки/товар и site.ru/товар вы рекомендовали использовать атрибут rel="canonical"

Подскажите, пожалуйста, если такая ситуация с категориями

site.ru/категория/подкатегория

site.ru/подкатегория

Что лучше использовать rel="canonical" или 301 редирект?

Елена Першина

Сотрудник Яндекса27 июля 2017, 11:28

tigrushkii,

Можно использовать оба варианта.

mackursk

26 июля 2017, 22:15

Я на новый домен загрузил дубль главной страницы сайта который давно уже работает и в индексе яндекса, хотел переделать дизайн, и проверял это все на новом домене, получилось так что новый домен был проиндексирован яндексом с тем же контенотом что и рабочий сайт. В то же время рабочий сайт попал под фильтр и улетел за 40 со сових позиций. Связанно это с дублем на новом домене или фильтр прилетел сам по себе?

Елена Першина

Сотрудник Яндекса27 июля 2017, 11:29

mackursk,

С таким вопросом лучше разбираться в поддержке. Нужно смотреть - нарушение это или простая склейка зеркал.

monetypochtoi.ru

27 июля 2017, 00:29

Спасибо очень полезно! Но у меня, продажа монет, монеты одинаковые, каталог, но фото монет разные чтобы клиент мог выбрать ту монету которая его устроит. У монет есть такая характеристика как сохранность, и я должен предоставить все одинаковые монеты разного сохрана, а они ушли в дубли, что делать в этом случае. Описать по триста одинаковых монет нет возможности, но монеты по сохрану разные, а поиковика будут одинаковы. Т.е. речь идет о каталоге, как быть????

Елена Першина

Сотрудник Яндекса27 июля 2017, 11:30

monetypochtoi.ru,

Попробовать сделать страницу с параметрами выбора. В самом простом виде - хотя бы таблицей, например, год и сохранность дают стоимость. Но как это лучше реализовать - конечно, вам решать.

monetypochtoi.ru

29 июля 2017, 04:15

Спасибо за ответ, буду думать

fimocica2012

27 июля 2017, 08:49

Здравствуйте! У меня возник вопрос , который появился как проблема относительно не давно. Дело в плагине АМП, который генерирует две одинаковые страницы. Например : в моем случае http://stroivagon.ru/geologiya/raschet-ustoychivosti-sklona.html http://stroivagon.ru/geologiya/raschet-ustoychivosti-sklona.html/amp

Интересно, что Яндекс считает их дублями а гугл нет, но ведь оптимизация мобильных устройств необходима как для Яндекса так и для гугла.Вопрос: стоит закрывать ссылку с окончанием /amp от индексирования в роботе ( например, следующими кодами
Disallow:*/*amp
Allow:*/*.html) или нет. С ув. Сергей

Витомир

27 июля 2017, 11:55

Поучительно, спасибо!
У меня много страниц типа таких - /krasnodar.shtml/images/foto/... или /sochi.shtml/images/foto/...
Как до и после shtml сделать запрет, так правильно?
Disallow: /*.shtml/*/
Спасибо!

Елена Першина

Сотрудник Яндекса27 июля 2017, 19:48

Витомир,

Достаточно просто Disallow: *.shtml/*

Обновлено 27 июля 2017, 19:48

Витомир

28 июля 2017, 09:52

Спасибо! Я правильно понимаю, всё что после shtml будет в запрете, но то что до, запрет не коснется?
Спасибо!

Елена Першина

Сотрудник Яндекса28 июля 2017, 11:57

Витомир,

Будет все так, как вы и хотели в описанном выше вопросе. Но вы можете проверить работу запрета в инструменте Анализ robots.txt - чтобы точно убедиться, что вас все устраивает..

Обновлено 31 июля 2017, 12:04

Витомир

31 июля 2017, 08:52

Благодарю!

Витомир

1 августа 2017, 08:08

Доигрался с запретами (до Вашего ответа) и сегодня большая часть страниц вылетела из поиска. Ошибку обнаружил и исправил. Как долго ждать возврата страниц в поиске и нужно ли что-то делать?
Спасибо!

Елена Першина

Сотрудник Яндекса2 августа 2017, 12:05

Витомир,

Если ошибка исправлена, то ничего дополнительно делать не нужно. Самые важные страницы можно в переобход закинуть (там сейчас лимит в день 20 страниц), чтобы они быстрее вернулись в поиск.

Витомир

2 августа 2017, 20:43

Спасибо большое! Я так и сделал.

Удалённый пользователь

27 июля 2017, 12:25

Что вообще происходит с поисковиком? День сайт в топе (по определенным запросам), после падает на позиции ниже 40, через неделю поднимается в топ, через несколько дней падает нище 50.... Что это такое вообще?Написал в поддержку 2 недели нет ответа.

ЭНЕРГОПУСК

27 июля 2017, 12:35

Спасибо за вебинар.
У меня на сайте elleron.ru та же проблемка, есть множество товара сотни, к примеру Электодвигатель 3кВт, 5кВт, 6 квт и тд...
описание на страничке каждого товара Общее, так как производитель один, только параметры, вес, размер мощность другая, но Робот в ВебМастере распознал как "недостаточно качественная страница", или "дубль", так как описание идет общее всей линейки серии. Как можно не нарушая правил, вернуть данные странички в индекс?

Елена Першина

Сотрудник Яндекса27 июля 2017, 19:56

ЭНЕРГОПУСК,

Попробовать сделать на одной странице сравнение этих товаров - параметрами, таблицей, иным образом, который для вас удобен и понятен индексирующему роботу.

printfx

27 июля 2017, 19:32

Здравствуйте!
Приведите, пожалуйста, пример сайта, на котором правильно настроена индексация страниц каталога товаров с использованием rel="canonical"?
Спасибо!

Елена Першина

Сотрудник Яндекса27 июля 2017, 19:55

printfx,

Мы же не анализируем вручную каждый сайт и не смотрим, что именно и как настроено на конкретном ресурсе, поэтому у нас нет таких примеров. А вот неправильный - просто море - по обращения в поддержку. Но у каждого свои ошибки - о наиболее частых как раз на вебинарах и рассказываем.

printfx

28 июля 2017, 01:50

Ну, причина все-таки в том, что назвав такой сайт, Вы сделаете ему рекламу :) Ладно, проехали. У Google есть статья с рекомендациям как настроить rel="canonical" для каталогов. И здесь несколько моментов. 1. Ваши рекомендации и рекомендации Google не согласуются, т.е. проблематично выполнить их одновременно. Так, для внутренних страниц каталога вы рекомендуете либо не указывать rel="canonical", либо указать действительный url этих страниц, а Google рекомендует указывать в rel="canonical" для внутренних страниц url первой страницы + rel="prev", rel="next". Т.е. по логике Google все страницы, участвующие в пагинации, представляют собой как бы один документ. Понятно, что вы не имеете никакого отношения к Google, но страдаем от таких противоречий мы, вебмастера. 2. Как настроить индексацию, если на странице, кроме пагинации "первая,2,3, .., последняя" есть select, в котором можно выбрать количество товаров, отображаемых на странице? Т.е. получается плавающее разбиение на страницы.
Спасибо.

Обновлено 28 июля 2017, 01:55

Елена Першина

Сотрудник Яндекса28 июля 2017, 14:55

printfx,

"Так, для внутренних страниц каталога вы рекомендуете либо не указывать rel="canonical", либо указать действительный url этих страниц" - у нас нет таких рекомендаций, мы советуем для страниц пагинации указывать именно первую страницу.
Если URL-адрес страниц не меняется при этом, настраивать ничего не нужно. В случае, если адрес изменяется, то страницы фильтров строит запретить в robots.txt

printfx

28 июля 2017, 20:48

URL страниц меняется, если запретить в robots.txt страницы каталога индексироваться не будут - это же очевидно!
Цитирую ответ Платона Щукина:
Наш индексирующий робот в настоящий момент не поддерживает обработку атрибутов rel="prev", rel="next", поэтому такие атрибуты будут роботом игнорироваться. Если Вы хотите, чтобы такие страницы пагинации индексировались и участвовали в поиске, то для их корректного индексирования атрибут rel="canonical" необходимо убрать, либо указать в нем адрес непосредственно этой страницы.
Если же такие страницы не должны индексироваться роботом, то мы рекомендуем настраивать атрибут rel="canonical" с указанием той страницы, которая должна участвовать в поиске. Атрибуты rel="prev", rel="next" при этом не помешают: наш робот их проигнорирует.

Елена Першина

Сотрудник Яндекса30 июля 2017, 14:23

printfx,

Запрещение незначимых фильтров не означает запрещение страницы как-таковой - если этот запрет правильно реализовать.

printfx

31 июля 2017, 16:41

вопрос был о другом, но скорее всего пока на него ответа нет :)

salamon.83

27 июля 2017, 23:57

Здравствуйте!
Подскажите Яндекс поисковик так не любит наш сайт source-cs.ru ?
2 года одно и тоже.. 2 дня на первых позициях год на 40 сороковых.
И что самое интересное посещаемость у сайта топовая а Яндекс поисковик его просто
не хочет индексировать на первых позициях.
ПОДСКАЖИТЕ КАК БЫТЬ 2 года прошло.. я несколько раз обращался в тех поддержку мне писали ждите
но 2 года это уже смешно.. в Гугле мы по данным запросам в топе
А в Яндексе 2 дня повесели и опять 25.. в 45 позиции (На скриншоте образец теста в поисковиках) http://pastenow.ru/1W3C3
Помогите пожалуйста?(

Станислав Р.

28 июля 2017, 11:10

у вас обычный переспам - http://prntscr.com/g1bmcz
Оставьте 1-2 вхождения в тексте и будут позиции, как в гугле.

salamon.83

28 июля 2017, 14:08

Приветствую!
Писали в тех поддержку, на что нам ответили
Yandex.Search support <webmaster@support.yandex.ru>
Кому: GameINTeriMedia
сегодня, 14:33

Здравствуйте, Александр!

Мы проанализировали ситуацию с Вашим сайтом: с ним все в порядке, и ограничений в его ранжировании с нашей стороны нет.
Я попробую прояснить, с чем может быть связано изменение позиций.
===========================================================
Ну а если был бы переспам , http://source-cs.ru/ , то по другим запросам сайт хотя бы был на 1 позициях например как, css v34, или ксс в 34,
(Все разом улетели в низ на 4 страницы).

А например на этой ссылки, http://source-cs.ru/ucp/ , запрос, скачать ucp, остались не тронуты на 1 позициях.

Станислав Р.

28 июля 2017, 15:18

во-первых, техподдержка проверяет только наложение хостовых фильтров, которые затрагивают весь сайт. У вас фильтры постраничные, поэтому они и написали, что "проблем нет".

Во-вторых, у вас переспам как-раз по ключу "css v 34", который поисковым роботом приравнивается к ключам:
ксс в 34
css v34
ксс в34

Поэтому по всем по ним страница под фильтром.

salamon.83

28 июля 2017, 14:45

Как я понимаю вы скриншот делали этой страницы
http://source-cs.ru/css34.php
А речь идет за главную страницу http://source-cs.ru/
На этой вроде нет переспама

Станислав Р.

28 июля 2017, 16:06

так у вас и на главной тоже самое - http://prntscr.com/g1f6f1

salamon.83

28 июля 2017, 17:56

Сократил ключевые слова..
Если вас не затруднит можете протестировать по данной ссылки http://source-cs.ru ?)

Станислав Р.

28 июля 2017, 19:07

вот это вообще уберите - http://prntscr.com/g1hn9f

salamon.83

28 июля 2017, 19:49

А сейчас нормально http://source-cs.ru (18 совпадений ) ?

Станислав Р.

28 июля 2017, 20:52

Сейчас нормально. Тоже самое сделайте тут http://source-cs.ru/css34.php

salamon.83

30 июля 2017, 05:55

Приветствую!
Перепробовал все по поводу того что сайт
source-cs.ru не поднимается по запросам и наткнулся на
========================================
http://tools.promosite.ru/old/clones.php

--------------------------------------------------
Поиск аффилированных сайтов: source-cs.ru
Архив, собранный через XML в 2010 (по выборке ~20% хостов Яндекса)
Аффилиатов у source-cs.ru НЕТ, а сам сайт в базе есть.
========================================
Не подскажете решение?

Станислав Р.

30 июля 2017, 11:29

ну так если аффилиатов нет, значит все ОК.

salamon.83

30 июля 2017, 12:35

Показывает что есть https://prnt.sc/g22m4m
Наш сайт http://source-cs.ru/ сайт который указан , он исключен из поиска за вирусы а так же его уже давно нет и он не наш http://css-boost.ru/

Обновлено 30 июля 2017, 12:36

salamon.83

30 июля 2017, 15:14

ТЕСТ ОНЛАЙН https://be1.ru/affiliation/
Наш сайт оригинал http://source-cs.ru/
Клон вредоносный http://css-boost.ru/

Станислав Р.

30 июля 2017, 17:46

нет у вас аффилиатов. Проверять лучше тут https://tools.pixelplus.ru/tools/affiliation

К тому же, аффилиаты бывают только по коммерческим запросам.

salamon.83

30 июля 2017, 20:47

Спасибо вам огромное!

salamon.83

31 июля 2017, 20:06

Привет еще раз
https://tools.pixelplus.ru/tools/affiliation

Статус
Указанные проекты http://counter-strike-source.ru/ и source-cs.ru признаны аффилированными в Яндексе.
Как исправить подскажите? (

Обновлено 31 июля 2017, 20:07

salamon.83

31 июля 2017, 20:34

Вернее
Указанные проекты http://source-cs.ru/ и http://counter-strike-source.ru/ признаны аффилированными в Яндексе.

Станислав Р.

31 июля 2017, 22:31

да оба этих сайта примерно на одних и тех же местах находятся (где-то на 40-60), так что он вам не мешает. Если бы он мешал, то он был бы в топе.

salamon.83

1 августа 2017, 16:44

Привет!
Я тут по моему еще на чудил, тем что к "sitemap.xml" прописывал ссылки
Данные ссылки находились в разделе файл Sitemap около года

http://source-cs.ru
http://source-cs.ru/css/
http://source-cs.ru/ucp/
http://source-cs.ru/css34.php
http://source-cs.ru/downloads/

а нужно было как я понимаю только
http://source-cs.ru/sitemap.xml

Скриншот - http://rgho.st/7XZq7mnsc
Так вот..
как долго сайту нужно теперь времени чтоб все встала на свои места?

Станислав Р.

1 августа 2017, 17:50

да это все вообще ни на что не влияет, я ж написал, что у сайта переспам. Переспам проходит через пару недель после удаления лишних вхождений.

salamon.83

4 августа 2017, 18:57

Привет! Подскажите для Яндекс поисковика это один и тот же запрос?
скачать css v34
скачать ксс в34

Станислав Р.

4 августа 2017, 20:21

"скачать ксс" и "скачать css" - да, а "в34" и "v34" - нет.

salamon.83

4 августа 2017, 19:53

Как я понимаю и в гугл "скачать ксс" и "скачать css" это один и тот же запрос?

Подскажите если вас не затруднит)
Тут все правильно прописано , я про то чтоб не было переспама?

<meta name="keywords" content="css v34, скачать css v34, скачать css v 34, скачать css, скачать ксс, css v 34, ксс в 34, ксс в34, скачать ксс в 34, скачать ксс в34, контр страйк соурс, скачать кс соурс, ксс, css" />

salamon.83

4 августа 2017, 19:59

Все ключевые запросы========================
css v34

css v 34

ксс в 34

ксс в34

скачать css v 34

скачать css v34

скачать ксс в 34

скачать ксс в34

скачать css

скачать ксс

css

ксс

Станислав Р.

4 августа 2017, 21:27

для гугла "в34" и "v34" - это тоже одинаковые запросы. Правильно так:

<meta name="keywords" content="скачать css v34, контр страйк соурс, кс" />

salamon.83

4 августа 2017, 21:07

Ну вы прям вообще урезали ключевые слова, я боюсь с гугла по позициям упадем)

Оставил:
<meta name="keywords" content="css v34, скачать css v34, скачать css v 34, скачать css, css v 34, контр страйк соурс, скачать кс соурс, css" />

Вроде нет переспама?)

salamon.83

4 августа 2017, 21:20

Я так понимаю это одни и те же запросы?
css v34

css v 34

Станислав Р.

5 августа 2017, 11:43

да. Более того, второй запрос Яндекс вообще считает опечаткой - https://yandex.ru/search/?msid=1501922527.60697.22871.21028&text=css v 34

salamon.83

5 августа 2017, 16:53

Все верно, вы правы.. но в гугле не считает
Многие пишут что "keywords" не Яндекс не Гугл не учитывают с 2011 года
Ну я все же поставил ваш вариант
<meta name="keywords" content="скачать css v34, контр страйк соурс, кс" />

Так как это только лишний переспам для сайта.

salamon.83

6 августа 2017, 09:39

Приветствую
http://source-cs.ru/

Подскажите еще, данные вхождения "CSS v34"считаются разными, или это все 5 одинаковых вхождений?
Скриншот http://rgho.st/6CNyXqXZM

И нет ли тут переспама по запросу "css v34" ?

Обновлено 6 августа 2017, 09:40

Станислав Р.

6 августа 2017, 12:05

одинаковые. Нет переспама.

salamon.83

6 августа 2017, 19:24

Спасибо вам большое!
Следуем вашим рекомендациям!
Если сайт появится в поисковике "Яндекс" я даже и не знаю как вас отблагодарить)

salamon.83

8 августа 2017, 15:54

Здравствуйте!
Подскажите можно делать с удаленных страниц "редирект" на 200 ок

http://monitor-css.ru/server_info/46.174.52.26:27258/
на
http://monitor-css.ru/

Вернее не удаленных, а полу живых
Там сам движок мониторинга сложный

Если я сделаю редирект то это примерно 500-700 страниц будут ссылаться на http://monitor-css.ru/ то этот сайт не попадет под фильтр?

Станислав Р.

8 августа 2017, 16:07

нет разницы, просто вы их удалите или редирект поставите. Эффект будет одинаковый.

salamon.83

8 августа 2017, 17:15

Спасибо! Поставили "Редирект"

salamon.83

17 августа 2017, 02:52

Приветствую
20 дней прошло и сайт http://source-cs.ru/ так и находится под фильтром
в Яндексе.
А в Гугл 1 позиции по запросами "css v34" посещаемость очень высокая но Яндекс держит сайт на 50-тых позициях
http://rgho.st/68RhlNRSl

Может в чем-то другом проблема?(

Станислав Р.

17 августа 2017, 11:51

проблема 100% в переспаме - http://prntscr.com/g9j9jc
Уменьшайте количество вхождений.

salamon.83

17 августа 2017, 16:47

по запросам
скачать ксс в34
скачать ксс в 34

скачать css v 34

вхождение вообще нету
а по
скачать css v34 только одно

salamon.83

17 августа 2017, 16:53

34 - 15

css v34 - 5

других вхождений нету

Станислав Р.

17 августа 2017, 22:57

ну вот везде, где 34, и уменьшать.

salamon.83

18 августа 2017, 01:07

Привет
Как я понимаю фильтр стоит не по запросам а всю страницу?
Так как у нас и эти запросы на 50 строчках а были на 1-2 строчках
cs source
кс соурс
=========================
cs source - 2 ВХОЖДЕНИЕ
кс соурс - 1 ВХОЖДЕНИЕ
В ПОИСКЕ ТОЖЕ ФИЛЬТР

Станислав Р.

18 августа 2017, 11:02

да, на всю.

salamon.83

24 августа 2017, 08:09

Здравствуйте!
Подскажите, Описание
<meta name="description" content="Counter-Strike: Source v34 бесплатно. Скачать CSS v34, КСС в 34. Клиент полностью на Русском языке с рабочим поиском серверов с ботами" />

На сайте http://source-cs.ru/
и на сайте http://source-v34.ru/
Можно чтоб были одинаковые?
<meta name="description" content="Текст" />

salamon.83

24 августа 2017, 08:31

И попереспаму
Яндекс тоже считает это как одно вхождение по ключевому слову
"css v34" ?
http://source-cs.ru/
http://rgho.st/74DbWmrrD

Станислав Р.

24 августа 2017, 11:27

описания нужно делать разными. Да, считает за вхождение.

salamon.83

24 августа 2017, 11:15

Станислав Р.

24 августа 2017, 12:23

нормально.

salamon.83

25 августа 2017, 15:25

Привет
По моему это не переспам а Яндекс троит
В вебмастере какие то сторонние ссылки

https://yandex.ru/search/?text=http%3A%2F%2Fsource-cs.ru%2Fvideo%2Fvip%2F4357%2Fkrasota_i_zdorove%2Fdzhaz_modern_uroven_1&lr=36

КРАСОТА, ЗДОРОВЬЯ, ОБРАЗОВАНИЕ
http://source-cs.ru/video/vip/4357/krasota_i_zdorove/dzhaz_modern_uroven_1
http://source-cs.ru/video/vip/5697/razvlechenija/lichnaja_zhizn_papinykh_dochek
http://source-cs.ru/video/vip/8045/khobbi_i_obrazovanie/chapati
http://source-cs.ru/video/vip/5428/razvlechenija/ehvelina_bljodans_i_viktorija_lopyreva_khotjat_detej

3 года у нас этот домен и это игровой сайт (контр-страйк) И что ха красота и здоровье что за тематика вообще?
Какая та библиотека это не наша тематика и ссылки откуда эти взялись?

Станислав Р.

25 августа 2017, 16:34

где конкретно эти ссылки находятся?

salamon.83

25 августа 2017, 15:42

В веб мастере Яндекса
http://rgho.st/7gyD2QB9K

Станислав Р.

25 августа 2017, 16:51

значит, на них где-то ссылки стоят в интернете. Посмотри в разделе "Внешние ссылки".

salamon.83

25 августа 2017, 16:06

Это ссылки от моего домена как я понимаю, но этих ссылок у меня никогда не было, это какой то сбой скорее всего в поисковой системе Яндекса
http://source-cs.ru/video/vip/4357/krasota_i_zdorove/dzhaz_modern_uroven_1

salamon.83

25 августа 2017, 16:10

Нашел сайт этот но к нам то он как относится не понимаю?
http://yourgames.ucoz.ru/video/vip/4357/krasota_i_zdorove/dzhaz_modern_uroven_1

(/video/vip/4357/krasota_i_zdorove/dzhaz_modern_uroven_1)

Станислав Р.

25 августа 2017, 17:16

спроси у них тут - https://yandex.ru/support/webmaster-troubleshooting/service-indexing_check-url.html

salamon.83

25 августа 2017, 16:53

Написал там штук 10 таких ссылок разных ПРИМЕР
ЯНДЕКС
https://yandex.ru/search/?text=http%3A%2F%2Fsource-cs.ru%2Fvideo%2Fvip%2F4357%2Fkrasota_i_zdorove%2Fdzhaz_modern_uroven_1&lr=36&clid=1993899&win=192

ГУГЛ

https://www.google.ru/search?newwindow=1&q=http%3A%2F%2Fsource-cs.ru%2Fvideo%2Fvip%2F4357%2Fkrasota_i_zdorove%2Fdzhaz_modern_uroven_1&oq=http%3A%2F%2Fsource-cs.ru%2Fvideo%2Fvip%2F4357%2Fkrasota_i_zdorove%2Fdzhaz_modern_uroven_1&gs_l=psy-ab.12...133216.134042.0.135927.2.2.0.0.0.0.200.385.0j1j1.2.0....0...1.1.64.psy-ab..0.0.0.0._kv_oMqKG70

==============================
В Яндексе почему то эти ссылки ссылаются на мой сайт
Может поэтому и не индексировался нормально в Яндексе 2 года на 45 позициях абсолютно по любым запросам

salamon.83

26 августа 2017, 07:56

Привет! Техподдержка написала
Здравствуйте, Александр!
Эти страницы запрещены для индексирования в файле robots.txt, поэтому в поиске не участвуют и никак не влияют на индексирование Вашего сайта. Отображение этих ссылок в сервисе Яндекс.Вебмастер носит исключительно информативный характер. Если ссылки на данные страницы отсутствуют, то со временем информация о них пропадет автоматически.
К сожалению, источники ссылок не сохраняются в нашей базе: робот может найти их в файле sitemap, в исходном коде страниц Вашего сайта, а также с других ресурсов интернета. При этом ссылки могли появиться по следующим причинам:
- Внешние ссылки.
Проанализировать входящие ссылки Вы можете при помощи этого инструмента: https://webmaster.yandex.ru/site/indexing/external-links/ .
- Некорректно указаны относительные ссылки, отсутствует тег <base>.
Проверьте, присутствует ли тег <base> на всех страницах сайта и убедитесь в корректности указанных ссылок.
- Имеются ошибки на стороне CMS или "движка" сайта.
В этом случае мы рекомендуем обратиться к разработчикам CMS или поискать информацию на специализированных форумах.

salamon.83

26 августа 2017, 07:58

Подскажите еще что за <base> и как его прописать?
Не на одном ТОПОВОМ сайте его не увидел нет его он не стоите вообще и почему я его должен прописать <base> ?

Станислав Р.

26 августа 2017, 10:44

https://ruseller.com/lessons.php?id=2067
В общем, никак это не влияет, забей.

salamon.83

26 августа 2017, 10:09

Понял-принял!
Нашел еще какой то подозрительный сайт который ссылается на наш сайт
http://notice.iptv.by/nomoney.php?n=rdostoevskogo35_82a&reason=3&host=source-cs.ru&url=/&params=

Скриншот http://rgho.st/8hPb5G5KW
СТРАННО ВСЕ ЭТО.

Станислав Р.

26 августа 2017, 11:23

он ссылается на тот сайт, который указан в GET-параметре host. Например, так он будет ссылаться на yandex.ru - http://notice.iptv.by/nomoney.php?n=rdostoevskogo35_82a&reason=3&host=yandex.ru&url=/&params=

salamon.83

26 августа 2017, 10:50

Почему он тогда в разделе
( http://source-cs.ru/ Веб мастер /Внешние ссылки) ?
http://notice.iptv.by/nomoney.php?n=rdostoevskogo35_82a&reason=3&host=source-cs.ru&url=/&params=

И нам этот сайт вред никакой не принесет?

Станислав Р.

26 августа 2017, 11:57

потому что этот URL попал в индекс. Вреда никакого нет.

salamon.83

10 сентября 2017, 11:47

Привет
Сайт неделю по висел http://source-cs.ru/ в Яндексе с 4 по 10, и упал на 45 позиции
http://rgho.st/79F4LF6st

И не знаю что за издевательство, ссылок только одна вхождений 1-2 все
что еще ему нужно.

Единственное я заметил то что когда сайт http://source-cs.ru/ был на 1 позициях то этот (тоже наш сайт) http://source-v34.ru/ просто попал под фильтр.

А вот сегодня как сайт http://source-cs.ru/ попал под фильтр то этот http://source-v34.ru/ сайт вышел с под фильтра

То есть ИНДЕКСИРУЕТСЯ
либо этот http://source-v34.ru/
либо этот http://source-cs.ru/
ТОЛЬКО КАКОЙ ТО 1 САЙТ

salamon.83

10 сентября 2017, 12:07

Статус
Указанные проекты source-cs.ru и source-v34.ru признаны аффилированными в Яндексе.
http://rgho.st/86fdNHVH9

То все нормально было, а теперь аффилированны

salamon.83

10 сентября 2017, 12:18

Были одинаковые только название сайта <title></title>
http://source-cs.ru/ Counter-Strike: Source v34, ксс в 34, Скачать css v34
http://source-v34.ru/ Counter-Strike: Source v34, ксс в 34, Скачать css v34

Сейчас изменил,
http://source-cs.ru/ Counter-Strike: Source v34, ксс в 34, Скачать css v34
http://source-v34.ru/ Counter-Strike: Source v34, Скачать css v34

Но не думаю что это повлияло, так как таких сайтов полно.

FPG-Arbyus

28 июля 2017, 14:34

После переезда сайта на https индексирование новых страниц не происходит. Их больше нет в поиске. Несколько старых страниц, которые находились в топе исключены из поиска в формулировкой "Недостаточно качественная". Речь об уникальном контенте - описании книг. Так же на страницах приводятся ссылки на книгу и её аудиоверсия в видеоформате. Страница признана недостаточно качественной. Из поиска убрана. И теперь в топе либо выдаётся книга без описания, либо однотипные переделанные сео-статьи.
Действуя по инструкции перехожу на вкладку нарушения и выбираю сайт - нарушений не обнаружено. Связаться с тех.поддержкой Яндекс.Вебмастера также невозможно.
Как решить данную проблему? Или всё, про сайт можно забывать? Яндекс роботы на столько тупые, что 100% уникальный авторский контент, не заточенный под СЕО запросы теперь автоматически попадает в спам-лист как некачественный?

Станислав Р.

28 июля 2017, 15:20

FPG-Arbyus,

https://yandex.ru/blog/platon/2778 - переезжали по этой инструкции?

FPG-Arbyus

28 июля 2017, 19:53

да. всё чётко по ней.

Станислав Р.

28 июля 2017, 20:28

FPG-Arbyus,

ну вот, например, новая страница https://activateme.ru/personal-development/stat-soboy/pochemu-kalorijnost-i-energeticheskaya-tsennost-potreblyonnyh-produktov-ne-vliyayut-na-figuru.html - она уже в индексе:

https://yandex.ru/yandsearch?lr=213&text=url%3Awww.activateme.ru%2Fpersonal-development%2Fstat-soboy%2Fpochemu-kalorijnost-i-energeticheskaya-tsennost-potreblyonnyh-produktov-ne-vliyayut-na-figuru.html%20%7C%20url%3Aactivateme.ru%2Fpersonal-development%2Fstat-soboy%2Fpochemu-kalorijnost-i-energeticheskaya-tsennost-potreblyonnyh-produktov-ne-vliyayut-na-figuru.html&redircnt=1501262867.1

FPG-Arbyus

29 июля 2017, 00:35

https://yadi.sk/i/MGQSno5Y3LT2UJ

кстати, да. Благодарю. У меня тоже по ней поиск отработал чётко. Добавлена 4 часа назад.

А по данным Веб Визора последнее обновление было 27.07.2017.
То есть, он инфу по добавлению страницы в поиск не светит. Странно как-то.

Бауцентр

28 июля 2017, 16:41

Спасибо, очень полезный вебинар!

agafo14

29 июля 2017, 15:10

День добрый! В видео обещали выложить шпаргалку по дублям. Я не вижу, или ее нет?

Станислав Р.

29 июля 2017, 16:33

agafo14,

agafo14

29 июля 2017, 18:38

Спасибо!

flatcher321

31 июля 2017, 17:40

Посоветуйте пожалуйста!

На сайте ~10000 страниц, ~5000 совсем старые (10 лет) и не очень качественные (просто качество со временем росло). Это новости, некоторые схожие по содержанию (в новости вставлялся одинаковый кусок текста-описания, в общем не дубли). Реальные пользователи туда не заходят. А вот Яндекс постоянно реиндексирует. Хочу их удалить, что-бы просто почистить сайт и снять нагрузку. В общем, они ненужны.

NB! Опасения следующие: не будет ли плохо для ресурсу от потери такого большого количества страниц? И да, на них все же стоят ссылки (люди по ним не ходят, конечно), которые дают какой то вес ресурсу в целом.

Спасибо!

Елена Першина

Сотрудник Яндекса31 июля 2017, 18:02

flatcher321,

Удаление ненужных страниц - не проблема. Главное точно понять, что они не нужны. Это можно сделать, оценив, сколько и откуда на них трафика приходится. Если страницы есть, совпадающие по темам - лучше их удалять с редиректом.

flatcher321

31 июля 2017, 18:33

спасибо за быстрый ответ! :) Но я забыл уточнить еще один момент: будет ли польза от такого шага? Еще раз спасибо за внимание. ;)

Елена Першина

Сотрудник Яндекса1 августа 2017, 22:07

flatcher321,

Опять же зависит от трафика. Если он есть - то не факт, может даже вред быть. А если страницы ненужные, но тратят ресурсы робота на обход - да, может быть и польза. Я бы начала с эксперимента с небольшим количеством страниц, на которые точно нет трафика.

Alexsik-a

31 июля 2017, 22:41

Добрый вечер. Подскажите, пожалуйста, у меня сайт best-mother.ru (статейный и каталог садов) и там очень много дублей, хотя я вроде в CMS установил параметр canonical (тк ряд страниц доступы иногда как в конечном разделе, так и в не конечном разделе, также этот параметр добавил и для страниц пагинации). Сделал такие правила давно, а в обходе еще за 26 июля снова вижу. в чем может быть дело?

Обновлено 2 августа 2017, 11:59

Елена Першина

Сотрудник Яндекса2 августа 2017, 12:00

Alexsik-a,

Обходить-то мы их можем, мы не канонические страницы не должны в поиск отдавать. Если вдруг неканонические страницы у вас в поиск попали - тогда нужно в поддержку писать.

По сайту

1 августа 2017, 10:27

Для чего все эти вебинары? Над чем работать, если я.директ занимает 4 позиции а я.карты вылазят на 5-ом месте? У меня раб. ноут 15.6 дюйм. ВЕСЬ первый экран выдачи - спецразмещение в Директе где размещают мягко говоря ..........

Обновлено 1 августа 2017, 10:28

C6V расчет доставки

1 августа 2017, 21:39

У вас не работает не один механизм для сайтов на js.
Например если сделать настройки подобных сайтов по вашему же faq, то получишь вот такую картинку например:
Счел дублями
/integrations?_escaped_fragment_=
/integrations
И так весь сайт полностью, включая и главную. От сюда не чего не индексируется как нужно.
Так что, товарищи, вместо вебинаров, сидели бы пилили фичу с индексацией js, как гугл.

Обновлено 1 августа 2017, 21:39

Елена Першина

Сотрудник Яндекса2 августа 2017, 18:34

C6V расчет доставки,

У вас исключаются страницы HTML-копий, но страницы по нужным адресам в поиске? Это нормальная ситуация, робот получает контент с копий и включает страницы по нужным адресам.

C6V расчет доставки

2 августа 2017, 18:44

сейчас у меня вообще проблема с снипетами. не чего не трогал на сайте уже пол года как почти, пропали все снипеты в выдаче. В снипетах только тайтл и все =(

Елена Першина

Сотрудник Яндекса2 августа 2017, 19:03

C6V расчет доставки,

точнее, конечно, поддержка Вебмастера подскажет, увидев сайт. Но вообще так обычно бывает, когда робот не получает контент с сайта.

Дмитрий

4 августа 2017, 13:33

Здравствуйте! А есть живые примеры с использованием селекторов для размещения на странице во избежание создания дублей?

Обновлено 4 августа 2017, 13:34

Проводник

5 августа 2017, 06:35

Очередной апокалипсис от яндекса. Я еще годы назад поднимал тему о том, что вы генерируете дубли сами. Не понятно из-за чего, но посещаемость упала на 50%. Ваша техподдержка ничего не сказала совсем. И что теперь делать? В вашем вебмастере ничего не сказано, почему упала посещаемость? Очередной ваш косяк, которые вы плодите регулярно.

Проводник

5 августа 2017, 07:06

Как решить то, что вы нагенерировали?:
/index.php?name=files&op=view&id=3857
/index.php?id=3857&name=files&op=view
/index.php?&op=view&id=3857&name=files
/index.php?&op=view&id=3857&name=files&ops
/index.php?&op=view&id=3857&name=files&files
/index.php/index.php?&op=view&id=3857&name=files

Ваша техподдержка :

Здравствуйте, Дмитрий!
Благодарим Вас за то, что обратили внимание на проблему с индексированием Вашего сайта. Часть страниц, действительно, может отсутствовать в результатах поиска, при этом никаких санкций на них не наложено.
Наши алгоритмы устроены так, чтобы на запросы пользователей давать наиболее полный ответ, и в связи с этим в результаты поиска попадают наиболее релевантные и уникальные страницы сайтов. Мы всегда работаем над совершенствованием алгоритмов, принимающих решение по включению тех или иных страниц в результаты поиска, и примеры страниц Вашего сайта переданы в поисковый отдел нашей компании для анализа и последующей корректировки алгоритмов.

И такую муть я получал на протяжении 7 лет от вас

dmspoli

7 августа 2017, 10:34

Хотелось бы посмотреть на ваше решение для:

/index.php?name=files&op=view&id=3857
/index.php?id=3857&name=files&op=view
/index.php?&op=view&id=3857&name=files

pecuniat

5 августа 2017, 14:05

Вот за это спасибо. По делу и конкретно. Ещё бы неплохо громко предупреждать людей, устанавливающих ваш движок для поиска по сайту, что он генерит несметное количество дублей, и что это нужно привентивно пресекать в robots сразу после установки поиска на сайте. Если такое есть - пардон, не видел... В своё время я избежал этой проблемы благодаря советам на сторонних форумах.

Елена Першина

Сотрудник Яндекса7 августа 2017, 12:07

pecuniat,

Если вы про движок Яндекс.Поиска для сайта, то он никакие дубли не генерит и генерить не может. А то, что страницы поиска на сайте (любого) как сущность нужно закрывать от индексирования, как и иные типы динамического контента, говорилось уже несметное количество раз.

pecuniat

7 августа 2017, 12:26

Да, я про него и именно про кучу мусора в поиске от него. Просто здесь не видел это "несметное количество раз" ) Решил сказать: вдруг кто-нибудь такой же невнимательный как я увидит и учтёт.

Александр С.

6 августа 2017, 09:55

Здрасти!
Пожалуйста скиньте ссылку на форму заполнения, чтобы написать в техю поддержку по вопросу сайта.
А то тут везде кликаю на "Обратная связь" всегда ссылают на раздел Помощь, где куча вопросы с ответами, а формы заполнения я так и не нашёл. просто измучился.
заранее спасибо

Елена Першина

Сотрудник Яндекса7 августа 2017, 12:07

Александр С.,

Она там есть, если дойти до конца вопросов с уточнениями, что именно случилось с вашим сайтом.

Александр С.

7 августа 2017, 18:51

здесь переписываться о моём сайте не буду.
чтобы дойти до конца, как вы говорите нужно хорошое зрение, а у меня зрение очень плохое. плохо, что нет сразу ссылки на форму отправки

Елена Першина

Сотрудник Яндекса7 августа 2017, 19:08

Александр С.,

Не плохо, подавляющее большинство вопросов не требуют обращения в поддержку - и решаются, если читать подсказки. Так человек куда быстрее решает проблему - если его цель именно решить проблему, а не написать в поддержку.

Александр С.

7 августа 2017, 19:18

да, вы правы. я так и делаю всегда.

ладно, спасибо за помощь. пойду пить чай

Проводник

8 августа 2017, 11:43

Вы проигнорировали меня, пожалуйста, ответьте на мой вопрос, как мне решить проблему с вашей чехардой

/index.php?name=files&op=view&id=3857
/index.php?id=3857&name=files&op=view
/index.php?&op=view&id=3857&name=files

и почему посещаемость упала на 70%

Ваша техподдержка молчит

Проводник

8 августа 2017, 11:46

Елена Першина

Сотрудник Яндекса8 августа 2017, 15:40

Мы не генерируем дубли - мы индексируем то, что находим на вашем сайте. Если у вас есть дубли - закройте их от индексирования или приведите к канонической страницы. К сожалению, за вас мы этого сделать не можем, так как это настройки вашего сайта.

Проводник

8 августа 2017, 17:15

Именно вы и генерируете их, вопрос встал на сайте разработчика и он подтвердил, что генерируете их вы.

Ответьте, пожалуйста, мне на вопрос как мне закрыть эти дубли:

/index.php?name=files&op=view&id=3857 (должно быть так) Как закрыть эти:

/index.php?id=3857&name=files&op=view
/index.php?&op=view&id=3857&name=files

Я проверил все входящие и внутренние ссылки, нигде нет ссылок на ссылки вида тех двух, что я указал выше.

И почему просел трафик на 70%? В панели никаких сообщений нет.

Проводник

8 августа 2017, 17:17

Цитирую :

"Данный вопрос уже подымался ранее. Проблема глобальная и касается не только SLAED CMS. Дело в том что для языка PHP последовательность передачи переменных в ссылке/адресной строке не имеет значения.
Поисковые системы типа Google, Yandex и Co. используя своё положение монополистов придумывают свои правила которые выгодны только им и принуждают других плясать под свою музыку. Это касаетя не только вопроса с дублированием ссылок но и многих других факторов и стандартов связанных с сайтостроением.

Одним из решениев которое я вижу на данный момент это реализация функции маршрутизации запросов системы, как обычных так и ЧПУ адресов."

Проводник

8 августа 2017, 17:37

И еще одну вещь проясните, если вы не при чем:

ПОЧЕМУ 8 ЛЕТ НЕ ВСТАВАЛ ЭТОТ ВОПРОС, а теперь это проблема? Почему сейчас они откуда то возникли?

Fundamentum

8 августа 2017, 19:48

То есть ваша великая CMS не поддерживает общепринятые стандарты поисковых систем, и поисковые же системы виноваты? ))) Действительно, им же нужно смотреть на все "удачные попопытки" "пряморуких разработчиков".

Елена Першина

Сотрудник Яндекса8 августа 2017, 19:50

Давайте еще раз - вы сами пишите, что ваше CMS не поддерживает общие стандарты и создает дубли. Чтобы разобраться, как закрыть ваши дубли - нужно понять, по какому принципу они генерируются. Из приведенного примера кажется, что можно так (вариант):
Disallow: /index.php?id=
Disallow: /index.php*op=*id=*name=*

Но нужно вытаскивать все варианты построения дублей и проверять, все ли удалось закрыть.

Елена Першина

Сотрудник Яндекса8 августа 2017, 20:05

Хороший совет - перепроверяйте то, что вам говорит разработчик. Например, правильно ли он сделал настройки. Дубли практически всегда возникают из-за неправильной настройки сайта. И почти всегда разработчикам сложно сказать, что эти дубли возникли из-за этого.

Fundamentum

8 августа 2017, 20:09

Ну что вы! Разработчика так можно и премии лишить - а вот Яндексу нечего не будет. Сжальтесь над человеком, спасите его премию, признайте, что это вы дубли им нагенерировали!

dmspoli

9 августа 2017, 00:41

Fundamentum,

Уточните и назовите международный стандарт

dmspoli

9 августа 2017, 00:41

Fundamentum,

8 лет дублей не было.

dmspoli

9 августа 2017, 00:42

Напишите номер стандарта

dmspoli

9 августа 2017, 09:15

Fundamentum,

Прежде чем открывать рот, или запускать пальчики на клаву, поинтересовались бы, разработчик я или владелец сайта

Проводник

10 октября 2017, 12:29

Подождите пропустил ответ "мы не генерируем дубли":

Flood in GET - name=pages, op=view, id=583
IP Адрес:
Пользователь: Гость
Ссылка:
Браузер: Mozilla/5.0 (compatible; YandexBot/3.0; http://yandex.com/bots)

Это что? Вы генерируете урлы?

светодиодные-товары.рф

7 августа 2017, 11:04

Добрый день.
Подскажите где логика?
Вот по нашей логике основная страница(главная категория)
https://эксперт-снабжения.рф/avtomatika/

а по версии робота она является дублем след страницы:
Страница https://эксперт-снабжения.рф/avtomatika/ дублирует уже представленную в поиске страницу https://эксперт-снабжения.рф/3m. Укажите роботу предпочтительный адрес с помощью 301 редиректа или атрибута rel="canonical".

Страница https://эксперт-снабжения.рф/3m является страницей производителя и ни какого отношения ни контентом , ни товарами отношения к https://эксперт-снабжения.рф/avtomatika/ не имеет.

Елена Першина

Сотрудник Яндекса7 августа 2017, 12:08

Если у страниц написано, что они дубли - значит на момент индексирования у них был единый или очень похожий контент. Если сейчас контент отличается, отправьте страницы на переиндексирование.

светодиодные-товары.рф

7 августа 2017, 13:02

Спасибо за ответ.
Отправил на переиндексирование , но результат 0.

Елена Першина

Сотрудник Яндекса7 августа 2017, 13:37

В смысле, переиндексировались и повторно признаны дублями? Или еще не переиндексировались?

Елена Першина

Сотрудник Яндекса7 августа 2017, 13:40

Кстати, у вас meta name="description"не прописан на 3M, насколько я вижу.

Станислав Р.

7 августа 2017, 14:33

просто у вас на обоих страницах выдавалась ошибка - https://hghltd.yandex.net/yandbtm?fmode=inject&url=https%3A%2F%2Fxn----8sbdndfpj3aeonken4oyb.xn--p1ai%2F3m&tld=ru&lang=en&la=1501477376&tm=1502105521&text=url%3Awww.xn----8sbdndfpj3aeonken4oyb.xn--p1ai%2F3m%20%7C%20url%3Axn----8sbdndfpj3aeonken4oyb.xn--p1ai%2F3m&l10n=ru&mime=html&sign=f3edfdba5c577ff25c7f102470c6ea5b&keyno=0

Поэтому робот и признал их дублями.

Проводник

8 августа 2017, 11:54

светодиодные-товары.рф

8 августа 2017, 15:57

переиндексировались , но проблема осталась прежняя.
Причем следующие категории преследует та же напасть.
https://xn----8sbdndfpj3aeonken4oyb.xn--p1ai/pnevmatika/

Вы можете доступно объяснить как абсолютно разные страницы могут являться дублями(

Обновлено 8 августа 2017, 15:58

Станислав Р.

8 августа 2017, 16:10

надо дождаться, когда вот это переиндексируется https://xn----8sbdndfpj3aeonken4oyb.xn--p1ai/3m

Елена Першина

Сотрудник Яндекса8 августа 2017, 19:38

Выше верно отметили, что если страницы отдали при ошибки один и тот же контент - то именно этот контент мог быть посчитан как дублирующийся.

Алексей

7 августа 2017, 14:00

хотим белый список по Clean-param!!!!

itth2016

8 августа 2017, 18:09

Интересный вебинар, спасибо. Подскажите как бороться с такой ситуацией: есть каталог, в котором есть два товара с похожим описанием и они расцениваются вебмастером как дубли
http://it-th.ru/catalog/monobloki/232208/
http://it-th.ru/catalog/monobloki/232207/
это совершенно разные товары в одной линейке, одного производителя, но так как робот оценивает только текст, то символьные различия между страницами невелики. поэтому процент текстовых изменений позволяет роботу причислить страницы к "практически идентичным". да, есть решение - вписывать текст в каждый товар, но в масштабах огромной выгрузки - это непосильная задача, причем товар может сегодня быть в наличии, а завтра нет. Поэтому писать внутри текст неоправданные трудозатраты. как выйти из этой ситуации?

Станислав Р.

8 августа 2017, 23:27

itth2016,

нужно сделать так, чтобы у таких товаров были разные Title и Description. Сейчас они у вас полностью совпадают.

itth2016

9 августа 2017, 09:45

значит в семинаре должна быть поправка, что робот изучает не только текст страницы, но и метатеги. спасибо за разъяснение, постараемся исправить

Елена Першина

Сотрудник Яндекса9 августа 2017, 14:37

itth2016,

Есть общая рекомендация иметь различные описания и заголовки для всех страниц сайта. Но вообще и содержание самих страниц стоит развести.

Екатерина

9 августа 2017, 03:16

День добрый! Подскажите пожалуйста, появилось очень много страниц дублей вот такого типа - урл?sa=X&ved=0ahUKEwj2r6OOla7TAhVKM5oKHZQEAFQQ9QEIDjAA
и
урл?action_object_map={\"1554704371468201\":820512661322787}&action_ref_map=[]&action_type_map
правильно ли я сделаю если запрет пропишу так:
Clean-param: sa&action_object_map
боюсь не выпадут ли из индекса все страницы, в которых есть сочетание "sa" в адресе?
Или лучше сделать так:
Disallow: *sa=*
заранее спасибо за ответ!

Елена Першина

Сотрудник Яндекса9 августа 2017, 15:12

Екатерина,

Если их очень много, то лучше использовать "Disallow: *sa=*", тогда робот не будет их посещать (при использовании Clean-param робот периодически может заходить на такие страницы).

Екатерина

9 августа 2017, 15:18

большое спасибо!

Елена Першина

Сотрудник Яндекса9 августа 2017, 15:33

Екатерина,

На всякий случай не забудьте проверить закрытие в анализаторе robots.txt в Вебмастере.

Проводник

26 августа 2017, 03:52

Объясните этот бред.
Бот выбрасывает главную страницу форума из индекса и через несколько часов возвращает? http://images.vfl.ru/ii/1503708545/662a46f5/18374367.jpg

И, повторяюсь, почему просела посещаемость? Ваша техподдержка молчит

GK Gorbunoff

27 августа 2017, 11:22

День добрый! Возможно, чуть не в эту тему, но других более подходящих тем для моего вопроса не нашла.
Подскажите, пожалуйста, есть основной сайт, он размещён на площадке тиу, где, к сожалению, есть не все необходимые инструменты, и их самостоятельное добавление невозможно, так как это конструктор.
Хотим создать ещё один сайт с большим функционалом, который будет дублировать определенную информацию с основного сайта, новый сайт будет использоваться исключительно для определенных целей, в том числе статистики и тд, раскручивать его только по контекстке, не нужно чтоб он отображался в поиске.
Собственно 2 вопроса: как сделать создание второго сайта грамотно, чтоб не попасть под санкции? И второй вопрос: можно ли с него делать ссылки на основной сайт, если новый сайт будет например закрыт от индексации?
Надеюсь, понятно объяснила, что хотим;))) заранее спасибо за развёрнутые ответы;)

Елена Першина

Сотрудник Яндекса28 августа 2017, 12:47

GK Gorbunoff,

Из вашего описания сложно понять, зачем вам все-таки второй сайт той же тематики, поэтому сложно тут что-либо посоветовать. Однотипные сайты со схожими задачами мы обычно не рекомендуем создавать.

GK Gorbunoff

28 августа 2017, 13:05

Он будет использоваться на контекстной рекламе, для подписок и сбора статистики

Елена Першина

Сотрудник Яндекса28 августа 2017, 16:29

GK Gorbunoff,

Что вам мешает использовать ваш обычный сайт для этого? Или лендинг сделать на том же домене?

GK Gorbunoff

28 августа 2017, 16:39

Мы на конструкторе тиу сидим;((
А подскажите поподробнее про лендинг на одном домене, или ссылку пришлите чтоб прочитать, буду благодарна, не сталкивалась с этим.

Елена Першина

Сотрудник Яндекса28 августа 2017, 16:50

GK Gorbunoff,

Поднимаете отдельный раздел, его заверстываете под нужную вам акцию - профит без создания странно-дублирующего сайта.

GK Gorbunoff

28 августа 2017, 17:35

Спасибо, поняла!

Шамиль

31 августа 2017, 06:56

Подскажите пожалуйста, у меня на сайте появились дубли страниц из-за одного плагина, там добавлялось к урлу ?user=1, т.е. http://site.ru/category/post.html?user=1 . посмотрев данный семинар я прописал в роботсе Clean-param: user ,т.е.
User-agent: *
....
Clean-param: user
....
Host: https://сайт.ру
Это правильно или нет?

Елена Першина

Сотрудник Яндекса31 августа 2017, 12:19

Шамиль,

Всё правильно . Если вы совсем не используете get-параметры на сайте, лучше просто "Disallow: *?*.

Шамиль

31 августа 2017, 12:45

Спасибо Елена

popsik

1 сентября 2017, 11:31

Очень интересует вопрос, можно ли реализовывать каноникал через заголовок http,
в официальном faq нет нигде этой информации, только через атрибут link, при этом чуть ниже в комментариях к теме про каноникал сказано, что вроде можно это сделать.
Использует ли Яндекс этот способ указания каноникла?

driffru

3 сентября 2017, 11:17

Подскажите, почему для страниц пейджинга сайта https://driff.ru/ отображается что дублируются дескрипшены, если страницы пейджинга не представляют ценность для пользователей?

Обновлено 5 сентября 2017, 13:30

Елена Першина

Сотрудник Яндекса5 сентября 2017, 13:31

driffru,

Ну, видимо потому что они дублируются. Вы их клеили, как в вебинаре сказано?

susu2016

17 сентября 2017, 15:30

В яндекс вебмастере в разделе "страницы в поиске", во вкладке все страницы, некоторые страницы с одинаковым url отображаются по два раза. Это не дубли, а одна и та же страница! С чем это связано?

Елена Першина

Сотрудник Яндекса18 сентября 2017, 22:36

susu2016,

Очень похоже на проблему с нашей стороны, проверим, и если так, исправим максимально быстро. Спасибо.

Комментарий удалён

Елена Першина

Сотрудник Яндекса3 октября 2017, 15:35

Самый правильный вариант - второй. Поисковики нормально отнесутся к большому количеству межхостовых редиректов, тут переживать не стоит.

Удалённый пользователь

3 октября 2017, 15:58

Спасибо!

Александр

3 ноября 2017, 12:05

Добрый всем день!
В исключённых из поиска страницах числятся, к примеру, такие :https://www.dessy.ru/catalog-pdc397047.htmlchip с ошибочным окончаниями. Видимо, на просторах инета кто-то так поставил на мой сайт ссылку. И происходит коллизия: Яндекс считает страницу не канонической. Как с этим бороться? Можно ли в robot.txt прописать нечто типа этого:
Disallow: /*.html/*/

Елена Першина

Сотрудник Яндекса3 ноября 2017, 17:42

Александр,

Если окончания страниц меняются, то поможет комбинация:

Disallow: *.html*
Allow: *.html$

Обновлено 3 ноября 2017, 17:42

Александр

8 ноября 2017, 11:49

Спасибо! Взял поп-корн, сижу, жду результаты....

Соловьев Алексей Юрьевич

10 ноября 2017, 17:02

Здравствуйте.
Появился следующий вопрос:
Обратил внимание, что все страницы моего сайта с get-параметрами (фильтры, сортировки) имеют ссылку на канонический URL. В то же время исходя из предложенных рекомендаций эти страницы закрыты от индексации в robots.txt. Может стоить разрешить эти страницы к индексированию? Не теряется ли вес канонической страницы в случае запрета индексирования? Ведь ссылки в данном случае не видны.

С уважением, Алексей.

Rost

15 ноября 2017, 11:41

Вопрос, на засыпку есть пациент http://mir-vkontakte.ru/ каноникалы прописаны пагинация и страницы категорий,архивы и тд закрыты от индексации. Однако в индексе в 2 раза больше страниц чем по факту, в какую сторону ковырять?

Елена Першина

Сотрудник Яндекса16 ноября 2017, 15:52

Rost,

1. Посмотрите исключенные страницы - нет ли там ответа.
2. Выгрузите список страниц в поиске и выгрузите список страниц сайта - через эксель найдите отличия.
3. И посмотреть в сторону отсутствия редиректов со / и без него в конце страниц типа: http://mir-vkontakte.ru/chto-takoe-sfs-v-instagrame/#more-4609/

jackov.klimchuk

26 ноября 2017, 13:55

Здравствуйте! Подскажите, пожалуйста, почему страницы полностью разные, а робот начал писать что это дубли и выкидывать их из поиска. В гугле все ок. Спасибо за быстрый ответ!

Елена Першина

Сотрудник Яндекса26 ноября 2017, 23:22

jackov.klimchuk,

Значит для робота не разные. Наиболее вероятная причина - что была проблема с вашим сервером, когда выдавалась текстовая заглушка, которая оказалась для всех страниц одинаковой. Но могут быть и другие причины - за подробностями лучше в поддержку Вебмастера с примерами страниц - дубля и не дулбля.

jackov.klimchuk

21 февраля 2018, 20:34

Спасибо

d.s.korepanova

24 декабря 2017, 18:40

Здравствуйте! Подскажите пожалуйста -
1. на страницах присутствует rel canonical для исключения дублей
<link rel="canonical" href="https://site.com/page1/">

2. сайт на ajax и для индексации созданы html-версии страниц, доступные по адресам типа https://site.com/page1/?_escaped_fragment_=
3. на страницах присутствует мета-тег <meta name="fragment" content="!">

При этом в вебмастере ситуация такая:
1. страницы https://site.com/page1/?_escaped_fragment_= исключены из поиска - "Страница проиндексирована по каноническому адресу https://site.com/page1/"
2.Страница https://site.com/page1/ дублирует уже представленную в поиске страницу (главную https://site.com/)

То есть робот не получил html-версию страницы https://site.com/page1/ с корректным содержимым, а получил только "скелет" верстки, который одинаков для всех страниц до начала работы скриптов.

Что нужно сделать, чтоб позволить роботу получать html-версию страниц, но при этом указать ему верный канонический адрес страницы и не допустить дублей?

Елена Першина

Сотрудник Яндекса24 декабря 2017, 18:55

d.s.korepanova,

Можете этот вопрос отправить в поддержку Вебмастера, желательно указав сайт. Хочется в живую взглянуть на реализацию, чтобы за теорией практику не пропустить.

d.s.korepanova

24 декабря 2017, 20:18

Вопрос отправлен в поддержку Вебмастера

Елена Першина

Сотрудник Яндекса25 декабря 2017, 10:07

d.s.korepanova,

спасибо!

maria.golubnichenko

12 января 2018, 09:03

Здравствуйте, я новичок в технических вопросах, не могли бы Вы сказать: если поменять все ссылки на сайте с относительных на абсолютные, скажется ли это как-то на ранжировании сайта? Как раз столкнулся с проблемой дублей из-за относительных ссылок

Елена Першина

Сотрудник Яндекса12 января 2018, 12:22

maria.golubnichenko,

Нет, сказаться не должно, ведь непосредственные адреса страниц в базе робота не изменятся.

Роман Лебедев

31 января 2018, 09:13

Вебмастер сообщает о дублях страниц.
Но это разные страницы. Есть ли какой то метод сообщить роботу что это разные страницы?
Вот пример: https://yadi.sk/i/k6t9wr683RwNa8

freecolorbaby

4 февраля 2018, 17:39

Здравствуйте!
В исключенных страницах есть дубли, вот такого рода

https://babytime.com.ua/kolyaski/kolyaski-dlya-novorozhdennyh/kolyaska-dlya-novorozhdennogo-2-v-1-adamex-sofia-50-kozha
https://babytime.com.ua/kolyaska-dlya-novorozhdennogo-2-v-1-adamex-sofia-50-kozha

Почему эти страницы считаются дублем если срабатывает редирект со страницы https://babytime.com.ua/kolyaska-dlya-novorozhdennogo-2-v-1-adamex-sofia-50-kozha на страницу https://babytime.com.ua/kolyaski/kolyaski-dlya-novorozhdennyh/kolyaska-dlya-novorozhdennogo-2-v-1-adamex-sofia-50-kozha

Спасибо!

Елена Першина

Сотрудник Яндекса5 февраля 2018, 15:01

freecolorbaby,

А почему они не должны считаться дублями, если, по факту, по урлам в итоге отдается один и тот же контент?

freecolorbaby

5 февраля 2018, 21:46