Откуда в Яндекс-вебмастере страницы с кодом 404, с URL похожим на sql-запросы?

  • 8 Ответов
  • 537 Просмотров

0 Пользователей и 1 Гость просматривают эту тему.

Добрый день! Есть сайт Joomla 3 + VirtueMart 3.0.6 (http://alcopribor.ru).

В Яндекс-вебмастере в разделе "Индексирование сайта - Исключенные (404) страницы" присутствует несколько десятков ссылок примерно такого вида:

catalog/skidki-i-aktsii-smotret-vse/manufacturer/by,p.ratings/results,25-24
catalog/skidki-i-aktsii-smotret-vse/manufacturer/by,p.ratings/results,49-48
catalog/skidki-i-aktsii-smotret-vse/by,p.ratings/results,265-264
catalog/skidki-i-aktsii-smotret-vse/manufacturer/by,p.ratings/results,241-240

Откуда могут браться адреса страниц, напоминающие в хвосте некий SQL-запрос? Как такие страницы попали в поле зрения Яндекса? (Вирусов на сайте не наблюдаю, проверял; robots.txt вполне джумловский).

PS. Я-то думаю, ничего страшного в этом нет, но клиент переживает и просит вычистить такие страницы, поковыряв движок чтобы их убрать. В каком направлении ковырять?

Заранее спасибо!

Попробуйте мой способ, который, в принципе, работает для любых компонентов: http://joomlaforum.ru/index.php/topic,328308.msg1650158.html#msg1650158
Ставь лайк, если согласен, и делай репост!

  => мои публикации
    => мои работы
      => спектр моих услуг

*

Оффлайн ELLE

Оно у них 404 отдает, мета-теги будут как мертвому припарка, в данном случае

NDanilov2015, ссылки - от старой сортировки в каталоге - по рейтингу. Сайт, видимо,  был обновлен, т.к. я таких урлов со времен J1.5 + VM1.x не припомню.
Если в Вебмастере указано, что есть ссылки на эти страницы - скорее всего раньше пользователи где-то поделились. Тогда лучше редиректы прописать в корень данного раздела.

ELLE, редиректы могут и сайт уронить, если ссылок много, и по ним будет шастать какой-нибудь сумасшедший бот.
Ставь лайк, если согласен, и делай репост!

  => мои публикации
    => мои работы
      => спектр моих услуг

Тогда уже в robots.txt их прописать и не "париться"!
Ставь лайк, если согласен, и делай репост!

  => мои публикации
    => мои работы
      => спектр моих услуг

*

Оффлайн ELLE

ELLE, редиректы могут и сайт уронить, если ссылок много, и по ним будет шастать какой-нибудь сумасшедший бот.
Боту можно 404 отдавать, пользователям отложенный редирект

Тогда уже в robots.txt их прописать и не "париться"!
Тогда эти ссылки из раздела с 404 ошибкой, перейдут в раздел с запрещенными в роботс страницами.

==========
В общем, если на эти страницы нет ссылок с других сайтов, можно ничего не делать, со временем пропадут сами. Если они там задержались, скажем уже 6 месяцев прошло, то можно в саппорт написать, почистят.

Спасибо огромное, а то уже замучался ^-^

Однако, всё не так просто:
Disallow: /*by,`p`.ratings выдаёт в анализаторе robots.txt предупреждение "Возможно был использован недопустимый символ".

А, да, собственно, URL невалидный :)
Wildcard (*) вместо спецсимволов ставить опасно - вместо "сломанных" URL под раздачу могут попасть нормальные.
Хотя, с другой стороны, если это имеет такое важное значение для клиента, то можно поиграться с .htaccess, из которого можно отдавать 410 заголовок GONE (https://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html#sec10.4.11)
Ставь лайк, если согласен, и делай репост!

  => мои публикации
    => мои работы
      => спектр моих услуг