Откуда же она может взяться?
Например, от сюда
Пример №1
Страница с исходящей неправильной ссылкой:
http://joomlaportal.ru/content/category/2/38/2/(текст ссылки: Как добавить IP пользователя в письма из компонента Контакты? )
Сама ссылка
http://joomlaportal.ru/content/view/1323/2/Дрцугие ссылки на эту страницу
joomlaportal.ru/content/view/1323/75/
joomlaportal.ru/content/view/1323/1/
Пример №2
Статья: Как увеличить длину заголовков материалов
ис.
http://joomlaportal.ru/content/blogcategory/30/46/9/9/вид ссылки:
http://joomlaportal.ru/content/view/226/53/ис.
http://joomlaportal.ru/content/category/3/30/61/вид ссылки:http://joomlaportal.ru/content/view/226/61/
Поиск был совершен по записям Yandex.
Если провести полную проверку всех ссылок, например, при помощи PagePromoter, то можно будет наверняка обнаружить все страницы, которые ссылаются с этими ссылками.
Однако есть ещё один вариант. Сайт большой, возможно когда-то была проиндексирована страница с корявым URL, потом ссылка на эту страницу была закрыта для пользователей, но оставалась рабочей и в памяти поисковика. Он просто периодически находил страницу, находил корявую ссылку и сохранял её.
Что касается сторонних пауков, которые выстраивают карту.
Далее я могу только предполагать, так как не знаю, был ли динамичный Sitemap, которым Вы пользовались, происходила ли проверка ссылок на сайте хотя бы 1 раз в неделю с внесением в карту сайта новых изменений.
Как мы уже с Вами говорили причина изменения ссылок это Itemid, он разный при различном расположении модулей.
При работе с сайтом, уже после создания Sitemap, Вы наверняка добавляли модули, использовали разное отображение списков статей Блогом или в виде таблицы и т.д в результате на каких то страницах появлялись ссылки на страницы с «корявым» URL
Если Sitemap не динамичный, то такие изменения не отображались в карте сайта, а поисковик находил эти страницы и индексировала, как страницы так и ссылки с «корявыми» URL.
Но на счёт сторонних пауков и причин «корявых» URL это только моё предположение
а я не говорю о процентах, я говорю о том, что если такая ситуация может реализована не для обмана поисковика, а для благих целей - например для улучшения юзабилити сайта, для удобства пользователя и т.д. И в таком случае, если вдруг какие-то санкции сработают, всегда можно аргументировано объяснить зачем это сделано, для чего и т.д. И если сайт содержит полезную информацию и действительно сделан для людей, а не для манипуляций алгоритмами поисковых ботов, то бояться тут совершенно нечего.
Согласен, аргументировано всегда можно объяснить технической поддержки поисковика, что это сделано для удобства пользователя, но не роботу-поисковику.
Он анализирует страницы на основе вложенных в него алгоритмов и на их основе налагает фильтры и баны. Если сайт вылетает из поисковой системы это заметно владельцу сайта и он начинает разбираться, переписывать с тех. поддержкой.
Но большинство владельцев сайта даже не заметят наложенные фильтры, исчезновение из поиска по каким-то ключевым запросам (если они этого не отслеживают). Сайт в индексе поисовика, но в результате идёт снижение количества посетителей из поисковых систем.
Не побежишь же к тех. поддержки поисковика с вопросом, почему от Вас людей так мало стало ходить ко мне на сайт :-)
Да и поисковики не сообщают о том, что на сайт наложено наказание или фильтр.
И если на небольших сайтах ещё можно как-то отследить изменения наложение фильтров, уменьшение «авторитетности», то для больших сайтов это сделать очень сложно.
И ещё один неприятный момент, скорее всего связанный с добавление новых моделей или появлением других путей попадания на статью пользователем
Вот эти URL были у статьи "Как увеличить длину заголовков материалов" 03.07.2007 проиндексированы Yandex
http://joomlaportal.ru/content/view/226/59/http://joomlaportal.ru/content/view/226/46/А эти URL от 29.07.2007 (проиндексированы Yandex)
joomlaportal.ru/content/view/226/63/
joomlaportal.ru/content/view/226/61/
joomlaportal.ru/content/view/226/58/
Постоянный вид URL для страниц один из важных показателей поисковикам надежности и авторитетности сайта, а он меняется во времени.
Joomla система интересная, но без качественного SEF снижаются конкурентные возможности сайтов, построенные на этой CMS.
Встроенный SEF эту проблему не решает. Может быть следует доработать в русских локализациях этот минус?
Я не программист, и в тоже время, если вдруг будет создаваться такая SEF готов участвовать в тестировании
Работал только с OpenSEF и пока меня беспокоят только две вещи в нём:
1. ( Главная) Нагрузка на сервер, общая скорость работы сайта и соответственно скорость работы с ним посетителей.
2. Размер URL, их как-то надо уменьшать.