Форум русской поддержки Joomla!® CMS
10.12.2016, 05:13:59 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

Войти
   
   Начало   Поиск Joomla 3.0 FAQ Joomla 2.5 FAQ Joomla 1.5 FAQ Правила форума Новости Joomla Реклама Войти Регистрация Помощь  
Страниц: [1]   Вниз
  Добавить закладку  |  Печать  
Автор

Ребята...какой-то ахтунг с индексацие дублей

 (Прочитано 354 раз)
0 Пользователей и 1 Гость смотрят эту тему.
Serebro2009
Осваиваюсь на форуме
***

Репутация: +0/-0
Offline Offline

Сообщений: 95


« : 04.08.2016, 22:37:54 »

Суть проблемы: в первых числах августа произошел апдет поисковой выдаче. В Вебмастере яндекса - обнаружил что количество проиндексированных страниц возраслов 1000 раз. Индексируются дубли которых оказалась просто НЕМЕРЯНО. Адреса подобные:

http://site.рф/index.html/snegohody/motowezdehod/snegohody/motowezdehod/snegohody/articles/articles/dokumentacija/motobuksirovshhik_volgar_peredneprivodnyj/motobuksirovshhik_volgar_peredneprivodnyj.html

и так далее.

Платон ответил:

По всей видимости, робот где-то в интернете обнаружил ссылки на подобные адреса и поэтому попытался их проиндексировать, а поскольку страницы были доступны и отдавали контент, они были успешно проиндексированы.

Выяснить, откуда именно роботу стали известны те или иные страницы, не представляется возможным, поскольку нашей в базе просто не сохраняются данные об этом. Со своей стороны могу порекомендовать Вам проверить исходный код доступных страниц сайта на предмет наличия подобных ссылок.

Я замечу, что сайт стоит на чистом HTML уже не первый год...подобного не было, сторонние расширения не ставил. В чем проблема?


Записан
effrit
Группа развития
*****

Репутация: +733/-7
Offline Offline

Пол: Мужской
Сообщений: 6824


effrit.com


« Ответ #1 : 04.08.2016, 22:43:30 »

плагин no doubles ставвить. есть на форуме
Записан
Serebro2009
Осваиваюсь на форуме
***

Репутация: +0/-0
Offline Offline

Сообщений: 95


« Ответ #2 : 04.08.2016, 22:48:43 »

Какой плагин? HTML чистый,
Лучше посоветуйте как запретить в роботс к индексации страницы начинающиеся с http://site.рф/index.html/
Записан
Serebro2009
Осваиваюсь на форуме
***

Репутация: +0/-0
Offline Offline

Сообщений: 95


« Ответ #3 : 05.08.2016, 00:23:27 »

Что за ерунда, еще три тысячи страниц добавились в индекс...как так-то
Записан
ChaosHead
Профи
********

Репутация: +382/-10
Offline Offline

Пол: Мужской
Сообщений: 4397



« Ответ #4 : 29.08.2016, 14:24:41 »

У Joomla проблема с дублями, она показывает контент по разным адресам, а вас возможно хотят конкуренты так песимизировать. Ставьте плагин, что выше написали.
Записан
SeBun
Практически профи
*******

Репутация: +134/-3
Offline Offline

Пол: Мужской
Сообщений: 2289



« Ответ #5 : 29.08.2016, 15:29:42 »

У Joomla проблема с дублями
Да он не по адресу. У него не Жумла, а статичные странички на HTML.

ТС, сколько всего страниц на сайте? Настраивайте htaccess так, что бы отдавал только запрашиваемые, на остальные - 404 ошибка, иначе вылетите из поиска. Или переносите все на Joomla, она имеет в своем арсенале расширения, решающие данную проблему.
Записан
Филипп Сорокин
Живу я здесь
******

Репутация: +121/-4
Offline Offline

Пол: Мужской
Сообщений: 1467


« Ответ #6 : 29.08.2016, 15:50:40 »

В robotx.txt прописываете:

Код:
Disallow: /index.html/
Записан
annushka
Осваиваюсь на форуме
***

Репутация: +2/-0
Offline Offline

Пол: Женский
Сообщений: 123


Joomla!


« Ответ #7 : 15.10.2016, 18:12:12 »

Ищите, откуда на эти страницы на вас ссылаются. Проанализируйте входящие ссылки.
Конкуренты, возможно, вас так из выдачи выжимают, ссылки на несуществующие страницы размещая, а после индексации снимая.
Можно вручную страницы и разделы в Я-вебмастере из индекса удалить и роботс, конечно же, подправить.
Записан
dmitry_stas
Профи
********

Репутация: +798/-4
Offline Offline

Сообщений: 7781



« Ответ #8 : 15.10.2016, 23:21:59 »

Какой плагин? HTML чистый,
юморите? Azn как на чистом HTML могут быть такие дубли? Azn кто у вас за роутинг отвечает? .htaccess?

что отдает страница http://site.рф/index.html/snegohody/motowezdehod/snegohody/motowezdehod/snegohody/articles/articles/dokumentacija/motobuksirovshhik_volgar_peredneprivodnyj/motobuksirovshhik_volgar_peredneprivodnyj.html
, какой код? код главной страницы? сайт покажите
Записан
dmitry_stas
Профи
********

Репутация: +798/-4
Offline Offline

Сообщений: 7781



« Ответ #9 : 15.10.2016, 23:25:26 »

В robotx.txt прописываете:

Код:
Disallow: /index.html/
что то типа такого, но не спасет полностью. есть же и другие страницы HTML, к ним тоже смогут цеплять хвосты. надо иначе, чтобы универсально для всех страниц, но для начала надо понять, как это возможно на "чистом html" Azn
« Последнее редактирование: 15.10.2016, 23:30:28 от dmitry_stas » Записан
shurakana
Живу я здесь
******

Репутация: +48/-6
Offline Offline

Сообщений: 862



« Ответ #10 : 15.10.2016, 23:46:27 »

У Joomla проблема с дублями, она показывает контент по разным адресам, а вас возможно хотят конкуренты так песимизировать. Ставьте плагин, что выше написали.
Много раз слышал об этом, как воспроизвести эти дубли? у меня ни на одном сайте их нет. Имею ввиду в индекс..)

юморите? Azn как на чистом HTML могут быть такие дубли? Azn кто у вас за роутинг отвечает? .htaccess?
это html6..))
Записан
dmitry_stas
Профи
********

Репутация: +798/-4
Offline Offline

Сообщений: 7781



« Ответ #11 : 16.10.2016, 00:09:12 »

Много раз слышал об этом, как воспроизвести эти дубли? у меня ни на одном сайте их нет. Имею ввиду в индекс..)
это html6..))
руками пишите в адресной строке index.php/и дальше что угодно - вот вам и дубли

это html6..))
а, ну да, ну да...
Записан
ELLE
Support Team
*****

Репутация: +862/-0
Offline Offline

Пол: Женский
Сообщений: 4723



« Ответ #12 : 16.10.2016, 00:38:28 »

Насколько я вижу, все уже в порядке у ТС. Сайт он пересобрал на Joomla, все уже переиндексировалось и с виду дублей в индексе нет.
Записан
dmitry_stas
Профи
********

Репутация: +798/-4
Offline Offline

Сообщений: 7781



« Ответ #13 : 16.10.2016, 00:41:14 »

загадка осталась без отгадки... ну и ладно Azn
Записан
ELLE
Support Team
*****

Репутация: +862/-0
Offline Offline

Пол: Женский
Сообщений: 4723



« Ответ #14 : 16.10.2016, 00:45:04 »

А кстати можно глянуть на чем у него был сайт...)
Показать текстовый блок
В кеше уже нет ничего, глянем в вебархиве
 
Записан
SeBun
Практически профи
*******

Репутация: +134/-3
Offline Offline

Пол: Мужской
Сообщений: 2289



« Ответ #15 : 16.10.2016, 00:53:36 »

Короче, на святом духе и честном слове сайт держался....
Записан
ELLE
Support Team
*****

Репутация: +862/-0
Offline Offline

Пол: Женский
Сообщений: 4723



« Ответ #16 : 16.10.2016, 00:58:22 »

Да нет) Вроде как на самом деле на html) Может, хостинг сломали или какие иные проблемы на онном) Так-то если все ровно настроено и не было вмешательства извне, то на такие запросы, сервер должен 404 отдавать без лишних телодвижений со стороны вебмастера)
Записан
dmitry_stas
Профи
********

Репутация: +798/-4
Offline Offline

Сообщений: 7781



« Ответ #17 : 16.10.2016, 01:43:19 »

на ум приходит только сервер на голом apache, без nginx, что само по себе странно. или еще более фантастический вариант - nginx настроенный таким образом, чтобы HTML проксировать на апач. что вообще бред Azn ну и плюс все таки должно быть что то, что такой роутинг отработает. версия со взломом очень вероятна... а судя по тому, что это голый HTML, то если версия со взломом подтвердится - то поломали скорее всего не серверную сторону, а утянули например пароль от ftp... а это значит что ломатели могут и вернуться... ТС, я бы наверное поднял бекапы и отдал бы их на анализ, если самостоятельно сомневаетесь. сайт, логи сервера, и т.п.
« Последнее редактирование: 16.10.2016, 01:47:46 от dmitry_stas » Записан
Страниц: [1]   Вверх
  Добавить закладку  |  Печать  
 
Перейти в:  

Powered by SMF 1.1.21 | SMF © 2006, Simple Machines

Joomlaforum.ru is not affiliated with or endorsed by the Joomla! Project or Open Source Matters.
The Joomla! name and logo is used under a limited license granted by Open Source Matters
the trademark holder in the United States and other countries.

LiveInternet