0 Пользователей и 1 Гость просматривают эту тему.
  • 7 Ответов
  • 975 Просмотров
*

Игарь

  • Захожу иногда
  • 97
  • 0 / 0
Всем доброго вемени суток,
у меня такая вот штука: заинтересровало меня как отображается мой сайт в поисковике Goggle.
Почитал и понял что за это ответственны Bot`ы от Google которые читают и индексируют всё на прополую если нет файлов sitemap.xml и robots.txt
(Я так понимаю и с ними тоже все на прополую, только то что указанно с большей вероятностью индексируют)

Почитал как их составлять, составил, зарегистрировался в в.у. консоле, залил карту сайта и положил в корень оба файла.
Прошло пару дей, катра сайта от части проиндесированнна, от части нет.
То что не доиндексировалось было затребовано для индексации. Ждёмс.....

На данный омент в Google присутствует ОЧЕНЬ большое колличество старых ссылок, прописаных через index.php
Ои работают, НО если честно немного смущают своим "index.php" от коротого я избавился уж как пару месяцев.
Может кто то подсказать как от их избавиться?



И ещё, на сайте есть три формуляра в .pdf-фрмате, они тоже проиндексированны поисковиком и висят в списке результатов.
Можно ли их временно заблокировать а тем временем внести в robots.txt "Disallow: /downloads/" и/или "Disallow: /*.pdf".
Т.е. они блокируются на примерно пол года а потом уже повторно не индексируются и пропадают из списка результатов?


.... и ещё на сайте есть два меню подвязанные к тожу же контенту, это "Продукты" и "Все продукты".
Т.е. "Продукты" это пункт меню а "Все продукты" это первый дуплирующийся подпункт.
Та же песя с пуктами "Ремонт" и "Все ремонты".
Как бы с ними быть, может прописать в карте сайта с нулевым приоритетом?


сайт: _https://www.fechtbedarf-bajtinger.de/






Заранее спасибо,
Игорь
 
 
*

Kostelano

  • Давно я тут
  • 525
  • 51 / 1
Re: Google Search Console, sitemap.xml и robots.txt
« Ответ #1 : 19.05.2020, 12:51:40 »
Добрый день, search.google.com.




Удаляете + добавляете соответствующую запись в robots.txt, чтобы позже вновь не появилось в индексе.
*

voland

  • Легенда
  • 11030
  • 588 / 112
  • Эта строка съедает место на вашем мониторе
Re: Google Search Console, sitemap.xml и robots.txt
« Ответ #2 : 19.05.2020, 13:21:45 »
ТС, есть правило - один вопрос - одна тема.
У вас там каша из полудюжины вопросов, не надо так.
И не надо сюда рассказы писать - пишите лаконично, лишние эпитеты хороши на литературном конкурсе
*

Игарь

  • Захожу иногда
  • 97
  • 0 / 0
Re: Google Search Console, sitemap.xml и robots.txt
« Ответ #3 : 19.05.2020, 13:24:23 »
ТС, есть правило - один вопрос - одна тема.
У вас там каша из полудюжины вопросов, не надо так.
И не надо сюда рассказы писать - пишите лаконично, лишние эпитеты хороши на литературном конкурсе


Спасибо за замечание, учту.
*

Игарь

  • Захожу иногда
  • 97
  • 0 / 0
Re: Google Search Console, sitemap.xml и robots.txt
« Ответ #4 : 19.05.2020, 13:35:43 »
Добрый день, search.google.com.




Удаляете + добавляете соответствующую запись в robots.txt, чтобы позже вновь не появилось в индексе.



Спасибо за скорую подсказку.
Я так понимаю это приминительно старых ссылок содержащих "index.php"?
А как прописывать что бы они вновь не индексировались?
"Disallow: index.php" ?, т.е. всё что после "mysite.com" до "index.php" после перепишется и дупликаты Google автоматом снесёт?
(Я не понимаю - ссылок с "index.php" нет но они перенаправдяются на рабочие ссылки без "index.php" или они всё же есть и будут индексипрованы вновь?)

Т.е. я их блокирую "временно", googl берёт из карты сайта новые ссылки без "index.php" и старые после разблокировки автоматически удаляет?


С .pdf-файлами я так понимаю, действовать так же (?)


А как быть с "Продукты" и "Все продукты"?
Только noidex?
Это черег Tag Manager?


*

Игарь

  • Захожу иногда
  • 97
  • 0 / 0
Re: Google Search Console, sitemap.xml и robots.txt
« Ответ #5 : 19.05.2020, 16:49:52 »
Может я чего о не понимаю, но Google отказывается индексировать страницу по тому что на "не удобна для мобильных"?  *suicide*
_https://ibb.co/jMRD8fP



EDIT: не понимаю если честно, если индексирование этих страниц проведено не было, почему они находятся чеез поисковик?
_https://ibb.co/K64cW46
« Последнее редактирование: 19.05.2020, 19:17:41 от Игарь »
*

Игарь

  • Захожу иногда
  • 97
  • 0 / 0
Re: Google Search Console, sitemap.xml и robots.txt
« Ответ #6 : 20.05.2020, 13:07:13 »
Можно ли защититься от индексации таких вот URL: _https://www.fechtbedarf-bajtinger.de/ankuendigungen?rCH=-2
с помощью следующей записи в robots.txt: Disallow: /?rCH=-2/
?

(Как я нашёл, это что то связанное с Cookie-Hint, который у меня давно уже деактивирован, но URL в Google остался)
ПС: как старый контент гугл тоде отказался удалять, 4 раза заявление ставил.
В последствии заблокировал "временно".

.... или всё же Disallow: /ankuendigungen?rCH=-2/
« Последнее редактирование: 20.05.2020, 14:07:54 от Игарь »
*

Kostelano

  • Давно я тут
  • 525
  • 51 / 1
Re: Google Search Console, sitemap.xml и robots.txt
« Ответ #7 : 20.05.2020, 23:36:20 »
Я бы записал так:
Код
Disallow: /*?rCH=*
Чтобы оставить сообщение,
Вам необходимо Войти или Зарегистрироваться
 

Дополнительное название домена в Google

Автор web1

Ответов: 1
Просмотров: 442
Последний ответ 18.12.2023, 12:56:21
от SeBun
Нет позиций в Google Joomla 3

Автор Benderalfa

Ответов: 1
Просмотров: 1300
Последний ответ 20.09.2022, 20:53:56
от darkghost
Роботу Googlebot заблокирован доступ в файле robots.txt

Автор illimited

Ответов: 3
Просмотров: 1789
Последний ответ 29.05.2022, 14:57:55
от web1
Google не индексирует страницы через ajax ссылки

Автор illimited

Ответов: 0
Просмотров: 960
Последний ответ 31.03.2022, 23:53:05
от illimited
meta-description не отображается в Google

Автор Игарь

Ответов: 39
Просмотров: 4735
Последний ответ 20.11.2021, 18:17:12
от Byzi