Новости Joomla

0 Пользователей и 1 Гость просматривают эту тему.
  • 10 Ответов
  • 488 Просмотров
*

ast

  • Захожу иногда
  • 81
  • 6 / 0
Здравствуйте!
Моему сайту около 10 лет. На хостинге занимает места около 1,5Гб. За это время понятно, что часть статей удалялась с сайта, что-то переделывалось, что-то выкидывалось, где-то что-то менялось. Очевидно, что за всё это время на хостинге накопились изображения, которые занимают место, но остаются невостребованными. Возникла мысль собрать со всех страниц ссылки на изображения, собрать список всех изображений на хостинге, наложить один список на другой. Таким образом получить список картинок, которые не используются.
Не могу решить как собрать со всех страниц списки ссылок на изображения.
Помогите решить задачу.
*

sivers

  • Живу я здесь
  • 2465
  • 336 / 0
Была подобная задача.
Как вариант - пройтись рекурсивно по всем директориям с изображениями и с помощью функции fileatime проверить время последнего обращения к файлу. Если, скажем, последнее обращение к картинке было более года назад, то скорее всего она уже не актуальна.
На связи в telegram @sivers
sivers @ inbox . ru
https://sivers.su/
*

AlexB

  • Завсегдатай
  • 1973
  • 54 / 2
Реально задача сложная.
Выше преложили искать по дате обращения, и это по сути правильно, но не на всех хостах это возможно....

*

ChaosHead

  • Гуру
  • 5241
  • 451 / 13
Огонь тема! Тоже в планах стоит. Ссылки на изображения находятся в бд. Можно получить их полный список с помощью сложных запросов. Первая трудность возникнет если у вас стоят разные компоненты, где вы размещаете контент, а значит нужны более сложные запросы и пути хранения изображений могут быть разные.
*

effrit

  • Легенда
  • 10132
  • 1118 / 13
  • effrit.com
тема уже поднималась.
одной базой тут не ограничишься - графику тянут ещё и стили и файлы шаблона.
хотя, если в какую-то подпапку все сгружалось, то по базе можно пробить.
поищите тему, там и примеры расширений и кода вроде были.
*

sivers

  • Живу я здесь
  • 2465
  • 336 / 0
но не на всех хостах это возможно....
это верно. для уменьшения количества обращений к диску (особенно на SSD носителях) эту функцию иногда отключают. Поэтому сперва надо удостовериться в ее работа. Например, проверить несколько файлов, даты обращения к которым известны заранее. Т.е. открыл фото в браузере - проверил дату. Через время открыл еще раз - проверил дату и сравнил с предыдущей.
На связи в telegram @sivers
sivers @ inbox . ru
https://sivers.su/
*

ast

  • Захожу иногда
  • 81
  • 6 / 0
Огонь тема! Тоже в планах стоит. Ссылки на изображения находятся в бд. Можно получить их полный список с помощью сложных запросов. Первая трудность возникнет если у вас стоят разные компоненты, где вы размещаете контент, а значит нужны более сложные запросы и пути хранения изображений могут быть разные.
Да, это была первая мысль - взять ссылки из БД. Но компонентов несколько, ссылки в некоторых хранятся относительные. То есть, где-то в настройках указан корень хранения изображений этого компонента, а в полях таблиц часть пути, которую нужно склеить с настройками. Где-то используется экранирование. Где-то кириллические ссылки сконвертированы в UTF-8. Посему прикинул, что этот путь не самый лёгкий, а проще всего будет изъять ссылки на картинки со всех страниц сайта.
*

ast

  • Захожу иногда
  • 81
  • 6 / 0
Была подобная задача.
Как вариант - пройтись рекурсивно по всем директориям с изображениями и с помощью функции fileatime проверить время последнего обращения к файлу. Если, скажем, последнее обращение к картинке было более года назад, то скорее всего она уже не актуальна.
Не подходит, так как полный бэкап сайта делается регулярно.
*

ChaosHead

  • Гуру
  • 5241
  • 451 / 13
тема уже поднималась.
одной базой тут не ограничишься - графику тянут ещё и стили и файлы шаблона.
хотя, если в какую-то подпапку все сгружалось, то по базе можно пробить.
поищите тему, там и примеры расширений и кода вроде были.
Ну да, согласен, из бызы всё сложно вытянуть. Ок, поищу. Пока в голову приходит ещё взять логи веб-сервера за несколько месяцев и посмотреть к каким картинкам был доступ. Остальные можно во временную папку переместить, а потом и в корзину. Но тоже есть шанс пропустить редкозапрашиваемые картинки.
*

ast

  • Захожу иногда
  • 81
  • 6 / 0
Ну да, согласен, из бызы всё сложно вытянуть. Ок, поищу. Пока в голову приходит ещё взять логи веб-сервера за несколько месяцев и посмотреть к каким картинкам был доступ. Остальные можно во временную папку переместить, а потом и в корзину. Но тоже есть шанс пропустить редкозапрашиваемые картинки.
А вот это крутая идея! Именно её я и решил взять за основу. На днях проверял битые ссылки на сайте с помощью Xenu Link Sleuth, а он проходит по всем веб-страницам сайта. Таким образом, в логах моего Апача появился полный перечень картинок! Бинго! Осталось его только извлечь.
*

ast

  • Захожу иногда
  • 81
  • 6 / 0
В общем на всё про всё у меня ушёл один день. По результатам работы - 37% старых изображений оказались лишними, которые надо удалить.
Теперь места под хостинг требуется намного меньше!
Чтобы оставить сообщение,
Вам необходимо Войти или Зарегистрироваться