0 Пользователей и 1 Гость просматривают эту тему.
  • 18 Ответов
  • 1064 Просмотров
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
На сайте более тысячи статей, созданных с помощью какого то стремного редактора, все статьи в ужасном формате, но функция "очистить форматирование" в редакторе TinyMCE очень хорошо очищает статьи от хлама, но вручную такой объем статей почистить нереально. Есть ли способ автоматизировать этот процесс?
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
это 1 рабочий день. что тут нереального?
Уточню, что статей 13000+
*

dmitry_stas

  • Легенда
  • 13151
  • 1234 / 8
это 1 рабочий день. что тут нереального?
походу для r91228pz.bget.ru нужно апи )))
Тут дарят бакс просто за регистрацию! Успей получить!
Все советы на форуме раздаю бесплатно, то есть даром. Индивидуально бесплатно консультирую только по вопросам стоимости индивидуальных консультаций
*

effrit

  • Легенда
  • 10132
  • 1118 / 13
  • effrit.com
хыхы. не, меня бегет выгонит, если всякие лентяи начнут по 10к статей гонять по нему  ;D

вот есть такая штука
http://htmlpurifier.org/

или можно извратиться и записать действия
https://lifehacker.ru/wildfire/
и потом заколупать в скрипт смену айдишников статей. не пользовался, но вроде бы подъемный вариант
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
хыхы. не, меня бегет выгонит, если всякие лентяи начнут по 10к статей гонять по нему  ;D

вот есть такая штука
http://htmlpurifier.org/

или можно извратиться и записать действия
https://lifehacker.ru/wildfire/
и потом заколупать в скрипт смену айдишников статей. не пользовался, но вроде бы подъемный вариант

Разве поиск автоматизации рутины относят к лентяйству, а не к эффективности?
*

effrit

  • Легенда
  • 10132
  • 1118 / 13
  • effrit.com
естессно!
вот любой нормальный китаец порадовался бы такому фронту работ! ибо счастье - в труде!
а вы вон чего задумали - автоматизировать... лень и малодушие!  ;D
а вообще, настоящий программист - это лентяй, который придумывает всякие алгоритмы, лишь бы сбежать от рутины.
*

ProtectYourSite

  • Живу я здесь
  • 2356
  • 135 / 4
  • Безопасность вебсайтов
Смотря какой мусор, я на одном сайте скачивал дамп бд и регулярками проходился.
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
Смотря какой мусор, я на одном сайте скачивал дамп бд и регулярками проходился.
Ну например параграфы обернуты в
Код
<span style="color:#ccc"></span>
и на самих параграфах
Код
<p style="text-align:justify">
*

ProtectYourSite

  • Живу я здесь
  • 2356
  • 135 / 4
  • Безопасность вебсайтов
style=\"[^\"]*\" типо такого для стилей
Но в бд могут кавычки экранироваться
*

Missile

  • Завсегдатай
  • 1098
  • 90 / 1
я на одном сайте скачивал дамп бд и регулярками проходился
Можно даже без регулярок - просто в Блокноте через пункт "Заменить".
<p style="text-align:justify">
Это - нормальное форматирование. По крайней мере, можно оставить.
*

effrit

  • Легенда
  • 10132
  • 1118 / 13
  • effrit.com
Missile, пришло время узнать про Notepad++  ^-^
блокнот - для бедных!  ;D

держу в курсе:
поигравшись с кривым wildfire, я в порыве энтузиазма перепрыгнул на Kantu.
он не такой кавайный и в нем нет визуального программирования связей, зато сразу доступна вкладка с примерами, в которых есть чтение данных из csv - вот где сила!
в результате за полчаса состряпал скрипт открывания статей с идешниками из файла, нажиманием кнопки и "очистить форматироание" и закрыванием с сохранением.

и лишь потом понял, что очистка срабатывает только для выделенного текста  ;D
так что надо ещё одно действие вставить и попробовать ускорить это все.
а еще выяснилось, что эта автомата нагло срет в код статьи, добавляя пустой div со своим ID, даже если никакой макрос не запущен.
https://forum.a9t9.com/t/div-id-kantu-mark-div/1143
именно поэтому подобные кривые штуки надо держать на резервном браузере.
 
*

effrit

  • Легенда
  • 10132
  • 1118 / 13
  • effrit.com
в общем, заработало.
скрипт для Kantu (браузерный аддон, ставить лучше на резервный браузер, т.к. сыроватое оно)
https://a9t9.com/kantu
8-10 секунд на статью, по ходу, можно ускорить изменением интервала первых двух операндов, но это рискованно, т.к. может тупо скрипт очистки не успеть сработать.
а вот так выглядит код
Код
{
  "Name": "a_clean_formatting",
  "CreationDate": "2018-12-1",
  "Commands": [
    {
      "Command": "csvRead",
      "Target": "articles.csv",
      "Value": ""
    },
    {
      "Command": "store",
      "Target": "180",
      "Value": "!timeout_macro"
    },
    {
      "Command": "store",
      "Target": "fast",
      "Value": "!replayspeed"
    },
    {
      "Command": "while",
      "Target": "\"${!csvReadStatus}\" == \"OK\"",
      "Value": ""
    },
    {
      "Command": "echo",
      "Target": "status = ${!csvReadStatus}, line = ${!csvReadLineNumber}",
      "Value": ""
    },
    {
      "Command": "open",
      "Target": "https://j300/administrator/index.php?option=com_content&task=article.edit&id=${!COL1}_${!csvReadLineNumber}",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "id=mceu_59-open",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "id=mceu_107-text",
      "Value": ""
    },
    {
      "Command": "selectFrame",
      "Target": "relative=top",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "//*[@id=\"mceu_49\"]/button/i",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "//*[@id=\"toolbar-save\"]/button",
      "Value": ""
    },
    {
      "Command": "storeEval",
      "Target": "${!csvReadLineNumber}+1",
      "Value": "!csvReadLineNumber"
    },
    {
      "Command": "store",
      "Target": "true",
      "Value": "!errorIgnore"
    },
    {
      "Command": "csvRead",
      "Target": "articles.csv",
      "Value": ""
    },
    {
      "Command": "store",
      "Target": "false",
      "Value": "!errorIgnore"
    },
    {
      "Command": "endWhile",
      "Target": "",
      "Value": ""
    }
  ]
}

+ надо на вкладке CSV сделать импорт своего файла articles.csv с id-шниками нужных статей, каждый на своей строке! без запятых и прочих разделителей.

макрос записан на дефолтном TinyMCE для суперадмина. Это важно, т.к. скрипт бьет по кнопкам с определенными ID, так что если у вас другой редактор или конфигурация другая, то надо будет поменять в нужных местах id кнопок.
ну и адрес админки надо поменять с
Код
https://j300/
на свой.

зы
медаль главному лентяю!  ;D
*

ProtectYourSite

  • Живу я здесь
  • 2356
  • 135 / 4
  • Безопасность вебсайтов
Можно даже без регулярок - просто в Блокноте через пункт "Заменить".
Ну так в блокноте по регуляркам прогонять.
*

Missile

  • Завсегдатай
  • 1098
  • 90 / 1
*

arma

  • Завсегдатай
  • 1753
  • 81 / 3
Missile, лет двадцать вы загнули, первый релиз был 2008 году - итого лет десять  ;D ^-^
Я им пользуюсь
*

Missile

  • Завсегдатай
  • 1098
  • 90 / 1
первый релиз был 2008 году
Не, он точно был раньше. Я его помню ещё из той эпохи, когда про софт узнавали из дисков, прилагаемых к журналам типа "Мир ПК". Возможно, конечно, что я путаю с Notepad'ом с одним плюсом.
*

arma

  • Завсегдатай
  • 1753
  • 81 / 3
Я не спорю на этот счёт. Это как спорить сколько лет Деду Морозу, главное, что он есть ;D
Чтобы оставить сообщение,
Вам необходимо Войти или Зарегистрироваться
 

Что хранится в таблице overrider Joomla 3?

Автор web1

Ответов: 2
Просмотров: 207
Последний ответ 04.04.2024, 22:10:48
от web1
Перестала работать почта на всех сайтах

Автор svarg

Ответов: 5
Просмотров: 471
Последний ответ 23.02.2024, 22:05:51
от Vastriet
reCAPTCHA V2 Google - Для Joomla 3

Автор Alex GOOD

Ответов: 35
Просмотров: 8342
Последний ответ 10.01.2024, 21:41:38
от Vastriet
Joomla 3.10.12 и MySQL 8

Автор designer71

Ответов: 0
Просмотров: 399
Последний ответ 19.10.2023, 11:25:18
от designer71
Почему Joomla не поддерживает формат webp?

Автор Sensession

Ответов: 74
Просмотров: 10641
Последний ответ 03.10.2023, 19:44:42
от fsv