0 Пользователей и 1 Гость просматривают эту тему.
  • 18 Ответов
  • 928 Просмотров
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
На сайте более тысячи статей, созданных с помощью какого то стремного редактора, все статьи в ужасном формате, но функция "очистить форматирование" в редакторе TinyMCE очень хорошо очищает статьи от хлама, но вручную такой объем статей почистить нереально. Есть ли способ автоматизировать этот процесс?
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
это 1 рабочий день. что тут нереального?
Уточню, что статей 13000+
*

dmitry_stas

  • Легенда
  • 13152
  • 1233 / 8
это 1 рабочий день. что тут нереального?
походу для r91228pz.bget.ru нужно апи )))
Тут дарят бакс просто за регистрацию! Успей получить!
Все советы на форуме раздаю бесплатно, то есть даром. Индивидуально бесплатно консультирую только по вопросам стоимости индивидуальных консультаций
*

effrit

  • Легенда
  • 10129
  • 1114 / 13
  • effrit.com
хыхы. не, меня бегет выгонит, если всякие лентяи начнут по 10к статей гонять по нему  ;D

вот есть такая штука
http://htmlpurifier.org/

или можно извратиться и записать действия
https://lifehacker.ru/wildfire/
и потом заколупать в скрипт смену айдишников статей. не пользовался, но вроде бы подъемный вариант
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
хыхы. не, меня бегет выгонит, если всякие лентяи начнут по 10к статей гонять по нему  ;D

вот есть такая штука
http://htmlpurifier.org/

или можно извратиться и записать действия
https://lifehacker.ru/wildfire/
и потом заколупать в скрипт смену айдишников статей. не пользовался, но вроде бы подъемный вариант

Разве поиск автоматизации рутины относят к лентяйству, а не к эффективности?
*

effrit

  • Легенда
  • 10129
  • 1114 / 13
  • effrit.com
естессно!
вот любой нормальный китаец порадовался бы такому фронту работ! ибо счастье - в труде!
а вы вон чего задумали - автоматизировать... лень и малодушие!  ;D
а вообще, настоящий программист - это лентяй, который придумывает всякие алгоритмы, лишь бы сбежать от рутины.
*

ProtectYourSite

  • Живу я здесь
  • 2280
  • 128 / 4
  • Безопасность вебсайтов
Смотря какой мусор, я на одном сайте скачивал дамп бд и регулярками проходился.
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
Смотря какой мусор, я на одном сайте скачивал дамп бд и регулярками проходился.
Ну например параграфы обернуты в
Код
<span style="color:#ccc"></span>
и на самих параграфах
Код
<p style="text-align:justify">
*

ProtectYourSite

  • Живу я здесь
  • 2280
  • 128 / 4
  • Безопасность вебсайтов
style=\"[^\"]*\" типо такого для стилей
Но в бд могут кавычки экранироваться
*

Missile

  • Завсегдатай
  • 1073
  • 88 / 1
я на одном сайте скачивал дамп бд и регулярками проходился
Можно даже без регулярок - просто в Блокноте через пункт "Заменить".
<p style="text-align:justify">
Это - нормальное форматирование. По крайней мере, можно оставить.
*

effrit

  • Легенда
  • 10129
  • 1114 / 13
  • effrit.com
Missile, пришло время узнать про Notepad++  ^-^
блокнот - для бедных!  ;D

держу в курсе:
поигравшись с кривым wildfire, я в порыве энтузиазма перепрыгнул на Kantu.
он не такой кавайный и в нем нет визуального программирования связей, зато сразу доступна вкладка с примерами, в которых есть чтение данных из csv - вот где сила!
в результате за полчаса состряпал скрипт открывания статей с идешниками из файла, нажиманием кнопки и "очистить форматироание" и закрыванием с сохранением.

и лишь потом понял, что очистка срабатывает только для выделенного текста  ;D
так что надо ещё одно действие вставить и попробовать ускорить это все.
а еще выяснилось, что эта автомата нагло срет в код статьи, добавляя пустой div со своим ID, даже если никакой макрос не запущен.
https://forum.a9t9.com/t/div-id-kantu-mark-div/1143
именно поэтому подобные кривые штуки надо держать на резервном браузере.
 
*

effrit

  • Легенда
  • 10129
  • 1114 / 13
  • effrit.com
в общем, заработало.
скрипт для Kantu (браузерный аддон, ставить лучше на резервный браузер, т.к. сыроватое оно)
https://a9t9.com/kantu
8-10 секунд на статью, по ходу, можно ускорить изменением интервала первых двух операндов, но это рискованно, т.к. может тупо скрипт очистки не успеть сработать.
а вот так выглядит код
Код
{
  "Name": "a_clean_formatting",
  "CreationDate": "2018-12-1",
  "Commands": [
    {
      "Command": "csvRead",
      "Target": "articles.csv",
      "Value": ""
    },
    {
      "Command": "store",
      "Target": "180",
      "Value": "!timeout_macro"
    },
    {
      "Command": "store",
      "Target": "fast",
      "Value": "!replayspeed"
    },
    {
      "Command": "while",
      "Target": "\"${!csvReadStatus}\" == \"OK\"",
      "Value": ""
    },
    {
      "Command": "echo",
      "Target": "status = ${!csvReadStatus}, line = ${!csvReadLineNumber}",
      "Value": ""
    },
    {
      "Command": "open",
      "Target": "https://j300/administrator/index.php?option=com_content&task=article.edit&id=${!COL1}_${!csvReadLineNumber}",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "id=mceu_59-open",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "id=mceu_107-text",
      "Value": ""
    },
    {
      "Command": "selectFrame",
      "Target": "relative=top",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "//*[@id=\"mceu_49\"]/button/i",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "//*[@id=\"toolbar-save\"]/button",
      "Value": ""
    },
    {
      "Command": "storeEval",
      "Target": "${!csvReadLineNumber}+1",
      "Value": "!csvReadLineNumber"
    },
    {
      "Command": "store",
      "Target": "true",
      "Value": "!errorIgnore"
    },
    {
      "Command": "csvRead",
      "Target": "articles.csv",
      "Value": ""
    },
    {
      "Command": "store",
      "Target": "false",
      "Value": "!errorIgnore"
    },
    {
      "Command": "endWhile",
      "Target": "",
      "Value": ""
    }
  ]
}

+ надо на вкладке CSV сделать импорт своего файла articles.csv с id-шниками нужных статей, каждый на своей строке! без запятых и прочих разделителей.

макрос записан на дефолтном TinyMCE для суперадмина. Это важно, т.к. скрипт бьет по кнопкам с определенными ID, так что если у вас другой редактор или конфигурация другая, то надо будет поменять в нужных местах id кнопок.
ну и адрес админки надо поменять с
Код
https://j300/
на свой.

зы
медаль главному лентяю!  ;D
*

ProtectYourSite

  • Живу я здесь
  • 2280
  • 128 / 4
  • Безопасность вебсайтов
Можно даже без регулярок - просто в Блокноте через пункт "Заменить".
Ну так в блокноте по регуляркам прогонять.
*

Missile

  • Завсегдатай
  • 1073
  • 88 / 1
*

arma

  • Завсегдатай
  • 1729
  • 81 / 2
Missile, лет двадцать вы загнули, первый релиз был 2008 году - итого лет десять  ;D ^-^
Я им пользуюсь
*

Missile

  • Завсегдатай
  • 1073
  • 88 / 1
первый релиз был 2008 году
Не, он точно был раньше. Я его помню ещё из той эпохи, когда про софт узнавали из дисков, прилагаемых к журналам типа "Мир ПК". Возможно, конечно, что я путаю с Notepad'ом с одним плюсом.
*

arma

  • Завсегдатай
  • 1729
  • 81 / 2
Я не спорю на этот счёт. Это как спорить сколько лет Деду Морозу, главное, что он есть ;D
Чтобы оставить сообщение,
Вам необходимо Войти или Зарегистрироваться
 

Как добавить php код в материале Joomla 3.3.0

Автор Davit

Ответов: 9
Просмотров: 2168
Последний ответ 05.08.2022, 15:49:50
от fsv
Joomla не видит последнюю версию

Автор mak200

Ответов: 1
Просмотров: 174
Последний ответ 28.07.2022, 16:44:57
от mak200
Почему в админке Joomla в Менеджере категорий не отображаются счетчики материало

Автор mak200

Ответов: 0
Просмотров: 143
Последний ответ 28.07.2022, 16:42:17
от mak200
Ошибка 404 при открывании медиа-менеджера и модулей в Joomla

Автор Cloddy

Ответов: 1
Просмотров: 194
Последний ответ 20.07.2022, 15:55:19
от gquma
How To: Как перенести и объединить все материалы с одной Joomla на другую

Автор ever2013

Ответов: 1
Просмотров: 222
Последний ответ 30.06.2022, 15:15:37
от effrit