0 Пользователей и 1 Гость просматривают эту тему.
  • 18 Ответов
  • 355 Просмотров
*

lilsaint5800

  • Захожу иногда
  • 68
  • 1 / 0
  • Джизос
На сайте более тысячи статей, созданных с помощью какого то стремного редактора, все статьи в ужасном формате, но функция "очистить форматирование" в редакторе TinyMCE очень хорошо очищает статьи от хлама, но вручную такой объем статей почистить нереально. Есть ли способ автоматизировать этот процесс?
Джумлировал джумлировал да невыджумлировал...
*

lilsaint5800

  • Захожу иногда
  • 68
  • 1 / 0
  • Джизос
это 1 рабочий день. что тут нереального?
Уточню, что статей 13000+
Джумлировал джумлировал да невыджумлировал...
*

dmitry_stas

  • Легенда
  • 12543
  • 1178 / 8
это 1 рабочий день. что тут нереального?
походу для r91228pz.bget.ru нужно апи )))
Тут дарят бакс просто за регистрацию! Успей получить!
Все советы на форуме раздаю бесплатно, то есть даром. Индивидуально бесплатно консультирую только по вопросам стоимости индивидуальных консультаций
*

effrit

  • Легенда
  • 9226
  • 1008 / 11
  • effrit.com
хыхы. не, меня бегет выгонит, если всякие лентяи начнут по 10к статей гонять по нему  ;D

вот есть такая штука
http://htmlpurifier.org/

или можно извратиться и записать действия
https://lifehacker.ru/wildfire/
и потом заколупать в скрипт смену айдишников статей. не пользовался, но вроде бы подъемный вариант
*

lilsaint5800

  • Захожу иногда
  • 68
  • 1 / 0
  • Джизос
хыхы. не, меня бегет выгонит, если всякие лентяи начнут по 10к статей гонять по нему  ;D

вот есть такая штука
http://htmlpurifier.org/

или можно извратиться и записать действия
https://lifehacker.ru/wildfire/
и потом заколупать в скрипт смену айдишников статей. не пользовался, но вроде бы подъемный вариант

Разве поиск автоматизации рутины относят к лентяйству, а не к эффективности?
Джумлировал джумлировал да невыджумлировал...
*

effrit

  • Легенда
  • 9226
  • 1008 / 11
  • effrit.com
естессно!
вот любой нормальный китаец порадовался бы такому фронту работ! ибо счастье - в труде!
а вы вон чего задумали - автоматизировать... лень и малодушие!  ;D
а вообще, настоящий программист - это лентяй, который придумывает всякие алгоритмы, лишь бы сбежать от рутины.
*

ProtectYourSite

  • Завсегдатай
  • 1784
  • 101 / 4
  • Безопасность вебсайтов
Смотря какой мусор, я на одном сайте скачивал дамп бд и регулярками проходился.
*

lilsaint5800

  • Захожу иногда
  • 68
  • 1 / 0
  • Джизос
Смотря какой мусор, я на одном сайте скачивал дамп бд и регулярками проходился.
Ну например параграфы обернуты в
Код
<span style="color:#ccc"></span>
и на самих параграфах
Код
<p style="text-align:justify">
Джумлировал джумлировал да невыджумлировал...
*

ProtectYourSite

  • Завсегдатай
  • 1784
  • 101 / 4
  • Безопасность вебсайтов
style=\"[^\"]*\" типо такого для стилей
Но в бд могут кавычки экранироваться
*

Missile

  • Давно я тут
  • 978
  • 87 / 0
я на одном сайте скачивал дамп бд и регулярками проходился
Можно даже без регулярок - просто в Блокноте через пункт "Заменить".
<p style="text-align:justify">
Это - нормальное форматирование. По крайней мере, можно оставить.
*

effrit

  • Легенда
  • 9226
  • 1008 / 11
  • effrit.com
Missile, пришло время узнать про Notepad++  ^-^
блокнот - для бедных!  ;D

держу в курсе:
поигравшись с кривым wildfire, я в порыве энтузиазма перепрыгнул на Kantu.
он не такой кавайный и в нем нет визуального программирования связей, зато сразу доступна вкладка с примерами, в которых есть чтение данных из csv - вот где сила!
в результате за полчаса состряпал скрипт открывания статей с идешниками из файла, нажиманием кнопки и "очистить форматироание" и закрыванием с сохранением.

и лишь потом понял, что очистка срабатывает только для выделенного текста  ;D
так что надо ещё одно действие вставить и попробовать ускорить это все.
а еще выяснилось, что эта автомата нагло срет в код статьи, добавляя пустой div со своим ID, даже если никакой макрос не запущен.
https://forum.a9t9.com/t/div-id-kantu-mark-div/1143
именно поэтому подобные кривые штуки надо держать на резервном браузере.
 
*

effrit

  • Легенда
  • 9226
  • 1008 / 11
  • effrit.com
в общем, заработало.
скрипт для Kantu (браузерный аддон, ставить лучше на резервный браузер, т.к. сыроватое оно)
https://a9t9.com/kantu
8-10 секунд на статью, по ходу, можно ускорить изменением интервала первых двух операндов, но это рискованно, т.к. может тупо скрипт очистки не успеть сработать.
а вот так выглядит код
Код
{
  "Name": "a_clean_formatting",
  "CreationDate": "2018-12-1",
  "Commands": [
    {
      "Command": "csvRead",
      "Target": "articles.csv",
      "Value": ""
    },
    {
      "Command": "store",
      "Target": "180",
      "Value": "!timeout_macro"
    },
    {
      "Command": "store",
      "Target": "fast",
      "Value": "!replayspeed"
    },
    {
      "Command": "while",
      "Target": "\"${!csvReadStatus}\" == \"OK\"",
      "Value": ""
    },
    {
      "Command": "echo",
      "Target": "status = ${!csvReadStatus}, line = ${!csvReadLineNumber}",
      "Value": ""
    },
    {
      "Command": "open",
      "Target": "https://j300/administrator/index.php?option=com_content&task=article.edit&id=${!COL1}_${!csvReadLineNumber}",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "id=mceu_59-open",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "id=mceu_107-text",
      "Value": ""
    },
    {
      "Command": "selectFrame",
      "Target": "relative=top",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "//*[@id=\"mceu_49\"]/button/i",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "//*[@id=\"toolbar-save\"]/button",
      "Value": ""
    },
    {
      "Command": "storeEval",
      "Target": "${!csvReadLineNumber}+1",
      "Value": "!csvReadLineNumber"
    },
    {
      "Command": "store",
      "Target": "true",
      "Value": "!errorIgnore"
    },
    {
      "Command": "csvRead",
      "Target": "articles.csv",
      "Value": ""
    },
    {
      "Command": "store",
      "Target": "false",
      "Value": "!errorIgnore"
    },
    {
      "Command": "endWhile",
      "Target": "",
      "Value": ""
    }
  ]
}

+ надо на вкладке CSV сделать импорт своего файла articles.csv с id-шниками нужных статей, каждый на своей строке! без запятых и прочих разделителей.

макрос записан на дефолтном TinyMCE для суперадмина. Это важно, т.к. скрипт бьет по кнопкам с определенными ID, так что если у вас другой редактор или конфигурация другая, то надо будет поменять в нужных местах id кнопок.
ну и адрес админки надо поменять с
Код
https://j300/
на свой.

зы
медаль главному лентяю!  ;D
*

ProtectYourSite

  • Завсегдатай
  • 1784
  • 101 / 4
  • Безопасность вебсайтов
Можно даже без регулярок - просто в Блокноте через пункт "Заменить".
Ну так в блокноте по регуляркам прогонять.
*

Missile

  • Давно я тут
  • 978
  • 87 / 0
*

arma

  • Завсегдатай
  • 1505
  • 70 / 2
Missile, лет двадцать вы загнули, первый релиз был 2008 году - итого лет десять  ;D ^-^
Я им пользуюсь
*

Missile

  • Давно я тут
  • 978
  • 87 / 0
первый релиз был 2008 году
Не, он точно был раньше. Я его помню ещё из той эпохи, когда про софт узнавали из дисков, прилагаемых к журналам типа "Мир ПК". Возможно, конечно, что я путаю с Notepad'ом с одним плюсом.
*

arma

  • Завсегдатай
  • 1505
  • 70 / 2
Я не спорю на этот счёт. Это как спорить сколько лет Деду Морозу, главное, что он есть ;D
Чтобы оставить сообщение,
Вам необходимо Войти или Зарегистрироваться
 

Как настроить rewrite для Joomla от дублей в nginx?

Автор 20strannik08

Ответов: 18
Просмотров: 1267
Последний ответ Сегодня в 14:10:40
от MichailPickStyle
[Решено] Joomla 3.5.1, создание материала

Автор sakha.rap

Ответов: 11
Просмотров: 227
Последний ответ 18.03.2019, 06:12:44
от sakha.rap
Joomla для блога

Автор yepi

Ответов: 1
Просмотров: 90
Последний ответ 17.03.2019, 18:34:40
от ChaosHead
Удалить остатки компонентов из Joomla 3

Автор Zudva

Ответов: 9
Просмотров: 148
Последний ответ 13.03.2019, 22:00:21
от ProtectYourSite
Забыл пароль от сайт - Joomla 3x

Автор Dannik

Ответов: 7
Просмотров: 108
Последний ответ 13.03.2019, 17:41:22
от Dannik