0 Пользователей и 1 Гость просматривают эту тему.
  • 18 Ответов
  • 460 Просмотров
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
На сайте более тысячи статей, созданных с помощью какого то стремного редактора, все статьи в ужасном формате, но функция "очистить форматирование" в редакторе TinyMCE очень хорошо очищает статьи от хлама, но вручную такой объем статей почистить нереально. Есть ли способ автоматизировать этот процесс?
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
это 1 рабочий день. что тут нереального?
Уточню, что статей 13000+
*

dmitry_stas

  • Легенда
  • 13121
  • 1229 / 8
это 1 рабочий день. что тут нереального?
походу для r91228pz.bget.ru нужно апи )))
Тут дарят бакс просто за регистрацию! Успей получить!
Все советы на форуме раздаю бесплатно, то есть даром. Индивидуально бесплатно консультирую только по вопросам стоимости индивидуальных консультаций
*

effrit

  • Легенда
  • 9752
  • 1071 / 13
  • effrit.com
хыхы. не, меня бегет выгонит, если всякие лентяи начнут по 10к статей гонять по нему  ;D

вот есть такая штука
http://htmlpurifier.org/

или можно извратиться и записать действия
https://lifehacker.ru/wildfire/
и потом заколупать в скрипт смену айдишников статей. не пользовался, но вроде бы подъемный вариант
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
хыхы. не, меня бегет выгонит, если всякие лентяи начнут по 10к статей гонять по нему  ;D

вот есть такая штука
http://htmlpurifier.org/

или можно извратиться и записать действия
https://lifehacker.ru/wildfire/
и потом заколупать в скрипт смену айдишников статей. не пользовался, но вроде бы подъемный вариант

Разве поиск автоматизации рутины относят к лентяйству, а не к эффективности?
*

effrit

  • Легенда
  • 9752
  • 1071 / 13
  • effrit.com
естессно!
вот любой нормальный китаец порадовался бы такому фронту работ! ибо счастье - в труде!
а вы вон чего задумали - автоматизировать... лень и малодушие!  ;D
а вообще, настоящий программист - это лентяй, который придумывает всякие алгоритмы, лишь бы сбежать от рутины.
*

ProtectYourSite

  • Живу я здесь
  • 2057
  • 110 / 4
  • Безопасность вебсайтов
Смотря какой мусор, я на одном сайте скачивал дамп бд и регулярками проходился.
*

lilsaint5800

  • Захожу иногда
  • 87
  • 1 / 0
  • Джизос
Смотря какой мусор, я на одном сайте скачивал дамп бд и регулярками проходился.
Ну например параграфы обернуты в
Код
<span style="color:#ccc"></span>
и на самих параграфах
Код
<p style="text-align:justify">
*

ProtectYourSite

  • Живу я здесь
  • 2057
  • 110 / 4
  • Безопасность вебсайтов
style=\"[^\"]*\" типо такого для стилей
Но в бд могут кавычки экранироваться
*

Missile

  • Завсегдатай
  • 1053
  • 87 / 1
я на одном сайте скачивал дамп бд и регулярками проходился
Можно даже без регулярок - просто в Блокноте через пункт "Заменить".
<p style="text-align:justify">
Это - нормальное форматирование. По крайней мере, можно оставить.
*

effrit

  • Легенда
  • 9752
  • 1071 / 13
  • effrit.com
Missile, пришло время узнать про Notepad++  ^-^
блокнот - для бедных!  ;D

держу в курсе:
поигравшись с кривым wildfire, я в порыве энтузиазма перепрыгнул на Kantu.
он не такой кавайный и в нем нет визуального программирования связей, зато сразу доступна вкладка с примерами, в которых есть чтение данных из csv - вот где сила!
в результате за полчаса состряпал скрипт открывания статей с идешниками из файла, нажиманием кнопки и "очистить форматироание" и закрыванием с сохранением.

и лишь потом понял, что очистка срабатывает только для выделенного текста  ;D
так что надо ещё одно действие вставить и попробовать ускорить это все.
а еще выяснилось, что эта автомата нагло срет в код статьи, добавляя пустой div со своим ID, даже если никакой макрос не запущен.
https://forum.a9t9.com/t/div-id-kantu-mark-div/1143
именно поэтому подобные кривые штуки надо держать на резервном браузере.
 
*

effrit

  • Легенда
  • 9752
  • 1071 / 13
  • effrit.com
в общем, заработало.
скрипт для Kantu (браузерный аддон, ставить лучше на резервный браузер, т.к. сыроватое оно)
https://a9t9.com/kantu
8-10 секунд на статью, по ходу, можно ускорить изменением интервала первых двух операндов, но это рискованно, т.к. может тупо скрипт очистки не успеть сработать.
а вот так выглядит код
Код
{
  "Name": "a_clean_formatting",
  "CreationDate": "2018-12-1",
  "Commands": [
    {
      "Command": "csvRead",
      "Target": "articles.csv",
      "Value": ""
    },
    {
      "Command": "store",
      "Target": "180",
      "Value": "!timeout_macro"
    },
    {
      "Command": "store",
      "Target": "fast",
      "Value": "!replayspeed"
    },
    {
      "Command": "while",
      "Target": "\"${!csvReadStatus}\" == \"OK\"",
      "Value": ""
    },
    {
      "Command": "echo",
      "Target": "status = ${!csvReadStatus}, line = ${!csvReadLineNumber}",
      "Value": ""
    },
    {
      "Command": "open",
      "Target": "https://j300/administrator/index.php?option=com_content&task=article.edit&id=${!COL1}_${!csvReadLineNumber}",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "id=mceu_59-open",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "id=mceu_107-text",
      "Value": ""
    },
    {
      "Command": "selectFrame",
      "Target": "relative=top",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "//*[@id=\"mceu_49\"]/button/i",
      "Value": ""
    },
    {
      "Command": "click",
      "Target": "//*[@id=\"toolbar-save\"]/button",
      "Value": ""
    },
    {
      "Command": "storeEval",
      "Target": "${!csvReadLineNumber}+1",
      "Value": "!csvReadLineNumber"
    },
    {
      "Command": "store",
      "Target": "true",
      "Value": "!errorIgnore"
    },
    {
      "Command": "csvRead",
      "Target": "articles.csv",
      "Value": ""
    },
    {
      "Command": "store",
      "Target": "false",
      "Value": "!errorIgnore"
    },
    {
      "Command": "endWhile",
      "Target": "",
      "Value": ""
    }
  ]
}

+ надо на вкладке CSV сделать импорт своего файла articles.csv с id-шниками нужных статей, каждый на своей строке! без запятых и прочих разделителей.

макрос записан на дефолтном TinyMCE для суперадмина. Это важно, т.к. скрипт бьет по кнопкам с определенными ID, так что если у вас другой редактор или конфигурация другая, то надо будет поменять в нужных местах id кнопок.
ну и адрес админки надо поменять с
Код
https://j300/
на свой.

зы
медаль главному лентяю!  ;D
*

ProtectYourSite

  • Живу я здесь
  • 2057
  • 110 / 4
  • Безопасность вебсайтов
Можно даже без регулярок - просто в Блокноте через пункт "Заменить".
Ну так в блокноте по регуляркам прогонять.
*

Missile

  • Завсегдатай
  • 1053
  • 87 / 1
*

arma

  • Завсегдатай
  • 1611
  • 76 / 2
Missile, лет двадцать вы загнули, первый релиз был 2008 году - итого лет десять  ;D ^-^
Я им пользуюсь
*

Missile

  • Завсегдатай
  • 1053
  • 87 / 1
первый релиз был 2008 году
Не, он точно был раньше. Я его помню ещё из той эпохи, когда про софт узнавали из дисков, прилагаемых к журналам типа "Мир ПК". Возможно, конечно, что я путаю с Notepad'ом с одним плюсом.
*

arma

  • Завсегдатай
  • 1611
  • 76 / 2
Я не спорю на этот счёт. Это как спорить сколько лет Деду Морозу, главное, что он есть ;D
Чтобы оставить сообщение,
Вам необходимо Войти или Зарегистрироваться
 

Новостная лента RSS в Joomla в виде слайдера с дугого сайта

Автор tolik1985

Ответов: 0
Просмотров: 35
Последний ответ Сегодня в 15:28:21
от tolik1985
Ошибка Class 'Joomla\CMS\Uri\Uri' not found

Автор Шмайсер

Ответов: 1
Просмотров: 96
Последний ответ 22.05.2020, 19:49:07
от Septdir
Генерация микроразметки og:description Joomla

Автор bigbelka

Ответов: 4
Просмотров: 167
Последний ответ 21.05.2020, 11:40:33
от effrit
Хлебные крошки отображаются не на всех страницах

Автор yulix

Ответов: 4
Просмотров: 164
Последний ответ 18.05.2020, 13:50:15
от yulix
Joomla\Filesystem\File::delete: Failed deleting inaccessible file

Автор Gerostrat

Ответов: 6
Просмотров: 696
Последний ответ 13.05.2020, 16:39:18
от idle