Это всё непросто делается. Объясню только то, как я вижу:
Вариант 1 (правильный): Работаем с базой данных. Вычищаем все эти ошмётки. База сразу в десятки раз легче становится. Это, скорее всего, в коммерческий раздел.
Вариант 2: Чуть проще. Правим уже на выходе.
1. Копируем необходимые файлы компонента в папку шаблона. В нашем случае - статьи. Как и куда - я в каждом втором своем посте пишу буквально.
2. Сперва фукнцией strip_tags удаляем все тэги кроме необходимых (параграфы, таблицы, заголовки, изображения, списки)
3. Потом гуглим регулярное выражение для удаления аттрибутов и проходимся второй раз, удаляя все лишние атрибуты типа style, align, target...
Это тоже, видимо, в коммерческий раздел надо задачу писать.