А кто говорит что большие БД это плохо. Это наоборот хорошо. Самое ценное на сайте это БД. Особенно если сайт коммерческий и доходный. Вопрос насколько она нормализована, сколько и каких запросов к ней идет. И делать умный поиск в CMS, да еще на php совсем не стоило.
Все верно, главное запросы и индексы. Но почему то сверху всех пугает именно размер и разбухание.
Пока не появились эксперты, рискну подвести промежуточный итог.
- размер не влияет на скорость.это один из принципов бд. Скорость зависит от совершенно иных факторов. Не так давно по этому поводу был отличный перевод на хабре от маилру.
- json не мешает поиску, потому что не принимает участия в нем.
- не важно как хранит компонент свой контент, главное чтобы безопасно (без изменений)
- русские буквы считаются спец символами потому что не входят в состав латиницы или чисел или первых 127 символов. Поэтому кодируются. Иначе будут проблемы на каждом втором сайте (видел их тысячи). Далеко не у всех правильно создана база.
- у кодировки нет понятия "язык". Это лишь порядковый номер символов.
- utf8 это 2 байта. Всегда. Поэтому json его трансформирует в безопасный вариант.
- не нужно править базу руками. Только через api. На любом проекте.
- индекс для поиска будет всегда и он всегда весит больше оригинала. И json это лишь мизерная часть. Посмотрите размеры таблиц. Умный поиск из коробки самый толстый. Если разберетесь как он работает, то поймете почему. Там хранится все примерно как внутри сфинкса (морфология, словари)
Мой вопрос до сих пор в силе. Почему хранить валидный json в базе это плохо? Про размер... это не аргумент)