Карта групп методов сжатия
|
|
Статистические |
Преобразующие |
||
|
Поточные |
Блочные1'' |
" Поточные |
Блочные |
|
|
Для "слов", модель "Источник с памятью" |
CM, DMC, все РРМ |
CMBZ, preconditioned PPMZ |
Все LZ, в т.ч. LZH и LZW |
ST, в т, ч. BWT |
|
Для "элементов", модели "Источник без памяти" или "Аналоговый сигнал" |
Адаптивный HUFF |
Статический HUFF |
SEM, VQ, MTF, DC, SC, DWT |
DCT, FT, фрактальные методы |
|
Для "элементов" или "битов" |
Адаптивный ARIC |
Статический ARIC |
RLE, LPC, в т.ч. дельта |
PBS, ENUC |
Каждая группа (ветвь, семейство) содержит множество методов. Исключением является блочно-ориентированный СМ - это относительно мало исследованная область. Авторам не известны другие практические реализации, кроме компрессоров СМ Булата Зиганшина и "pre-conditioned PPMZ" Чарльза Блума.
Статистические методы оперируют величинами вероятностей элементов напрямую (или величинами относительных частот1, что по сути то же самое), а преобразующие используют статистические свойства данных опосредованно. Есть и методы смешанного типа, но их меньше.
Все поточные методы применимы и к блокам, но обратное неверно. Блочные методы неприменимы к потокам, поскольку не могут начать выполнение, пока не задана длина блока, заполненного данными, подлежащими сжатию.
В первой строке "карты групп" - методы для источников с памятью, порождаемые ими данные выгодно трактовать как слова. Однако методы для потоков "слов" оперируют, как правило, элементами заданного размера, а не словами, поскольку разбиение потока элементов на слова заранее в общем случае неизвестно.
Во второй строке - методы для источников без памяти и аналоговых сигналов. Эти данные при сжатии невыгодно рассматривать как слова.
Не все методы для потоков R-битовых "элементов" применимы к "битам" (только те, которые в третьей строке "карты").
Очевидно, что невыгодно применять методы для "элементов" - к "словам" или "битам". Менее очевидно, что невыгодно и обратное: применять методы для потоков "слов" к данным без значимых вероятностных взаимосвязей, к "элементам" или "битам".
- 393 просмотра









