Определение типов файлов по сигнатурам или «magic numbers»

Натолкнулся на интересную ссылку (или, например, эта).
Для обработки многих форматов файлов требуется их соответствие определенным правилам построения. Как следствие, можно выявить определенные последовательности бит или закономерности, присущие конкретным форматам. Как пример, если открыть в HEX-редакторе любой исполняемый файл Windows, то первые два его байта будут равны 4D 5A (MZ).

Алгоритм Хаффмана

Рассмотрим использование алгоритма Хаффмана на пример оптимизации занимаемого пространства а БД при хранении массива, состоящего из целых чисел в диапазоне [0,255]. Массив представляет собой отображение звуковой информации wav-файла. Среднее количество хранимых элемента массива составляет ~20 000. Поиск по данным в данном примере осуществляться не будет.

Читать далее