Методы сжатия данных
Годовой спецкурс ВМиК МГУ, 2006-2007
     

Результаты проверки первого задания

Оценки

ФИО Группа Ari PPM other Штраф Бонус Всего Комментарии
Моисейцев Алексей Борисович 209 11 13 15 + 12 -1 10 60 BWT кушает кучу памяти, долго работает. После компиляции проекта bwt показал немного лучшие результаты по степени сжатия, чем бинарник, вложенный в архиве. Штраф за неправильную коммандную строку для классической версии арифметика. Бонус за первое место в категории "Другие алгоритмы".
Бакулин Артём Геннадьевич 427 25 9 20 54 Бонус за первое место в арифметике, несмотря на то, что thebat.exe распаковал неверно и был взят худший результат для этого файла. PPM тоже неверно распаковал thebat.exe.
Цветков Илья Игоревич 203 9 20 -2 20 47 Штраф за неправильный архив и за то, что оставляет за собой временный файл при сжатии PPM. Бонус за первое место в PPM.
Усанов Дмитрий Альфредович 215 24 11 -1 34 Штраф за неправильный архив.
Фокин Александр Павлович 327 23 11 34
Рагулина Кира Олеговна 321 9 12 21 Из двух PPM был выбран лучший результат
Прусов Александр Сергеевич 203 7 11 -2 16 Штраф за неправильный архив и параметры. Неправильно распаковался thebat.exe арифметиком и mtf.
Галочкин Игорь Валентинович второе высш. 5 5 10 Увеличил в размерах thebat.exe. Алгоритм PPM был протестирован с различными агрессивностями, был взят лучший результат
Касьянов Артем Сергеевич 210м 8 8

Файлы, использовавшиеся для тестирования

Файл Размер, байт Скачать Комментарии
_11b.dat 1 000 000 zip, 2кб Искусственно сгенерированный файл.
_201b.dat 1 000 000 zip, 1кб Искусственно сгенерированный файл.
_repeat2.dat 1 000 000 zip, 5кб Искусственно сгенерированный файл.
Prestuplenie_i_nakazanie.txt 1 153 705 zip, 450кб Текстовый файл. Роман "Преступление и наказание."
thebat.exe 11 889 976 zip, 4,8мб Обычный исполняемый файл.

Результаты тестирования

В таблице для каждого файла указан размер архива, полученного с помощью программы. Если программа не справилась с архивированием/разархивированием файла, либо полученный после разархивирования файл отличался от исходного, то программе засчитывался худший результат по этому файлу среди всех участников.
Замечание: поскольку thebat.exe примерно в 10 раз больше всех остальных файлов, то размер этого файла после сжатия делился на 10 и уже потом добавлялся к сумме размеров других фалов после сжатия. Это было сделано для того, чтоб коэффициент сжатия каждого файла вносил равный вклад в результат. Поэтому в колонке "Сумма" появляются дробные числа. Точно таким же образом был вычислен суммарный оригинальный размер файлов, при помощи которого было рассчитано, во сколько раз был сжат данный набор.

Классический вариант алгоритма

ФИО Номер
группы
_11b.dat _201b.dat _repeat2.dat Prestuplenie_i_
nakazanie.txt
thebat.exe Сумма Степень сжатия (раз) Баллы Комментарии
Бакулин Артём Геннадьевич 427 25 31 3405 671792 12879852 1963238,2 2,72 25 Неправильно распаковался thebat.exe.
Усанов Дмитрий Альфредович 215 432649 66 5479 670732 8615828 1970508,8 2,71 24
Фокин Александр Павлович 327 436445 3942 30121 674005 8628817 2007394,7 2,66 23
Моисейцев Алексей Борисович 209 432457 8 227992 670802 8496390 2180898 2,45 11
Цветков Илья Игоревич 203 432482 41 499181 671287 9802970 2583288 2,07 9
Рагулина Кира Олеговна 321 432461 15 499166 671418 9803170 2583377 2,07 9
Касьянов Артем Сергеевич 210м 481734 268963 305671 768764 9026457 2727777,7 1,96 8
Прусов Александр Сергеевич 203 432471 29 499171 671286 12879852 2890942,2 1,85 7 Неправильно распаковался thebat, ошибка в 1 байте!
Галочкин Игорь Валентинович второе высш. 436522 1625521 504846 675191 12879852 4530065,2 1,18 5 Увеличил размер thebat.exe.

Вариант алгоритма с использованием PPM

ФИО Номер
группы
_11b.dat _201b.dat _repeat2.dat Prestuplenie_i_
nakazanie.txt
thebat.exe Сумма Степень сжатия Баллы Комментарии
Цветков Илья Игоревич 203 40 10 3774 367904 5112501 882978,1 6,05 20 Оставляет временный файл
Моисейцев Алексей Борисович 209 8 8 3359 446102 5911132 1040590,2 5,13 13
Рагулина Кира Олеговна 321 221 15 4194 475982 6468022 1127214,2 4,74 12 Был взят PPM2, как лучший из двух предложенных алгоритмов PPM.
Усанов Дмитрий Альфредович 215 101 68 3739 527431 7193553 1250694,3 4,27 11
Фокин Александр Павлович 327 3947 3932 8360 448638 7984210 1263298 4,23 11
Галочкин Игорь Валентинович второе высш. 437331 73321 245360 702042 9114797 2369533,7 2,25 5 Агрессивность была подобрана, чтоб получить результат получше

Другие алгоритмы сжатия без потерь

ФИО Номер
группы
_11b.dat _201b.dat _repeat2.dat Prestuplenie_i_
nakazanie.txt
thebat.exe Сумма Степень сжатия Алгоритм Баллы Комментарии
Моисейцев Алексей Борисович 209 3823 19 6153 578631 5837006 1172326,6 4,56 BWT 15 Кушает кучу памяти, долго работает
Моисейцев Алексей Борисович 209 8 8 3359 670802 8692647 1543441,7 3,46 ARI с предпроцессингом 12
Прусов Александр Сергеевич 203 29 32 3370 746420 9354768 1685327,8 3,17 MTF 11
Бакулин Артём Геннадьевич 427 30551 113 6100 683952 12879852 2008701,2 2,66 RLE -> BWT -> MTF -> RLE -> ARI 9 Не распаковался thebat.exe.
Главная | О курсе | Лекции | Библиотека | Задания | Оценки | FAQS
  (с) Лаборатория компьютерной графики, 1997-2005
Дизайн: Алексей Игнатенко