Исследование параметров мультимедийных файлов - davaiknam.ru o_O
Главная
Поиск по ключевым словам:
страница 1
Похожие работы
Название работы Кол-во страниц Размер
Исследование статистических свойств параметров однотипных элементов 1 52.31kb.
Исследование влияния параметров состава Х на Выходные характеристики... 1 67.9kb.
Исследование гидродинамических параметров и молекулярного состава... 1 195.78kb.
Возможности использования мультимедийных средств при обучении физики 1 81.6kb.
Методические указания к контрольной работе студента заочной формы... 1 63.21kb.
Исследование зависимости периода и частоты механических колебаний... 1 287.77kb.
Требования, касающиеся файлов с дизайнами этикеток iml, передаваемых... 1 38.45kb.
План-конспект открытого урока по русскому языку с использованием... 1 71.61kb.
Исследование и оптимизация интегрированной системы измерения параметров... 1 301.93kb.
Исследование зависимости периода колебаний и приведенной длины маятника... 1 133.48kb.
Практическая работа по теме: «Создание архивных файлов» 1 43.52kb.
Графическое представление звука стандарта pcm wav 1 47.65kb.
Направления изучения представлений о справедливости 1 202.17kb.

Исследование параметров мультимедийных файлов - страница №1/1

Лабораторная работа

ИССЛЕДОВАНИЕ ПАРАМЕТРОВ МУЛЬТИМЕДИЙНЫХ ФАЙЛОВ


(ЗВУКОВЫЕ ФАЙЛЫ)
Цель работы
Изучить основные форматы звуковых файлов WAV, MP3 и установить зависимости размера файла различных форматов от степени сжатия с учетом субъективной оценки качества воспроизведения и с использованием полученных в результате анализа спектрограмм.

Основные сведения о форматах звуковых файлов

Формат файла определяет способ хранения содержащейся в нем информации и используется для того, чтобы файл можно было открыть и сохранить. На формат файла указывает 3-буквенное расширение, добавляемое в конце имени файла.

Звуковые файлы можно разделить на два типа: с оцифрованным звуком и с нотной записью.
Файлы с оцифрованным звуком

Файлы с оцифрованным звуком содержат значения амплитуды звукового сигнала, измеренные через одинаковые промежутки времени tд. Процесс замены непрерывного сигнала последовательностью его значений называют дискретизацией (sampling). Частота дискретизации (sampling rate) fд – величина, обратная промежутку времени между измерениями (fд = 1/tд), показывающая, сколько раз в секунду считывается значение сигнала, измеряется в герцах или килогерцах (Гц, кГц).

Каждое измеренное значение преобразуют в целое число длиной 8 или 16 битов со знаком или без (квантование, quantizing). Как и в магнитофоне, запись может осуществляться в режимах моно и стерео. Дискретизация и квантование выполняются аналого-цифровым преобразователем (АЦП). Воспроизводится оцифрованный звук с помощью цифро-аналогового преобразователя (ЦАП). Измеренная амплитуда звукового сигнала называется отсчетом (sample).

В соответствии с теоремой отсчетов (теорема Котельникова) в сигнале, измеряемом с частотой дискретизации fд, не должны содержаться гармонические компоненты с частотами выше fд/2, иначе цифровое представление сигнала не будет адекватно аналоговому. Значит, частота дискретизации должна быть как минимум вдвое больше максимальной частоты аналогового сигнала fmax: fд >= 2fmax.

Наиболее часто встречаются следующие частоты дискретизации: 8 (используется для оцифровывания телефонного сигнала), 11, 16, 22 и 44 кГц.

Процесс оцифровки называется импульсно-кодовой модуляцией (ИКМ).

Для осуществления ИКМ необходимо произвести 3 операции:




– дискретизацию сигналов во времени;




– квантование полученных импульсов по амплитуде;




– кодирование квантованных по амплитуде импульсов (преобразование квантованного импульса в число).

При квантовании непрерывно изменяющаяся величина преобразуется в ступенчато-изменяющуюся с заданными размерами ступеней. Этот процесс может выполняться с равномерными и неравномерными ступенями квантования. Ступень квантования – разность между двумя соседними заданными значениями квантованной величины. Так осуществляется преобразование аналогового звука в цифровой формат WAV. При этом в максимальной степени сохраняется исходный звук с определенной степенью точности, но размер файла оказывается достаточно большим. Например, при частоте дискретизации 44 кГц (16 битов на отсчет, стерео) размер файла будет составлять 44×16×2=1408 кбит в одной секунде звучания или 1408/8=176 кбайт. Поэтому часто используется сжатие звука, при этом удаляется часть информации, которую не воспринимает человеческое ухо.

Самый популярный на сегодняшний день цифровой формат аудиосжатия MP3 В алгоритме сжатия Mpeg Layer 3 обычно применяется обрезание маскированных частот (звуков такой частоты, которую человеческое ухо не улавливает или улавливает плохо).

Алгоритм сжатия использует особенности восприятия звуков человеческим ухом – так называемый, психоакустический эффект. Сигнал определенной частоты (тон), воздействуя на ухо, не позволяет различить (маскирует) другие тоны, близкие к нему по частоте и меньшие по амплитуде. В реальном звуковом сигнале одновременно присутствуют несколько маскирующих тонов на различных частотах.

Совокупным действием всех маскирующих тонов определяется граница маскирования – функция от частоты, определяющая минимальную амплитуду воспринимаемых сигналов. Компоненты сигнала, амплитуда которых лежит ниже границы маскирования, человеческим ухом не воспринимаются, поэтому их можно не передавать.

За счет вышеперечисленных вещей, а также специальных алгоритмов компрессии и достигается сжатие исходного файла (аналогично формату WAV) в 10–12 раз.

Таким образом, форматы с оцифрованным звуком являются наиболее универсальными и могут содержать любую звуковую информацию (музыку, речь, природные и любые другие звуки) с заранее заданным качеством.


Файлы с нотной записью

Файлы с нотной записью (MIDI) содержат последовательность команд, сообщающих какую ноту и каким инструментом и как долго нужно воспроизводить в тот или иной момент времени.

Формат может предусматривать одновременную игру нескольких музыкальных инструментов. Размер такого файла может быть в десятки и сотни раз меньше файлов с оцифрованным звуком. Однако такие файлы не могут воспроизводить речь, природные и любые другие звуки, а только музыку без слов. Это связано с тем, что в микросхеме звуковой платы записаны заранее синтезированные звуки основных музыкальных инструментов и, соответственно, воспроизводить музыку можно только теми инструментами, которые имеются в наличии, т. е. какие инструменты есть в оркестре, те и будут воспроизводить музыку.

Задание

1. Ознакомиться с форматами звуковых файлов WAV, MP3, MIDI.

2. Подобрать музыкальный фрагмент звукового файла формата WAV (размер файла будет зависеть от числа бит на один отсчет или разрядности квантования, частоты дискретизации, режима записи и продолжительности звучания) с продолжительностью звучания 10–15 с и частотным спектром, включающим частоты до 20 кГц.

3. Получить зависимости размера файла от частоты дискретизации для файлов формата WAV и степени сжатия для формата MP3 для переменной и постоянной скоростей воспроизведения (bitrate); исследовать влияние частоты дискретизации для файлов формата WAV и степени сжатия для формата MP3 на размеры файлов с учетом субъективной оценки качества воспроизведения и с использованием полученных в результате анализа спектрограмм для звукового фрагмента с наиболее богатым спектром.

4. Подобрать музыкальный фрагмент звукового файла формата MIDI, аналогичный исследуемому фрагменту формата WAV, и оценить его размер и качество звучания.
Содержание отчета
1. Результаты проведенных исследований оформить в виде таблицы.

2. Сделать выводы по эффективности использования разных звуковых форматов.



Влияние сжатия на качество воспроизведения звуковой информации


Фор­мат

Частота дискретизации, кГц

(bitrate, кбит/с)



Количество

битов


Сте­рео

Длитель­ность, с

Размер файла, кбайт

Качество

звучания


(наличие высоких

частот)


WAV

44 кГц

16

Да










WAV

22 кГц

16

Да










WAV

11 кГц

8 или16

Да










WAV

8 кГц

8

Нет










MP3

пост.


256-320кбит/с
















MP3

пост.


128-256кбит/с
















MP3

пост.


48-96кбит/с
















MP3

перем.


256-320кбит/с
















MP3

перем.


128-256кбит/с
















MP3

перем.


48-96кбит/с


















Контрольные вопросы

1. В чем разница между алгоритмами сжатия с потерей звуковой информации и без потери информации?

2. За счет чего сжимается звук алгоритмом MP3?

3. Как определить размер файла формата WAV, зная число битов на один отсчет или разрядность квантования, частоту дискретизации, режим записи и продолжительность звучания?

4. Сравните недостатки и достоинства WAV и MP3 форматов.

5. Сравните недостатки и достоинства файлов с оцифрованным звуком и нотной записью.


ЛИТЕРАТУРА

1. Карпов Б. Microsoft Office 2000: справочник. – СПб: Питер, 2000. – 448 с.

2. Сван Т. Форматы файлов Windows / Пер. с англ. Д.А. Зарецкой. – М.: БИНОМ, 1994. – 288 с.

3. Яворских Е.А. Звук на персональном компьютере – СПб: Питер, 2004. – 347 с.








Если каждый месяц откладывать понемногу, то уже через год вы будете удивлены, как мало у вас набралось. Эрнест Хаскинс
ещё >>