как найти глубину кодирования звука

Что такое частота дискретизации звука? Что такое кодирование звука?

Содержание:

Кодирование звуковой информации и частота дискретизации звука — это два взаимосвязанных понятия, чуть ниже вы поймете почему.

Все понимают значение термина «звук»? Любое звучание — это всего лишь колебание невидимых волн, которые могут распространяться по воздуху, в водной стихии или в любом другом окружении; эти волны имеют бесперебойную частотность и интенсивность колебания. Люди улавливают различные звуки при помощи своего уха, что дает им возможность различать их громкость и тональность. Причем тон зависит от частотности волн, а громкость от ее интенсивности.

Чтобы измерить громкость звука, люди используют специализированную единицу измерения — Дб (децибел). Громкость звучания имеет прямую зависимость от его интенсивности, поэтому когда мы говорим, что громкость уменьшилась или увеличилась на 15 Дб, это означает, что интенсивность уменьшилась или увеличилась в 15 раз.

Если громкость измеряется в Дб, то частотность звука измеряют в Гц (Герцах). Герцы показывают сколько колебаний в секунду делает звуковая волна.

Кодирование звуковой информации

Как мы знаем, современный компьютер — это мощное устройство для обработки различных типов данных. Компьютер также может обрабатывать и звук, поэтому когда мы произносим «кодирование звуковой информации», то косвенно подразумеваем наличие компьютера. Но компьютер не осуществляет кодирование нашего привычного аналогового звука, который мы улавливаем своим ухом. Для компьютера пригоден только цифровой звук. Чтобы преобразовать стандартный звук в цифровой необходимо специальное устройство. На компьютере таким устройством является звуковая карта.

Преобразование звука из «привычного человеческому уху» в цифровой — это и есть процесс дискретизации. Причем для дискретизации звука, так же как и обычному звучанию, свойственна частотность и интенсивность.

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Кодирование звуковой информации: частота дискретизации звука

Чтобы компьютерное устройство смогло преобразовать стандартный звук в цифровой формат (последовательность цифр), ему необходимо само звучание привести в соответствующий дискретный формат. Для этого применяется такое свойство, как «временная дискретизация».

Временная дискретизация представляет собой процесс разбивки и фиксации «привычного нам» звучания на небольшие промежутки по времени. В каждом зафиксированном промежутке измеряется показатель интенсивности звучания.

Частота дискретизации звука — это количественное значение фиксации интенсивности звучания в течение одной секунды. Чем больше частотность дискретизации звучания, тем четче оцифрованный звуковой сигнал будет отражать «привычный нашему уху» звук, соответственно, кодирование звуковой информации будет качественней. Частота дискретизации звука располагается в интервале от 8000 и до 48 000 измерительных фиксаций интенсивности в секунду. Вообще-то сегодняшние компьютерные звуковые системы смогут осуществлять куда большее количество фиксаций громкости в секунду, чем 48 000 (48кГц), некоторые могут вплоть до 192 000. Просто 48 кГц — это частота дискретизации стандарта DAT, который часто используется на компьютере, также есть стандарт CD со своими 44.1 кГц.

У вас может возникнуть такой вопрос. Мы же знаем, что, раз используется большая частота дискретизации звука, тогда и лучше будет само кодирование звуковой информации и, соответственно, оцифрованное звучание будет качественней. Это не совсем так. Чем интенсивней частота дискретизации, тем сильнее возрастает нагрузка на вычислительные мощности компьютера. Поэтому важно найти «золотую середину», чтобы и звук был хороший, и компьютер справлялся. Для этого оптимальную частоту дискретизации звука выбрали по-другому пути. Известно, что человеческое ухо улавливает частоты до 20 кГц. Опираясь на теорему Котельникова, можно посчитать, что, для того, чтобы цифровой звук соответствовал 20 кГц аналогового, то частотность его дискретизации должна составлять примерно в 2 раза больше, то есть около 40 кГц. Делать частотность дискретизации намного больше нет смысла, потому что человеческое ухо не рассчитано на такой диапазон.

Кодирование звуковой информации: глубина кодирования звука

Глубина кодирования звука — это количественная мера, которая показывает объем информации, необходимый для кодирования уровней в момент дискретизации. Простыми словами: в момент дискретизации происходит «срез» интенсивности звучания. Чтобы этот «срез» как-то оцифровать, нужна определенная величина информации. Вот эта величина информации и есть глубина кодирования звука.

Глубина кодирования звука исчисляется в битах. Самые распространенные варианты это звук в 8 или 16 бит. Но нужно понимать, что есть звуковые карты, которые выдают глубину кодирования звучания и в 24 бита.

Кодирование звуковой информации с глубиной кодирования звука в 16 бит будет означать, что зафиксированным «срезам» громкости при дискретизации звучания будет задаваться 16-битный код двоичной системы счисления.

Кодирование звуковой информации напрямую имеет зависимость от частоты дискретизации и глубины кодирования звука. Например, нижайшее качество звучания будет обеспечено частотностью в 8 кГц и глубиной 8 бит. Самое высшее качество звучания будет обеспечено частотностью в 48 кГц и глубиной в 16 бит. Но самое главное, чем больше качество звучания, тем больше будет его «вес».

Источник

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

СОДЕРЖАНИЕ

Двоичное представление

Integer PCM аудио данные обычно хранятся в виде подписанных чисел в дополнительном двоичном формате.

Квантование

Ошибка квантования, возникающая при аналого-цифровом преобразовании (АЦП), может быть смоделирована как шум квантования. Это ошибка округления между аналоговым входным напряжением АЦП и выходным цифровым значением. Шум нелинейный и зависит от сигнала.

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Плавающая запятая

Разрешение выборок с плавающей запятой менее прямолинейно, чем целочисленных выборок, потому что значения с плавающей запятой не распределены равномерно. В представлении с плавающей запятой пространство между любыми двумя соседними значениями пропорционально значению. Это значительно увеличивает SNR по сравнению с целочисленной системой, потому что точность сигнала высокого уровня будет такой же, как точность идентичного сигнала на более низком уровне.

Компромисс между числами с плавающей запятой и целыми числами заключается в том, что пространство между большими значениями с плавающей запятой больше, чем пространство между большими целыми значениями той же битовой глубины. Округление большого числа с плавающей запятой приводит к большей ошибке, чем округление небольшого числа с плавающей запятой, тогда как округление целого числа всегда приводит к тому же уровню ошибки. Другими словами, целые числа имеют равномерное округление, всегда округляя младший бит до 0 или 1, а с плавающей запятой имеет однородное отношение сигнал / шум, уровень шума квантования всегда пропорционален уровню сигнала. Минимальный уровень шума с плавающей запятой будет расти по мере увеличения сигнала и падать по мере его падения, что приводит к слышимой дисперсии, если битовая глубина достаточно мала.

Обработка звука

Большинство операций обработки цифрового звука включают повторное квантование выборок и, таким образом, вносят дополнительную ошибку округления, аналогичную исходной ошибке квантования, возникающей во время аналого-цифрового преобразования. Чтобы предотвратить ошибку округления, превышающую неявную ошибку АЦП, вычисления во время обработки должны выполняться с более высокой точностью, чем входные отсчеты.

Дизеринг

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

24-битный звук не требует дизеринга, так как уровень шума цифрового преобразователя всегда громче, чем требуемый уровень любого дизеринга, который может быть применен. 24-битный звук теоретически может кодировать 144 дБ динамического диапазона, но, судя по таблицам данных производителя, не существует АЦП, который может обеспечить более

Дизеринг также можно использовать для увеличения эффективного динамического диапазона. Воспринимается динамический диапазон 16-битного звука может составлять 120 дБ или больше с шумом формы псевдослучайного сигнала, воспользовавшись частотной характеристики человеческого уха.

Динамический диапазон и запас по высоте

Передискретизация

Для увеличения разрешения, эквивалентного n дополнительных битов, сигнал должен быть передискретизирован на

Например, 14-битный АЦП может воспроизводить 16-битный звук 48 кГц при работе с 16-кратной передискретизацией или 768 кГц. Поэтому передискретизированный PCM обменивает меньшее количество бит на выборку на большее количество выборок, чтобы получить такое же разрешение.

Формирование шума

Приложения

Смешивание 8-битных int, 16-битных int, 24-битных int, 32-битных int, 32-битных чисел с плавающей запятой и 64-битных чисел с плавающей запятой

GarageBand ’11 (версия 6)DAW от Apple Inc.16-битное значение по умолчанию с 24-битной записью реального инструментаМужествоАудиоредактор с открытым исходным кодом16- и 24-битный LPCM и 32-битный с плавающей запятойFL StudioDAW от Image-Line16- и 24-битные int и 32-битные числа с плавающей запятой (под управлением ОС)

Битрейт и размер файла

Источник

Кодирование звука относится к способам сохранения и передачи аудиоданных. В приведенной ниже статье описывается, как работают такие кодировки.

Как найти глубину кодирования звука

Аудиоформат не эквивалентен аудиокодированию. Например, популярный формат файла, такой как WAV, определяет формат заголовка аудиофайла, но сам по себе не является кодировкой звука. WAV-аудиофайлы часто, но не всегда используют линейную кодировку PCM.

В свою очередь, FLAC является как форматом файла, так и кодировкой, что иногда приводит к некоторой путанице. В пределах Speech API FLAC глубина кодирования звука — это единственная кодировка, которая требует, чтобы аудиоданные включали заголовок. Все другие кодировки указывают беззвучные аудиоданные. Когда мы ссылаемся на FLAC в Speech API, мы всегда ссылаемся на кодек. Когда мы ссылаемся на формат файла FLAC, мы будем использовать формат «.FLAC».как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Вы не обязаны указывать кодировку и частоту дискретизации для файлов WAV или FLAC. Если этот параметр опущен, API облачной речи автоматически определяет кодировку и частоту дискретизации для файлов WAV или FLAC на основе заголовка файла. Если вы укажете значение кодировки или частоты дискретизации, которое не соответствует значению в заголовке файла, API облачной речи вернет ошибку.

Глубина кодирования звука — это что такое?

Аудио состоит из осциллограмм, состоящих из интерполяции волн разных частот и амплитуд. Чтобы представить эти формы сигналов в цифровых средах, сигналы должны быть отбракованы со скоростью, которая может представлять звуки самой высокой частоты, которые вы хотите воспроизвести. Для них также необходимо хранить достаточную глубину бит для представления правильной амплитуды (громкость и мягкость) осциллограмм по образцу звука.

Способность устройства звуковой обработки воссоздавать частоты известна как его частотная характеристика, а способность создавать надлежащую громкость и мягкость известна как динамический диапазон. Вместе эти термины часто называют верностью звукового устройства. Глубина кодирования звука — это средство, с помощью которого можно восстановить звук, используя эти два основных принципа, а также возможность эффективно хранить и передавать такие данные.

Частота выборки

Звук существует как аналоговая волновая форма. Сегмент цифрового звука аппроксимирует эту аналоговую волну и сэмплирует ее амплитуду с достаточно высокой скоростью, чтобы имитировать собственные частоты волны. Частота дискретизации цифрового аудиосигнала определяет количество выборок, взятых из исходного материала аудио (в секунду). Высокая частота дискретизации увеличивает способность цифрового звука точно представлять высокие частоты.как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Как следствие теоремы Найквиста-Шеннона, обычно нужно пробовать хотя бы вдвое большую частоту любой звуковой волны, которую необходимо записать в цифровом виде. Например, для представления звука в диапазоне человеческого слуха (20-20000 Гц), цифровой аудиоформат должен отображать не менее 40000 раз в секунду (что является причиной того, что звук CD использует частоту дискретизации 44100 Гц).

Бит глубины

Глубина кодирования звука — это влияние на динамический диапазон заданного образца звука. Более высокая битовая глубина позволяет представлять более точные амплитуды. Если у вас много громких и мягких звуков в одном и том же звуковом образце, вам понадобится больше бит, чтобы правильно передавать эти звуки.

Более высокие битовые глубины также уменьшают соотношение «сигнал/шум» в образцах аудио. Если глубина кодирования звука составляет 16 битов, музыкальный звук CD передается с использованием данных величин. Некоторые методы сжатия могут компенсировать меньшие битовые глубины, но они, как правило, являются потерями. DVD Audio использует 24 бит глубины, в то время как в большинстве телефонов глубина кодирования звука составляет 8 бит.как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Несжатый звук

Большая часть обработки цифрового звука использует эти два метода (частоту дискретизации и глубину бит) для простого хранения аудиоданных. Одна из самых популярных технологий цифрового звука (популяризированная при использовании компакт-диска) известна как модуляция импульсного кода (или PCM). Аудио выбирается с установленными интервалами, и амплитуда дискретизированной волны в этой точке сохраняется как цифровое значение с использованием битовой глубины образца.

Линейный PCM (который указывает, что амплитудный отклик является линейно однородным по выборке) является стандартом, используемым на компакт-дисках и в кодировке LINEAR16 Speech API. Оба кодирования создают несжатый поток байтов, соответствующий непосредственно аудиоданным, и оба стандарта содержат 16 бит глубины. Линейный PCM использует частоту дискретизации 44 100 Гц на компакт-дисках, что подходит для перекомпоновки музыки. Однако частота дискретизации 16000 Гц более подходит для рекомпозиции речи.

Сжатый звук

Аудиоданные, как и все данные, часто сжимаются, что облегчает их хранение и транспортировку. Сжатие в аудиокодировании может происходить либо без потерь, либо с потерями. Сжатие без потерь можно распаковать, чтобы восстановить цифровые данные в исходную форму. Сжатие обязательно удаляет некоторую ​​информацию во время процедуры декомпрессии и параметризуется, чтобы указать степень толерантности к технике сжатия для удаления данных.как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Без потерь

Без потерь сжимаются цифровые аудиозаписи, используя сложные перестановки сохраненных данных, что не приводит к ухудшению качества исходного цифрового образца. При сжатии без потерь при распаковке данных в исходную цифровую форму информация не будет потеряна.

Итак, почему методы сжатия без потерь иногда имеют параметры оптимизации? Эти параметры часто обрабатывают размер файла для времени декомпрессии. Например, FLAC использует параметр уровня сжатия от 0 (самый быстрый) до 8 (наименьший размер файла). Сжатие FLAC более высокого уровня не потеряет никакой информации по сравнению со сжатием более низкого уровня. Вместо этого алгоритму сжатия просто нужно будет затрачивать больше вычислительной энергии при построении или деконструировании оригинального цифрового звука.

API Speech поддерживает два кодирования без потерь: FLAC и LINEAR16. Технически LINEAR16 не является «сжатием без потерь», поскольку в первую очередь не задействовано сжатие. Если размер файла или передача данных важны для вас, выберите FLAC как ваш вариант кодирования звука.

Потеря компрессии

Сжатие аудиоданных устраняет или уменьшает некоторые типы информации при построении сжатых данных. Speech API поддерживает несколько форматов с потерями, хотя их следует избегать, поскольку потеря данных может повлиять на точность распознавания.как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Популярный MP3-кодек является примером метода кодирования с потерями. Все методы сжатия MP3 удаляют звук извне обычного аудиодиапазона человека и регулируют уровень сжатия, регулируя эффективную скорость передачи данных кодека MP3 или количество бит в секунду для сохранения даты звука.

Например, стерео CD с использованием линейного PCM из 16 бит имеет эффективную скорость передачи битов. Формула глубины кодирования звука:

441000 * 2 канала * 16 бит = 1411200 бит в секунду (бит/с) = 1411 Кбит/с

Например, сжатие MP3 удаляет такие цифровые данные, используя скорость передачи данных, такие как 320 кбит/с, 128 кбит/с или 96 кбит/с, что приводит к ухудшению качества звука. MP3 также поддерживает переменные скорости передачи битов, которые могут дополнительно сжать аудио. Оба метода теряют информацию и могут влиять на качество. С уверенностью можно сказать, что большинство людей могут определить разницу между кодированной MP3-музыкой 96 кбит/с или 128 Кбит/с.как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Другие формы сжатия

MULAW — это 8-битное кодирование PCM, где амплитуда выборки модулируется логарифмически, а не линейно. В результате uLaw уменьшает эффективный динамический диапазон сжатого звука. Хотя uLaw был введен специально для оптимизации кодирования речи в отличие от других типов аудио, 16-битный LINEAR16 (несжатый PCM) по-прежнему намного превосходит 8-битный сжатый звук uLaw.

AMR и AMR_WB модулируют кодированный аудиокасс, вводя переменную скорость передачи битов в исходный звуковой образец.как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Хотя Speech API поддерживает несколько форматов с потерями, вам следует избегать их, если у вас есть контроль над исходным аудио. Хотя удаление таких данных посредством сжатия с потерями может не оказывать заметного влияния на звук, слышимый человеческим ухом, потеря таких данных для механизма распознавания речи может значительно ухудшить точность.

Источник

Информатика. Базовый курс

Кодирование звука и видео информации

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звукаЗвук представляет собой волну с меняющейся интенсивностью и частотой (громкостью и его тональностью соответственно). Чем больше амплитуда, тем громче звук. Чем больше частота, тем больше тон.

Хранение и передача аналогового звукового сигнала осуществляется за счёт представления его в виде электрического сигнала с помощью модуляции.

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Модуляция – процесс изменения одного или нескольких параметров (амплитуды, частоты или фазы) высокочастотного колебания по закону низкочастотного сигнала (несущей частоты).

Существуют разные виды модуляции:

Амплитудная (АМ, amplitude modulation ) – изменение высокочастотных колебаний с частотой, равной частоте звукового сигнала. Например, несущей частотой может быть питание сети – 50 Гц. Или радиоволна СВ (MW) диапазона от 300 кГц до 3 МГц.как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Частотная (FM, frequency modulation) – модуляция при которой информационный сигнал управляет несущей частотой. По сравнению с амплитудной модуляцией здесь амплитуда остаётся постоянной.

Цифровой сигнал

Для того чтобы аналоговый (непрерывный) сигнал представить последовательностью чисел определённой разрядности, его необходимо превратить в дискретный (прерывистый) сигнал, а затем подвергнуть квантованию.

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звукаЗа кодирование звука отвечает звуковая карта, чем выше разрядность звуковой карты, тем больше уровней квантования она выдаёт и тем точнее становится звук при прослушивании.

На современном ПК карта всегда интегрирована в материнской плате, и имеет разрядность не ниже 24 бит.

Оцифровка звука – дискретизация и квантование аналогового сигнала.

1-й этап: Дискретизация сигнала по времени

Допустим, Вы, с помощью микрофона записали свой голос длительностью 5 сек. Этот фрагмент можно разбить на равные малые временный отрезки, которые в сумме дают нам 5 сек. Получаем частоту дискретизации (f, Гц), которая является обратной величиной времени: t сек. При частоте дискретизации 8 кГц=8 000 Гц, из формулы получаем отрезок, равный 0,000125 сек. или 125 миллисекунд.

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука2-й этап: Квантование сигнала по уровню

Чем больше уровней будет доступно для кодирования временных отрезков, тем ближе к аналогу будет закодированный файл, но при этом объём файла увеличится.

Например, возьмём 8 уровней, чтобы их закодировать в двоичный код нам достаточно 3 бита, что мы получаем из формулы Хартли:

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

2³=8 – комбинаций двоичного ряда чисел от 000 до 111.

Параметр (i) – называется глубина кодирования. 8 бит – 256 уровней, 16 бит – 65 536 уровней, 24 бита – более 16 млн. уровней.

3 этап: Определяем скорость потока звука

Частота дискретизации – 22 кГц, глубина кодирования – 16 бит. Произведение этих двух величин дает нам скорость потока 352 кбит/сек.

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Именно такой канал передачи данных потребуется для воспроизведения звукового файла в режиме он-лайн.

Расчёт количество звуковой информации

Для определения информационного объёма звуковой информации, нам необходимы следующие параметры:

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Задача 1:

Одна минута записи цифрового аудиофайла занимает 1,3 МБ, разрядность звуковой платы — 8 бит. С какой частотой дискретизации записан звук?

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Воспользуемся формулой: I=f∙t∙i∙n , из формулы видно что для нахождения частоты дискретизации формула примет вид: f=I/t∙i∙n.

1,3 МБ = 13,31,2 КБ = 1 363 148,8 Байт. Принимая во внимание что 8 бит = 1 Байту, делим 1 363 148,8 на 60, канал у нас записан 1, поэтому n=1.

Ответ: 22719,1 Гц или 22 050 Гц, см. основные настройки параметров звукового файла в программе Audacity как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Задача 2:

Две минуты записи цифрового аудиофайла занимают на диске 5,1 МБ. Частота дискретизации — 22 050 Гц. Какова разрядность аудиоадаптера?

как найти глубину кодирования звука. Смотреть фото как найти глубину кодирования звука. Смотреть картинку как найти глубину кодирования звука. Картинка про как найти глубину кодирования звука. Фото как найти глубину кодирования звука

Решение: 5,1 МБ = 5 347 737,6 Байт, делим по формуле: i = I / f∙ t ∙ n.

5 347 737,6 / 22 050 ∙ 120 = 2,02 Байт.

Ответ: 16 бит.

Кодирование видео

Информация хранится на различных носителях в виде файлов. Файл занимает память и может быть измерен в единицах измерения информации: бит, Байт, КБ и т.д.

Стремительное развитие интернета резко увеличило обмен информацией между людьми, для оптимизации хранения данных люди стали использовать специальные алгоритмы сжатия.

В основе цифрового видео лежит графический и звуковой файлы. Если рассчитать объём видеофайла без сжатия, нам необходимо учитывать тот факт, что человек начинает воспринимать смену кадров (картинок), как непрерывное плавное движение, если за 1 сек. будет мелькать 24 кадра.

Основы ТВ

Для приёма телевизионного сигнала используется антенна и приёмник. Приёмник – это электронная схема, которая преобразует сигнал в изображение на экране. В этом процессе участвует генератор кадровой развёртки и строчной.

Кадровая развёртка формируется на частоте, близкой к частоте переменного тока в бытовых электросетях – 50 Гц.

Кадровая развёртка, в сочетании со строчной служит для преобразования плоского двумерного изображения в одномерную последовательность, то есть, видеосигнал, а в телевизоре или мониторе компьютера для преобразования видеосигнала обратно в изображение на экране.

Для создания такой последовательности, используются специальные стандарты разложения:

576i, 625/50 — стандарт разложения, принятый для аналогового и цифрового телевидения в Европе, России, Австралии, странах Африки и Азии. 576 – это количество активных строк для аналогового телевидения и число пикселей по вертикали, для цифрового. Буква «i», англ. Interlace означает чересстрочную развёртку, передающую 25 целых кадров в 50 полях за 1 секунду.

480i, 525/60 — стандарт разложения, принятый в США, число активных строк составляет 480.

Существует также прогрессивная (p) кадровая развёртка, где все строки каждого кадра отображаются последовательно. Прогрессивная развертка стала широко распространена с появлением персональных компьютеров. Для комфортного чтения мелкого текста с экрана монитора, чересстрочная развертка стала малопригодна, так как мерцание строк вызывало быстрое утомление глаз.

Помимо развёртки существует ещё и соотношение сторон: аналоговое ТВ – 4:3, цифровое ТВ – 16:9, широкоформатное.

Форматы со сжатием

Давайте для начала посчитает объём видеофайла без сжатия, длительность 1 час 30 мин., 576i, 16:9. Звук записан с частотой дискретизации – 44 100 Гц, глубина кодирования 24 бит.

Решение:

Видео: I = 576 ∙ 1024 ∙ 25 ∙ 5400 ∙ 24 = 1 911 029 760 000 бит = 222,5 ГБ

Звук: I = 44 100 ∙ 5400 ∙ 24 = 5 715 360 000 бит = 681,3 МБ = 0,665 ГБ

Ответ: 223,2 ГБ.

Графический формат JPEG

Алгоритм JPEG (от англ. Joint Photographic Experts Group) в большей степени пригоден для реалистичных изображений с плавными переходами яркости и цвета, таковыми являются фотографии.

В основу алгоритма заложен переход от цветового пространства RGB к цветовому пространству YCbCr. Y – компонент яркости, Cb и Crсиний и красный цветоразностные компоненты. Суть сжатия состоит в том что для каждого блока пикселей 2х2 записывается не 12 значений, а 6, за счёт использования усреднённого компонента цвета.

Видео и аудио форматы MPEG

Алгоритм MPEG (англ. Moving Picture Experts Group) – стандарты сжатия и передачи цифровой видео и аудио информации. Базовым объектом кодирования в стандарте MPEG является кадр телевизионного изображения. Поскольку в большинстве фрагментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, сжатие начинается с создания исходного кадра.

При сжатии аудио используются хорошо разработанные психоакустические модели, чтобы выбросить звуки, которые не слышны человеческому уху.

Современные цифровые стандарты

Современные дисплеи и мониторы уже давно вышли за рамки старых добрых стандартов.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *