Wav bit depth сколько ставить
Перейти к содержимому

Wav bit depth сколько ставить

  • автор:

Сравнение 24-битного и 16-битного звука: результаты аудиотеста

Блогер Archimago немало сил потратил, чтобы ответить на вопрос: какое качество звука человек способен определять на слух? В рамках одного из его последних аудиотестов респондентов просят вслепую различить звуки с динамическим диапазоном 24 бит и 16 бит. Каждый из них скачивал несколько пар 24-битных файлов, один из которых претерпел конверсию 24-16-24 бита, то есть на практике был 16-битным файлом. Их просили определить разницу.

В тесте приняли участие 140 добровольцев (138 мужчин и 2 женщины: честная демографическая картина для аудиофилов). Средний возраст респондентов: 44 года.

Согласно анкетам, более 20% респондентов назвались музыкантами и звукоинженерами, поэтому можно сравнить результаты среди «профессионалов» и любителей, с учётом статистической погрешности.

Стоимость аудиоаппаратуры у участников опроса чаще всего лежит в диапазоне от $1000 до $3000.

Результаты опроса по трём парам файлов довольно любопытны. В двух из трёх композиций правильные и неправильные ответы распределились ровно пополам.

А в композиции Bozza 52,85% пользователей ошиблись, приняв 16-битный файл за 24-битный.

20 респондентов правильно ответили на все вопросы, а 21 человек ошибся во всех вариантах, что тоже вписывается в рамки статистического распределения.

Ещё более удивительно, что музыканты показали результат хуже среднего, даже с учётом статистической погрешности! Особенно сильно напутали в композиции Вивальди.

А вот результат среди пользователей, у которых стоимость звукового оборудования превышает $6000.

Наушники тоже вовсе не помогают отличить 16-битную музыку от 24-битной.

Подводя итог. Конечно, есть приложения, в которых нужно работать именно с 24-битным звуком (тот же мастеринг). Но факт в том, что на слух 16- и 24-битный звук совершенно не различимы друг от друга. Если кто-то заявляет, что способен услышать разницу, то этот человек наверняка заблуждается.

Wav bit depth сколько ставить

Форум сайта plus-msk.ru > Создание минусовок и иных композиций > Cubase, Nuendo > пишу минуса с помощью вст ,а сохранить в каком формате,чтоб не было потерь в качестве?

13.02.2009, 22:15

итак ,я сохраняю в wav с разрешением 32 бит float и частотой 44.100.

карта у меня креатив 24 битная.не хочеться терять в качестве,правильно ли я сохраняю.есть сомнения,.и после того как сохранил микс в вав пытаюсь записать аудио сд,а пишет в CyberLink PowerStarter что неподдерживаемый формат и приходиться сначала конвертировать в мп 3 ,затем писать в аудио сд.
что скажете по этому поводу? в неро запишет или нет с вав в аудио сд?

14.02.2009, 00:03

формат аудио-сд — 16 бит 44 кгц. никакие другие файлы не запишутся. конвертировать надо не в мп3, а понижать разрядность вав файла до 16 бит, обязательно применяя dither..

Добавлено через 1 минуту
просто, когда конвертируете в мп3 — программа-конвертер эти действия сама проводит. не обязательно по наилучшему алгоритму.

Владимир Матвийчук
14.02.2009, 00:48

сашко,
полностью согласен с ig202,
от себя добавлю, что Nero при записи Audio CD так не ругается, и конвертирует 32 или 24 бита в 16 бит 44,1 кгц. Dithering — в зависимости от цели, с котрой пишется Audio CD, т.е. я его не всегда применяю.

14.02.2009, 01:42

сашко,
зачем в 32 бита сохраняешь?
непонятно. гемморой только себе создаешь.
нормально все получается в 16 и 44,1

14.02.2009, 07:55

Владимир Матвийчук,
Ну да, не ругаиццо.
Хотя. у тебя какая Нюра? Я юзаю 6-ю версию до сих пор — она лёгкая дюже, не хочу многовесные восьмёрки-девятки с кучей ненужного дополнительного софта.
Дык вот — ругается!

сашко,
вот тебе алгоритм перекодировки трека в удобоваримый CD-формат при помощи Sound Forge:
1. Открываем трек в Фордже, жмём на него правой кнопкой мышки и выбираем третью закладку — Properties — смотрим свойства трека:
[Ссылки могут видеть только зарегистрированные и активированные пользователи] ([Ссылки могут видеть только зарегистрированные и активированные пользователи])

2. Видим, что он у нас 24-48. Непорядок. Лезем в меню Process, выбираем функцию Resample:

[Ссылки могут видеть только зарегистрированные и активированные пользователи] ([Ссылки могут видеть только зарегистрированные и активированные пользователи])

3. В окошке этой функции выбираем 44 100, качество interpolation accuracy) — максимум (4) и ставим внизу галочку Apply an anti-alias filter during resample:

[Ссылки могут видеть только зарегистрированные и активированные пользователи] ([Ссылки могут видеть только зарегистрированные и активированные пользователи])

4. После того, как файл ресэмплируется, опять лезем в меню Process и выбираем Bit-Depth Converter:

[Ссылки могут видеть только зарегистрированные и активированные пользователи] ([Ссылки могут видеть только зарегистрированные и активированные пользователи])

5. В его окошке выставляем 16 бит:

[Ссылки могут видеть только зарегистрированные и активированные пользователи] ([Ссылки могут видеть только зарегистрированные и активированные пользователи])

6. Снова жмём правой кнопкой по треку, выбираем Properties, видим — файл стал 44100-16:

[Ссылки могут видеть только зарегистрированные и активированные пользователи] ([Ссылки могут видеть только зарегистрированные и активированные пользователи])

Вуаля. Save As — обзываем трек как надо и сохраняем куда надо.

А ниже, кстати, указано, что исходный-то материал (Source) как был, так и остался 24-48.
Мы просто сделали копию. Фордж применяет неразрушающую редакцию. Всё, что ты творишь с файлом, он делает не в самом файле, а в его инструментальных копиях (Tool Copy).

14.02.2009, 08:37

выходит в кубе нужно сохранять в 16 бит и 44.100 ? и всё?почти всегда записываю на сд .
и что это такое Dithering.

14.02.2009, 09:13

В Кубе ты можешь работать как угодно и в чём угодно. Я не знаю, как Куб это делает, но в Сонаре я после, допустим, сведения трека в 24-48 импортирую этот трек как файл wave 16-44, в какую-нить папку, Сонар мне сам конвертирует его в то, что я попрошу. А проект останется в 24-48.

14.02.2009, 09:19

overload,
куб тоже это всё сделает,как ему указать.а вот как лучше в 16 или 24 бита сохранять? и раз в 44.100 частоту нужно сохр,то для чего нужна к примеру 48.100?

14.02.2009, 09:44

Чем выше битность и частота, тем звук качественнее. Это надо при записи, при редакции. Выше качество — больше косяков слышишь, проще убирать ненужное, выводить нужное.
А вот сохранять для CD надо, как уже сказано тут было, в 16-44100. Это потому что у Audio CD стандарт такой.
Нет, записать, конечно, можно и в 24 бита. Например, по цифровому оптическому шнуру или SPDIF на минидиск, современные минидиск-деки хавают 24 бита легко, и качество звучания получается выше. Но вот с аудио CD такое не прохиляет.
Ты же на Жигуль колёса от трактора не ставишь. Хотя — и там колёса, и тут колёса. Но стандарт другой. не подходит, и всё тут.
Если, допустим, твоя DVD-дека способна воспроизводить 24 бита и 48 килогерц, то можно создавать диск не как Audio CD, а просто как диск с данными, сливая на болванку твои вавки в 24-48. Но обычный музыкальный центр или бумбокс такой диск может и не прочитать.

14.02.2009, 10:23

Чем выше битность и частота, тем звук качественнее. Это надо при записи, при редакции. Выше качество — больше косяков слышишь, проще убирать ненужное, выводить нужное.

Более того, как показывает практика, проект сведенный в 24/32 — 48000,а потом переконвертированный в 16/44100 звучит качественней, чем сразу сведенный в 16/44100

Владимир Матвийчук
14.02.2009, 10:27

overload,
Nero 7.5.9, если не ошибаюсь.

Согласен, сохранять в Cubase в разрешении выше, чем 16/44 имеет резон только в случае дальнейшей обработки, например, WaveLab. А если нет, то, конечно, подготовить к записи на AudioCD можно и нужно прямо в Кубе.

сашко, Dithering — это подмешивание в трек шума, почти неслышного, но «удобного» для человеческого восприятия ухом музыки. Подробнее — Google.

14.02.2009, 10:47

но в Сонаре я после, допустим, сведения трека в 24-48 импортирую этот трек как файл wave 16-44, в какую-нить папку
Более того, как показывает практика, проект сведенный в 24/32 — 48000,а потом переконвертированный в 16/44100 звучит качественней, чем сразу сведенный в 16/44100
Не верно.

Не имеет смысла писать в 48 000, если потом будет софтовый ресемплинг в 44 000, т.к. при нем, из-за ошибок пересчета и несовершенных алгоритмов вы получите ту же картину, зачастую хуже в итоге (зависит от алгоритма), что при изначальной частоте дискритизации 44 100.
Битность же влияет на динамический диапазон, так что писать с битностью 32 Float не имеет смысла, разве что, вы пишете симонический оркестр с его максимальными перепадами (да и то, спорно. )
Советуют, если вы хотите повысить частоту разрядности, писать в разрядность кратную конечной. Например, если конечный формат 44 100, то желательно писать в 88 000, так легче алгоритму ресемплинга справиться потом с задачей. Но , не всякий комп потянет проект с такой частотой.
Отсюда вывод — оптимальная разрядность DAW 44 100\24BIT с последующим понижением битности (дитеринг обязательно!) до 16BIT, если это формат CD.
Ну а дитеринг встроен во все современные максимайзеры — L2, Элефант, Озон и т.д.

сашко, Dithering — это подмешивание в трек шума
И смещение его в высокочастотную область..

Наиболее качественный, на данный момент, софтовый ресемплер Voxengo r8brain PRO

14.02.2009, 13:11

Вот тут ([Ссылки могут видеть только зарегистрированные и активированные пользователи]) мы некоторое исследование на тему ресэмплинга провели. Если интересно.

14.02.2009, 20:04

Интересно конечно.:aga: Не противоречит сказонному мной.:aga: Кстати, я практически «процитировал» в своем посте создателя этого ресурса [Ссылки могут видеть только зарегистрированные и активированные пользователи] на которрый ссылается CakeWorker.

14.02.2009, 21:56

итак ,попробую снова изьясниться.как я понял для того чтобы минус записать на сд с минимум потерей качества,нужно:
1.с миди каждый трек экспортировать в wav с разрешением 24 бит и частотой 88200.
2.затем открыть новый проэкт кубэйс и залить все сохранённые треки,после окончательного сведения экспортировать в аудиомикс тоже в 24 бита с 88200 частотой.
3.открыть сохранённый микс в адоб аудишион и переконвертировать в мп3 в 320 кб с 44100 стерео (9.6:1)
4.вылетает табличка с настройкой будущего формата.оставляем 44100,на вкладке резолюшн меняю на 16 бит ,dither оставляю по умолчанию всё там (галочки стоят)
есть ещё какойто ползунок вроде как качество ниже-выше,ставить на самый высокий?
вот посмотрите
[Ссылки могут видеть только зарегистрированные и активированные пользователи]*********ru/451178m.jpg ([Ссылки могут видеть только зарегистрированные и активированные пользователи]*********ru/451178.htm)

1 и 2 пункт по моему желанию,мне так удобней да икажеться что качество лучше чем сразу с миди экспортировать в wav
если что не так допонял поправте меня .спасибо

Добавлено через 48 минут
а вот если хочу с вав а не в мп3 кодировать в 16 бит 44100 ничего в аудишине не выходит,то перегруз конкретный,то шип.в общем где то не там лажу.

Владимир Матвийчук
15.02.2009, 00:07

сашко,
ну намудрил. Прямо в Кубейсе экпортируй в Wave 16/44. Если после Куба ничего больше делать с файлом не будешь, а сразу писать на CD. Если я неправ, поправьте меня, коллеги.

Похоже, я почти полностью повторил пост №11, тоже свой.

15.02.2009, 00:26

оооооооооо есть. методом тыка додумался,и теперь и пишет с вав на диск.круто вот только не понял про pre/post filter нужна там галочка или нет.читал что если заранее отфильтровать частоту 22050 нг,то не нужна ,но я так и не научился разбираться по спектроанализатору.
и вот ещё ,параметры дезера оставить как есть или другие?(какие)(я про дитеринг аудишина 1.0)

Добавлено через 17 минут
сашко,
ну намудрил. Прямо в Кубейсе экпортируй в Wave 16/44. Если после Куба ничего больше делать с файлом не будешь, а сразу писать на CD. Если я неправ, поправьте меня, коллеги.

Похоже, я почти полностью повторил пост №11, тоже свой.

ситуация проясняеться и сразу у меня есть наводящий вопрос.я после сведения буду записывать сразу на диск.,значит мне нужен 16 бит и 44100 разрядность,а вот если я хочу дитерингом воспользоваться,тем более что все рекомендуют,мне прийдётся сохранить в 24 бит 48000 а после переконвертировать в 1644 и поставить галочку дитеринга,но тогда есть риск потери качества,как говорит павел.я пользуюсь озоном и где то там есть дитеринг?вот где подскажите и как он по сравнению с дитерингом аудишина 1.0.

Владимир Матвийчук
15.02.2009, 00:56

сашко,
Внутренняя работа Куба и выход с его микшера идёт в 32 бита с той частотой, которая указана в свойствах проекта. Куб делает всю тягомотину, что ты собрался делать, за нас. Короче, при экспорте указывай 16 бит 44,1 кГц, а в выходной шине Куба ставь плагин дитеринга; да, можно Озон. В закладке, где loudness, под ревером. Там ещё есть DC оффсет, и если ты этот оффсет на более ранней стадии, в треках, не убрал; то смело жми его. С Аудишн не работаю, качество дитеринга сравнить не могу.

15.02.2009, 02:37

Владимир Матвийчук,
cпасибо.от теперь оно.разобрался

Добавлено через 36 минут
[Ссылки могут видеть только зарегистрированные и активированные пользователи]*********ru/415340m.jpg ([Ссылки могут видеть только зарегистрированные и активированные пользователи]*********ru/415340.htm)
а тут чё ставить 32 флот или 24 бит(формат записи)

15.02.2009, 09:11
а тут чё ставить 32 флот или 24 бит(формат записи)
У меня 24
Владимир Матвийчук
15.02.2009, 09:19

сашко,
Это формат записи аудиофайла. А если карточки у нас только 24-битные, думаю, нет смысла ставить 32. И 24-х, и 32-битный файл будет обрабатываться 32-битными делами Куба. А 32-битный файл в данном случае будет лишь больше размером, чем 24.

Опять же, поправьте меня, коллеги, если я неправ.

15.02.2009, 09:21

Сам проект с максимально возможной частотой и битностью, чтобы подцепить как можно меньше транкейта внутри него, а единоразовый финальный пересчет так или иначе происходит с некоторыми математическими округлениями.
Опять 25! Читайте выше. 44100\24 — это грамотно и за глаза хватает.

15.02.2009, 17:52
Абсолютно согласен с Pavell, .
15.02.2009, 20:15

вот по вашим советам по поводу битности и разрядности доработал над авторским минусом(неделю мурыжил)только закончил ,здесь в этой теме как раз те профи от которых хотел бы услышать советы по минусу.хотелось бы слышать всё отсыгранного ,до всех мелочей.выкладываю ссылку
[Ссылки могут видеть только зарегистрированные и активированные пользователи]

15.02.2009, 21:38

А не профи, можно высказываться?! 😉
На мой взгляд надо немного поработать
над панорамированием.
Мне кажется, что как-то все инструменты в одной kуче.
Или я ошибаюсь?

15.02.2009, 22:57

а вот по понорамме раздвинул более.бас выдвенул громче и соло ревера довабил ,а то как то сухо вроде.завтра на громком звуке попробую что получилсь.продолжайте критиковать
[Ссылки могут видеть только зарегистрированные и активированные пользователи]

15.02.2009, 23:06

Вот так получше будет.
Соло надо поярче, теряется. Это ж СОЛО!
И мне кажется на соло с ревером немного переборщил.

16.02.2009, 00:26

Davno uznal ob etom—-Rebyata vash proekt soderjit 25 trekov VST i kogda vi ego sohranyaete v 16bit44100,on silno ujimaetsy, tak kak 25 trekov mashina sbrasivaet za 1minutu v odin trek,s 32bitfloat i 88200 namnogo shire-eto snachala ne slishno,no na horoshih monitorah i zvuk ob’emnee i vosokie yarche,a potom v Wavelabe dojimaem do 16/44100.********* godami. A v celom,esli fanera zvuchit, to ee ne cho ne isportit.

Владимир Матвийчук
16.02.2009, 00:46

Romarion,
A v celom,esli fanera zvuchit, to ee ne cho ne isportit! В общем, если музыка в треке есть, то её не того. Не потеряешь, если плохое сведение. Но и не приобретёшь.

Пример плохого сведения при хорошей аранжировке — критикуйте!: [Ссылки могут видеть только зарегистрированные и активированные пользователи]

16.02.2009, 13:04

Опять 25! Читайте выше. 44100\24 — это грамотно и за глаза хватает. Грамотно или нет зависит от целей и возможностей.
а что звучит: стандарт звука — «Хватает за глаза» 🙂
мне так и 44\16 хватает, но более корректно описывают сигнал более высокая дискретизация и битность, она же позволяет более точную математику при работе плагинов, более глубокое округление суммирования.
Но повторю, дабы избежать не нужных убеждений — решают цели и возможности

16.02.2009, 13:34

более корректно описывают сигнал более высокая дискретизация и битность, она же позволяет более точную математику при работе плагинов, более глубокое округление суммирования.
Это да, высокая дискретизация и битность всегда лучше, но а дальше то куда? Если так и оставить — будет лучше. А если ресемплить до 44 100? Чем будете ресемплить, плагином? Вернетесь к тому, с чего начали. Лучше не будет. Вот я о чем. Если у вас нет серьезных конверторов для оцифровки с большой дискретизацией и серьезных, аналоговых приборов для ресемпленга, то все это «игра теней». Не морочьте себе голову, как говориться.

16.02.2009, 15:14

народ, всё время скидываю audio mixdown в real time , где-то мелькало ,что это делать необязательно,(хотя, как мне показалось, что если скидывать не в real time -есть потери )
хотелось бы услышать и другое мнение. biggrin:

Владимир Матвийчук
16.02.2009, 15:40

nazarol-jk,
в реалтайме миксдаун делать нужно только в одном случае — если есть внешние модули/инструменты/обработки, которые Нюэндо/Кубом не просчитаются. Вероятность глюка в реалтайме считаю большей — треснул буфер :wink:, проц заскочил за 100% и т.д. В «оффлайне», так сказать, можно миксить и перезагруженные проэкты — они просчитаются, хоть и не воспроизводятся.

16.02.2009, 17:56

в реалтайме миксдаун делать нужно только в одном случае — если есть внешние модули/инструменты/обработки, которые Нюэндо/Кубом не просчитаются.
+1

16.02.2009, 18:56

Вернетесь к тому, с чего начали.
вряд ли так. внутри проекта накопишь гораздо больше грязи при различных манипуляциях с одиночными трэками при более низкой частоте
финальный сброс с понижающим ресемплом более щадящее решение
в идеале ресемплировать задача мастеринг-инженера

Aleksandr1
16.02.2009, 19:05

Неужели азы мастерства аранжировки стали начинаться с «правильного ресэмплирования»? :vah:
Стареем однозначно. -))

16.02.2009, 20:22

внутри проекта накопишь гораздо больше грязи при различных манипуляциях с одиночными треками
У меня нет никаких таких манипуляций. Кубендо не использует офф-лайн редактирование.
Делал Повалий ,Гайтане и БиСам в 44100\24 как всегда. Никаких нариканий.

16.02.2009, 20:40

а может у кого есть инструкция на русском к асио драйверам.пришло время и тут познакомиться поболее.у меня раньше была ,а потом кудато исчезла,может по невнимательности вытер.там картинки и описания на русском к каждому элементу.
скиньте на мыло.буду благодарен

Владимир Матвийчук
16.02.2009, 23:02
сашко,
к каким именно драйверам? Для какой карты?
17.02.2009, 00:12

Владимир Матвийчук,
(дрова)ASIO4ALL_2_7,карта креатив 24 бит,но карта то зачем?мне бі просто растолковать в драйвере есть галочки разные ,ползунки,вот для чего какая из них нужна.ивсё.

Владимир Матвийчук
17.02.2009, 00:26

сашко,
спрашивал потому, что для каждой АСИО карты свои драйвера. Креатив не все модели поддерживает АСИО, поэтому для неё и прочих Реалтеков придумали Asio4All.

В данной статье описаны настройки новой версии драйверов ASIO4ALL v2.
Настройка аудио программ
Чтобы работать с ASIO4ALL, необходимо правильно настроить программу. Параметры настройки зависят от конкретной программы. Обычно следует войти в настройку аудио конфигурации и выбрать ASIO — ASIO4ALL v2.
Должна появиться кнопка, при помощи которой вызывается ASIO Control Panel. Внешний вид этой кнопки зависит от используемой программы. После нажатия этой кнопки откроется ASIO4ALL v2 Control Panel. Если будут возникать дополнительные вопросы, желательно обратиться к руководству по аудио приложению!
Как только откроется ASIO4ALL v2 Control Panel, можно начинать настройку основной конфигурации.
Основная конфигурация

1. Device List
Это список аудио устройств WDM, найденных в системе. Изменения настроек происходит только для выбранного утсройства.
Выбраным устройством считается то, для которого название написано жирным шрифтом. На картинке выше это CMI8738/C3DX PCI Audio Device, остальные устройства недоступны.
Текущее состояние каждого устройства отображается маленькой иконкой и может быть одним из следующих:
o Running — Устройство полностью запущено.
o Available — Устройство должно быть доступно для использования в данной сессии, но запущено не было.
o Unavailable — Устройство используется другим процессом, или не доступно для текущей сессии по другим причинам.
o Beyond Logic — Устройство по неизвестной причине не запускается и/или выдаёт какую-либо ошибку. Иногда закрытие и повторное открытие панели управления может решить эту проблему, например в случае, если было подключено устройство по USB .
2. Кнопка Action
Выбирает текущее устройство для работы с ASIO. В основном режиме можно выбрать одновременно только одно устройство.
3. ASIO Buffer Size
Этим регулятором настраивается ASIO Buffer Size для текущего выбранного устройства. Маленький размер буфера означает маленькую задержку. Если при воспроизведении будет слышно потрескивание – рекомендуется увеличить размер буфера.
4. Кнопка Done
Закрывает панель управления.
5. Переключатель Advanced
Переключает панель управления в режим Advanced, в котором можно отрегулировать дополнительные параметры. Переключатель Advanced открывает дополнительную секцию в окне панели управления.
6. Load Default Settings
Нажатие этой кнопки сбрасывает все пользовательские настройки на настройки по умолчанию.
7. ASIO4ALL Web Site
Если компьютер подключён к Интернету, эта кнопка приведёт прямо на сайт ASIO4ALL, где можно проверить обновления и получить дополнительную информацию (пока что только на английском).
Расширенная конфигурация

Как только панель управления будет переключена в режим Advanced, внешний вид панели несколько усложнится. Пункты в списке устройств будут «растянуты». В расширенном списке устройств можно полностью просмотреть архитектуру WDM аудио.
Список устройств состоит из: Devices, Device Interfaces и так называемые «Pins» (это жаргон Microsoft). Иллюстрация выше показывает, как взаимосвязаны вышеперечисленные элементы в иерархии WDM.
Теперь кнопкой Action можно включать/выключать каждый элемент в списке устройств. Таким способом можно смонтировать «установку» из нескольких устройств. Но такая «установка» требует, чтобы все устройства работали от одного и того же источника синхронизации. Этого можно достигнуть последовательностью соединения устройств через S/PDIF и т.д.
Если устройства не синхронизированы, существует вероятность того, что их потоки через некоторое время разойдутся!
Описание правой стороны панели в режиме Advanced (1..5).
1. Latency Compensation
Так как ASIO4ALL не обладает достаточной информацией об архитектуре основного устройства/драйвера, это может вызывать некоторую задержку.
Этими регуляторами можно компенсировать неизвестные задержки для ASIO4ALL.
В установке из нескольких устройств будет использоваться наибольшее соответствующее значение. Поэтому, для некоторых устройств возможны характерные задержки !
2. Use Hardware Buffer
Включает аппаратный буфер для выбранного устройства. Действует только для так называемых «WavePCI» минипортов, так как другие типы WDM драйверов обычно не дают прямой доступ к аппаратному буферу.
Наиболее важное преимущество использования аппаратного буфера в том, что при таком методе меньше нагрузка на центральный процессор. В дополнении, возможно дальнейшее уменьшение времени задержки.
Аппаратная буферизация на данный момент работает некорректно для «установки» из нескольких устройств.
Если аппаратная буферизация не поддерживается определённым аудио устройством, при игре будет ясно слышная задержка.
3. Kernel Buffers/Buffer Offset
Если буферизация отключена, этот регулятор позволяет добавить два дополнительных буфера, которые будут поставлены в очередь для аудио выхода. Каждый дополнительный буфер увеличивает выходную задержку для устройства по времени, которое берётся для одного буфера. Поэтому, начальное значение «2» должно меняться только на маломощных машинах, на которых маленькие размеры буфера ASIO не могут достигаться значениями по умолчанию.
Если аппаратный буфер включен, этот регулятор определяет количество компенсации (в мс) между тем, когда ASIO4ALL вставляет считываемые данные из аппаратного буфера, и позицией, где ASIO4ALL «думает», что аппаратура читает эти данные. Звучит непонятно? Вы ещё код который это вычисляет не видели. )
Обычно более высокие настройки повышают задержку и одновременно надёжность, низкие настройки приведут к нежелательному эффекту.
4. Always Resample 44.148 kHz
ASIO4ALL может пересемплировать в реальном времени 44.1 кГц из/в 48 кГц. Пересемплирование будет автоматически происходить всякий раз, когда ASIO4ALL открыт для 44.1 кГц, а WDM драйвер не поддерживает эту частоту семплирования.
Однако, могут быть исключения, когда AC97 поддерживает внутреннее пересемплирование на 44.1 кГц. Очень часто качество пересемплирования AC97 оставляет желать лучшего и приводит к неприятным последствиям. Чтобы избежать таких проблем, следует включить эту опцию.
5. Force WDM driver to 16 Bit
Это опция работает только тогда, когда WDM драйвер поддерживает частоту дискретизации выше 16 бит, но ниже 24. Некоторые AC97 устройства, например, могут работать с частотой 20 бит, но фактически не могут быть открыты больше, чем на 16 бит. Эта опция помогает избежать таких проблем.
Проблемы
Хотя ASIO4ALL является ASIO драйвером для любого аудио оборудования, из-за различных конфигураций могут возникать различного рода проблемы, которые не связаны с ASIO4ALL. Наиболее вероятно, если поменять установку устройства в панели управления ASIO4ALL, количестве доступных входных и выходных каналов, вероятно, изменится, так же, как и названия каналов, обнаруженных приложением. Поэтому, желательно перезапускать аудио приложение после любого изменения в установке аудио устройств всякий раз, когда видно, что отдельное приложение не может сделать нужные изменения на лету.
Основные проблемы и возможные решения:
• ASIO4ALL v2 не виден в меню аудио конфигурации приложения
Есть две возможные причины этого: либо приложение не поддерживает ASIO, либо ASIO4ALL v2 установлен пользователем с ограниченными правами в системе. В последнем случае, следует зайти в систему, как администратор и повторно установить ASIO4ALL v2. После удачной установки, ASIO4ALL v2 не будет требовать прав администратора для запуска.
• Аудио устройство помечено, как Unavailable или Beyond Logic даже тогда, когда не используется в другом месте
Следует убедиться, что MS GS Software Wavetable Synth или любое подобное название не включено где-нибудь в установке MIDI. На сайте ASIO4ALL есть подробная информация относительно этого.
Если любой такой Software Wavetable Synth (иногда представлен, как . DLS Synth. ) может быть причиной препятствия, рекомендуется попробовать перезапустить аудио приложение. Иногда, при переключении с другого драйвера на ASIO4ALL v2, предыдущий драйвер не освобождает аудио оборудование.
Если это USB/PCMCIA/FireWire устройство, закройте панель управления ASIO4ALL, отключите устройство, включите повторно и снова откройте панель управления ASIO4ALL.
• Изменения, сделанный в панели управления, не передаются на другие приложения
. И при этом они не передаются между разными пользователями системы! Это не ошибка, это такая особенность! ASIO4ALL v2 запоминает настройки для каждого приложения/пользователя! Это даёт возможность запускать несколько копий ASIO4ALL одновременно, если они не используют одно и то же аудио оборудование.

Цифровой аудиоформат 24/192, и почему в нем нет смысла. Часть 3 [Перевод]

Прим. перев.: Это перевод предпоследней части развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, почему обывателям нет никакого смысла хранить и воспроизводить музыку в формате 24/192 (и о том, кому действительно имеет смысл работать с 24-битным аудио).

Вернемся к вашим ушам

Мы обсудили диапазон частот, который способны распознавать уши, но что насчет динамического диапазона (это диапазон от наиболее тихого звука до самого громкого)?

Один из способов точно определить динамический диапазон – это снова посмотреть на кривые болевого порога и порога слышимости. Расстояние от наивысшей точки кривой болевого порога до самой низкой точки кривой слышимости составляет около 140 децибел – для молодого и здорового человека. Правда, слушать звук на такой громкости долго не получится, поскольку +130 дБ уже достаточно, чтобы повредить слух за несколько минут или даже секунд. Для справки скажу, что громкость отбойного молотка на расстоянии одного метра составляет 100-110 дБ.

Интересный момент: порог слышимости увеличивается с возрастом и потерей слуха, а болевой порог с возрастом уменьшается. Волосковые клетки улитки в ухе захватывают только часть всего диапазона в 140 дБ, поэтому мускулатура уха непрерывно регулирует количество звука, достигающего улитку, путем сдвига слуховых косточек – как радужка регулирует количество света попадающего в глаз [9]. Механизм костенеет с возрастом, что ограничивает слуховой динамический диапазон и снижает эффективность защитных механизмов.

Окружающий шум

Немногие люди осознают, насколько тихим может быть звук на пороге слышимости человека.

Самое слабое звуковое давление, которое способен воспринимать человек, составляет -8 дБ SPL [11]. По шкале А для измерения уровня шума, гул от лампы накаливания в 100 Вт на расстоянии одного метра составляет около 10 дБ SPL, что на 18 дБ громче. Гудение лампы будет намного громче, если подключить её к реостату.

Как пример звукового давления в 20 дБ SPL (что на 28 дБ громче самого тихого звука) часто приводится пустая студия звукозаписи или шумоизолированная комната. Найти место тише достаточно сложно, поэтому вы никогда не слышали шум, издаваемый лампочкой.

Динамический диапазон 16 бит

16-битная линейная импульсно-кодовая модуляция имеет динамический диапазон в 96 дБ, в соответствии с наиболее общим способом подсчета, когда динамический диапазон вычисляется как (6*кол-во бит) дБ. Многие верят, что 16-битное аудио не передает произвольные звуки тише, чем -96 дБ. Это большое заблуждение.

Ниже я привел две ссылки на 16-битные аудиофайлы. Один содержит звук частотой 1 кГц, при громкости 0 дБ (где 0 дБ – самый громкий звук), а другой – также звук частотой 1 кГц, с громкостью -105 дБ.

  • Сэмпл 1: Звук 1 кГц при 0 dB (16 бит / 48 кГц WAV)
  • Сэмпл 2: Звук 1 кГц при -105 dB (16 бит / 48 кГц WAV)

Выше изображен график спектрального анализа звука громкостью -105 дБ перекодированный в формат 16/48 с помощью ИКМ. Громкость 16-битного аудио с применением ИКМ очевидно ниже 96 дБ, иначе -105 дБ нельзя было бы представить или услышать. Как такое возможно? Закодировать этот сигнал без искажений так, чтобы он был значительно выше уровня шума, в то время как его амплитуда занимает треть бита? Часть загадки разрешается за счет правильного псевдослучайного сигнала, что как бы делает шум квантования независимым от входного сигнала. Косвенно, это означает, что такой способ квантования не вносит искажений, а только некоррелированный шум. Это, в свою очередь, означает, что мы можем кодировать сигналы с произвольной битовой глубиной, включая сигналы с пиковыми амплитудами, менее чем одним битом [12]. Тем не менее, псевдослучайный сигнал не меняет того факта, что если уровень сигнала опускается ниже уровня шума, то он практически исчезает. Как же звук громкостью -105 дБ по-прежнему различим на фоне шума в -96 дБ? Ответ таков: мы неверно представляем характеристики шума в -96 дБ. Мы используем неприменимое определение динамического диапазона. Формула (6*кол-во бит) дБ дает нам среднеквадратичный шум всей полосы сигнала, а каждая волосковая клетка чувствительна только к узкому спектру от всей полосы частот. Поскольку каждая волосковая клетка слышит только часть общей энергии шумов, то уровень шума, принимаемый клеткой, будет намного ниже, чем весь диапазон частот громкостью -96 дБ. 16-битное аудио может обладать более глубокой модуляцией, чем 96 дБ, если использовать правильный псевдо-сигнал, который смещает энергию шума квантования в зону, где его сложнее расслышать. На практике [13] 16-битное аудио может достигать громкости в 120 дБ. 120 дБ – это больше, чем разница между звуком комара в комнате и отбойным молотком в футе от вас. Или разница между пустой звуконепроницаемой комнатой и достаточно громким звуком, который способен повредить слух в секунды. 16 битов хватает, чтобы хранить весь слышимый спектр, и будет хватать всегда. Соотношение сигнал-шум Стоит сделать небольшое замечание о том, что соотношение сигнал/шум для уха меньше, чем динамический слуховой диапазон. Внутри заданной критической полосы, обычно, сигнал/шум составляет лишь 30 дБ. Отношение сигнал/шум не достигнет рамок диапазона слышимости, даже при условии расширения полосы частот. Это гарантирует, что формат 16 бит ИКМ обеспечивает разрешающую способность сверх необходимого. Также стоит отметить, что увеличение битовой глубины звука с 16 бит до 24 не увеличивает разрешающей способности и «качество» звука. Это всего лишь расширит динамический диапазон – расстояние между самым тихим и самым громким звуком, за счет снижения уровня шума. Как бы то ни было, 16 бит уже обеспечивают уровень шума, который мы не в состоянии услышать. Когда 24 бита имеют значение? Профессионалы используют для записи музыки 24-битные сэмплы [14] из-за меньшего уровня шумов и по соображениям удобства. 16 бит достаточно, чтобы охватить весь слышимый диапазон с запасом. Но он не охватывает весь возможный диапазон аудио-оборудования. Основная причина использования 24 бит во время записи – это избежание ошибок. Вместо того, чтобы осторожничать, выравнивая 16 бит по центру диапазона, рискуя отрезать верхние частоты или добавить шума, 24 бита позволяют оператору установить примерный уровень и более не думать об этом. Промах на пару бит не влечет за собой никаких последствий, а эффекты, которые динамически сжимают записанный спектр, имеют большее пространство для маневра. Также инженеру требуется большее 16 бит при смешении сигналов и мастеринге. Современные рабочие процессы могут включать, буквально, тысячи эффектов и операций. Шум квантования и уровень собственных шумов 16-битной выборки могут быть незаметны при воспроизведении, но при увеличении такого шума в несколько тысяч раз, он сразу становится заметным, а 24-битный формат сохраняет накапливающийся шум на очень низком уровне. После того, как музыка готова к записи на диски, нет никаких причин оставлять больше чем 16 бит. Тесты на прослушивание Понимание живет там, где встречаются теория и реальность. Вопрос разрешается только тогда, когда они обе приходят в согласие. Эмпирические данные, полученные из тестов на прослушивание позволили судить, что 44.1 кГц/16 бит обеспечивает максимально возможное качество воспроизведения. Множество контролируемых тестов подтвердили это, но я рекомендую недавнюю работу «Слышимость стандарта CD, аналогово-цифровое и цифро-аналоговое преобразование, использованное в воспроизведении аудио с высокой разрешающей способностью», проделанную местными ребятами из Бостонского аудио-сообщества. К сожалению, для доступа к полному тексту работы нужно быть членом Общества звукоинженеров. Тем не менее, эта работа широко обсуждалась во многих статьях и на форумах, авторами, которые туда [в сообщество] входят. Вот несколько ссылок:

  • Новая частота дискретизации: насколько высоко качество современных CD? [ссылка]
  • Ветка форума Hydrogen Audio [ссылка]
  • Справочная информация со страницы Бостонского-аудио сообщества, включая перечень оборудования и список сэмплов [ссылка]

В ходе этой работы проводился эксперимент: были отобраны испытуемые, которые выбирали между записями на высококачественных аудио DVD/SACD, подобранными приверженцами звука высокой четкости, чтобы показать его превосходство, и теми же записями, но в CD формате 16/44.1 кГц. Слушателям нужно было выявить какие-либо различия между ними, используя методологию случайного выбора. Бостонское аудио-сообщество проводило эксперимент с использованием высокопрофессионального оборудования в шумоизолированной среде, как с обычными, так и с тренированными слушателями. Среди 554 попыток, испытуемые выбирали «правильно» в 49.8% случаев. Другими словами, они пытались угадать. Ни один слушатель в течение всего теста не смог опознать, которая из записей была в формате 16/44.1, а какая была звуком высокой четкости [15]. А 16-битный сигнал даже не был сглажен! В еще одном недавнем исследовании [16] изучалась возможность расслышать ультразвук, как предполагали более ранние исследования. Тест был построен таким образом, чтобы максимизировать возможность распознавания, для этого были добавлены интермодуляционные составляющие в места, где они были бы наиболее слышны. Было установлено, что нельзя услышать ультразвуковые волны… но оказалось, что искажения от интермодуляционных составляющих распознать можно. Эта статья породила череду дальнейших исследований, результаты большей части которых противоречили друг другу. Некоторые неясности были разрешены, когда обнаружилось, что ультразвук может вызывать большее количество интермодуляционных искажений в усилителях мощности, чем ожидалось. Например, Дэвид Гризингер (David Griesinger) провел этот эксперимент [17] и обнаружил, что его акустическая установка не вносила заметных интермодуляционных искажений, но зато их вносил усилитель. Читатель, будь осторожен Очень важно не вырывать отдельные работы или «комментарии экспертов» из контекста или брать их только с ресурсов, интересных вам. Не все статьи полностью соглашаются с этими результатами (а несколько даже не соглашаются с большей частью), поэтому легко наткнуться на мнение меньшинства, которое может доказывать любую точку зрения, которую вы можете вообразить. Несмотря ни на что, статьи и ссылки, приведенные выше, представляют большую важность и серьезный объем знаний и экспериментальных записей. Нет ни одной известной статьи, которая бы прошла испытание временем и поставила бы под сомнение состоятельность этих результатов. Споры происходят только среди потребителей и внутри сообществ меломанов. Во всяком случае, количество неоднозначных, незаконченных и откровенно несостоятельных экспериментальных результатов, доступных в поиске Google, подчеркивает, насколько сложно провести точное и объективное исследование. Различные ученые ищут всякие мелочи, требуют проводить строгий статистический анализ, чтобы выявить подсознательные выборы, которые непреднамеренно делали испытуемые. Таким образом, мы скорее пытаемся доказать что-то, чего в принципе не существует, что делает положение вещей еще сложнее. Доказательство нулевой гипотезы сродни разрешению проблемы остановки – это нереально. Единственный вариант подтвердить что-то в этом случае – собрать достаточно много эмпирических данных. Несмотря на это, работы, подтверждающие нулевую гипотезу – это действительно серьезное доказательство; подтвердить «не слышимость» экспериментально гораздо сложнее, чем обсуждать её. Неизвестные ошибки в тестовых методиках и оборудовании почти всегда дают ложноположительные результаты (из-за случайного внесения звуковых различий), а не ложноотрицательные. Если профессиональные исследователи с таким трудом проводят исследование отдельных аудио-различий, то вы можете представить, как это трудно для любителей. Как (ненарочно) испортить результаты звукового эксперимента Самый «лучший» комментарий, который я слышал от людей, верящих в высококачественное аудио (перефразировано): «Я слышал высококачественный звук лично, и улучшение качества звучания очевидно. Вы серьезно хотите, чтобы я не верил своим ушам?» Разумеется, вы можете верить собственным ушам. Но дело в том, что это мозг чересчур доверчив. Я не пытаюсь кого-то оскорбить, это проблема всех людей. Предвзятое мнение, эффект плацебо и двойное слепое тестирование Любое испытание, где слушатель может опознать два варианта по любым признакам, кроме как на слух, обычно приводит к результатам, которые слушатель ожидал заранее. Это называется предвзятостью и имеет схожесть с эффектом плацебо. Это означает, что люди «слышат» различия, из-за подсознательных сигналов и предпочтений, которые не имеют отношения к звуку – это как предпочесть более дорогой (или более привлекательный) усилитель более дешевому. Человеческий мозг устроен таким образом, чтобы подмечать особенности и различия там, где их нет. И эту особенность нельзя отключить, просто попросив человека принимать объективные решения – это происходит на подсознательном уровне. Предвзятость нельзя ликвидировать скепсисом. Контролируемые эксперименты доказывают, что осознание принятия предвзятых решений лишь усиливает эффект! Тест, во время которого не было устранено влияние предвзятых суждений, ничего не стоит [18]. При одностороннем слепом тестировании слушатель ничего не знает заранее о вариантах и не получает никакой обратной связи в ходе испытания. Такое тестирование лучше прямого сравнения, но не исключает предвзятости экспериментатора. Тот, кто проводит тест, может непреднамеренно повлиять на его ход или передать свою собственную предвзятость слушателю неосторожными репликами (например: «Вы уверены, что это то, что вы слышите?», язык тела также может указать на «неправильный» выбор, и заставить сомневаться, и так далее). Влияние предвзятости человека, проводящего тест, на результаты слушателя также было подтверждено экспериментально. Двойные слепые тесты – это стандарт, в таких тестах ни экспериментатор, ни слушатель не получают какой либо информации о содержании теста и текущих результатах. Наиболее известный пример – это ABX-тесты, проводимые компьютером, которые есть в свободном доступе – их можно запустить на вашем собственном ПК [19]. ABX-тесты подразумевают минимальное количество результатов слухового теста, до достижения которых они считаются неполноценными. Имеющие хорошую репутацию аудио-форумы, такие как Hydrogen Audio, часто запрещают любые обсуждения результатов слуховых тестов, если они не соответствуют минимальным требованиям объективности [20]. Выше изображено рабочее окно Squishyball – простой командной строки инструмента ABX, запущенного в xterm. Лично я не проводил ни одного качественного сравнительного теста в процессе исследований (неважно, насколько серьезных) без применения ABX. Наука есть наука, тут нет места нерадивости. Проделки громкости Человеческое ухо может сознательно различать амплитудные различия громкости примерно в 1 дБ, и эксперименты показывают возможность определения различий в пределах 0,2 дБ на подсознательном уровне. Люди практически повсеместно считают громкий звук лучше, и 0,2 дБ достаточно, чтобы человек выказал предпочтение. По результатам любого сравнения, в котором неаккуратно выставлены амплитуды, будет наблюдаться явно выраженное предпочтение громкому звуку, даже если различия в громкости малы для того, чтобы осознать это. Продавцы аудио знают об этом трюке уже очень давно. Профессиональный стандарт тестирования требует различия амплитуд на величину, не превышающую 0,1 дБ. Это часто требует использования осциллографа или анализатора сигналов, потому что подгадывать и крутить ручки, пока звук не совпадет, достаточно нерационально. Отсечение сигнала Отсечение сигнала – это еще одна ошибка (иногда проявляющаяся только с течением времени), которую легко допустить. Может оказаться, что несколько обрезанных сэмплов и их производные сигналы сравниваются с необрезанным сигналом. Опасность отсечения части сигнала особенно разрушительна в тестах, которые дискретизируют, передискретизируют цифровые сигналы и управляют ими «на лету». Допустим, мы хотим сравнить качество звучания сигналов с частотой дискретизации 48 кГц и 192 кГц. Обычный способ провести такой эксперимент – обеспечить субдискретизацию из 192 кГц в 48 кГц, а затем снова провести повышающую дискретизацию до 192 кГц, после чего сравнить два этих сигнала в ABX-тесте [21]. Такой порядок позволяет нам исключить любую возможность изменения параметров оборудования или подмены сэмплов, влияющую на результаты. Мы можем использовать тот же ЦАП для воспроизведения обоих сэмплов и переключаться между ними без каких-либо изменений в режиме работы оборудования. К сожалению, большинство сэмплов используют весь цифровой диапазон. Невнимательное применение передискретизации часто может привести к случайному обрезанию звука. Очень важно или следить за отсечением (и отбрасывать обрезанный звук), или избегать его, применяя различные методы: например, ослабление (аттенуацию) звука. Другой носитель – другая мастер-копия Я просмотрел несколько статей и блогов, которые утверждали о достоинствах 24 бит или 96/192 кГц, путем сравнения CD и аудио-DVD с «одинаковыми» записями. Такое сравнение несостоятельно, потому что для этих записей используются разные мастер-диски. Непреднамеренные сигналы Непреднамеренные аудио-сигналы практически неизбежны в старых аналоговых и гибридных цифро-аналоговых тестовых установках. Очевидно, что цифровые установки могут полностью устранить проблему в некоторых формах тестирования, но могут и увеличить количество потенциальных ошибок программного обеспечения. Такие ограничения и баги уже достаточно давно дают ложноположительные результаты в тестированиях [22]. Статья «Цифровые испытания – больше о ABX-тестировании» рассказывает увлекательную историю об удивительном тестировании слуха, проведенном в 1984 году, призванном опровергнуть авторитет меломанов того времени, которые поначалу утверждали, что CD уступает винилу. Статья касается не столько результатов испытания (я подозреваю, вы сможете догадаться, какими они были), сколько хаотичности мира, вовлеченного в проведение такого теста. Например, ошибка со стороны организаторов теста случайно показала, что приглашенный эксперт по прослушиванию делал выбор, основываясь не на качестве звучания, а скорее на различных потрескиваниях, которые производили реле коммутаторов. Анекдотические истории не заменяют реальные данные, но эта история показывает, с какой легкостью скрытые недостатки могут влиять на слуховые тесты. Некоторые из убеждений меломанов тоже довольно забавны, например кто-то надеется, что многие из современных исследований будут считаться глупыми через 20 лет. Примечания к Части 39. Все знают это чувство, когда перепонки «разжимаются» после выключения громкой музыки. 10. Несколько отличных графиков можно найти на сайте HyperPhysics. 11. 20 мПа обычно принимаются за 0 дБ для удобства измерения. Это приблизительно равно порогу слышимости на частоте 1 кГц. На частотах от 2 до 4 кГц ухо настолько же чувствительно как на 8 дБ. 12. В приведенной ниже статье описано лучшее объяснение сглаживания, что я встречал, хотя она [статья] больше о сглаживании изображений. Но первая половина охватывает теорию и практику сглаживания в аудио, перед тем как перейти к теме изображений. Кэмерон Николас Кристов, статья «Оптимальное сглаживание и ограничение шума на изображениях». 13. Инженеры, занятые в цифровой обработке сигналов, могли заметить, как это сделал мой всезнающий соотечественник, что 16-битное аудио, в теории, может иметь бесконечный динамический диапазон для чистого звука, если вы воспользуетесь бесконечным рядом Фурье, чтобы преобразовать его. Эта концепция очень важна для радиоастрономии. Хотя работа уха не сильно отличается от преобразования Фурье, его разрешение относительно ограничено. Это накладывает ограничение на максимально возможную битовую глубину 16-битных сигналов. 14. В производстве цифровой музыки используют 32-битные числа с плавающей точкой, потому что это очень удобно для современных процессоров, и потому что это полностью устраняет вероятность того, что случайное обрезание останется незамеченным и погубит композицию. 15. Несколько читателей хотели узнать как тест Майера и Морана в 2007 году мог дать нулевой результат, если ультразвук может вызывать интермодуляционные искажения? Должно быть очевидно, что «мог» и «иногда» не то же самое что «смог» и «всегда». Интермодуляционные искажения от ультразвуковых волн могут появиться, а могут и не появиться в любой системе, при любом наборе условий. Нулевой результат Майера и Морана означает, что интермодуляционные искажения были неслышны на системах, которые они использовали во время теста. Вниманию читателей предлагается ознакомиться с простым тестом на определение интермодуляционных искажений, и определить интермодуляционный потенциал их собственного оборудования. 16. Кару и Шого (Karou and Shogo), статья «Определение порога для звука, частотой выше 22кГц» (2001). Материал номер 5401, представленный на 110 собрании 12-15 мая 2001 года в Амстердаме. 17. Дэвид Грезингер, статья «Восприятие средних частот и интермодуляционные искажения высоких частот в динамиках, и их взаимодействие с аудиозаписями высокого разрешения». 18. Со времени публикации несколько комментаторов отправили мне похожие версии одного анекдота (перефразировано): «Я как-то слушал какие-то наушники/ усилители/ записи ожидая результат А, но был очень удивлен, когда пришел к результату Б! Доказано: предвзятость – это чушь!» Я могу сказать две вещи. Во-первых, предвзятость суждения не заменяет все верные результаты на неверные. Она склоняет результаты в труднопредсказуемом направлении на неизвестную величину. Как вы можете утверждать, что верно, а что – нет, наверняка, если тест был сфальсифицирован вашим подсознанием? Скажем, вы ожидали услышать большую разницу, но были удивлены, услышав малую разницу. Что если там не было разницы совсем? Или разница есть, но будучи осведомлённым о возможной предвзятости, ваш благонамеренный скептицизм скомпенсировал ваше мнение? Или, может быть, вы были совершенно правы? Объективное тестирование, например ABX, устраняет все эти неопределенности. Во вторых: «Вы думаете, что вы не судите предвзято? Отлично! Докажите это!» Значимость объективного теста заключается не только в его способности убедить нас, но и в способности убедить в этом других. Заявления требуют доказательств. Чрезвычайные заявления требуют экстраординарных доказательств. 19. Наверно, самые простые инструменты для ABX-тестирования:

  • Foobar2000 с ABX-плагином
  • Squishyball, инструмент командной строки Linux, которым пользуемся мы в Xiph

20. На Hydrogen Audio, аббревиатура TOS8 (objective testing requirement) обозначает необходимое условие тестирования, цифра 8 обозначает восьмой пункт условий предоставления услуг. 21. Принято считать, что передискретизация наносит непоправимый вред сигналу. Это совсем не так. По крайней мере, до тех пор, пока кто-то не допустит ошибку, например, обрезав сигнал. Субдискретизированный, а потом дискретизированный снова сигнал будет неотличим от оригинала. Это обычный тест, используемый для установки более высоких параметров дискретизации, что не обязательно. 22. Это, может быть, не связано напрямую со звуком, но… нейтрино что, быстрее скорости света, серьезно? [Заключительная часть]

Эту статью прочитали 46 652 раза
Статья входит в разделы: Интересное о звуке

Поделиться материалом:

FL Studio Сохраняемые и экспортируемые форматы файлов

Диалоговое окно экспорта проекта (*.wav; *.mp3, *.ogg, *.flac, *.mid) [ править ]

Чаще всего вы будете экспортировать свой проект в *.wav или *.mp3 звуковые файлы, которые будут проигрываться в медиа-плеере, стерео или Hi-Fi системах. Финальный микс экспортируется из FL Studio с помощью опции Export из меню File, процесс проходит не в режиме реального времени, и называется рендерингом. Время будет зависеть от настроек экспорта и сложности проекта. Рендерируемый звук лучшего качества, чем живой звук из FL Studio.

Fl studio rendering.png

О рендеринге

  • Мастер канал микшера — по умолчанию рендерится мастер канал микшера, если вы не используете Split mixer tracks. Это означает, что любой канал микшера, не направленный напрямую, или косвенно на мастер канал, не будет включен в рендер.
  • Форматы экспорта:
    • Звук — *.wav, *.mp3, *.ogg и .flac форматы которые сохраняют полный звуковой микс вашего проекта. По умолчанию рендерится мастер канал микшера, но вы можете экспортировать отдельные каналы микшера с помощью опции Split mixer tracks. См. примечание ниже, включая звуки от внешних синтезаторов и аудиооборудования.
    • MIDI — *.mid, который сохраняет нотные данные пошагового секвенстора/пианоролла в стандартный MIDI файл. MIDI это не звуковой формат.
    • Режим песни — длина задается такой иерархией: 1. Любое выделение временной шкалы, 2. Последний маркер времени за пределами последнего такта, содержащего данные. 3. Конец последней строки, содержащей данные И 4. настройка хвоста.
    • Режим паттерна — длина задается такой иерархией: 1. Последний маркер времени за пределами последнего такта, содержащего данные в паттерне. 2. Конец последней строки, содержащей данные в паттерне И 3. Настройка хвоста.

    Запись внешнего оборудования

    Чтобы включить звук от внешнего оборудования, такого как синтезатор, драм машина или сэмплер в финальный рендеринг:

    1. Сделайте MIDI подключение к устройству от компьютера и звуковое подключение от устройства к входу вашей звуковой карты.
    2. Запишите звук при воспроизведении в FL Studio (с использованием плагина MIDI Out для управления оборудованием).
    3. Поместите записанный звук, как аудио клип в плейлист.
    4. Отрендерьте проекта в звук, как здесь описано.

    Project type (тип проекта) [ править ]

    • Mode (режим) — выберите рендеринг всей песни или текущего выбранного паттерна. В режиме Song длина рендеринга песни задается такой иерархией: 1. Любое выделение временной шкалы, 2. Последний маркер времени за пределами последнего такта, содержащего данные. 3. Конец последней строки, содержащей данные И 4. настройка хвоста
    • Tail (хвост) — решает, как будут обрабатываться затухающие эффекты после конечной точки песни. Например, обычно вы не хотите, чтобы затухающая реверберация была отрублена в конце песни (Leave remainder), или, если вы создаете лупы, подмешивание конечной реверберации в начало может сделать луп более плавным (Wrap remainder). Leave remainder по умолчанию. Примечание: Если вы делаете луп файлы используйте *.wav формат, *.mp3 добавляет небольшое количество тишины в начале звука, которая будет мешать зацикливанию.
      • Leave Remainder (оставить до конца) — расширяет длительность песни захватывая любые затухающие звуки. Если Leave Remainder всеровно отрезает какие либо хвосты звуков, то для определения конечной точки рендеринга в плейлисте может быть использован «маркер повтора». Хотя точки маркеров повтора обычно игнорируются, если они размещены после последнего паттерна, аудио клипа или клип автоматизации в плейлисте, проект будет рендерен до позиции маркера повтора.
      • Wrap Remainder (вернуть оставшееся) — переносит любой затухающий звук конца песни в её начало. Эта опция полезна при рендеринге лупов с эффектами для создания гладкого лупа. Примечание: Эта функция рендеринга начинает работать после последнего такта, подмешивая любые затухающие звуки звучащие после последнего такта обратно в начало песни. Если затухающий звук происходит от нот перед последним тактом, они не будут возвращены.
      • Cut Remainder (обрезать в конце) — обрезает сигнал и заканчивает рендеринг сразу после окончания последнего такта, выделения или временного маркера.

      Fl studio rendering mode.png

      • Length (номер такта) — сообщает длину песни, паттерна или выделения в тактах, которые будут экспортированы.
      • Total Time (общее время) — показывает общую длительность экспорта песни, паттерна или выделения.
      • Disk Space (дисковое пространство) — показывает дисковое пространство необходимое для экспорта в звуковой файл(ы). Если в панели Output format(s) выбрано несколько форматов сохранения, то здесь отобразится суммарное дисковое пространство.

      Output format (выходящий формат) [ править ]

      Выберите выходящий формат(ы) для рендеринга проекта. Чтобы сохранить более чем в одном формате, просто выберите в этой панели несколько вариантов.

      Частота дискретизации — выхода (микшера) устанавливается в окне звуковых настроек.

      • WAV — Wave (Lossless Uncompressed Audio — несжатый звук без потерь). Wave это звуковой формат без потерь, и предпочтителен для обработки звука в производственной среде (используйте его, чтобы сохранить все ваши сэмплы, звуки и архивные материалы). Выпадающее меню ниже содержит опции битовой глубины для экспортируемого wav файла.
        • Какую битовую глубины я должен использовать? — битовая-глубина влияет на уровень шума сэмпла. Это определяет самый тихий звук, который может быть захвачен или минимальные изменения громкости, которые могут быть сделаны. Обычно для «прослушивания» музыки достаточно 16 бит. Используйте 24 или 32 бит для архивирования музыкальных файлов.
          • 16 bit int — высоко-качественный звуковой wav файл совместимый с широким спектром воспроизводящих устройств. Это также аудиоформат CD, так что если вы хотите создать звуковые файлы совместимые с CD форматом, используйте 44,1 КГц, 16-битwav файлы, убедитесь, что в окне звуковых настроек установлено 44.1 kHz. Примечание: FL Studio не записывается в формат CD, программа может только создавать звуковые файлы готовые для записи. Используйте любую VST CD записывающую программу для создания аудио CD.
          • 24 bit intwav формат с общей битовой глубиной использующийся в аппаратных и некоторых старых DAW. Используйте эту битовую глубину, если программное обеспечение или стороннее оборудование не поддерживают 32-Bit float.
          • 32 bit float — это родной формат движка смешивания FL Studio. Рендерьте в 32 bit float, когда собираетесь продолжить микширование или редактирование файла в другой программе (звуковом редакторе или DAW), которая поддерживает формат 32-битный с плавающей точкой. 32-бит с плавающей точкой обеспечивает больше точности при обработке звука, и таким образом обеспечивает высочайшее качество сохраняющееся при дальнейшей обработки и пост продакшене.
        • Какую частоту дискретизации я должен использовать?
          • Частота дискретизации влияет на самую высокую частоту, которая может быть захвачена сэмплом. Возможны значения между 22000 Гц (22 кГц) и 192000 Гц (192 кГц). Поскольку 44100 Гц (44,1 кГц) является стандартом CD и способен захватывать весь диапазон частот, который люди могут слышать (от 20 Гц до 20 кГц), используйте его. У вас должна быть определенная причина использования частоты дискретизации выше 44,1 кГц. Например, видео часто используют 48 кГц в качестве частоты дискретизации по умолчанию для звука. Установите частоту дискретизации FL Studio в звуковых настройках.
      • MP3/OGG — компрессируемый звук с потерями качества: Mp3 (MPEG Layer 3) и ogg (Ogg Vorbis) это форматы с «потерями», которые являются компактными для экономии места. Это означает, что при более низком битрейте вы можете услышать нежелательные артефакты, часто они описывается как «булькающие звуки» или «пузырьки». Ползунок определяет битрейт mp3/ogg звуковых файлов, увеличение битрейта качество звука улучшается, но увеличивается и размер файла.
        • Какой битрейт я должен использовать?
          • 64 kb/s (или менее) — это полезный формат для низко-качественных интернет «демо» треков. Будут заметны артефакты сжатия.
          • 128 kb/s — это та точка, где для большинства людей начинается «приемлемое» качество. Хорошо подойдёт для интернет-вещания, либо отправки музыкальных файлов по электронной почте.
          • 160 kb/s — это та точка, начиная с которой многие люди перестают отличать разницу между CD и MP3 (конечно не считая пользователей FL Studio). Это хороший минимальный битрейт, используемый для распространения и прослушивания музыки. Некоторые материалы могут по-прежнему производить звуковые артефакты сжатия. Внимательно прослушайте весь трек в наушниках, если важно качество то рассмотрите более высокий битрейт.
          • 224 kb/s (или выше) — с таким битрейтом MP3/OGG становятся практически неотличимыми от CD при нормальных условиях прослушивания. Это хороший минимальный битрейт используемый для архивирования качественно сжатых копий звука. Битрейт 224 или выше может быть полезен при сотрудничестве через интернет, когда вы должны поделиться звуковыми файлами, которые могут быть непрактичными в CD .wav формате (1400 кб/с).

      Максимальный битрейт для mp3 это 320 kb/s, а для ogg 450 kb/s. Это означает, что если вы установите ползунок в значение 450 kb/s, mp3 файлы будут по-прежнему рендериться в 320 kb/s, в то время как ogg файлы будут рендериться в 450 kb/s. Взаимосвязь между настройками битрейта и слышимостью артефактов будет зависеть от рендериремого материала и окружающей среды прослушивания. Вы всегда должны проверить рендериные файлы в хорошей паре наушников до их релиза. Конвертация в mp3 добавляет небольшое количество тишины в начало файла в дополнение к оригинальному звуку. По этой причине он не подходит для использования, в тех ситуациях где решающее значение имеет время-выравнивания звука (лупы, сэмплы, вокальные треки и т.д.). Там где это возможно при обмене или сохранении звука используйте по крайней мере формат 16-Bit .wav.

      • FLAC — компрессируемый звук без потерь. FLAC (Free Lossless Audio Codec — коек без потерь звука) похож на WAV-формат, сохраняет всю аудиоинформацию в закодированной форме сигнала. FLAC обладает дополнительным полезным свойством значительно сжимать (уменьшать) размер файла. Файлы FLAC обычно от 20% до 30% меньше, чем эквивалентный WAV-файл, при этом сохраняя битность и исходные данные. Примечание: Это сжатие размера файла, похожее на .zip и т.д., А не на сжатие на уровне звука.
        • Compression Level (уровень сжатия) — этот параметр определяет усилия, направленные на уменьшение размера аудиофайла. Разница в размере файла между уровнем 0 (наименьшее усилие) и 8 (наибольшее усилие) обычно составляет около 10%, относительно небольшая разница, готовьтесь к тому, чтобы быть недовольным.
          • 0 — быстрое сжатие, файлы немного большие.
          • 5 — установка по умолчанию.
          • 8 — медленнее сжатие, файлы немного меньше.
            Все настройки FLAC после декомпрессии идентичны (без потерь). Учитывая, что различия в размерах файлов минимальны, не важно, какой из параметров вы используете, это влияет только на время кодирования. Типичное время кодирования для параметра 0 примерно в 4 раза быстрее, чем 8.
        • FLAC bit depth (битовая глубина FLAC) — выберите 16 или 24 бит. См. раздел WAV формата для получения информации о битовой глубине.

      FL Studio автоматически преобразует FLAC-файлы и в WAV-формат, когда вы загружаете их в плейлист или плагины, такие как Edison или Slicex.

      • MIDI — это стандарт нотных и автоматизационных данных, в нём может быть сохранено содержимое пошагового секвенсора и пианоролла. Нотные данные сохраняются вместе с проектом FL Studio, экспортируйте в MIDI только если вы намерены импортировать нотные данные в другую стороннюю программу. Для экспорта:
        1. Убедитесь в том, что сохранили проект в его нынешнем состоянии, потому как следующий шаг будет заменять инструменты.
        2. Используйте макрос Prepare for MIDI export (подготовка к экспорту в MIDI) из главного меню Tools, который заменяет все инструменты автоматически настроенными плагинами MIDI Out. Это необходимо, чтобы экспортировать все MIDI проекта в правильный многоканальный формат. Чтобы экспортировать в MIDI файл данные отдельного пианоролла используйте опцию Export as MIDI file из меню пианоролла.
        3. Выберите MIDI в диалоговом окне экспорта проекта и нажмите кнопку Start.
        4. Не сохраняйте ваш проект в этом состоянии, вы потеряете первоначальные настройки инструментов. Сохраните новый проект, если это потребуется.

      MIDI это не звуковой-формат. Если ваш медиа-плеер может воспроизводить MIDI файлы, то для создания звука от MIDI данных он будет использовать синтезатор/сэмплер встроенные в вашу звуковую карту.

      Quality (качество) [ править ]

      • Resampling (ресэмплинг) — выберите метод интерполяции сигнала, используемый в плагине Sampler/аудио-клипах. Интерполяция это процесс подгонки кривой, который вычисляет промежуточные сэмплы амплитуды между известными точками сэмплов (заполнение пробелов). Это требуется только тогда, когда происходит транспонирование сэмпла от его оригинальной высоты, и программа определяет синхронизированные значения с исходными точками. Без квантования интерполяции (амплитуды), ошибки могут создать не желательные высокочастотные гармонические артефакты (алиасинг и ошибки квантования). FL Studio предоставляет несколько методов увеличения сложности вычислений и следовательно точности:
        • Linear (линейная интерполяция) — это самый быстрый метод. Он обеспечивает общее линейное усреднение между сэмплами, однако это может порождать алиасинг (высокочастотные шумы), в случае если сэмплы транспонируются далеко от своей оригинальной высоты.
        • 6-point Hermite (6-точечное преобразование Хермита) — оптимизировано для быстрой интерполяции кривой с высоким качеством в линейной интерполяции. Он идеально подходит для экспорта «рабочих проектов» ваших звуковых файлов.
        • 64, 128, 256, 512-point Sinc (64, 128, 256, 512-ти точечная синхронизация) — методы обеспечивающие повышенное качество интерполяции, но они очень медленные. Мы рекомендуем вам использовать как минимум 64-точечную синхронизацию при финальном рендеринге, а ещё лучше максимальное значение, если вы готовы ждать окончания рендеринга.

      Существует независимая интерполяция живого звука устанавливаемая в F10 > Audio Settings в разделе Mixer (живой звук значит не при экспорте, а при проигрывании проекта). Если в настройках Mixer и при рендеренге установлены разные значения интерполяции, это может привести к разному звучанию при живом воспроизведении и после рендеринг звука, особенно в области высоких частот. Алиасинг может создать «ложную» высокочастотную яркость. Установите живую интерполяцию в метод 64-point sinc, это позволит свести к минимуму эту проблему, если она возникнет.

      • HQ for all plugins (высокое качество для всех плагинов) — устанавливает режим высокого качества для всех родных плагиновFL Studio (эффектов, инструментов и сэмплеров), использованных в проекте. VST плагины также могут быть рендерины в режиме высокого качества, если в настройках оболочки выбрано Notify about rendering mode (сообщить о режиме рендеринга).
      • Disable maximum polyphony (отключить максимальную полифонию) — игнорирует установки «максимальной полифонии» (MAX) в разделе дополнительных настроек инструмента, но не игнорирует опцию Mono, если она включена.
      • Dithering (дизеринг) — применяется при конвертации 32 бит в 16 бит и ниже, *.wav и *.mp3 файлы. Дизеринг следует применять только один раз, при финальном рендеринге в 16-битный звуковой файл (если вообще стоит). FL Studio использует «формированный» алгоритм дизеринга, который сдвигает большую часть «шипения» выше 10 кГц.

      Что такое дизеринг? Проще говоря, дизеринг это случайные значения наименьшего бита, при преобразовании битовой глубины (например от 32 к 16-битному файлу). Наименее значение бита в цифровом звуковом файле представляет собой наименьшее возможное изменение выходящего уровня. Цель дизеринга состоит в том чтобы разрушить предсказуемость ошибок округления, которые происходят во время преобразования битовой глубины. Ошибки округления влияют только на наименьшие значения бит, поэтому дизеринг рандомизирует это значение (0 или 1) в соответствии с используемой формулой дизеринга. Если дизеринг не используется, эти ошибки округления коррелируют со звуковым сигналом и таким образом получаются искажения. Когда дизеринг используется, эти искажения заменяются дополнительным фоновым шипением. Шипение как правило меньше отвлекает и менее заметно чем алиасинг, и поэтому дизеринг стал стандартной процедурой при создании 16-битных финальных CD. Шумы алиасинга вызванный понижением битности (без дизеринга) или шипение (с дизерингом), слышны только в очень, очень тихой части записи, где музыка приближается к пределам битовой глубины. И если у вас громкость установлена очень сильной. Если вы слышите шумовые артефакты, и ваш трек играет на нормальном уровне прослушивания, то вероятно это другой тип шума на основе алиасинга частоты дискретизации (см. настройки интерполяции) или артефакты сжатия (mp3/ogg битовой глубины). На музыкальных форумах много глупостей о преимуществах дизеринга. Помните, что это просто случайное дрожание наименьшего значения битовой глубины. Это не добавляет «блеска», «кача» или «баса»! Это заменяет один очень низкоуровневый шум (алиасинг) на другой (шипение). Различные типы дизеринга, обсуждения которых вы можете видеть — это всего лишь разные тембральные вариациями дизеринга.

      Miscellaneous (разное) [ править ]

      • Save playlist markers (сохранить маркеры плейлиста) — маркеры нарезки будут сохранены в файле формата .wav на месте каждого временного маркера плейлиста.
      • Save loop markers (сохранить маркеры зацикливания) — сохраняет маркеры зацикливания в .wav-файлах. Полезно для создания зацикленных сэмплов для использования в плагинах Sampler.
      • Save note markers (сохранить маркеры нот) — каждая нота и аудиоклип (начало) в проекте добавляют маркеры нарезки в экспортированный аудиофайл, так экспортированный звук отлично нарезается, готов к использованию. Используйте в плагинах режущих лупы, таких как Fruity Slicer и Slicex или в плейлисте, со специальными параметрами растяжения по времени. Time stretching > Mode> Slice stretch and map. Примечание: Поскольку каждая нота и аудиоклип добавляют нарезку, сложные проекты быстро выйдут из-под контроля. Используйте эту опцию с несколько канальными сэмплерами, FPC или ограниченным количеством нотных плагинов, чтобы специально создавать лупы с нарезкой.
      • Save tempo information (сохранение информации о темпе) — сохраняет темп проекта в формате метаданных в формате .wav. Полезно для программ, которые могут читать этот тип данных. Примечание: Вы можете изменить темп, используя диалоговое окно Sample PropertiesEdison и маркеры нарезки/регионов в окне редактирования сигнала Edison.
      • Split Mixer Tracks (разделить каналы микшера) — когда эта опция активна, каждый канал микшера вашего проекта экспортируется в отдельный .wav файл. Примечания:
        • Эта опция не работает при экспорте в форматы flac/mp3/ogg.
        • Если вы используете плагины с несколькими выходами на разные каналы микшера, убедитесь, что в микшере эти каналы имеют названия. FL Studio использует это, чтобы понимать, что они используются, и будет их ренднрить.
        • Мастер эффекты используются только при экспорте мастер канала микшера. Чтобы включить мастер-эффекты, используйте меню плейлиста > Consolidate feature.
        • Выключенные каналы микшера, включая мастер, не будут экспортироваться.

        Кнопки рендеринга [ править ]

        • Background Rendering (фоновый рендеринг) — сворачивает окно и рендеринг производится в фоновом режиме, позволяя работать с другими программами Windows.
        • Start (старт) – запускает рендеринг. Когда начнется процесс, название кнопки изменится на Abort (отмена).

        Параметры экспорта командной строки [ править ]

        См. здесь несколько способов запуска командной строки в Windows. Это позволяет вам пакетно обрабатывать проектные и MIDI-файлы.

        • Windows рендеринг аудиофайлов — открыть окно командной строки. Используйте команду CD в окне командной строки, чтобы перейти в папку установки FL Studio. например CD C:\Program Files (x86)\Image-Line\FL Studio 12. Затем введите:
          • Один проект — FL.exe /R /Emp3 «/Fc:\MyProjects\Target Project.flp»
          • Все проекты в папке (включая подпапки) с использованием полного пути — FL.exe /R /Emp3 /F»C:\Program Files (x86)\Image-Line\FL Studio 12\Data\Projects\Demo songs\»
          • Один проект — Open «/Applications/FL Studio.app» —args -R -Emp3 -F»/Applications/FL Studio Mac Beta.app/Contents/Resources/FL/Data/MyProjects/Target Project.flp»
          • Все проекты в папке (включая подпапки) с использованием полного пути — Open «/Applications/FL Studio.app» —args -R -Emp3 -F»/Applications/FL Studio Mac Beta.app/Contents/Resources/FL/Data/Projects/Demo songs/»
          • Рендеринг в файл MIDI (Пример: FL.exe /M /Fc:\MyProjects)

          Файл проекта FL Studio (*.flp) [ править ]

          Это родной формат проектов FL Studio. Он сохраняет все данные, относящиеся к проекту, но учтите он не включает в себя сэмплы (если в проекте нет звуков загруженных в редактор Edison), пресеты DrumSynth и SimSynth, которые включены в проект. Чтобы экспортировать пакет, который включает в себя сэмплы, используемые в проекте, вместо этого сохраните в Zip.

          Демо плагины сохраняются вместе с проектом, но в следующий раз, когда вы открываете проект они будут заменены заполнителями. При попытке сохранить проект в .flp/.zip, который содержит демо-плагины вы получите предупреждение об этом. Печальное решение — перед сохранением заменить демо плагины на не-демо. Счастливое решение — продолжите сохранение, а затем купите плагин, и в следующий раз при открытии проекта плагин(ы) будут повторно загружены и будут в не-демо режиме :).

          Архивный файл проекта (*.zip) [ править ]

          Проекты могут быть сохранены в стандартные ZIP файлы. Этот формат будет сохранять файл проекта FL Studio и все сэмплы/пресеты используемые в проекте. FL Studio также может открывать непосредственно ZIP файлы (см. «Архивный файл проекта» в форматах файлов открытия/импорта).

          Демо плагины сохраняются вместе с проектом, но в следующий раз, когда вы открываете проект они будут заменены заполнителями. При попытке сохранить проект в .flp/.zip, который содержит демо-плагины вы получите предупреждение об этом. Печальное решение — перед сохранением заменить демо плагины на не-демо. Счастливое решение — продолжите сохранение, а затем купите плагин, и в следующий раз при открытии проекта плагин(ы) будут повторно загружены и будут в не-демо режиме :).

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *