VIP STUDY сегодня – это учебный центр, репетиторы которого проводят консультации по написанию самостоятельных работ, таких как:
  • Дипломы
  • Курсовые
  • Рефераты
  • Отчеты по практике
  • Диссертации
Узнать цену

Быстрое определение коэффициента качества передачи речи

Внимание: Акция! Курсовая работа, Реферат или Отчет по практике за 10 рублей!
Только в текущем месяце у Вас есть шанс получить курсовую работу, реферат или отчет по практике за 10 рублей по вашим требованиям и методичке!
Все, что необходимо - это закрепить заявку (внести аванс) за консультацию по написанию предстоящей дипломной работе, ВКР или магистерской диссертации.
Нет ничего страшного, если дипломная работа, магистерская диссертация или диплом ВКР будет защищаться не в этом году.
Вы можете оформить заявку в рамках акции уже сегодня и как только получите задание на дипломную работу, сообщить нам об этом. Оплаченная сумма будет заморожена на необходимый вам период.
В бланке заказа в поле "Дополнительная информация" следует указать "Курсовая, реферат или отчет за 10 рублей"
Не упустите шанс сэкономить несколько тысяч рублей!
Подробности у специалистов нашей компании.
Код работы: K002049
Тема: Быстрое определение коэффициента качества передачи речи
Содержание





Глава 1.
Быстрое определение коэффициента качества передачи речи (БОККПР)
Качество передачи речи представляет интерес для любых помещений, где происходит устное общение людей, а в таких помещениях, как лекционные аудитории, театры, конференц-залы этот вопрос особенно важен.
Были сделаны многочисленные попытки оценить разборчивость речи с помощью субъективных и объективных методов. Субъективные методы основаны на подсчете правильно услышанных слов и для них использовалась специально обученная группа ораторов и слушателей. Этот метод требует больших затрат времени и средств и не всегда может быть применим на практике из-за наличия субъективных факторов. Усилия были направлены на разработку методов, которые бы основывались на объективных измерениях разборчивости речи и использовании акустических факторов: фоновых шумов и реверберации.
БОККПР является объективным методом оценки качества акустического канала в отношении понимания речи. Он основан на измерении уменьшения степени модуляции сигнала между оратором и слушателем. Метод БОККПР является сжатым вариантом метода определения коэффициента качества речи (ККПР), и в какой-то степени аналогичен ему, но имеет ряд преимуществ:
 автоматически учитываются влияния фоновых шумов и реверберации, вследствие чего коррекция результатов не требуется
 измерения проводятся при одновременном воздействии сигнала и фоновых шумов, в результате чего не требуется раздельных замеров сигнала и шумов
 измерения по методу БОККПР быстры и могут проводиться в течение 10 с.
Идея, лежащая в основе метода, основана на теории о том, что понимание речи определяется восприятием низкочастотной модуляции сигнала. Величина ККПР изменяется от 0 до 1 и служит мерой оценки разборчивости речи и определяется по замеренному уменьшению коэффициента модуляции между оратором и слушателем. 
Четкая передача речи предполагает идентичность огибающей речевого сигнала оратора в точке, где располагается слушатель. Разборчивость речи может быть количественно определена величиной, показывающей, насколько изменилась степень модуляции огибающей сигнала из-за шумов и реверберации. Коэффициент уменьшения степени модуляции в функции частоты называется функция передачи модуляции(ФПМ). Именно она и позволяет проводить объективную оценку качества передачи речи.
Контрольный сигнал
Метод БОККПР предполагает уменьшение степени модуляции сигнала. Пример сигнала человеческого голоса показан на рисунке 1.1. Используемый контрольный сигнал имеет определенные характеристики, которые имитируют человеческий голос. Он состоит из несущего шумового сигнала и низкочастотной огибающей, показанной на рисунке 1.2. Несущий сигнал имеет две октавы розового шума со средними частотами 500 Гц и 2 кНц, их уровня выбраны так, чтобы получить средние уровни, встречающиеся в обычной речи, т.е 59 дБ в октаве 500 Гц и 50 дБ в октаве 2 кГц на расстоянии 1м (рисунок 1.3). Низкочастотная модуляция, которая есть в голосе, имитируется девятью дискретными сигналами с частотами от 1 до 11,2 Гц, они перекрывают диапазон частот, присутствующих в голосе человека. (рисунок 1.4)



Рисунок 1.1. Пример огибающей модулированного по интенсивности сигнала человеческой речи

Рисунок 1.2. Модуляция контрольного cигнала для метода БОККПР ( в октаве 2 кГц)

Рисунок 1.3. Долговременный средний октавный спектр обычной человеческой речи на расстоянии 1м (L_экв=60 дБ). Заштрихованные зоны указывают несущий сигнал метода БОККПР

Рисунок 1.4. Кривая спектра модуляции человеческой рчи. Дискретные значения частот, используемые в методе БОККПР, отмечены «*». Четыре частоты модуляции находятся в октаве 500 Гц (1,2,4,8 Гц), а пять в октаве 2 кГц (0.7, 1.4, 2.8, 5.6 и 11.2 Гц)
Измерения
Измерения проводятся с помощью передачи контрольного сигнала и его анализа в точке расположения cлушателя, чтобы выяснить, насколько уменьшилась степень модуляции для каждой из частот. Предполагается, что полученные значения коэффициентов уменьшения модуляции вызваны только шумом и соответственно только значение отношения сигнал/шум привело бы к уменьшению степени модуляции. Величина ККПР есть среднеарифметическое этих значений отношения сигнал/шум, она пронормирована и её значение изменяется от 0 до 1.
Фоновые шумы и реверберация
Однако уменьшение степени модуляции речевого cигнала определяется не только отношением сигнал/шум, но и реверберацией. Определённое значение ККПР может быть получено комбинацией этих факторов (Рисунок 1.5). На практике мы не можем точно определить меры влияние отношения сигнал /шум и реверберации, но эту информацию можно получить при изучении функции передачи модуляции(ФПМ). Если основной фактор –  реверберация, то ФПМ имеет отрицательный наклон (Рисунок 1.6). Это происходит, так как быстрые колебания огибающей становятся более расплывчатыми по сравнению c медленными, и степень уменьшения модуляции становится больше при более высоких частотах.

Рисунок 1.5. Кривые равных ККПР,  показывающие влияние различных сочетаний cигнал/шум и времени реверберации на одни и те же значения ККПР

Рисунок 1.6. Функция передачи модуляции для двух случаев:  а) при отсутствии реверберации и отношении сигнал/шум = О дБ; б) при отсутствии фоновых шумов и начальном времени затухания 1,5 c.


Теоретическая модель
Значения ККПР могут быть вычислены по известным акустическим параметрам помещения, поэтому на стадии проектирования можно задать требуемые значения ККПР, а измерения действительных значений ККПР будут служить проверкой соответствия результата заданной спецификации. 
Функция передачи модуляции, на которой основываются вычисления ККПР, может быть определена по известной величине времени реверберации(Т) и отношению сигнал/шум (S/N):
m(F)=  1/??(1+(2?F ЕДТ/13,8))?^2 ?1/((1+?10?^((-0,1S)?N) ) ),
где m(F) - коэффициент уменьшения степени модуляции на частоте F, а Т –  начальное время затухания реверберирующего сигнала между оратором и слушателем. Полученные значения m переводятся в значения эквивалентного отношения сигнал/шум и усреднены в виде значения ККПР
Вычисление значения ККПР
Вычисляем значение 9 значений эквивалентного отношения сигнал/шум для каждой частоты модуляции:
x_i=10 lg?[m_i?((1-m_i))], 
где x_i - значение эквивалентного отношения сигнал шум для значения коэффициента уменьшения степени модуляции
Если x_i>15 дБ, то принимаем x_i = 15 дБ
Если x_i<15 дБ, то принимаем x_i = -15 дБ.
Определяем среднеарифметическое значение 9 значений x_i и нормируем.
Значение ККПР = ((x_i ) ?+ 15)/30. 
Ограничения
Есть ограничения на условия измерений, при которых можно использовать метод БОККПР:
- Линейная передача. Нелинейные искажения не принимаются во внимание
- Отсутствие чистых тонов в фоновом спектре вне полос 500 Гц и 2 кГц. Фоновые шумы должны быть стационарны во времени.
- Время реверберации помещения частотонезависимо.
При каждом измерении и для каждой окованной полосы проводится вычисление эквивалентного начального времени затухания(ЭНВЗ) и эквивалентоного отношения сигнал/шум (ЭОСШ). Величина ЭНВЗ соответствует спаду уровня реверберирующего сигнала на 5 дБ. По значениям ЭНВЗ и ЭОСШ можно определить, снижение разборчивости произошло из-за реверберации или из-за фоновых шумов. 
1.2. Уточнение оценки разборчивости речи при звуковом сопровождении кино- и видеофильмов
Общий темп речи определяется отношением числа лингвистических единиц(слогов,слов), которые присутствуют в сообщении, ко времени произношения сообщения. Для устной монологической русской речи он колеблется от 120 до 405 слогов в минуту(2...6,75 сл/с), среднее значение около 288 слогов в минуту(~5 сл/с). При медленном темпе усложняется синтетическое обобщение впечатлений, а быстрый темп мешает аналитическому рассмотрению речевого потока. Также быстрый темп речи затрудняет процесс предвосхищения последующего содержания сообщения, который является характерным для понимания речи. 
Общий темп зависит от абсолютного темпа речи. Его определяют, как отношение числа лингвистических единиц сообщения ко времени, которое было затрачено на его воспроизведение, за вычетом времени пауз. Среднее время пауз в устной монологической и диалогической речи примерно 52,5% от общего времени произнесения сообщения.
С учётом изложенного, речевой сигнал можно представить как последовательность импульсов с примерно одинаковой амплитудой и скважностью порядка 0,5 и можно определить частоту их следования и даже предельное время запаздываниях(ПВЗ) отраженных сигналов в помещениях с реверберацией. По этим данным, изменение темпа речи влияет на восприятие реверберирующего сигнала, и при убыстрённом темпе речи (УТР) 7,4 сл/с ПВЗ =40 мс, при нормальном темпе речи (НТР) 5,3 сл/с - 68 мс, а при замедленном темпе речи (ЗТР) - 92 мс. Можем заметить, что увеличение темпа речи ведёт к уменьшению промежутка времени, в котором помеха ещё не воспринимается и, соответственно, к необходимости уменьшения стандартного времени реверберации Т60. 
Примем время паузы между слогами нормального темпа русской речи tп=0,1с равным промежутку времени tз, в течение которого уровень звука уменьшается на 10 дБ от первоначального, что практически исключает восприятие реверберационных помех, найдём значение Т60 по энерговременному соотношению для экспоненциального характера затухания: 
t_п=t_з=ln??E(t_з )/E_0 ?/(-13,8) T_60=0,17T_60
Отсюда, для НТР Т60=tз/0,17=0,59с, а для УТР –  23с, что требует существенного увеличения фонда звукопоглощения в помещении.
Для комплексной оценки разборчивости переводной речи звукового сопровождения фильмов пользуются выражением для коэффициента модуляции m(F) огибающей речевого сигнала в результате действия шумов и реверберации.
m(F)=  1/??(1+(2?F ЕДТ/13,8))?^2 ?1/((1+?10?^((-0,1S)?N) ) ),
где F –  частота следования слогов в слитной речи;
S/N – отношение сигнал/шум, дБ;
ЕДТ = 0,17Т60 - начальное время реверберации, определенное по кривой затухания энергии на уровне 10 дБ.
По известным значениям Т60, F и S/N по формуле вычисляются значения m(F), по ним определяем коэффициент передачи, который служит мерой оценки разборчивости речи по субъективной шкале в методе RASTI (RapidSpeechTransmissonIndex)
С другой стороны, величина m(F) может быть определена экспериментальным путём по значению эквивалентного отношения сигнал/шум:
S/N_э=10 lg?[(m(F))?((1-m(F)))]
Если основным фактором является фоновый шум, то m не зависит от F, а если большее влияние реверберации, то m(F) будет спадать с ростом F.
Полученная экспериментальная зависимость (кривая 1 на рис. 1.10) характеризует потери слоговой разборчивости S при неизменной реверберации в зависимости от значения эквивалентного отношения сигнал/шум. Полученная кривая в диапазоне отношений S/Nэ от -3 до 12 дБ хорошо аппроксимируется прямой линией.
На рис 1.11 изображена кривая, характеризующая изменение разборчивости в зависимости от величины реверберации при постоянном значении отношения сигнал/шум. Измерения проводились в различных помещениях объемом от 30 до 150 м2 с различной акустической обработкой и временем реверберации от 0,2 до 5 с при установке неизменного отношения S/N=15 дБ в ближнем поле источников речи и шума, при этом фоновый шум помещений не превышал уровня создаваемой помехи.
Анализ показал, что в диапазоне изменений эквивалентного отношения S/Nэ от -3 до 12 потери разборчивости с пределах допустимого, следовательно для него удобно построить графики измерений для трёх значений Тина речи, что соответствует F=2, F=5 и F = 7 Гц при выбранном ранее отношении S/N = 10 дБ (см.рисунок 1.7). А на рисунке 1.8 показана зависимость разборчивости речи от величины времени ревербераии. Используя эти зависимости, может найти по частным значениям коэффициента модуляции соответствующие величины разборчивости речи. "Отличная" звукопередача будет соответствовать m большей или равной 0,75.
Эти зависимости позволяют комплексно уточнить значения разборчивости речи в помещениях при разных Т60.

Рисунок 1.7. Зависимость слоговой разборчивости от эквивалентного отношенияS/Nэ

Рисунок 1.8. Зависимость разборчивости речи от величины времени реверберации.



Глава 2.РАЗБОРЧИВОСТЬ РЕЧИ
Основным качественным показателем радиотелефонной и телефонной аппаратуры является качество передачи речи при эксплуатации.
Давно прошло время, когда качество передачи речи по системе связи определялось случайным подбором параметров отдельных элементов этой системы.
В настоящее время аппаратуру рассчитывают под заданное качество передачи ( или максимально возможное в определенных условиях), которое может быть измерено и выражено в измерительных единицах.
Количественное измерение качества речи имеет свои особенности и трудности, которые не возникают при любых других видах измерений.
Эти трудности возникают из-за того, что оконечными звеньями любой системы для передачи речи являются люди - говорящий с слушающий.
Качество речи,которую передают по каналу связи, зависит не только от совершенства аппаратуры, установленной на передающей стороне тракта, но и от свойств голосового аппарата говорящего, а качество приема, помимо всего прочего, от свойств слуха принимающего. 
Речевые особенности и свойства слуха различны не только для разных людей, но и для одного человека может изменяться в зависимости от воздействия внешних факторов и внутреннего психофизиологического состояния.
Если, например, качество любой электрической или иной машины может быть определено однократным измерением напряжения на зажимах или мощности и т.п., то в аппаратуре для передачи речи однократное измерение какой-либо электрической или акустической величины не даёт никаких оснований для суждения о её качестве. Здесь сама речь и комбинация факторов, которая влияет на её восприятие, настолько многообразны, что в большинстве случаев приходится прибегать к статистическим методам измерения, способным дать некие устойчивые средние величины. 
Один из таких методов, получивший наибольшее распространение, - артикуляционный метод. Он основан на учете статических свойств слуха и речи, согласно артикуляционному методу качество передачи речи оценивается путём измерения разборчивости.
Разборчивость речи, как численная мера качества передачи речи, может быть измерена или вычислена по известным параметрам тракта.
Отметим, что артикуляционным методом может определяться не только качество всего тракта передачи, но и отдельных его элементов, в том числе качество голосового и слухового аппарата. В связи с этим, метод артикуляции используется не только в технике связи, но и в биологии в целях исследования свойств голосового аппарата и процессов восприятия разных звуковых раздражителей, а также в медицине для количественной и качественной оценки потерь слуха при различных заболеваниях слуховых органов и их диагностики. Также артикуляционные измерения используются в архитектурной акустике при испытании акустических свойств помещенй.
Существуют и объективные методы измерения разборчивости речи, они основаны на вычислении влияния факторов, которые оказывают действие на разборчивость, таких как внешние шумы и реверберация. 
2.2. Субъективные методы измерения разборчивости речи
2.2.1. Оценка по пятибалльной шкале МККР.
Этот метод рекомендован Международным Консультативным Комитетом по Радиосвязи. Принимаемый речевой текст оценивается оператором последующей шкале:
- неразборчиво («1»);
- разборчиво временами («2»);
- разборчиво с трудом («3»);
- разборчиво («4»);
- совсем разборчиво («5»).
Основные недостатки этого метода — это возможность больших субъективных отклонений в оценке различными экспертами. Имеется некоторое затруднение при определении разницы между соседними оценками (например,между «разборчиво» и «совсем разборчиво»)
2.2.2. Метод переспросов.
Этот метод основан на статистическом наблюдении за разговорамиабонентов в реальных условиях пользования ими переговорной аппаратурой. Сущность его состоит в том, что производится контрольное подслушивание разговора абонентов в течение длительного времени, фиксируется число случаев, когда абоненты просят повторения неуслышанных элементов, и далее  вычисляется среднее число переспросов на 100 секунд разговора.
2.2.3. Метод мнений.
Этот метод основывается на использовании в качестве испытательного материала непосредственно самой речи (разговоры, которые ведутсяспециально выделенными парами операторов). Его сущность состоит в следующем: 12 (или 24) пары операторов (которые не должны быть специальнонатренированными) последовательно и попарно ведут произвольный разговор по испытуемому тракту. Эти разговоры позволяют каждому из операторов оценить качество тракта, при этом оценка производится по таблице оценок от «0»(разговор возможен лишь с большим трудом) до «4» (полное отсутствиенапряжения при разговоре). Достоинство этого метода состоит в том, чтокачество тракта определяется на основе действительных впечатленийабонентов. Существенным недостатком является необходимость привлечениябольшого числа лиц.
2.2.4. Артикуляционный метод
Посредством артикуляционных таблиц, которые передаются через исследуемую систему связи, можно установить влияние искажающих факторов, встречающихся в системе, а именно: ограничения передаваемого спектра, амплитудные и нелинейные искажения, уровень и спектр окружающих шумов и т.д.
Все эти факторы снижают разборчивость речи за счет того, что звук, прошедший через тракт, приходит искаженный и может быть принят за другой или вовсе не принят. Следовательно, артикуляционные таблицы служат инструментом для измерения разборчивости речи, передаваемой через тракты с различными характеристиками. Требуется, чтобы принятая в эксплуатации система артикуляционных таблиц была универсальным инструментом, не требующим замены или корректировки при разных искажениях на испытуемых трактах.
Правильность результатов измерений при различных условиях испытаний - есть критерий доброкачественности таблиц. 
2.2.4.1. Виды артикуляционных таблиц и их применение.
В соответствии с различными видами разборчивости, создаются и виды артикуляционных таблиц: слоговые, словесные, фразовые. 
Разборчивость звуков подсчитывается по результатам измерений с слоговыми артикуляционными таблицами, где они встречаются в сочетании с другими, типичными для данного языка. Передача отдельных звуков в целях испытаний тракта практически невозможна и была бы не совсем корректна, т.к не соответствовала бы условию сохранения естественности измеряемого процесса, поскольку в реальности в речи звуки встречаются только в сочетаниях с другими звуками. 
При этом будем иметь в виду, что разборчивость звуков, полученная в результате испытаний со слоговыми артикуляционными таблицами, не будет иметь ничего общего с разборчивостью звуков в реальной речи или в передаче отдельных фраз. Естественно, что в последних двух случаях подсчёт правильно воспринятых звуков даст значения разборчивости больше, чем для слоговых таблиц, где передаются не имеющие смысла сочетания. Это объясняется тем, что смысловые ассоциации создают избыточность речевого сигнала, позволяющую принимающему правильно принять даже те звуки, которые фактически им не были услышаны.
Установлено, что для каждого национального языка все виды разборчивости связаны друг с другом однозначными функциональными зависимостями, которые остаются неизменными для любых условий передачи на реально существующих трактах. Так D - звуковая разборчивость, S - слоговая, W - словесная и J – фразовая разборчивость связаны между собой зависимостями вида: S=f(D), W=f(S), J=f(W). Эти зависимости могут быть получены аналитическим или экспериментальным путём.
Из факта существования этих однозначных зависимостей следует то, что измерения с различными видами таблиц не дополняют друг друга, а эквивалентны и значит, что измерив одну величину, мы можем получить остальные простым отсчетом по установленной для данного языка системе взаимосвязей между различными видами разборчивости.
Реальная речь может передаваться приятным и мелодичным голосом, а может грубым, иметь различное смысловое содержание, выражать разное эмоциональное отношение говорящего и при этом иметь одну и ту же величину разборчивости. Это обстоятельство даёт возможность упростить структуру таблиц и получить повышенную точность и повторяемость результатов артикуляционных измерений, т.к только при этих условиях можно избавиться от влияния на результат измерений целого ряда факторов, не имеющих отношения к свойствам исследуемого тракта.
Аналогично тому, как мы можем совершенно точно определить весовое содержание отдельных элементов в сложном химическом соединении по известному содержанию одного какого-то элемента и заранее известной химической формуле, так же и при артикуляционных измерениях на трактах передачи речи нет необходимости иметь в таблицах все языковые формы. Нужно лишь знать разборчивость определенных форм и связной речи. По результатам испытаний с таблицами простых форм мы получаем правильное суждение о качестве тракта для передачи речи в целом. Необходимым условием является предварительное тщательное изучение и установление взаимосвязей, существующих в языке. 
В большинстве случаев производства артикуляционных измерений в качестве основного вида артикуляционных таблиц используются слоговые таблицы(таблицы, не имеющие смысла звукосочетаний).
При довольно плохой слышимости целесообразно измерять разборчивость слов, это обусловлено тем, что в таких условиях слоговая разборчивость стремится к нулю и практически не поддаётся определению, тогда как разборчивость слов, из-за наличия смыслового фактора, даже при очень плохом качестве приема звуков, составляющих слова, все же сохраняет достаточные для отсчета величины.
Другим достоинством измерения словесной разборчивости является то, что обучение и тренировка бригады для чтения слов осуществляется немного проще и быстрее, чем для чтения слогов.
Применять словесные блицы в обычных условиях и при массовом производстве артикуляционных испытаний неудобно, т.к. они быстро запоминаются операторами, следовательно, требуется либо частое пересоставление их, либо составление их большого числа. 
Однако, какими бы способами не проводились измерения фразовой разборчивости, они остаются очень громоздкими и требуют значительных затрат времени, поэтому их не рекомендуют применять.
Измерения фразовой разборчивости проводится один раз: для выявления её зависимости от других видов разборчивости данного языка, затем, чтобы в дальнейшем иметь возможность определить её величину косвенным образом по имеющимся графикам.
2.3. Объективные методы измерения разборчивости речи.
2.3.1.
......

1.2.2. Объективные методы оценки разборчивости речи
Процесс организации субъективных экспертиз является длительной,сложной и дорогостоящей процедурой. Поэтому уже на протяжениидлительного времени ведётся поиск объективных методов оценкиразборчивости, позволяющий получить оценки, хорошо совпадающие ссубъективными экспертизами. В настоящее время разработаны разныеобъективные методы, которые схематично можно представить в видедиаграммы (см. рис. 1. [5]).
Как видно из диаграммы, эти методы можно разделить на следующиегруппы:
- формантные;
- теоретико-информационные;
- модуляционные;
- эмпирические.
Рассмотрим кратко суть каждого из методов.
1) Формантные методы.
1.1) Метод Н.Б. Покровского.
Всю анализируемую область частот разбивают на k смежных полос, с  центральными частотами f 0 k и граничными частотами f нk и f вk , впределах каждой из которых спектры речи и шума, а также плотностьвероятностей формант можно считать практически неизменными [5].
Формантную (артикуляционную) разборчивость A вычисляют как суммуразборчивостей Ak формант в каждой из полос:
ФОРМУЛА , (1.1)
где Pk – вероятность пребывания формант в k-й полосе частот:
pk=F1( f вk )-F1( f нk) ; (1.2)
F1(f) – закон распределения вероятностей формант по частоте; P(E'k) –коэффициент восприятия речи (определяется из специального графика, см. [5]);
E'k – эффективный уровень ощущения формант в k-й полосе частот:
Ek ' =Bрk-? Bk-Bшk , (1.3)
где Bpk и Bшk – уровни спектров мощности речевого сигнала и шума в k-й полосе частот; 
?Bk = Bpk – B'pk – разница между спектром речи Bpk и спектром формант B'pk.
1.2) Метод Ю.С. Быкова.
Его метод отличается от версии Покровского следующими положениями:
- спектр формант определяется как спектр такого шума, который, будучи просуммированным с речевым сигналом, приведёт к полной потере разборчивости речи;
- учитывается зависимость коэффициента восприятия от частоты.
Более подробно можно узнать в литературе: Быков Ю.С. Теория разборчивости речи и повышение эффективности радиотелефонной связи.
1.3) Метод М.А. Сапожкова.
Принципиальная особенность этой версии — фактическоеотождествление спектра формант со спектром речи. Мощность формант вдиапазоне выше 300 Гц по отношению к мощности речи в этом же диапазонесоставляет 98% (см. [5]).
1.4) Расчёт индекса артикуляции AI.
В рамках этого метода считается, что разборчивость речипропорциональна средней разности между пиковым уровнем речи иэффективным уровнем маскирующего шума. Для оценки индекса артикуляциииспользуется аналог соотношения (1.1), где в качестве коэффициентавосприятия используется функция
PAI (? L)={0,? L?0дБ ;
? L  30 , 030дБ ; (1.4)
где ?L = Bp пик — Bш пик. Получается хорошее совпадение этогокоэффициента восприятия с коэффициентом восприятия Сапожкова. Также стоит отметить, что, несмотря на простоту применения, этотметод имеет существенные недостатки: он учитывает только влияние шума наразборчивость без учёта других факторов (таких, как время реверберации, структура отражений и т. д.) [6]. Этот метод считается устаревшим.
1.5) Расчёт индекса разборчивости речи SII.
Вычислительная схема индекса артикуляции AI неоднократно подвергалась усовершенствованию, что привело к появлению версии,стандартизованной в ANSI S3.5-1997 и названной индексом разборчивости речиSII. Измерение разборчивости осуществляется аналогично методу AI, исоответствующие значения индексов разборчивости мало отличаются численнои находятся в линейной зависимости [5].
В стандарте предлагается четыре измерительные процедуры, каждаяиспользует различное число и размер частотных полос в пределах диапазона 150...8500 Гц. В каждой из них вычисляется отношение сигнал/шум и затем рассчитывается суммарный коэффициент SII, который может изменяться в пределах от 0 до 1.
2) Теоретико-информационные методы.
К таким методам выделяют метод, предложенный Калинцевым. Оценку относительного количества информации в речевом сообщении предложено производить с помощью соотношений, подобных (1.1)-(1.2). Отличие в том, чтовместо закона распределения формант по частоте оперируют законом распределения информации по частоте C0(f), а вместо P(E') используют законраспределения относительного количества информации по уровню Cотн(?Bp):Cотн (? Bp)=lg[ 1+q(d +q)?d -d ],q=100,1 ?Bp ;d=0,1?D(1.5)
где ?Bp = Bp – Bш — отношение сигнал/шум; D = Bpmax – Bрmin – динамический диапазон речевого сигнала.
3) Модуляционные методы.
3.1) Измерение и расчёт индекса передачи речи STI.
Идея методов «семейства» STI заключается в том, что речевой сигнал представляет собой свёртку импульсной характеристики звукового сигнала источника с импульсной характеристикой голосового тракта [6]. Речевой сигналможно приближенно рассматривать как некоторый широкополосный сигнал,модулированный другим низкочастотным сигналом. Частота модуляцииопределяется скоростью, с которой человек произносит форманты. Уменьшениеглубины модуляции делает речевой сигнал более похожим на шумовой иприводит к уменьшению его разборчивости. За счёт реверберации, искажений ишумов в помещении происходит уменьшение разборчивости сигнала, что можетбыть оценено по степени уменьшения его глубины модуляции.
Основа метода STI – определение 98 значений m(F), получаемых для 14значений частот модуляции в семи октавных полосах с центральными частотами от 125 до 8000 Гц. При использовании метода STI возможность одновременного учёта шумовой и реверберационной помех обеспечивается использованием специального тестового сигнала со спектром, идентичным спектру долговременной речи (см. [5]). Этот шум в каждой октавной полосе модулируется периодическим сигналом таким образом, чтобы огибающаямгновенной мощности сигнала имела форму синусоиды. В случае шумовой помехи индекс модуляции равен:
m= ?Itest?Itest+?Inoise=?Itest /?Inoise ?Itest /?Inoise+1= SNR 1+SNR (1.6) гдеSNR = Itest/Inoise – отношениесигнал/шум. 
Для оценки разборчивости речи это выражение несколько преобразуют: SNR= m 1-m,SNRдБ=10?log10 m 1-m (1.7)
Оценка производится следующим образом: вычисляют по измеренному коэффициенту m отношение сигнал/шум в точке приёма, а затем преобразуют это отношение в индекс передачи речи STI, используя специальный график (см.[5]).
3.2) Методы RASTI, STIPA, STITEL.
Метод расчёта быстрого индекса передачи речи RASTI представляет собой сокращённую версию метода STI. Количество октавных полос сокращенодо двух (500 и 2000 Гц). При таком подходе полоса пропускания ограничена,следовательно, фоновый шум с нерегулярным спектром и нелинейные искажения не учитываются корректно.
Метод расчёта STIPA представляет собой модификацию метода STI для систем звукоусиления, позволяющий учитывать и нелинейные искажения звука в помещении. Испытательный сигнал упрощён (в каждой из семи октав используют только две частоты модуляции).
Метод расчёта STITEL использует одну частоту модуляции в каждой из семи октавных полос. Несущий шум для каждой октавной полосы имеетширину спектра 1/2 октавы, чтобы избежать влияния на смежные полосы. Этотметод не позволяет учесть реверберационную помеху и нелинейные искажения[7].
4) Эмпирические методы.
4.1) Расчёт процента артикуляционных потерь согласных %Alcons.
Идея этого метода заключается в том, что для объективной оценкиразборчивости речи вычисляется процент потери согласных, которые, в основном, и определяют смысловое содержание речи. Формула для расчётапроцента потери согласных имеет следующий вид:
%ALcons= 200?D2?RT 60 2 ?NV?Q?M , (1.8)
где D – расстояние от источника звука до самого удалённого слушателя, м; RT60 – стандартное время реверберации, с; V – объём помещения, м3; Q – фактор направленности источника звука для расчётной точки; M – поправочный коэффициент, учитывающий влияние различных акустических иэлектроакустических эффектов; N – коэффициент, учитывающий использованиев системе нескольких источников [6]. 
В этой формуле учитывается влияние объёма помещения, расстояние до источника звука, коэффициенты направленности источников звука и т. д. Однако, у этого метода есть и недостатки: он основан на измерении в одной третьоктавной полосе вокруг 2000 Гц, поскольку здесь сосредоточена основная энергия согласных звуков. Другие частоты обычно не используются, что может привести к значительным погрешностям, в частности, за счёт частотнойзависимости коэффициента направленности источника звука от частоты. Такжев этом методе не учитываются отношение сигнал/шум, поздние отражения,спектр фонового шума и т. д.
4.2) Вычисление коэффициента чёткости C50.
Этот коэффициент определяет чёткость (ясность) звучания музыки и вычисляется как отношение энергии ранних отражений (до 50 мс) к энергии поздних отражений в помещении. В 1996 году этот коэффициент предложили использовать для оценки разборчивости речи (Маршалл). Для этого измеряют отношение энергий в нескольких частотных полосах, со специальнымвзвешиванием для речевого сигнала. Измерения проводят с помощью анализаимпульсной характеристики. Несмотря на простоту измерений, этот метод даётнеплохую корреляцию с субъективными оценками [6], но при этом обладаетрядом недостатков (например, не учитывается влияние шумовой помехи).
/////////////////////////
2.4. Факторы, влияющие на разборчивость речи
2.4.1. Объективные факторы
2.4.1.1 Влияние внешнего шума
2.4.1.2 Влияние реверберации
2.4.1.3 Влияние параметров системы звукоусиления
2.4.2. Субъективные факторы
Глава 3. Изучение влияния темпа русской речи на величину её разборчивости
3.1. Постановка эксперимента
Я выступила в качестве диктора, и мною были выбраны 15 фраз (см. табл. 3.2), которые были записаны в файлы с помощью компьютерной программы AdobeAudition. Далее была измерена длительность фраз и посчитана скорость их произнесения в слогах в секунду. Средний уровень фраз был установлен 80 дБ, и на эти фразы с помощью программы был наложен аддитивный белый шум с разными уровнями. В итоге были подготовлены фразы с разным отношением сигнал/шум (ОСШ) в 80, 79, 75, 70, 68, 60 и 50 дБ.
Таблица 3.1
Фраза
Количество слогов
Совхоз получил щедрый урожай
10
Вдали сверкает горный водопад
10
Радисты принимали на слух
9
На реке появляются первые льдины
12
Летний переход был завершён
9
Финны взяли новую машину
10
Механик вышел из заводского гаража
13
Министерство распределяет научные кадры
15
Химики награждены почётными медалями
15
Звонок раздался совершенно неожиданно
14
Лошадь запрягли в телегу
8
Больной берег своё здоровье
9
Общее состояние генерала ухудшилось
16
Парад состоится на площади
10
Докладчик говорил о доблести
10

В качестве помехи использовался белый шум, т.к в большинство известных результатов измерений разборчивости было получено именно с использованием белого шума, а влияние реверберации учтено не было, поскольку это представляет собой отдельную задачу для исследования. 
Схема опыта показана на рисунке 3.1.

Рисунок 3.1. Схема опыта
После создания файлов с разными темпами речи и с разным ОСШ, они были предоставлены слушателям. Им во время прослушивания надо было записать фразы, которые ими были услышаны и поняты. Результаты эксперимента занесены в таблицу 3.2
Таблица 3.2.



2,5
3,5
4
4,6
6
7
8
80,79
0,96
0,97
0,97
1
0,8
0,75
0,68
75
0,955
0,97
0,95
0,92
0,7
0,6
0,55
70
0,945
0,91
0,84
0,82
0,64
0,5
0,47
68
0,94
0,9
0,7
0,68
0,6
0,47
0,45
60
0,68
0,37
0,32
0,31
0,2
0,18
0,1
50
0,03
0,04
0
0
0
0
0

По данным таблицы 3.2 были построены графики зависимости разборчивости речи от её темпа для разных ОСШ. Результаты показаны на рисунке 3.2

Рисунок 3.2. Результаты опыта
Были измерены отклонения разборчивости и темпа от среднего.
 Отклонения разборчивости составили ?_разб=±0,05 дБ
 Отклонения по скорости составили ?V=±0,2 слог/с.
Из графиков видно, что полученные кривые имеют убывающий характер с возрастанием темпа речи и уменьшаются по абсолютному значению (графики становятся всё ниже) с уменьшением ОСШ.
Полученные результаты соответствуют ожидаемым: получился спад зависимости разборчивости речи при увеличении её темпа и уменьшении отношения сигнал/шум.
Можно сделать выводы по полученным зависимостям:
 Произошло уменьшение разборчивости русской речи при увеличении её темпа и уменьшении ОСШ
 Можно сделать предположение о существовании порогового значения темпа речи для восприятия её человеком. Для индикации этого значения была выбрана кривая примерно в средине разрыва.
 Ниже разрыва незначительное повышение темпа речи приводит к резкому снижению её разборчивости.
 Кривые имеют разрыв в диапазоне ОСШ от 68 до 50 дБ, который составляет около 70% разборчивости.
Итак, полученные графики дают.......................
Для получения полной версии работы нажмите на кнопку "Узнать цену"
Узнать цену Каталог работ

Похожие работы:

Отзывы

Незаменимая организация для занятых людей. Спасибо за помощь. Желаю процветания и всего хорошего Вам. Антон К.

Далее
Узнать цену Вашем городе
Выбор города
Принимаем к оплате
Информация
Наши преимущества:

Оформление заказов в любом городе России
Оплата услуг различными способами, в том числе через Сбербанк на расчетный счет Компании
Лучшая цена
Наивысшее качество услуг

По вопросам сотрудничества

По вопросам сотрудничества размещения баннеров на сайте обращайтесь по контактному телефону в г. Москве 8 (495) 642-47-44