Българският синтез на говор
Българският синтез на говор
Дали знаете, че една от най-интересните и актуални и днес области на електрониката — създаването на говорещи машини — можем да се похвалим с български принос? Още през 1976 година cm. н, с. Любомир Антонов от Единния център по физика към БАН получава авторско свидетелство относно метод и устройство за синтез на говор. Редовните читатели на нашия сайт със сигурност помнят, че той е един от тримата разработчици на първия български електронен калкулатор ЕЛКА 6521. За тази негова оригинална разработка, която е била патентована в тогавашните СССР, ФРГ и Франция и други страни, ще Ви разкажем накратко днес в Сандъците – сандъците. Трябва да Ви уведомим обаче, че в тази статия боравим с някои специфични термини и поради това пълноценното разбиране на информацията предполага преди това да сте прочели статията-предшественик ТУК.
Българският метод за синтез на говор се основава на фонемен синтез. За разлика от класическите аналогови синтезатори, при които отделните фонеми се получават чрез смесване на синусоидални колебания с различни амплитуди и честоти, тук синтезът се извършва изцяло от цифрови електронни схеми. Как се осъществява това?
В паметта на компютъра предварително са записани гласови периоди с различни формантни разпределения, елементи от шумови фонеми и различни звуци, съпровождащи речта. Там се съхранява информация и за местата на ударенията и амплитудните характеристики на съответните фонеми. Елементите на речта, записвани в паметта, се избират в зависимост от фонетичните особености на езика, на които машината ще говори.
Текстът, който предстои да бъде прочетен, се подлага на предварителен граматичен анализ. Определят се основните характеристики на изречението: честотна, от която зависи височината на гласа, и амплитудна, определяща неговата сила. фиксират се местата и продължителността на паузите. Следва фонетичен анализ. При него в зависимост от получените до този момент резултати и взаимното Влияние на отделните фонеми се определят съставът, амплитудната характеристика и продължителността на всяка фонема. Така за Всеки един елемент на речта се конкретизират параметрите; амплитуда, продължителност и начален адрес в постоянната памет, посока и скорост на четене. Всички величини се получават в режим реално време.
1, ЕИМ; 2. адресен регистър-брояч: 3, постоянна памет; 4. регистър за посока на броене; 5. регистър за определяне честотата на броене; 6, регистър на броя на адресите за четене; 7, регистър за амплитудно управление; 8. цифрово-аналогов преобразувател; 11, високоговорител; 12. линия за предаване на данни; 13, устройство за управление; 14. генератор на импулси
Според създателя на устройството Любомир Антонов, от едни и същи запомнени елементи могат да се получават различни фонеми само като се променя амплитудната характеристика, скоростта и посоката на прочитането им. Това значително намалява обема на необходимата памет.
По получените данни от паметта се извличат необходимите елементи (началните им адреси се пазят в адресен регистър-брояч). Посоката на четене се определя от регистъра за посока на броене, а скоростта се контролира от регистър за определяне честотата на броене.
При естествената реч човек никога не произнася по един и същ начин еднаквите думи. Тъй като при „езиковия код” съществува и голям коефициент на презапасяване, можем да си позволим и известно ,,творчество“, т. е. ние говорим по-бързо или по-бавно, като не произнасяме еднакво силно целите думи и т. н. За разлика от нас, машината стриктно изпълнява своята програма, всички фонеми се произнасят без отклонение от правилата. Подобна точна реч би звучала твърде неестествено. За дз се избегне педантизмът на машината и за да се получи по-естествена реч, българският метод предлага квазислучайно изменение на дължините и амплитудите.
Следва обработка на „цифрова реч“ от цифрово-аналогов преобразовател. В него се формира естественият аналогов сигнал, Усилвател-модулатор го доусилва до необходимото ниво, като осигурява желаната интонация на цялата дума или изречение. Говорът се възпроизвежда от високоговорител, По бреме на четенето от паметта и възпроизвеждането на поредния елемент на речта ЕИМ анализира и подготвя следващите данни, необходими за управление на синтеза. Ако една ЕИМ е с достатъчно бързо действие, тя би могла да управлява едновременно работата на няколко синтезатора. Удобното в случая е, че бързодействието не е задължително и методът е универсален. В зависимост от нуждите и възможностите устройството може да се реализира нв базата на Всяка универсална ЕИМ, миникомпютър или 16-битов микропроцесор.
Предимствата на българския метод за синтез на говор са много, но може би основното се състои в изключителното разнообразие на синтеза, основаващо се на неограничен речник при сравнително малък обем на паметта. Освен това речта, която се получава, е с добра разбираемост и звучи почти естествено.
Вашият коментар