Българският синтез на говор

Българският синтез на говор

Българският синтез на говор

Българският синтез на говор
Българският синтез на говор

Дали знаете, че  една от най-интересните и актуални и днес области на електрониката — създаването на говорещи машини — можем да се по­хвалим с български принос? Още през 1976 година cm. н, с. Любомир Антонов от Единния център по физика към БАН получава авторско свидетелство относно метод и устройство за синтез на говор. Редовните читатели на нашия сайт със сигурност помнят, че той е един от тримата разработчици на първия български електронен калкулатор ЕЛКА 6521. За тази негова оригинална разработка, която е била патентована в тогавашните СССР, ФРГ и Франция и други страни, ще Ви разкажем накратко днес в Сандъците – сандъците. Трябва да Ви уведомим обаче, че в тази статия боравим с някои специфични термини и поради това пълноценното разбиране на информацията предполага преди това да сте прочели статията-предшественик ТУК.

Българският метод за синтез на говор се основава на фонемен синтез. За разлика от класическите аналогови синтезатори, при които отдел­ните фонеми се получават чрез смесване на синусоидални колебания с различни ам­плитуди и честоти, тук синтезът се из­вършва изцяло от цифрови електронни схеми. Как се осъществява това?

В паметта на компютъра предварително са записани гласови периоди с различни формантни разпределения, елементи от шу­мови фонеми и различни звуци, съпровож­дащи речта. Там се съхранява информация и за местата на ударенията и амплитуд­ните характеристики на съответните фонеми. Елементите на речта, записвани в паметта, се избират в зависимост от фонетичните особености на езика, на които машината ще говори.

Текстът, който предстои да бъде про­четен, се подлага на предварителен гра­матичен анализ. Определят се основните характеристики на изречението: честот­на, от която зависи височината на гласа, и амплитудна, определяща неговата сила. фиксират се местата и продължител­ността на паузите. Следва фонетичен анализ. При него в зависимост от получените до този момент резултати и взаимното Влияние на отделните фонеми се определят съставът, амплитудната ха­рактеристика и продължителността на всяка фонема. Така за Всеки един елемент на речта се конкретизират параметрите; амплитуда, продължителност и начален адрес в постоянната памет, посока и ско­рост на четене. Всички величини се полу­чават в режим реално време.

Синтез на говор Sintez na govor
Синтез на говор Sintez na govor

1, ЕИМ; 2. адресен регистър-брояч: 3, по­стоянна памет; 4. регистър за посока на броене; 5. регистър за определяне често­тата на броене; 6, регистър на броя на ад­ресите за четене; 7, регистър за ампли­тудно управление; 8. цифрово-аналогов преобразувател; 11, високоговорител; 12. линия за предаване на данни; 13, устрой­ство за управление; 14. генератор на им­пулси

Според създателя на устройството Лю­бомир Антонов, от едни и същи запомнени елементи могат да се получават различни фонеми само като се променя амплитуд­ната характеристика, скоростта и посо­ката на прочитането им. Това значително намалява обема на необходимата памет.

По получените данни от паметта се из­вличат необходимите елементи (начал­ните им адреси се пазят в адресен регистър-брояч). Посоката на четене се определя от регистъра за посока на броене, а скоростта се контролира от регистър за определяне честотата на броене.

При естествената реч човек никога не произнася по един и същ начин еднаквите думи. Тъй като при „езиковия код” съще­ствува и голям коефициент на презапася­ване, можем да си позволим и известно ,,творчество“, т. е. ние говорим по-бързо или по-бавно, като не произнасяме еднак­во силно целите думи и т. н. За разлика от нас, машината стриктно изпълнява своята програма, всички фонеми се произ­насят без отклонение от правилата. По­добна точна реч би звучала твърде неесте­ствено. За дз се избегне педантизмът на машината и за да се получи по-естествена реч, българският метод предлага квазислучайно изменение на дължините и амплиту­дите.

Следва обработка на „цифрова реч“ от цифрово-аналогов преобразовател. В него се формира естественият аналогов сиг­нал, Усилвател-модулатор го доусилва до необходимото ниво, като осигурява же­ланата интонация на цялата дума или из­речение. Говорът се възпроизвежда от ви­сокоговорител, По бреме на четенето от паметта и възпроизвеждането на поред­ния елемент на речта ЕИМ анализира и подготвя следващите данни, необходими за управление на синтеза. Ако една ЕИМ е с достатъчно бързо действие, тя би могла да управлява едновременно рабо­тата на няколко синтезатора. Удобното в случая е, че бързодействието не е за­дължително и методът е универсален. В зависимост от нуждите и възможности­те устройството може да се реализира нв базата на Всяка универсална ЕИМ, мини­компютър или 16-битов микропроце­сор.

Предимствата на българския метод за синтез на говор са много, но може би основното се състои в изключителното разнообразие на синтеза, основаващо се на неограничен речник при сравнително малък обем на паметта. Освен това речта, която се получава, е с добра разбираемост и звучи почти естествено.

Share this post

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *