A Beszédtechnológia és Intelligens Interakciók Laboratóriumban számos magyar nyelvű könyv készült az elmúlt években, melyek közül néhányat letölthetővé tettünk.


Németh Géza, Olaszy Gábor (szerk.): A MAGYAR BESZÉD - beszédkutatás, beszédtechnológia, beszédinformációs rendszerek

Könyvborító: A magyar beszéd
PDF

A beszéd bonyolult jelenség, noha ezt nem érzékeljük, hisz mindannyian tudunk beszélni. A könyv bepillantást nyújt ebbe a bonyolult mechanizmusba, amelynek három fő alkotóeleme a nyelv, az egyén, aki beszél és a kisugárzott hanghullám mint akusztikai jel. A három alkotóelem összefüggéseit ismerheti meg az olvasó, a beszéd fiziológiai, fonetikai, akusztikai és jelfeldolgozási témaköreinek bemutatásán keresztül.

Az információs társadalom egyre jobban igényli a beszédtechnológa (a temészetes beszédlánc elemei gépi elemzésének és megvalósításának) megoldásait a korszerű információs rendszerekben, a távközlésben, az oktatásban, a beszédrehabilitációban és még számos területen. A beszédtechnológiával foglalkozó fejezetek bemutatják a terület főbb témaköreit (a gépi beszédészleléshez kapcsolódó ágazatokat, a beszédszintézist, a tömörítést stb.). A beszédtechnológia gyakorlati alkalmazásait gazdagon illusztrálja a kötet a távközlési és mobil alkalmazásoktól az egészségügyi fejlesztéseken keresztül a látássérülteket kiszolgáló rendszerekig. A magyar beszédet ilyen aspektusból tárgyaló könyv még nem jelent meg, tehát a kötet hiányt pótol.

Letöltés: A magyar beszéd

Honlap: magyarbeszed.hu

Olaszy Gábor: Mássalhangzó-kapcsolódások a magyar beszédben

Könyvborító: Mássalhangzó-kapcsolódások a magyar beszédben
PDF

Az utóbbi évtizedekben egyre több munka jelenik meg a beszéd kutatásával kapcsolatban. Ez a hiánypótló kötet a magyar mássalhangzó-kapcsolódások szerkezetének összefoglaló és részletes vizsgálatával foglalkozik. Ilyen átfogó jellegű mű most jelenik meg először magyarul.

A beszéd hangsorépítésében a magánhangzók (V) és mássalhangzók (C) egyfajta váltakozása teszi lehetővé, hogy a percepció számára változatos, egymástól megkülönböztethető hangsorokat ejtsünk. A hangsorok felépítése során (amikor beszélünk) alapvetően négyféle hangkapcsolódási forma jöhet létre: a leggyakoribbak a mássalhangzóból magánhangzóba (CV), illetve magánhangzóból mássalhangzóba (VC) való hangkapcsolódások, ritkábban fordulnak elő a magánhangzó-magánhangzó (VV), és a mássalhangzó-mássalhangzó (CC) kapcsolatok.

A könyv e legutóbbi formával foglalkozik, a kettő és többelemű magyar mássalhangzó-kapcsolódásokat vizsgálja, azokat is leginkább artikulációjuk, koartikulációjuk és az abból adódó akusztikai szerkezetük, valamint annak változása szempontjából. A kötetben a vizsgálódások alapját a CC kapcsolatok képezik, ugyanis ezek a kapcsolatok alkotják a mássalhangzó-kapcsolódások alapelemét. Úgy tekintjük, hogy a három- és többelemű mássalhangzó-kapcsolatok alapvetően CC kapcsolatokból levezetve vizsgálhatók, hiszen felfoghatók úgy is, hogy azokból épülnek fel. Az olvasó minden CC kapcsolatra talál adatot. Ezen felül a leggyakoribb három-, négy- és ötelemű kapcsolatokat is tárgyaljuk. A függelékben értékes táblázatokat adunk közre a mássalhangzó-kapcsolatok gyakorisági előfordulásáról, szerkezeti felépítéséről.

A könyvhöz szervesen hozzátartozik a szintén újdonságnak számító internetes, interaktív honlap (http://fonetika.nytud.hu/cccc), amelynek beszédadatbázisa tartalmazza az itt tárgyalt hangkapcsolatok mintaszavait. Ez az első nyilvános magyar beszédkutatási adatbázis, amelyhez bárki hozzáférhet és tanulmányozhatja a beszéd és azon belül a mássalhangzó-kapcsolódások szerkezeti felépítését.

A kötetet elsősorban a felsőfokú oktatás több területének ajánljuk, de eredményesen forgathatják középiskolai magyartanárok is, és mindenki, akit érdekel a beszéd szerkezeti felépítése. Az itt közölt vizsgálati anyag hozzájárulhat a nyelvészek, a beszédkutatók, a kommunikációs mérnökök, a beszédtechnológiával foglalkozó szakemberek mindennapi kutató munkájához is.

Letöltés: Mássalhangzó-kapcsolódások

Olaszy Gábor: Hangidőtartamok és időszerkezeti elemek a magyar beszédben

Könyvborító: Hangidőtartamok és időszerkezeti elemek a magyar beszédben
PDF

A beszéd összetett biológiai folyamat eredménye és biológiai rendszerek (emberek) között tölti be a hangos információáramlás megvalósulását. A beszéd belső szerkezeti elemei mind kapcsolódnak az időtényezőhöz (artikuláció, tempó, ritmus), ezért az időszerkezet fontos paramétere a beszédnek. A legutóbbi kutatásokkal a magyar beszéd időszerkezetét eddig soha nem látott mélységben vizsgáljuk. Az eredmények három szempontból adnak újszerű adatokat. Az egyik, hogy elkészítettük a magyar beszéd időszerkezeti modelljét, amellyel kiszámíthatók egy tetszőleges szöveg hangzó változatának időtényezői, tehát jósolni tudjuk a várható hangidőtartamokat (például géppel is elő tudjuk állítani a hangsor időszerkezetét beszédszintézishez). A másik fontos szempont, hogy korszerű módszerekkel, közvetlen mérési eredményeket adunk közre a felolvasott köznapi magyar beszéd hangidőtartamairól, tempóiról, ritmikájáról, szünetezéséről, ami függhet a produkciótól, illetve a műfajtól is. Ezzel párhuzamosan röviden tárgyaljuk a spontán beszéd hasonló időszerkezeti vonatkozásait is. A harmadik újdonság, hogy a mérésekhez intenzív számítógépes támogatást alakítottunk ki, melynek következtében a mérések akár meg is ismételhetők, új mérések is tervezhetők, számos eredmény megtekinthető az Interneten (http://fonetika.nytud.hu). Az új eredmények jól használhatók az oktatásban és a kutatásban, továbbá minden olyan területen, amely kapcsolódik a beszédhez (nyelvtanítás, nyelvi zavarok vizsgálata, beszédhibák javítása, beszédrehabilitáció stb.). Az eredmények a 21. század elejére jellemző magyar beszéd időszerkezeti viszonyait tükrözik.

Letöltés: Hangidőtartamok

Olaszy Gábor: A beszéd akusztikai-fonetikai elemzése és modellezése különös tekintettel a korszerű beszédépítés követelményeire

Könyvborító: Olaszy Gábor disszertáció
PDF

A beszéd kutatásának területe a 20. század utolsó évtizedeiben jelentősen kiszélesedett, új kutatási részterületek alakultak ki, megsokszorozódtak a témával kapcsolatos tudományos konferenciák, eszmecserék és a szakirodalmi közlemények számában is ugrásszerű növekedés tapasztalható. Ehhez a kiszélesedő tudományos kutatási folyamathoz kapcsolódik a jelen értekezés is. Az értekezés a folyamatos beszéd szerkezetének akusztikai-fonetikai szempontú vizsgálatával kapcsolatos magyar kutatásokat, azok eredményeit foglalja össze. A cél a beszéd akusztikai szerkezeti szintjén lejátszódó folyamatok modellezése, szabályok kidolgozása az idő- és az alapfrekvencia-szerkezet tekintetében, a korszerű beszéd- építés követelményeinek figyelembevételével. A mű első 5 fejezetében a beszédépítés fajtáit mutatjuk be, majd az eddigi kutatási eredmények áttekintése után felsoroljuk, hogy milyen új kutatási követelményekkel kell szembenéznie a 2000. év beszéd- kutatójának, ha korszerű beszédépítési eljárásokat akar kidolgozni. Az eredmények ismertetése szempontjából az értekezés két fő fejezetet tartalmaz: a szegmentális szintű elemzéseket (6. fejezet) és az erre épülő szupraszegmentális szintű vizsgálatokat (7. fejezet). A szegmentális részben a specifikus hangidőtartamok meghatározása jelenti a legfontosabb eredményt. Erre építi fel a szerző, a szupraszegmentális részben azt az új szabályrendszert (specifikus hangidőtartam- módosító szabályokat), amelynek segítségével modellezni lehet az időszerkezetet és meg lehet adni a folyamatos beszédhangsor minden hangjára a végleges hangidő- tartamokat. A szupraszegmentális részben foglalkozunk továbbá az értekezés másik fontos témakörével, a folyamatos beszédre jellemző alapfrekvencia változások vizsgálatával, modellezésével. Ennek a munkának az eredménye, hogy a korábban kidolgozott fonológiai szintű dallamjelöléseket össze lehet kapcsolni a most meghatározott fonetikai szintű dallamformákkal. Így mód nyílik arra, hogy a fonológiai szabályokat konkrét, hangzó megvalósításokban szintézissel ellenőrizzük. A kialakított dallamsémák és dallamelemek felhasználáshoz szabályrendszert dolgoztunk ki. A szabályok felhasználásával felépíthetők a magyar folyamatos beszédre legjellemzőbb alapfrekvenciagörbék. Ezek hitelességét a szerző szintetizált mintákkal bizonyítja. Az értekezés 8. fejezetében a kutatási eredmények felhasználásával kapcsolatos kérdésekről esik szó. A 9. fejezet tartalmazza az új tudományos eredményeket. Az értekezéshez hangos melléklet is tartozik, amelyen hangzó formában is (33 fájl) bemutatásra kerülnek az értekezésben szereplő beszédkutatási eredmények. A fájlokra az aktuális oldalon lábjegyzeti hivatkozások találhatók (például: CD 3, 4). A hangos melléklet tartalomjegyzéke az értekezés 217. oldalán található. Az értekezés szerves tartozéka a függelék, amelyben a magyar beszéd hangjainak specifikus időtartamait és azok eloszlásait tartalmazó táblázatok kaptak helyet.

Letöltés: Olaszy Gábor DSc disszertációja

Letöltés: Olaszy Gábor Dsc disszertációjának CD melléklete