Dr. Csapó Tamás Gábor

tudományos segédmunkatárs

Elérhetőség

Távközlési és Médiainformatikai Tanszék
BME I. épület, IB152-es szoba
Magyar Tudósok krt. 2.
Budapest, 1117 HUNGARY

E-mail

csapot /kukac/ tmit /pont/ bme /pont/ hu

Telefon

+36-1-463-3512

Fax

+36-1-463-3107

Csapó Tamás Gábor 2014 októberében védte meg ,,A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú szövegfelolvasó rendszerben'' PhD című disszertációját. Fokozatszerzése óta eltelt időben is rendszeresen publikál szakterülete jelentős folyóirataiban (pl. Journal of the Acoustical Society of America - Express Letters), illetve konferenciáin (pl. Interspeech, ICASSP). A BME TMIT Beszédtechnológia és Intelligens Interakciók Laboratúriumban végzett kutatási munkája mellett aktív tagja az "MTA-ELTE „Lendület” Lingvális Artikuláció Kutatócsoportjának (http://lingart.elte.hu). Nemzetközi tanulmányai révén (pl. Fulbright ösztöndíj az USÁ-ba) jó kapcsolatokat ápol több külföldi kutatócsoporttal is. Kiváló oktatói képességekkel is rendelkezik, számos tárgy oktatásában vesz részt angol és magyar nyelven. Aktív témavezetőként több magyar és külföldi (Erasmus, Stipendicum Hungaricum) hallgatót irányít az alap- és mesterképzésben.


Kutatási területek

Beszéd artikuláció (2D nyelvultrahang), deep learning, gépi szövegfelolvasás, jelfeldolgozás, ember-gép interfészek

Programozási nyelvek, keretrendszerek

Programozás
Matlab/Octave, Python, C#, Xamarin
Text-to-Speech
HTS, hts_engine, SPTK, Merlin
Deep learning
keras, TensorFlow

Nyelvi ismeretek

angol
folyékony írás, olvasás, beszéd
német
középfokú írás, olvasás
francia
alapfokú olvasás
magyar
anyanyelv

Tanulmányok

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Summa cum laude, téma: A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú szövegfelolvasó rendszerben

  • Department of Speech and Hearing Sciences, Indiana University, Bloomington, IN, USA (Fulbright ösztöndíj)

    Kutatási téma: ,,Nyelvmozgás vizsgálata beszéd közben ultrahang segítségével''

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Villamosmérnöki és Informatikai Kar, Mérnök Informatikus Szak

Munkahely

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Távközlési és Médiainformatikai Tanszék, Beszédtechnológia és Intelligens Interakciók Laboratórium

  • MTA-ELTE "Lendület" Lingvális Artikuláció Kutatócsoport

    (részmunkaidő)

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Távközlési és Médiainformatikai Tanszék, Beszédtechnológia és Intelligens Interakciók Laboratórium

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Távközlési és Médiainformatikai Tanszék, Beszédtechnológiai Laboratórium

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Távközlési és Médiainformatikai Tanszék, Beszédtechnológiai Laboratórium

Díjak, kitüntetések, ösztöndíjak

  • NKFIH FK-17 kutatási témapályázat (124584)

    Kutatási téma: "Artikulációs mozgás alapú beszédgenerálás"

  • Nemzeti Fejlesztési Minisztérium, Információs Társadalomért szakmai érem

  • Huszty Dénes Alapítvány, Disszertáció pályázat

  • Fulbright ösztöndíj, Department of Speech and Hearing Sciences, Indiana University, Bloomington, IN, USA

    Kutatási téma: ,,Nyelvmozgás vizsgálata beszéd közben ultrahang segítségével''


    Magyar Mérnökakadémia utazási ösztöndíj, Bloomington

  • BMe kutatói pályázat, 3. helyezés

    honlaptervező verseny


    Microsoft No Time to W8 verseny, 1. helyezés

    ,,Időjárás mindenkinek'' Windows 8 alkalmazás (megosztva más kollégákkal a BME-TMIT-ről)


    Campus Hungary utazási ösztöndíj, 8th Speech Synthesis Workshop

  • Acoustical Society of America - International Student Grant

  • OPAKFI Diplomamunka pályázat, 3. helyezés


    Bizáky Puky Péter Alapítvány, utazási ösztöndíj, Interspeech 2009

  • BME VIK Tudományos Diákköri Konferencia, 2. helyezés


    BME GTK Tudományos Diákköri Konferencia, 1. helyezés


    Országos Tudományos Diákköri Konferencia, 1. helyezés


    Köztársasági ösztöndíj, Oktatási Minisztérium


    Kari BME ösztöndíj, BME VIK


    Egyetemi BME ösztöndíj, BME


    International Speech Communication Association, utazási ösztöndíj, Interspeech 2007

  • BME VIK Tudományos Diákköri Konferencia, 1. helyezés

Tagságok

  • Magyar Tudományos Akadémia köztestületi tag

  • International Speech Communication Association (ISCA) diák tag

  • IEEE Signal Processing Society diák tag

  • Hírközlési és Informatikai Tudományos Egyesület diák tag

Egyéb szakmai tevékenység

  • Bíráló

    IEEE Signal Processing Letters, Journal on Multimodal User Interfaces, International Journal of Speech Technology, IETE Technical Review, Interspeech (2013, 2017, 2018), MSZNy (2017, 2018), CogInfoCom (2013), BME VIK TDK (2015), BME diplomaterv, RADIOELEKTRONIKA (2016), SPECOM (2016)

  • ECSE Summer School, University of Joensuu, Finnország

    Kurzus: ,,Speaker and Language Recognition''


    ATHENS programme, Telecom ParisTech, Párizs, Franciaország

    Kurzus: ,,Scientific Research Methods''


Oktatási tevékenység

  • Deep learning a gyakorlatban Python és LUA alapon

    előadások, gyakorlatok tartása és házifeladatok javítása

  • Beszédtudományok (ELTE)

    vendégelőadás tartása a gépi beszéd-előállításról


    Szoftver laboratórium - adatbázisok

    gyakorlatok tartása és házifeladatok javítása

  • Infocommunication (angol)

    tananyag kidolgozása, előadások tartása

  • Human-Computer Interaction / Ember-gép interfész (angol és magyar)

    tananyag kidolgozása, előadások és gyakorlatok tartása, féléves feladat osztályozása


    Önálló laboratórium, szakdolgozat, szakmai gyakorlat témavezetés (magyar és angol)

    BSc és MSc hallgatók

  • Mérés laboratórium (angol és magyar)

    VoiceXML dialógustervezés mérés kidolgozása és tartása, Beszédátvitel mérés tartása

Tudásgondozás

  • High-Quality Vocoding for Speech Synthesis and Voice Conversion

    PhD (angol)

  • Voice conversion using modern machine learning (2)

    MSc diplomaterv/2 (angol)

  • Generating realistic ultrasound tongue images using Generative Adverserial Networks

    MSc önálló laboratórium/2 (angol)

  • Silent Speech Interface (Mély neurális hálózat alapú artikuláció-beszéd becslés) (2)

    MSc önálló laboratórium/2

  • Variational AutoEncoder – felügyelet nélküli tanítás deep learning-ben

    MSc önálló laboratórium/2

  • Ultrasound-based Silent Speech Interface using deep learning

    BSc szakdolgozat (angol)

  • Voice conversion using modern machine learning

    MSc diplomaterv/1 (angol)

  • Silent Speech Interface (Mély neurális hálózat alapú artikuláció-beszéd becslés)

    MSc önálló laboratórium/1

  • Szabadúszó-munkáltató munka adminisztrációs rendszer

    BSc szakdolgozat

  • Interaktív térkép készítése felhasználó-központú tervezés módszertannal

    MSc diplomaterv/1

  • Speech generation with signal reshaping (2)

    MSc önálló laboratórium/2 (angol)

  • Voice Conversion Challenge (2)

    MSc önálló laboratórium/2 (angol)

  • Szinuszos kódoló alkalmazása beszédszintézishez

    BSc szakdolgozat

  • Acoustic to articulatory inversion using modern machine learning

    BSc önálló laboratórium (angol)

  • Voice Conversion Challenge (2)

    BSc önálló laboratórium (angol)

  • Voice Conversion

    BSc önálló laboratórium (angol)

  • Interaktív térkép készítése az egyetem számára

    MSc önálló laboratórium/2

  • Speech generation with signal reshaping

    MSc önálló laboratórium/1 (angol)

  • Voice Conversion Challenge

    MSc önálló laboratórium/1 (angol)

  • Articulatory-to-acoustic mapping with 2D ultrasound

    BSc szakdolgozat (angol)

  • Felhasználó-központú tervezés: Tablet/okostelefon alkalmazás, amit több ezren letöltenek

    BSc önálló laboratórium

  • User Centred Design in practice: Tablet/smartphone app

    Szakmai gyakorlat (angol)

  • VoiceBank application

    Szakmai gyakorlat (angol)

  • StrokeAid application

    Szakmai gyakorlat (angol)

  • Személyre szabható rádió

    BSc szakdolgozat

  • 3D-s objektumokat felismerő alkalmazás készítése

    MSc önálló laboratórium/1

  • Üzenetkezelés Androidon szövegfelolvasó kimenettel

    BSc önálló laboratórium

  • Tablet/okostelefon alkalmazás, amit több ezren letöltenek? Felhasználó-központú tervezés

    BSc önálló laboratórium

  • Beszélhetsz úgy, mint Stephen Hawking!

    BSc önálló laboratórium

  • Beszédtechnológiával kiegészített üzenetkezelő rendszer Androidon

    BSc szakdolgozat

  • Üzenetkezelő alkalmazás Androidon

    BSc szakmai gyakorlat

  • Folytonos alapfrekvencia becslő algoritmus

    BSc önálló laboratórium

  • Mély neuronhálók alkalmazása ultrahangos nyelvkontúr követésre

    BSc szakdolgozat

  • Mély neuronhálók alkalmazása ultrahangos nyelvkontúr követésre

    TDK dolgozat

  • Tracking tongue movement with ultrasound

    BSc önálló laboratórium (angol)

  • Investigation of a tongue-internal coordinate system for 2D ultrasound

    BSc önálló laboratórium (angol)

  • Levegős beszéd transzformációja normál beszéddé

    BSc önálló laboratórium

  • Beszéd alapú távvezérlő OkosTV-hez

    BSc szakdolgozat

  • Hangoskönyv alapján beszédadatbázis előkészítése

    MSc önálló laboratórium

  • Akusztikus ikonok tervezése és alkalmazása

    BSc szakdolgozat

  • Okos-TV alkalmazás fejlesztése: RSS hír olvasó és felolvasó

    MSc önálló laboratórium

  • Szövegfelolvasó készítése hangoskönyvből

    MSc önálló laboratórium

  • SmartTV (Okos-TV) alkalmazások fejlesztése

    BSc önálló laboratórium

  • Spontán jellegű beszéd mesterséges előállítása

    BSc szakdolgozat

  • Akusztikus ikonok vizsgálata és tervezése

    BSc önálló laboratórium

  • Gépi beszéd lazán

    MSc önálló laboratórium

  • Gépi beszéd lazán

    BSc önálló laboratórium

  • Spontán beszéd statisztikai feldolgozása és modellezése

    MSc önálló laboratórium