Dr. Csapó Tamás Gábor

tudományos segédmunkatárs

Elérhetőség

Távközlési és Médiainformatikai Tanszék
BME I. épület, IB152-es szoba
Magyar Tudósok krt. 2.
Budapest, 1117 HUNGARY

E-mail

csapot /kukac/ tmit /pont/ bme /pont/ hu

Telefon

+36-1-463-3512

Fax

+36-1-463-3107

Csapó Tamás Gábor oldala jelenleg feltöltés alatt áll.


Kutatási területek

Beszéd artikuláció, gépi szövegfelolvasás, jelfeldolgozás, ember-gép interfészek

Programozási nyelvek, keretrendszerek

Programozás
Matlab/Octave, Python, PHP, C, C#, Java
Text-to-Speech
HTS, hts_engine, SPTK

Nyelvi ismeretek

angol
folyékony írás, olvasás, beszéd
német
középfokú írás, olvasás
francia
alapfokú olvasás
magyar
anyanyelv

Tanulmányok

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Summa cum laude, téma: A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú szövegfelolvasó rendszerben

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Villamosmérnöki és Informatikai Kar, Mérnök Informatikus Szak

Munkahely

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Távközlési és Médiainformatikai Tanszék, Beszédtechnológia és Intelligens Interakciók Laboratórium

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Távközlési és Médiainformatikai Tanszék, Beszédtechnológia és Intelligens Interakciók Laboratórium

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Távközlési és Médiainformatikai Tanszék, Beszédtechnológiai Laboratórium

  • Budapesti Műszaki és Gazdaságtudományi Egyetem

    Távközlési és Médiainformatikai Tanszék, Beszédtechnológiai Laboratórium

Díjak, kitüntetések, ösztöndíjak

  • Nemzeti Fejlesztési Minisztérium, Információs Társadalomért szakmai érem

  • Huszty Dénes Alapítvány, Disszertáció pályázat

  • Fulbright ösztöndíj, Department of Speech and Hearing Sciences, Indiana University, Bloomington, IN, USA

    Kutatási téma: ,,Nyelvmozgás vizsgálata beszéd közben ultrahang segítségével''


    Magyar Mérnökakadémia utazási ösztöndíj, Bloomington

  • BMe kutatói pályázat, 3. helyezés

    honlaptervező verseny


    Microsoft No Time to W8 verseny, 1. helyezés

    ,,Időjárás mindenkinek'' Windows 8 alkalmazás (megosztva más kollégákkal a BME-TMIT-ről)


    Campus Hungary utazási ösztöndíj, 8th Speech Synthesis Workshop

  • Acoustical Society of America - International Student Grant

  • OPAKFI Diplomamunka pályázat, 3. helyezés


    Bizáky Puky Péter Alapítvány, utazási ösztöndíj, Interspeech 2009

  • BME VIK Tudományos Diákköri Konferencia, 2. helyezés


    BME GTK Tudományos Diákköri Konferencia, 1. helyezés


    Országos Tudományos Diákköri Konferencia, 1. helyezés


    Köztársasági ösztöndíj, Oktatási Minisztérium


    Kari BME ösztöndíj, BME VIK


    Egyetemi BME ösztöndíj, BME


    International Speech Communication Association, utazási ösztöndíj, Interspeech 2007

  • BME VIK Tudományos Diákköri Konferencia, 1. helyezés

Tagságok

  • Magyar Tudományos Akadémia köztestületi tag

  • International Speech Communication Association (ISCA) diák tag

  • IEEE Signal Processing Society diák tag

  • Hírközlési és Informatikai Tudományos Egyesület diák tag

Egyéb szakmai tevékenység

  • Bíráló

    IEEE Signal Processing Letters, Journal on Multimodal User Interfaces, International Journal of Speech Technology, IETE Technical Review, Interspeech (2013), CogInfoCom (2013), BME VIK TDK (2015), BME diplomaterv, RADIOELEKTRONIKA (2016), SPECOM (2016)

  • ECSE Summer School, University of Joensuu, Finnország

    Kurzus: ,,Speaker and Language Recognition''


    ATHENS programme, Telecom ParisTech, Párizs, Franciaország

    Kurzus: ,,Scientific Research Methods''


Oktatási tevékenység

  • Beszédtudományok (ELTE)

    vendégelőadás tartása a gépi beszéd-előállításról


    Szoftver laboratórium - adatbázisok

    gyakorlatok tartása és házifeladatok javítása

  • Infocommunication (angol)

    tananyag kidolgozása, előadások tartása

  • Human-Computer Interaction / Ember-gép interfész (angol és magyar)

    tananyag kidolgozása, előadások és gyakorlatok tartása, féléves feladat osztályozása


    Önálló laboratórium, szakdolgozat, szakmai gyakorlat témavezetés (magyar és angol)

    BSc és MSc hallgatók

  • Mérés laboratórium (angol és magyar)

    VoiceXML dialógustervezés mérés kidolgozása és tartása, Beszédátvitel mérés tartása

Önálló laboratórium, szakdolgozat, diplomatervezés


Publikációk

Összesen 43 publikáció, ebből
  • 15 folyóiratcikk (11 nemzetközi, 4 magyar)
  • 18 konferenciacikk (13 nemzetközi, 5 magyar)
  • 2 könyvfejezet (2 magyar)
  • 8 egyéb

  1. Markó Alexandra, Csapó Tamás Gábor, Takács Karolina, Listeners' evaluation of voice quality in Hungarian speakers, In: BESZÉDKUTATÁS, vol. 2017, 2017, pp. 55-66 DOI
  2. Kele Xu, Pierre Roussel, Tamás Gábor Csapó, Bruce Denby, Convolutional neural network-based automatic classification of midsagittal tongue gestural targets using B-mode ultrasound images, In: JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol. 141, no. 6, 2017, pp. EL531-EL537 DOI cikk
  3. Csapó Tamás Gábor, Deme Andrea, Gráczi Tekla Etelka, Markó Alexandra, Varjasi Gergely, Szinkronizált beszéd- és nyelvultrahang-felvételek a SonoSpeech rendszerrel, In: XIII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2017), Szeged, Magyarország, 2017, pp. 339-346 cikk
  4. Csapó Tamás Gábor, Németh Géza, Folytonos paraméterű vokóder rejtett Markov-modell alapú beszédszintézisben - magyar nyelvű kísérletek 12 beszélővel, In: XIII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2017), Szeged, Magyarország, 2017, pp. 308-315 poszter cikk
  5. Csapó Tamás Gábor, Grósz Tamás, Tóth László, Markó Alexandra, Beszédszintézis ultrahangos artikulációs felvételekből mély neuronhálók segítségével, In: XIII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2017), Szeged, Magyarország, 2017, pp. 181-192 előadás cikk
  6. Tamás Gábor Csapó, Géza Németh, Milos Cernak, Philip N Garner, Modeling Unvoiced Sounds In Statistical Parametric Speech Synthesis with a Continuous Vocoder, In: 24th European Signal Processing Conference, EUSIPCO 2016, Budapest, Magyarország, 2016, pp. 1338-1342 DOI előadás Scopus pdf cikk
  7. Milan Sečujski, Branislav Gerazov, Tamás Gábor Csapó, Vlado Delić, Philip N Garner, Aleksandar Gjoreski, David Guennec, Zoran Ivanovski, Aleksandar Melov, Géza Németh, Ana Stojković, György Szaszák, Design of a Speech Corpus for Research on Cross-Lingual Prosody Transfer, In: LECTURE NOTES IN ARTIFICIAL INTELLIGENCE, Budapest, Magyarország, vol. 9811, 2016, pp. 199-206 WoS DOI Scopus
  8. Kele Xu, Tamás Gábor Csapó, Pierre Roussel, Bruce Denby, A comparative study on the contour tracking algorithms in ultrasound tongue images with automatic re-initialization, In: JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol. 139, no. 5, 2016, pp. EL154-EL160 WoS DOI Scopus
  9. Bálint Pál Tóth, Tamás Gábor Csapó, Continuous Fundamental Frequency Prediction with Deep Neural Networks, In: European Signal Processing Conference (EUSIPCO 2016), Budapest, Magyarország, 2016, pp. 1348-1352 DOI előadás Scopus pdf cikk
  10. Tamás Gábor Csapó, Géza Németh, Milos Cernak, Residual-based excitation with continuous F0 modeling in HMM-based speech synthesis, In: LECTURE NOTES IN ARTIFICIAL INTELLIGENCE, Budapest, Magyarország, vol. 9449, 2015, pp. 27-38 DOI pdf előadás hangminták Scopus cikk
  11. Tamás Gábor Csapó, Steven M Lulich, Error analysis of extracted tongue contours from 2D ultrasound images, In: Proceedings of the Annual Conference of the International Speech Communication Association (INTERSPEECH 2015), Dresden, Németország, 2015, pp. 2157-2161 kép cikk poszter videos Scopus pdf
  12. Tamás Gábor Csapó, Géza Németh, Automatic transformation of irregular to regular voice by residual analysis and synthesis, In: Proceedings of the Annual Conference of the International Speech Communication Association (INTERSPEECH 2015), Dresden, Németország, 2015, pp. 613-617 poszter kép Scopus pdf cikk
  13. Markó Alexandra, Gráczi Tekla Etelka, Csapó Tamás Gábor, Tetten érhető-e a beszédalkalmazkodás a glottalizáció gyakoriságában?, In: Első- és második nyelv: Interdiszciplináris megközelítések. First and second language: Interdisciplinary approaches, 2015, pp. 225-238 cikk
  14. Markó Alexandra, Csapó Tamás Gábor, Az automatikus irreguláriszönge-detekció sikeressége az irregularitás mintázatának függvényében magyar (spontán és olvasott) beszédben, In: XI. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2015), Szeged, Magyarország, 2015, pp. 290-297 poszter cikk
  15. Kálmán Abari, Tamás Gábor Csapó, Bálint Pál Tóth, Gábor Olaszy, From text to formants - indirect model for trajectory prediction based on a multi-speaker parallel speech database, In: Proceedings of the Annual Conference of the International Speech Communication Association (INTERSPEECH 2015), Dresden, Németország, 2015, pp. 623-627 poszter demo Scopus pdf cikk
  16. Csapó Tamás Gábor, Csopor Dávid, Ultrahangos nyelvkontúrkövetés automatikusan: A mély neuronhálókon alapuló AutoTrace eljárás vizsgálata, In: BESZÉDKUTATÁS, vol. 23, 2015, pp. 176-186 link cikk
  17. Tamás Gábor Csapó, Géza Németh, Statistical parametric speech synthesis with a novel codebook-based excitation model, In: INTELLIGENT DECISION TECHNOLOGIES, vol. 8, no. 4, 2014, pp. 289-299 Scopus cikk
  18. Tamás Gábor Csapó, Géza Németh, Modeling irregular voice in statistical parametric speech synthesis with residual codebook based excitation, In: IEEE JOURNAL ON SELECTED TOPICS IN SIGNAL PROCESSING, vol. 8, no. 2, 2014, pp. 209-220 WoS DOI Scopus cikk
  19. Gy Szaszák, T Gábor Csapó, P N Garner, B Gerazov, Z Ivanovski, G Németh, B Tóth, Sečujski, and V Delić, The SP2 SCOPES project on speech prosody, In: Proceedings of DOGS2014 - Digital speech and image processing, Novi Sad, Szerbia, 2014, pp. 2-10 cikk
  20. Csapó Tamás Gábor, Németh Géza, Irreguláris beszéd regulárissá alakitása beszédkódoláson alapuló módszerrel, In: BESZÉDKUTATÁS, vol. 22, 2014, pp. 193-204 cikk
  21. Csapó Tamás Gábor, A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú szövegfelolvasó rendszerben, PhD disszertáció, BME TMIT, 2014, p. 112 tézisfüzet (angol) tézisfüzet (magyar) disszertáció pdf
  22. António Teixeira, Annika Hämäläinenc, Jairo Avelar, Nuno Almeida, Géza Németh, Tibor Fegyó, Csaba Zainkó, Tamás Csapó, Bálint Tóth, André Oliveira, Miguel Sales Dias, Speech-centric Multimodal Interaction for Easy-to-access Online Services – A Personal Life Assistant for the Elderly, In: PROCEDIA COMPUTER SCIENCE, Vigo, Spanyolország, vol. 27, 2014, p. 8 WoS DOI Scopus cikk
  23. Tamás Gábor Csapó, Géza Németh, A novel irregular voice model for HMM-based speech synthesis, In: ISCA 8th Speech Synthesis Worksop (SSW8), Barcelona, Spanyolország, 2013, pp. 229-234 előadás cikk hangminták
  24. Tamás Gábor Csapó, Géza Németh, A novel codebook-based excitation model for use in speech synthesis, In: Cognitive Infocommunications (CogInfoCom), Košice, Szlovákia, 2012, pp. 661-665 kép DOI pdf cikk WoS előadás Scopus video Google scholar
  25. Éva Székely, Tamás Gábor Csapó, Bálint Tóth, Péter Mihajlik, Julie Carson-Berndsen, Synthesizing Expressive Speech from Amateur Audiobook Recordings, In: IEEE Workshop on Spoken Language Technology, Miami, Amerikai Egyesült Államok, 2012, pp. 297-302 WoS DOI Scopus pdf cikk
  26. Gráczi TE, Lulich SM, Csapó TG, Beke A, Context and speaker dependency in the relation of vowel formants and subglottal resonances, In: Interspeech 2011, 12th Annual Conference of the International Speech Communication Association, Firenze, Olaszország, 2011, pp. 1901-1904 kép pdf WoS poszter Scopus cikk
  27. Géza Németh, Gábor Olaszy, Tamás Gábor Csapó, Spemoticons: Text-To-Speech based emotional auditory cues, In: ICAD 2011, Budapest, Magyarország, 2011, pp. 1-7 cikk pdf Google scholar
  28. Csapó Tamás Gábor, Németh Géza, Prozódiai változatosság rejtett Markov-modell alapú szövegfelolvasóval, In: VIII. Magyar Számítógépes Nyelvészeti Konferencia [Eighth Hungarian Conference on Computational Linguistics], Szeged, Magyarország, 2011, pp. 167-177 poszter pdf cikk
  29. Tamás Gábor Csapó, Csaba Zainkó, Géza Németh, A Study of Prosodic Variability Methods in a Corpus-Based Unit Selection Text-To-Speech System, In: INFOCOMMUNICATIONS JOURNAL, vol. LXV, no. 1, 2010, pp. 32-37 pdf cikk
  30. Csapó TG, Bárkányi Zs, Gráczi TE, Bőhm T, Lulich SM, Relation of formants and subglottal resonances in Hungarian vowels, In: 10th annual conference of the International Speech Communication Association 2009 (INTERSPEECH 2009), Egyesült Királyság / Anglia, 2010, pp. 484-487 kép pdf WoS poszter Scopus cikk
  31. Csaba Zainkó, Tamás Gábor Csapó, Géza Németh, Special Speech Synthesis for Social Network Websites, In: LECTURE NOTES IN ARTIFICIAL INTELLIGENCE, vol. 6231, 2010, pp. 455-463 kép DOI cikk WoS előadás Scopus Google scholar
  32. Géza Németh, Tamás Gábor Csapó, Bálint Tóth, Improving the Quality of Unit Selection and HMM based Speech Synthesis, In: FuturICT, Budapest, 2009. június 29-30., előadás, 2009 link
  33. Csapó TG, Gráczi TE, Bárkányi Zs, Beke A, Lulich SM, Patterns of Hungarian vowel production and perception with regard to subglottal resonances, In: PHONETICIAN, vol. 99-100, 2009, pp. 7-28 honlap link cikk
  34. Csapó Tamás Gábor, Változatos prozódia megvalósítása szövegfelolvasó rendszerekben, In: AKUSZTIKAI SZEMLE, vol. IX, no. III, 2009, pp. 16-18 összefoglaló
  35. Csapó Tamás Gábor, Zainkó Csaba, Németh Géza, Szintetizált beszéd prozódiai változatosságának növelése spontán beszéd alapján, In: Beszédkutatás, Budapest, 2009. október 16-17., előadás, 2009
  36. Csapó Tamás Gábor, Németh Géza, Mássalhangzó-magánhangzó kapcsolatok automatikus osztályozása szubglottális rezonanciák alapján, In: VI. Magyar Számítógépes Nyelvészeti Konferencia [Sixth Hungarian Conference on Computational Linguistics], Szeged, Magyarország, 2009, pp. 226-237 előadás cikk pdf Google scholar
  37. Csapó Tamás Gábor, Bárkányi Zsuzsanna, Gráczi Tekla Etelka, Beke András, Bőhm Tamás, A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben, In: Beszédkutatás, Budapest, 2009. október 16-17., előadás, 2009
  38. Csapó Tamás Gábor, Változatos prozódia megvalósítása szövegfelolvasó rendszerekben, 2008 pdf
  39. Csapó Tamás Gábor, Németh Géza, Fék Márk, Szövegfelolvasó természetességének növelése, In: HIRADÁSTECHNIKA, vol. LXIII, no. 5, 2008, pp. 7-11 pdf cikk
  40. Németh G, Fék M, Csapó T G, Increasing Prosodic Variability of Text-To-Speech Synthesizers, In: Interspeech 2007, Antwerpen, Belgium, 2007, pp. 474-477 cikk WoS poszter hangminták Scopus Google scholar
  41. Csapó Tamás Gábor, Steigerung der Natürlichkeit synthetisierter Sprache, 2007 pdf
  42. Csapó Tamás Gábor, Beszédszintetizátor prozódiai változatosságának növelése, 2007 pdf
  43. Csapó Tamás Gábor, Szintetizált beszéd természetesebbé tétele, 2006 pdf