A nagy házi feladat az aláírás feltétele és egyben komplexebb nagy házi feladat esetén lehetőség van 4-es vagy 5-ös megajánlott jegyre. Rosszabbra nem!
A házi feladatok, forráskódjuk, dokumentáció és prezentáció publikus lesz és felkerül a tárgy honlapjára, illetve github.com-ra GNU GPLv3 licensz alatt. A házi feladatot 2-3 fős csapatokban kell elkészíteni, a csapatok GitHub repoját mi készítjük el. A kiemelkedő projektek gazdái oklevelet kapnak és megjelennek a tantárgy honlapján.
A házi feladat bármelyik deep learning keretrendszerben készülhet. A kiemelkedő nagy házi feladat további TDK, BSc és MSc diploma, publikációs és akár PhD lehetőséget is jelenthet.

BENYÚJTANDÓ ANYAGOK

CSAPATOK

Egy témán 2-3 fős csapatok dolgoznak, 2-2 fős „vetésforgó” az alábbi szerepkörökkel:

  1. Tudományterület feltérképezése, cikkek olvasása.
  2. Adatok beszerzése, tisztítása, előkészítése.
  3. Hálózat és tanítás.
  4. Hiperparaméter optimalizálás és tesztelés.
  5. Interfész csatolás, opcionális (pl. Android).

Tehát a csapat minden tagja legalább 3 ponttal foglalkozik. Mindenkinek kötelező a (3)-as vagy (4)-es pontok valamelyikével foglalkoznia. A félév során lesz beszámoló az előrehaladásról.

A csapatok toborzásában segítünk, ehhez az alábbi dokumentumba írjátok be magatokat (házi témák itt): https://goo.gl/nFlcxq

KÖTELEZŐ MÉRFÖLDKÖVEK

KIZÁRÓLAG a mérföldkövek határidőre történő teljesítése esetén van lehetőség a megajánlott jegyre! Nincs utólagos pótlásra lehetőség! A mérföldkőhöz tartozó kódokat, notebookokat a GitHub-ra töltsétek fel.

BESZÁMOLÓ DOKUMENTUM

A beszámoló dokumentum angol vagy magyar nyelvű, maximum 8 oldal. A beszámoló forrását (.doc, .docx, .tex) és PDF exportját a csapat GitHub repojába kell feltölteni. A beszámoló jellemzően a következő részekből áll:

A beszámoló formázásnak a gépi tanulás témában elismert konferencia vagy folyóirat irányelveit kell követnie:

TÉMÁK

Ha van saját ötletetek, akkor lehetőség van azt kidolgozni a nagy házi keretében. A lenti lista csak ajánlás, minden esetben szükséges az előadókkal való egyeztetés. Publikus adatbázisok használata preferált, nem teljes listát a publikus adatbázisokról itt találtok.

BESZÉD, HANG, ZENE

AUD1. Szövegfelolvasás PC-n és Androidon, beszédminőség és -természetesség javítás
AUD2. A beszéd időzítési, F0 és spektrális paramétereinek modellezése LSTM
AUD3. LSTM/GRU alapú zeneszerzés
AUD4. Zeneszám ajánló a felhasználó playlist-je alapján
AUD5. Madárfütty felismerés zajos környezetben
AUD6. Érzelem felismerés hangfelvétel alapján
AUD7. Párhuzamos beszéd különválasztása
AUD8. Zenei toplista előrejelző
AUD9. Beszédkódolás, beszédtitkosítás
AUD10. Beszédből háttérzaj eltávolítása
AUD11. Személyazonosítás hang alapján
AUD12. End-to-end beszédfelismerés
AUD13. Kulcsszó felismerés ("OK Google", "Hello Siri")
AUD14. "Metáldetektor" - mennyire heavy a metál?
AUD15. Artikuláció-beszéd becslés (nyelvmozgás alapján beszéd generálás)
AUD16. Beszéd-artikuláció inverz feladat (beszéd alapján nyelv mozgásának becslése)
AUD17: Beszélő átalakítás hang alapján
AUD18: Silent Speech Interface
AUD19: Google WaveNet: minta alapján történő beszédszintézis
AUD20: FAIR (Facebook AI Research): beszélőadaptáció rádiós felvételek alapján
AUD21: Beszédfelismerés támadhatóságának vizsgálata

KÉP

IMG1. Fekete-fehér képek kiszínezése
IMG2. Képszintézis szöveg alapján (text-to-image)
IMG3. Képek tartalmának szöveges átirata (image-to-text)
IMG4. Tematikus képek összefűzése, kiegészítése deep learning alapon
IMG5. Káros növények felismerése crowdsourced adatok alapján
IMG6. Anyajegyek körbevágása bőrről készült fotókon
IMG7. Felügyelet nélküli képosztályozás
IMG8. Régi, megkopott, zajos képek digitális javítása
IMG9. Arcfelismerés biztonsági kamera felvételeken
IMG10. Érezelem felismerés kép/videó alapján
IMG11. Kinect alapú személyi edző (helyes guggolás, fekvőtámasz, stb.)
IMG12. Sofőr elalvás detektálás
IMG13. Kézírás alapján személyazonosítás
IMG14. Képek, videók stílizálása (Prizma app)
IMG15. Képek hiányzó részeinek pótlása
IMG16. Önvezető autó
IMG17. Prizma App szerű filterek
IMG18. Új típusú mély álmok (DeepDream)
IMG19. JPG minőségű képtömörítés
IMG20. Nyelvkontúr meghatározása ultrahangos képekből
IMG21. Képfelismérés támadhatóságának vizsgálata
IMG22. Képgenerálás GAN-okkal
IMG23: Beszédfelismerés ajakmozgás alapján
IMG24: Ultrahang képek felügyelet nélküli osztályozása Variational AutoEncoder alapon
IMG25: Képek összefűzése GAN-okkal

TERMÉSZETES NYELVFELDOLGOZÁS

NLP1. A Twitter 20_newsgroup szövegkorpusz osztályokba sorolása
NLP2. Szövegek automatikus kivonatolása
NLP3. ChatBot deep learning alapon
NLP4. Prediktív szövegbevitel (karakter és/vagy szó szintű)
NLP5. Automatikus forráskód minősítés
NLP6. Író nemének és korának becslése szöveg alapján
NLP7. LaTeX2PDF és PDF2LaTeX deep learning alapon
NLP8. Író azonosítás szöveg alapján, plágium detektor
NLP9. Helyesírás javító
NLP10. SPAM detektálás
NLP11. Fonetikus átírás LSTM segítségével
NLP12. BME CookBook - LSTM alapú szakácskönyv
NLP13. Automatikus email válasz
NLP14. CRNN alapú fordítógép
NLP15. Szófaj címkézés LSTM alapon
NLP16. Email alapján személyazonosítás
NLP17. Log file anomália detektálás
NLP18. Mondatok értelmének összehasonlítása (szemantikai hasonlóság)
NLP19. DNS láncok elemzése
NLP20. Ékezet nélküli szövegek ékezetesítése
NLP21. FAIR ParlAI framework bevezetése

VISELKEDÉS, MOZGÁS, EGÉSZSÉG

HEL1. Csípőficam detekció mobil szenzoradatok alapján
HEL2. Személyazonosítás lépéssítlus alapján
HEL3. Tömegközlekedési eszköz felhasználói minősítésének becslése szenzoradatok alapján
HEL4. EEG, EKG osztályozás
HEL5. Gyógyszeres kezelés ajánlása
HEL6. Realisztikus emberi járás, futás modellezése

PÉNZÜGYI

FIN1. Árfolyammozgás előrejelzés árfolyamadatok alapján (deviza, bitcoin, hazai és nemzetközi tőzsde, nyersanyagok)
FIN2. Volatilitás előrejelzés OHLC adatok alapján
FIN3. Tőzsdei szupport- és rezisztenciaszintek azonosítás
FIN4. Trend azonosítás idősorokban
FIN5. Pénzügyi hírek hatásának modellezése
FIN6. Blockchain tranzakciók detektálása és modellezése
FIN7. Ajánlati könyv (order book) alapú árfolyam mozgás előrejelzés
FIN8. Q-Learning alapú kereskedési stratégiák kidolgozása

JÁTÉK

GAM1. 2048 játék bot
GAM2. Invaders játék bot
GAM3. Póker bot
GAM4. OpenAI Gym
GAM5. OpenAI Universe
GAM6. TensorForce

ELMÉLET

THE1. Új típusú regularizátorok létrehozása és tesztelése
THE2. Neuronhálók vizualizációja
THE3. Elosztott hyperopt architektúra készítése, tesztelése
THE4. 4/8/16 bites mély neuronhálók
THE5. Gradiens ellenőrző és vizualizáló modul Torch-ban
THE6. Versengő neuronhálók (adversarial networks)
THE7. Sziámi neuronhálók (siamese networks)
THE8. Új típusú hiperparaméter optimalizáló algoritmusok
THE9. Reinforcement Learning algoritmusok fejlesztése

VERSENY

VER1. Kaggle.com-on hostolt bármelyik tárgy idején futó verseny
VER2. Numer.ai
VER3. Az OpenAI bármelyik kitűzött célja

ADATBÁZISOK

A publikus adatbázisok használata előnyben részesített. Pár publikus adatbázis forrás:

http://archive.ics.uci.edu/ml/datasets.html
https://snap.stanford.edu/data/
http://www.datasciencecentral.com/page/search?q=data+sets
Kaggle.com Open Data
Magyar Elektronikus könyvtár
Million Song Dataset
1 Billion Words dataset
MovieLens 1M Dataset
Twitter Sentiment140
http://host.robots.ox.ac.uk/pascal/VOC/
http://bioinf.jku.at/research/DeepTox/tox21.html
http://festvox.org/cmu_arctic/
LibriVox hangoskönyvek
Wiki Reading
http://www.speech.cs.cmu.edu/databases/
https://cptac-data-portal.georgetown.edu/cptacPublic/
MOCHA TIMIT
mngu0
IU_ULTRASOUND
https://ourworldindata.org/
YouTube 8M
Google Open Image Dataset
Allen Institute for AI datasets
SpaceNet dataset - nagyfelbontású műholdas felvételek
Visual Question and Answer dataset - képek és hozzájuk kapcsolódó kérdések és válaszok
Music Net - klasszikus zenék hullámformája és hangszerenként kotta

HATÁRIDŐ

A házi feladat benyújtásának határideje a szorgalmi időszak utolsó hetének vasárnapja, 23:59. Külön eljárási díj fejében a pótlási hét vasárnap 23:59.