A nagy házi feladat az aláírás feltétele és egyben komplexebb nagy házi feladat esetén lehetőség van 4-es vagy 5-ös megajánlott jegyre. Rosszabbra nem!
A házi feladatok, forráskódjuk, dokumentáció és prezentáció publikus lesz és felkerül a tárgy honlapjára, illetve github.com-ra GNU GPLv3 licensz alatt. A házi feladatot 2-3 fős csapatokban kell elkészíteni, a csapatok GitHub repoját mindig a csapat hozza létre. A kiemelkedő projektek gazdái megjelennek a tantárgy honlapján.
A házi feladat bármelyik deep learning keretrendszerben készülhet. A kiemelkedő nagy házi feladat további TDK, BSc és MSc diploma, publikációs és akár PhD lehetőséget is jelenthet.

ON-LINE FELÜLET

Az alábbi felületeken tudjátok beadni a munkátokat az egyes fázisokban. Mindenképp először a csapat minden résztvevője regisztráljon, és ugyanazt a csapatnevet adja meg. Aláírás és vizsga esetén is ez szükséges. Ezután a lentebb megadott határidőkre adjátok be a szükséges anyagokat.





Házi feladat végső benyújtása (fejlesztés alatt)


A deep learning nagy házi feladat beadásához kérlek először jelentkezz be a BME címtár azonosítóddal:

BENYÚJTANDÓ ANYAGOK

CSAPATOK

Egy témán 2-3 fős csapatok dolgoznak, 2-2 fős „vetésforgó” az alábbi szerepkörökkel:

  1. Tudományterület feltérképezése, cikkek olvasása.
  2. Adatok beszerzése, tisztítása, előkészítése.
  3. Hálózat és tanítás.
  4. Hiperparaméter optimalizálás és tesztelés.
  5. Interfész csatolás, opcionális (pl. Android).

Tehát a csapat minden tagja legalább 3 ponttal foglalkozik. Mindenkinek kötelező a (3)-as vagy (4)-es pontok valamelyikével foglalkoznia. A félév során lesz beszámoló az előrehaladásról.

A csapatok toborzásához segítségül ezt a táblázatot adjuk meg (házi témák itt): http://bit.ly/vitmav45-nagyhazi-csapat2018 (az adatok kezelése a Google szerverein történik, mi csak a toborzáshoz szükséges felület linkjét biztosítjuk)

KÖTELEZŐ MÉRFÖLDKÖVEK

KIZÁRÓLAG a mérföldkövek határidőre történő teljesítése esetén van lehetőség a megajánlott jegyre! Nincs utólagos pótlásra lehetőség! A mérföldkőhöz tartozó kódokat, notebookokat a GitHub-ra töltsétek fel.

LEADÁSI HATÁRIDŐK

Aláírás

Megajánlott jegy

BESZÁMOLÓ DOKUMENTUM

A beszámoló dokumentum angol vagy magyar nyelvű, minimum 4, maximum 8 oldal. A beszámoló forrását (.doc, .docx, .tex) és PDF exportját a csapat GitHub repojába kell feltölteni. Megajánlott jegy esetén kötelező az angol nyelv használata. A beszámoló jellemzően a következő részekből áll:

Leadási határidő: szorgalmi időszak utolsó hete, péntek 23:59
Megajánlott jegy esetén a megoldást egy 10 perces prezentáció keretében is be kell mutatni.

A beszámoló formázásnak a gépi tanulás témában elismert konferencia vagy folyóirat irányelveit kell követnie:

TÉMÁK

Ha van saját ötletetek, akkor lehetőség van azt kidolgozni a nagy házi keretében. A lenti lista csak ajánlás, minden esetben szükséges az előadókkal való egyeztetés. Publikus adatbázisok használata preferált, nem teljes listát a publikus adatbázisokról itt találtok.

BESZÉD, HANG, ZENE

AUD1. Szövegfelolvasás PC-n és Androidon, beszédminőség és -természetesség javítás
AUD2. A beszéd időzítési, F0 és spektrális paramétereinek modellezése LSTM
AUD3. LSTM/GRU alapú zeneszerzés
AUD4. Zeneszám ajánló a felhasználó playlist-je alapján
AUD5. Madárfütty felismerés zajos környezetben
AUD6. Érzelem felismerés hangfelvétel alapján
AUD7. Párhuzamos beszéd különválasztása
AUD8. Zenei toplista előrejelző
AUD9. Beszédkódolás, beszédtitkosítás
AUD10. Beszédből háttérzaj eltávolítása
AUD11. Személyazonosítás hang alapján
AUD12. End-to-end beszédfelismerés
AUD13. Kulcsszó felismerés ("OK Google", "Hello Siri")
AUD14. "Metáldetektor" - mennyire heavy a metál?
AUD15. Artikuláció-beszéd becslés (nyelvmozgás alapján beszéd generálás)
AUD16. Beszéd-artikuláció inverz feladat (beszéd alapján nyelv mozgásának becslése)
AUD17. Beszélő átalakítás hang alapján
AUD18. Silent Speech Interface
AUD19. Google WaveNet: minta alapján történő beszédszintézis
AUD20. FAIR (Facebook AI Research): beszélőadaptáció rádiós felvételek alapján
AUD21. Beszédfelismerés támadhatóságának vizsgálata
AUD22. WaveNet alapú beszédszintézis
AUD23. GAN alapú beszédszintézis

KÉP

IMG1. Fekete-fehér képek kiszínezése
IMG2. Képszintézis szöveg alapján (text-to-image)
IMG3. Képek tartalmának szöveges átirata (image-to-text)
IMG4. Tematikus képek összefűzése, kiegészítése deep learning alapon
IMG5. Káros növények felismerése crowdsourced adatok alapján
IMG6. Anyajegyek körbevágása bőrről készült fotókon
IMG7. Felügyelet nélküli képosztályozás
IMG8. Régi, megkopott, zajos képek digitális javítása
IMG9. Arcfelismerés biztonsági kamera felvételeken
IMG10. Érezelem felismerés kép/videó alapján
IMG11. Kinect alapú személyi edző (helyes guggolás, fekvőtámasz, stb.)
IMG12. Sofőr elalvás detektálás
IMG13. Kézírás alapján személyazonosítás
IMG14. Képek, videók stílizálása (Prizma app)
IMG15. Képek hiányzó részeinek pótlása
IMG16. Önvezető autót segítő alkalmazások
IMG17. Prizma App szerű filterek
IMG18. Új típusú mély álmok (DeepDream)
IMG19. JPG minőségű méy tanulással
IMG20. Nyelvkontúr meghatározása ultrahangos képekből
IMG21. Képfelismérés támadhatóságának vizsgálata
IMG22. Képgenerálás GAN-okkal
IMG23. Beszédfelismerés ajakmozgás alapján
IMG24. Ultrahang képek felügyelet nélküli osztályozása Variational AutoEncoder alapon
IMG25. Képek összefűzése GAN-okkal

TERMÉSZETES NYELVFELDOLGOZÁS

NLP1. A Twitter 20_newsgroup szövegkorpusz osztályokba sorolása
NLP2. Szövegek automatikus kivonatolása
NLP3. ChatBot deep learning alapon
NLP4. Prediktív szövegbevitel (karakter és/vagy szó szintű)
NLP5. Automatikus forráskód minősítés
NLP6. Író nemének és korának becslése szöveg alapján
NLP7. LaTeX2PDF és PDF2LaTeX deep learning alapon
NLP8. Író azonosítás szöveg alapján, plágium detektor
NLP9. Helyesírás javító
NLP10. SPAM detektálás
NLP11. Fonetikus átírás LSTM segítségével
NLP12. BME CookBook - LSTM alapú szakácskönyv
NLP13. Automatikus email válasz
NLP14. CRNN alapú fordítógép
NLP15. Szófaj címkézés LSTM alapon
NLP16. Email alapján személyazonosítás
NLP17. Log file anomália detektálás
NLP18. Mondatok értelmének összehasonlítása (szemantikai hasonlóság)
NLP19. DNS láncok elemzése
NLP20. Ékezet nélküli szövegek ékezetesítése
NLP21. FAIR ParlAI framework bevezetése
NLP22. Wit.ai alapú megoldás fejlesztése

VISELKEDÉS, MOZGÁS, EGÉSZSÉG

HEL1. Csípőficam detekció mobil szenzoradatok alapján
HEL2. Személyazonosítás lépéssítlus alapján
HEL3. Tömegközlekedési eszköz felhasználói minősítésének becslése szenzoradatok alapján
HEL4. EEG, EKG osztályozás
HEL5. Gyógyszeres kezelés ajánlása
HEL6. Realisztikus emberi járás, futás modellezése
HEL7. Testgesztus felismerés

PÉNZÜGYI

FIN1. Árfolyammozgás előrejelzés árfolyamadatok alapján (deviza, bitcoin, hazai és nemzetközi tőzsde, nyersanyagok)
FIN2. Volatilitás előrejelzés OHLC adatok alapján
FIN3. Tőzsdei szupport- és rezisztenciaszintek azonosítás
FIN4. Trend azonosítás idősorokban
FIN5. Pénzügyi hírek hatásának modellezése
FIN6. Blockchain tranzakciók detektálása és modellezése
FIN7. Ajánlati könyv (order book) alapú árfolyam mozgás előrejelzés
FIN8. Q-Learning alapú kereskedési stratégiák kidolgozása
FIN9. Kriptovaluták tranzakciós gráfjának elemzése és modellezése mély tanulással

REINFORCEMENT LEARNING

REL1. 2048 játék bot
REL2. Invaders játék bot
REL3. Póker bot
REL4. OpenAI Gym
REL5. OpenAI Universe
REL6. TensorForce
REL7. Google Dopamine
REL8. Pénzügyi kereskedési stratégia kidolgozása deep learninggel
REL9. Valós életbeli (pl. versenyautó) objektumok alakjának optimalizálása
REL10. Neuronháló architektúra optimizáció

ELMÉLET

THE1. Új típusú regularizátorok létrehozása és tesztelése
THE2. Neuronhálók vizualizációja
THE3. Elosztott hyperopt architektúra készítése, tesztelése
THE4. 4/8/16 bites mély neuronhálók
THE5. Gradiens ellenőrző és vizualizáló modul
THE6. Versengő neuronhálók (adversarial networks)
THE7. Sziámi neuronhálók (siamese networks)
THE8. Új típusú hiperparaméter optimalizáló algoritmusok
THE9. Reinforcement Learning algoritmusok fejlesztése
THE10. Új típusú idősor modellek
THE11. Hiperparaméter optimizációs algoritmusok fejlesztése

VERSENY

VER1. Kaggle.com-on hostolt bármelyik tárgy idején futó verseny
VER2. Numer.ai
VER3. Az OpenAI bármelyik kitűzött célja

ADATBÁZISOK

A publikus adatbázisok használata előnyben részesített. Pár publikus adatbázis forrás:

https://ai.google/tools/datasets/
http://archive.ics.uci.edu/ml/datasets.html
https://snap.stanford.edu/data/
http://www.datasciencecentral.com/page/search?q=data+sets
Kaggle.com Open Data
Magyar Elektronikus könyvtár
Million Song Dataset
1 Billion Words dataset
MovieLens 1M Dataset
Twitter Sentiment140
http://host.robots.ox.ac.uk/pascal/VOC/
http://bioinf.jku.at/research/DeepTox/tox21.html
http://festvox.org/cmu_arctic/
LibriVox hangoskönyvek
Wiki Reading
http://www.speech.cs.cmu.edu/databases/
https://cptac-data-portal.georgetown.edu/cptacPublic/
MOCHA TIMIT
mngu0
IU_ULTRASOUND
https://ourworldindata.org/
YouTube 8M
Google Open Image Dataset
Allen Institute for AI datasets
SpaceNet dataset - nagyfelbontású műholdas felvételek
Visual Question and Answer dataset - képek és hozzájuk kapcsolódó kérdések és válaszok
Music Net - klasszikus zenék hullámformája és hangszerenként kotta

HATÁRIDŐ

A házi feladat benyújtásának határideje a szorgalmi időszak utolsó hetének vasárnapja, hosszabbítási lehetőség nincs.