Diplome in magisteriji

Poleg tem na tej strani so dobrodošle tudi vaše lastne ideje. Predlagam, da se oglasite na govorilnih urah ali po elektronski pošti. Moji trenutni predlogi so povečini raziskovalno-razvojni projekti in praktične aplikacije. Raziskovalne naloge so pretežno s področij strojnega učenja in obdelave naravnega jezika. Motivacija za praktične naloge so povečini realni problemi, s katerimi se soočajo slovenska ali tuja podjetja in organizacije. Naloge so predlagane za več stopenj študija, vendar bomo dejansko količino dela, zahtevnost in obseg tematike prilagodili stopnji.


Ocenjevanje atributov s klasifikacijo in rangiranjem / Attribute evaluation using classification and ranking

Ocenjevanje kakovosti atributov je pomembna naloga v strojnem učenju, saj  nam omogoča, da nepomembne in redundantne atribute zavržemo in tako obdelamo tudi zelo velike množice podatkov. Uspešen način za ocenjevanje atributov je, da kakovost atributa določimo glede na to, kako uspešno loči med različno označenimi sosednjimi primeri. V visokodimenzionalnih šumnih problemih je pri tem ključna težava, da so relevantni sosednji primeri zaradi šuma težko določljivi. Problem boste poskusili rešiti z uporabo učenja soseščin s pomočjo klasifikacije in rangiranja preko rekurzivne razdelitve prostora na podprostore.  Rešitev preizkusite na več realnih problemih in jo primerjajte z drugimi znanimi metodami za ocenjevanje atributov.

Konstrukcija znanja s pomočjo globokih nevronskih mrež / Knowledge construction using deep neural networks

Ključno za uspeh globokega učenja je to, da postopoma skozi več nivojev gradimo bogatejšo predstavitev problema. Naučen globok model sicer dobro napoveduje, a njegovo znanje ni razumljivo. S posebno obliko globokih nevronskih mrež, ki postopno gradi predstavitev (autoencoders) lahko predstavitev tudi eksplicitno gradimo. Zgrajeno predstavitev želimo prikazati v človeku razumljivi obliki s konstrukcijo novih atributov, ki so funkcije osnovnih. V okviru naloge boste razvili konstrukcijo atributov za nekaj oblik funkcij in jih preizkusili na nekaj umetnih in realnih množicah podatkov.

Procesiranje naravnega jezika (slovenščina in drugi jeziki) - več nalog

S pomočjo orodij za obdelavo naravnega jezika želimo rešiti nekaj jezikovnih problemov v slovenščini in drugih jezikih. Primeri nalog so npr. avtomatsko postavljanje vejic z globokimi nevronskimi mrežami, izdelava slovničnega pripomočka z uporabo globokih nevronskih mrež itd. Nekatere naloge bodo potekale v sodelovanju z jezikoslovci.

Globoke nevronske mreže za morfološko bogate jezike

Za močno pregibne jezike (oz. morfološko bogate), kot je slovenščina, je potrebno pri učenju z globokimi nevronskimi mrežami na vhod poleg besed dodati tudi dodatno informacijo, ki mreži omogoči, da se nauči pomena pregibanja. Ta informacija je največkrat v obliki znakov, veččrkovnih zaporedij, končnic ali posebej naučenih podatkov o pregibanju. Preizkusite nekaj načinov za učenje globokih nevronskih mrež z morfološko bogatimi jeziki in mrežo preizkusite na klasifikaciji teksta.

Priprava orodij za obdelavo slovenščine  / Improvement of language tools for Slovene

Dvigniti želimo nivo in uporabnost avtomatske obdelave slovenskega jezika. V ta namen bomo nekaj orodij, ki so jezikovno dokaj neodvisna, prilagodili za slovenski jezik na osnovi velikih zbirk besedil (korpusov), ki jih imamo na razpolago. Posamezna naloga obsega prilagoditev enega od orodij, npr. vključitev slovenskega jezika v okolje R, nadgradnja paketa tm (textmining) ali vgradnja jezikovnih orodij v Language Tool.

Strojno prevajanje in povzemanje besedil / Machine translation and document summarization

V zadnjem času strojno prevajanje temelji na metodah globokih nevronskih mrež. V enega od obstoječih sistemov za strojno prevajanje boste vgradili podporo slovenščini in drugim močno pregibnim jezikom. Ideja je, da nevronskim mrežam dodamo še informaciji o pregibnosti, kar dosežemo z dodatnimi vhodi na nivoju znakov. Preverite uspešnost strojnega prevajanja s takšnimi množicami.

Izdelava jezikovne igre na mobilni platformi

Eden od načinov za hitrejše in bolj motivirano učenje je zaviti učenje v igro (gamification). Poskus take igre na področju bogatenja besednega zaklada je didaktična Igra besed (http://www.igra-besed.si/), ki temelji na (s)poznavanju sopojavitve besed. Trenutno je bistvo igre, da je igralec ugiba en del para pridevnik-samostalnik, vsaka od treh besed, ki jih vtipka, pa se točkuje glede na pogostost pojavitve ob drugi besedi. Igra je enostavna in uporablja avtomatsko luščene podatke iz jezikovnega korpusa Gigafida.
V okviru naloge boste igro razširili, izdelali za mobilne naprave in izboljšali vmesnik, npr. več možnosti igranj (dodajanje parov prislov+pridevnik, možnost izbire števila besed za vtipkanje), boljša igralnost (boljša povratna informacija in točkovanje, igra vseh prijavljenih hkrati).

Izbiro značilk pri velepodatkih / Feature selection for big data

Za delo z zelo velikimi podatkovnimi množicami, tako imenovanimi velepodatki (angl. big data) uporabljamo prilagojene metode. Za delovanje na velepodatkih bost prilagodili nekaj uspešnih metod za izbiro značilk in jih ovrednotili na več podatkovnih zbirkah, tudi na problemu modeliranja vremenskih spremenljivk. Delo bo potekalo v sodelovanju s prof. Jušem Kocijanom z IJS.

Identifikacija dinamičnih sistemov na podlagi Gaussovih procesov / Gaussian process based identification of dynamic systems

Metoda identifikacije modelov na podlagi  Gaussovih procesov (GP) je relativno nova metoda, ki omogoča tudi identifikacijo linearnih in nelinearnih dinamičnih sistemov. Metoda omogoča, da lahko prikažemo tudi negotovost napovedi v odvisnosti od razporeditve podatkov za modeliranje.  Običajno se za identifikacijo modelov oziroma optimizacijo uporablja metoda največjega verjetja (angl. maximum likelihood), ki pa ima težave z lokalnimi minimumi kriterijske funkcije. Alternativa, ki naj bi jo vrednotili v tem diplomskem delu je optimizacija z uporabo metode sekvenčni Monte Carlo. Na podlagi literature je potrebno narediti vrednotenje identifikacije različnih procesov z uporabo metode sekvenčni Monte Carlo z že izdelano programsko opremo oziroma jo po potrebi prilagoditi. Sekvenčno Monte Carlo metodo naj se preizkusi tudi za optimizacijo modela z izhodnim pogreškom (OE model). Za vrednotenje je potrebno poiskati primerne in različne primere dinamičnih sistemov.   Delo bo potekalo v sistemu Matlab v sodelovanju s prof. Jušem Kocijanom z IJS.

Vrednotenje algoritma za določanje stabilnost zaprtozančnega sistema, ki vsebuje neparametrični model /Validation of the algorithm for analysis of closed-loop stability with nonparametric model in the loop

Vinogradska je leta 2017 predlagala nov algoritem za določanje stabilnosti zaprtozančnega sistema, ki vsebuje neparametrični model. Algoritem, zapisan s pseudokodo je potrebno izvesti v enem od programskih jezikov (Python, Matlab, Java itd.) in ga preizkusiti na primerno izbranem primeru. Delo bo potekalo v sodelovanju s prof. Jušem Kocijanom z IJS.

Analiza podatkov o Parkinsonovi bolezni

Parkinsonova bolezen je zelo pogosta nevrodegenerativna motnja. Njeni simptomi vplivajo na različne vidike kakovosti življenja pacientov. Simptomi se spreminjajo skozi čas, zdravniki pa jih skušajo lajšati z različnimi zdravili. Analizirali boste podatke iz senzorjev, ki jih nosijo bolniki in poskušali napovedati najprimernejšo terapijo za posameznega bolnika.