Diplome in magisteriji

Poleg tem na tej strani so dobrodošle tudi vaše lastne ideje. Predlagam, da se oglasite na govorilnih urah ali po elektronski pošti. Moji trenutni predlogi so povečini raziskovalno-razvojni projekti in praktične aplikacije. Raziskovalne naloge so pretežno s področij strojnega učenja in obdelave naravnega jezika. Motivacija za praktične naloge so povečini realni problemi, s katerimi se soočajo slovenska ali tuja podjetja in organizacije. Nekatere naloge so predlagane za več stopenj študija. Dejansko količino dela, zahtevnost in obseg tematike bomo prilagodili stopnji.


Ocenjevanje atributov s klasifikacijo in rangiranjem (vse stopnje)
Attribute evaluation using classification and ranking (all levels)

Uspešen način za ocenjevanje atributov je, da kakovost atributa določimo glede na to, kako uspešno loči med sosednjimi primeri. V visokodimenzionalnih šumnih problemih je pri tem ključna težava, da so relevantni sosednji primeri zaradi šuma težko določljivi. Problem boste poskusili rešiti z uporabo učenja soseščin s pomočjo klasifikacije in rangiranja preko rekurzivne razdelitve prostora na podprostore.  Rešitev preizkusite na več realnih problemih in jo primerjajte z drugimi znanimi metodami za ocenjevanje atributov.

Konstrukcija informativnih atributov s pomočjo razlage napovednih modelov (univerzitetni študij prve stopnje, drugostopenjski študiji)
Construction of informative features using explanation of predictive models (1st cycle university study, 2nd cycle)

Obstoječa metoda za razlago napovedi odločitvenih modelov z usmerjenim vzorčenjem določi pomnožico pomembnih atributov za dano odločitev. Čeprav na ta način dobimo informacijo o tem, kaj vpliva na dano odločitev, še vedno ne vemo, kakšna je funkcijska oblika vpliva. To informacijo želimo pridobiti s konstrukcijo novih atributov, ki bodo statistično pomembni v dani podatkovni množici. V okviru naloge boste razvili konstrukcijo atributov in njihovo ovrednotenje ter nalogo preizkusili na nekaj umetnih in realnih množicah podatkov.

Tvorjenje dodatnih podatkov za identifikacijo dinamičnih sistemov  (univerzitetni študij prve stopnje, drugostopenjski študiji)
Generation of additional data for dynamic systems identification (1st cycle university study, 2nd cycle)

Iz omejenega števila merjenih podatkov želimo tvoriti dodatne podatke in jih uporabiti za modeliranje časovno spremenljivega obnašanja sistemov oziroma tako imenovano identifikacijo dinamičnih sistemov. Dinamične sisteme (npr. v tehnoloških sistemih, proizvodnji, ekološkem modeliranju) lahko identificiramo z regresijskimi metodami. Podatke pridobimo z vzorčenjem iz merjenih vhodnih in izhodnih signalov v dinamični sistem. Ker so vhodni in izhodni signali običajno pogojeni z dinamiko in z okoljem sistema (npr. omejitve glede amplitude in hitrosti vzorčenja)  na ta način mnogokrat ne moremo enakomerno pokriti učnega prostora, zato so pridobljeni modeli neustrezni.
Prilagodite obstoječo metodo tvorjenja delno umetnih podatkov na dinamične sisteme in pristop preizkusite. Kot modele za identifikacijo dinamičnih sistemov uporabite Gaussove procese, nevronske mreže in druge regresijske modele.  Metodo  preizkusite na enostavnem umetno tvorjenem problemu (problem longitudinalne dinamike vozila) in na primeru dejanskega hidravličnega procesa (model višine tekočine v ločevalniku).  

Dvo- in trodimenzionalna vizualizacija odločitvenih pravil, gruč in zanimivih skupin podatkov (vse smeri)
2D and 3D visualization of decision rules, clusters and subgroups (all levels)

Za razumljivost rezultatov analize podatkov je potrebno rezultate prikazati tako, da so čimbolj razumljivi in da je uporabniku omogočeno, da si sam izbere kateri vidiki ga najbolj zanimajo. Eden od načinov, kako to dosežemo je interaktivno premikanje po dvo in tridimenzionalnem prostoru ter sproten izris rezultatov in različnih latnosti, ki jih povezujejo. Na takšen način želimo prikazati tudi rezultate strojnega učenja in sicer učenja odločitvenih pravil in odkrivanja zanimivih podskupin. V prostoru bi prikazali različne lastnosti gruč, odkritih skupin in pravil, njihov opis in povezave med njimi.

Procesiranje naravnega jezika v povezavi s slovenščino - več nalog (vse  stopnje)

S pomočjo orodij za obdelavo naravnega jezika želimo rešiti nekaj jezikovnih problemov v slovenskem jeziku. Primeri nalog so npr. analiza berljivosti,  izdelava orodja za vizualizacijo sinonimov, avtomatsko postavljanje vejic s strojnim učenjem itd. Pri nekaterih nalogah boste uporabili tehnike učenja z globokimi bevronskimi mrežami. Nekatere naloge bodo potekale v sodelovanju z jezikoslovci.


Priprava orodij za obdelavo slovenščine  (vse  stopnje)
Improvement of language tools for Slovene (all cycles)

Dvigniti želimo nivo in uporabnost avtomatske obdelave slovenskega jezika. V ta namen bomo nekaj orodij, ki so jezikovno dokaj neodvisna, prilagodili za slovenski jezik na osnovi velikih zbirk besedil (korpusov), ki jih imamo na razpolago. Posamezna naloga obsega prilagoditev enega od orodij, npr. vključitev slovenskega jezika v okolje R, nadgradnja paketa tm (textmining) ali vgradnja jezikovnih orodij v Language Tool.

Strojno prevajanje in preoblikovanje stavkov (univerzitetni študij prve stopnje, drugostopenjski študiji)
Machine translation and sentence rephrasal (1st cycle university study, 2nd cycle)

Trenutno strojno prevajanje poteka tako, da sistem poišče najverjetnejši besedni in stavčni ekvivalenti v različnih jezikih. Kot učne množice sistemi za strojno prevajanje uporabljajo korpuse besedil, ki so jih prevedli ljudje. Ljudje - prevajalci uporabljajo drugačen pristop, saj pogosto stavke prevedejo tako, da jih besedno preoblikujejo, seveda pa ohranijo pomen. Težava je v tem, da tako prevedeni korpusi ne ustrezajo sistemom za strojno učenje. Stavki, ki so besedno preoblikovani, dejansko predstavljajo dodaten šum za z vidika sistemov za strojno prevajanje. Sestavite program, ki bo v prevajalski korpusih poiskal preoblikovane stavke in jih izločil iz učne množice za strojno prevajanje, ter preverite uspešnost strojnega prevajanja s takšnimi množicami.


Analiza in ovrednotenje atributov v zaporedju poslovnih odločitev (vse stopnje)
Analyis and evaluation of attributes describing short business decisions (all levels)

Nekatere poslovne odločitve poskušamo opisati z atributi, ki jih v času večkrat zapored izmerimo. S časovne razdalje lahko ugotavljamo, katere odločitve so bile dobre in katere ne, ter na tej podlagi ovrednotimo informacijsko in odločitveno vrednost atributov. Implementirajte in preizkusite algoritem za takšno vrednotenje atributov, ki temelji na podobnosti med posameznimi časovnimi koraki.