Big Data Analytics

Cilji predmeta

Vse večja vpetost družbenih medijev v poslovanje podjetij in digitalizacija poslovanja je za posledico imela nastanek masovnih podatkov, t.j. velike količine pogosto nestrukturiranih podatkov. Sočasno se povečujejo možnosti zanesljivega in cenovno ugodnega shranjevanja velikih količin podatkov, njihovega učinkovitega analiziranja ter pridobivanja relevantnih informacij. S pojavom masovnih podatkov je že mogoče boljše merjenje ekonomskih učinkov in rezultatov, kar omogoča nove raziskovalne pristope na številnih področjih. V prihodnosti lahko tako pričakujemo, da bo analitika masovnih podatkov zelo verjetno vplivala na vprašanja, ki si jih ekonomisti zastavljajo, s tem ko bodo omogočali boljšo osredotočenost na raznolikost populacij in analizo širših ekonomskih aktivnosti in povezav.
V okviru predmeta bomo predstavili ključne koncepte masovnih podatkov in najpogostejše analitične metode in orodja za njihovo analizo. Predstavili bomo nove tehnologije za obdelavo (zajem in pripravo) ter analizo masovnih podatkov. V okviru predmeta bodo obravnavane aktualne metode za analitiko v pomnilniku, podatkovno in besedilno rudarjenje na ekonomskih in finančnih primerih.
Osrednji del predmeta je koncipiran na praktičnem delu z različnimi orodji, s pomočjo študij primerov pa bodo dodatno ilustirani predstavljeni koncepti.

Vsebina predmeta

1. O masovnih podatkih
• Razumevanje masovnih podatkov
• Tehnologije masovnih podatkov
• Analitične tehnologije
• Poslovna vrednost in izzivi masovnih podatkov
2. Zajem, priprava ter shranjevanje podatkov
• Integracija podatkov
• Čiščenje in transformacija
• Prepletanje podatkov
• Shranjevanje podatkov
• Ogrodje za porazdeljeno shranjevanje in procesiranje velikih zbirk podatkov
3. Podatkovna analitika v pomnilniku
• Asociativna podatkovna analitika
• Večdimenzionalna podatkovna analitika
4. Podatkovno rudarjenje
• Razmerje med podatkovnim rudarjenjem in tradicionalno statistiko
• Proces podatkovnega rudarjenja
• Preiskovanje podatkov
• Klasifikacija
• Regresijski modeli
• Asociativna pravila
• Razvrščanje v skupine
• Globoko učenje
• Ocenjevanje modelov in izbira možnosti
5. Rudarjenje besedil
• Proces tekstovnega rudarjenja
• Korpus
• Pridobivanje podatkov iz spletnih strani
• Semantično razčlenjevanje in vreča besed
• Transformacije (tokenizacija, krnjenje, odstranjevanje pogostih besed, …)
• Analiza (razvrščanje v skupine, kategorizacija, …)
• Analiza razpoloženja

Nosilci predmeta

  • Govorilne ure
  • sreda ob 12.00 v RZ-404
  • Govorilne ure samo po predhodni najavi v kabinetu. Po dogovoru pa lahko izven rednih terminov po Zoomu. / Office hours only by prior appointment. Zoom meetings are possible outside official office hours.
  • POZOR: Aktualna sprememba govorilnih ur
  •  
  •  
  •  
  •  
  • Govorilne ure
  • sreda ob 15.00 v Zoom Room
  • Join Zoom Meeting https://uni-lj-si.zoom.us/j/98328916611?pwd=TFlwZGhaV3JjMEZpMDNMdnh4Zk90Zz09 Meeting ID: 983 2891 6611 Passcode: 600451
  • POZOR: Aktualna sprememba govorilnih ur
  •  
  •  
  •  
  •  
Na vrh strani