Filozofska fakulteta Univerze v Ljubljani
Oddelek za primerjalno in splošno jezikoslovje
|
Primož Jakopin
Jezikovne in spletne tehnologije
(Računalništvo za filologe)
Izbirni predmet Jezikovne in spletne tehnologije oz.
Računalništvo za filologe (po starem programu) je namenjen predvsem
študentom z jezikoslovjem in književnostjo povezanih smeri (filologom).
Njegov namen je seznaniti študente z osnovnim poglavjem spletnih tehnologij,
z možnostmi, ki jih odpirajo predvsem domači besedilni korpusi ter z
osnovami kvantitativne analize besedil.
Namesto preverjanja znanja sta seminarska naloga in zagovor.
V okviru naloge je treba napraviti statistični opis izbranega
literarnega dela v slovenskem ali angleškem jeziku, v obliki spletne strani za objavo
na internetu.
Predmet obsega 60 ur (2 + 2) predavanj in vaj v poletnem semestru, od
februarja do junija 2011 ob ponedeljkih od 16.20 do 17.55 v učilnici
013 ter od 18.00 do 19.35 v učilnici 011, obe sta v kleti FF.
Govorilne ure so ob sredah od 8. do 9. ure v kabinetu
R16BI, ki je v prizidku Filozofske fakultete na Rimski cesti. Do
kabineta se da priti tudi iz avle FF, najprej do prehoda na Rimsko
cesto, ki je na levi strani stopnišča med pritličjem in prvim
nadstropjem FF, potem čez prehod, prva vrata levo, ki peljejo do
polžastih stopnic v pritličje, tam naprej do izhoda na dvorišče,
diagonalno preko dvorišča do zunanjih stopnic ob boku enonadstropne
stavbe, po stopnicah do vrha, tam levo v stavbo, skozi nihajna vrata
in potem prva vrata desno. Elektronski naslov predavatelja je
ime.priimek@guest.arnes.si, kjer sta ime in priimek njegova, le da s
črko z namesto ž v imenu. Telefonska številka v kabinetu je 241 1432.
Izpitni roki so vsako prvo sredo v mesecu ob
govorilnih urah, razen februarja in avgusta.
Teme, ki pridejo v poštev:
- Računalnik kot komunikacijsko sredstvo, internet
- strojna oprema
- programska oprema
- internet: kaj, kako in zakaj
- elektronska pošta
- uporaba pregledovalnikov, iskanje po spletu
- Osebna stran
- Objava seminarskih in diplomskih nalog na svetovnem spletu
- Priprava naloge - odstavki, slike
- Konverzija iz formata .DOC (MS Word) v .HTML
- Razrez na datoteke s poglavji
- Oblikovanje kazala
- Priprava živega indeksa
- Besedilni viri
- Besedilni korpusi
- elektronska besedila
- standardi za označevanje - TEI
- uporaba domačih in tujih javno dostopnih besedilnih zbirk
- konkordančniki in iskalniki
- besedilni korpus
British National Corpus
- besedilni korpus FidaPLUS
- besedilni korpus
Nova beseda
- sestavni deli korpusa
- konkordačnik
- besedna iskanja
- struktura besedil
- zgradba indeksa
- Strojno prevajanje
- zgodovina
- stanje
- prostodostopni prevajalniki
- perspektive
- Oblikoslovno označevanje in lematizacija
- postopek
- namen
- prostodostopni označevalniki
- Besedilo kot podatkovna zbirka
- urejevalnik EVA - primer orodja za analizo besedila
- nabor znakov - od ASCII
do UNICODE
- izmenjava besedil med različnimi programi
- gradniki besedila: črke, besede, povedi
- izdelava histogramov
- uporaba enojezičnih in dvojezičnih slovarjev
- izdelava konkordančnih seznamov
- frekvenčni in obrnjeni slovar besed
- Statistični opis besedila
- porazdelitev črk
- porazdelitev besednih dolžin
- statistika polnopomenskih besednih vrst
- krivulje rasti besed
- porazdelitev dolžin povedi
Seminarska naloga
- izbor ustreznega literarnega dela iz spletnih zbirk
- izdelava besednega zaklada
- statistični opis
- postavitev naloge na internet
Viri in literatura
- D. Jurafsky, J. H. Martin, 2009. Speech and language processing, 2. izdaja,
Prentice Hall, 1024 str.
- C. D. Manning in H. Schütze, 1999. Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA, 620 str.
- G. Leech, P. Rayson, A. Wilson, 2001. Word Frequencies in Written and Spoken English: based on the British National Corpus. Longman, London, 320 str.
- Prispevki s konferenc
Association for Computational Linguistics (ACL)
- ACL wiki
- V. Gorjanc, 2005. Uvod v korpusno jezikoslovje. Izolit, Domžale, 163 str.
- P. Jakopin, 2002.
Entropija v slovenskih leposlovnih besedilih. Založba
ZRC, Ljubljana, 208 str.
Diplomske naloge in magistrska dela
Pri predmetu je mogoče izbrati tudi temo za diplomsko nalogo
ali magistrsko delo. Teme obsegajo kvantitativno analizo izbranega
zaključenega besedila ali določene jezikovne prvine večje besedilne
zbirke. Seznam še prostih tem je na voljo pri
predavatelju.
Stran je postavil
P. Jakopin in jo nazadnje spremenil 31. oktobra 2011.
Naslov strani: http://www.jakopin.net//ff/seminar/rac_za_filol.html
Obiskov
