Filozofska fakulteta Univerze v Ljubljani
Oddelek za primerjalno in splošno jezikoslovje
|
Primož Jakopin
Računalništvo za filologe
Izbirni predmet Računalništvo za filologe je namenjen predvsem
študentom z jezikoslovjem in književnostjo povezanih smeri (filologom).
Njegov namen je seznaniti študente z možnostjo kreativne uporabe interneta
pri lastnem delu, z uporabo domačih in tujih besedilnih korpusov ter z
osnovami kvantitativne analize besedil.
Namesto preverjanja znanja sta seminarska naloga in zagovor.
V okviru naloge je treba napraviti statistični opis izbranega
literarnega dela v slovenskem ali angleškem jeziku, v obliki spletne strani, primerne za objavo
na internetu.
Predmet obsega 60 ur (2 + 2) predavanj in vaj v poletnem semestru, od
februarja do junija 2010 ob ponedeljkih od 7.10 do 8.50 in od 16.20 do 17.55 v učilnici
013 v kleti FF.
Govorilne ure so ob sredah od 8. do 9. ure v kabinetu
R16BI, ki je v prizidku Filozofske fakultete na Rimski cesti. Do
kabineta se da priti tudi iz avle FF, najprej do prehoda na Rimsko
cesto, ki je na levi strani stopnišča med pritličjem in prvim
nadstropjem FF, potem čez prehod, prva vrata levo, ki peljejo do
polžastih stopnic v pritličje, tam naprej do izhoda na dvorišče,
diagonalno preko dvorišča do zunanjih stopnic ob boku enonadstropne
stavbe, po stopnicah do vrha, tam levo v stavbo, skozi nihajna vrata
in potem prva vrata desno. Elektronski naslov predavatelja je
ime.priimek@guest.arnes.si, kjer sta ime in priimek njegova, le da s
črko z namesto ž v imenu. Telefonska številka v kabinetu je 241 1432.
Izpitni roki so vsako prvo sredo v mesecu ob
govorilnih urah, razen februarja in avgusta.
Teme, ki pridejo v poštev:
- Računalnik kot komunikacijsko sredstvo, internet
- strojna oprema
- programska oprema
- internet: kaj, kako in zakaj
- elektronska pošta
- uporaba pregledovalnikov, iskanje po spletu
- Osebna stran
- Objava seminarskih in diplomskih nalog na svetovnem spletu
- Priprava naloge - odstavki, slike
- Konverzija iz formata .DOC (MS Word) v .HTML
- Razrez na datoteke s poglavji
- Oblikovanje kazala
- Priprava živega indeksa
- Besedilni viri
- Besedilni korpusi
- elektronska besedila
- standardi za označevanje - TEI
- uporaba domačih in tujih javno dostopnih besedilnih zbirk
- konkordančniki in iskalniki
- besedilni korpus
British National Corpus
- besedilni korpus FidaPLUS
- besedilni korpus
Nova beseda
- Strojno prevajanje
- zgodovina
- stanje
- prostodostopni prevajalniki
- perspektive
- Oblikoslovno označevanje in lematizacija
- postopek
- namen
- prostodostopni označevalniki
- Besedilo kot podatkovna zbirka
- urejevalnik EVA - primer orodja za analizo besedila
- nabor znakov - od ASCII
do UNICODE
- izmenjava besedil med različnimi programi
- gradniki besedila: črke, besede, povedi
- izdelava histogramov
- uporaba enojezičnih in dvojezičnih slovarjev
- izdelava konkordančnih seznamov
- frekvenčni in obrnjeni slovar besed
- Statistični opis besedila
- porazdelitev črk
- porazdelitev besednih dolžin
- statistika polnopomenskih besednih vrst
- krivulje rasti besed
- porazdelitev dolžin povedi
Seminarska naloga
- izbor ustreznega literarnega dela iz spletnih zbirk
- izdelava besednega zaklada
- statistični opis
- postavitev naloge na internet
Viri in literatura
- D. Jurafsky, J. H. Martin, 2009. Speech and language processing, 2. izdaja,
Prentice Hall, 1024 str.
- C. D. Manning in H. Schütze, 1999. Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA, 620 str.
- G. Leech, P. Rayson, A. Wilson, 2001. Word Frequencies in Written and Spoken English: based on the British National Corpus. Longman, London, 320 str.
- Prispevki s konferenc
Association for Computational Linguistics (ACL)
- ACL wiki
- V. Gorjanc, 2005. Uvod v korpusno jezikoslovje. Izolit, Domžale, 163 str.
- P. Jakopin, 2002.
Entropija v slovenskih leposlovnih besedilih. Založba
ZRC, Ljubljana, 208 str.
Diplomske naloge in magistrska dela
Pri predmetu je mogoče izbrati tudi temo za diplomsko nalogo
ali magistrsko delo. Teme obsegajo kvantitativno analizo izbranega
zaključenega besedila ali določene jezikovne prvine večje besedilne
zbirke. Seznam še prostih tem je na voljo pri
predavatelju.
Stran je postavil
P. Jakopin in jo nazadnje spremenil 24. marca 2010.
Naslov strani: http://www.jakopin.net//ff/seminar/rac_za_filol.html
Obiskov
