Nazaj: Oblikoslovno označevanje      Naprej: Entropija      Kazalo    Začetek    Konec

Doktorska disertacija P. Jakopina, str. 47 - 88

5. poglavje

Statistični opis

5.1  Znaki
     5.1.1  Nabor
     5.1.2  Porazdelitve
     5.1.3  N-terčki znakov
5.2  Besede
     5.2.1  Rast besednega zaklada
     5.2.2  Dolžine besed
     5.2.3  Najpogostejše besede
     5.2.4  Besedni n-terčki
5.3  Povedi
     5.3.1  Dolžine povedi
     5.3.2  Najpogostejše povedi
     5.3.3  Lipogramske povedi

Pri vsaki kvantitativni obdelavi je zanimivo vprašanje, kako se lotiti ustreznega opisa gradiva. Pri leposlovnih besedilih gre za opis gradnikov hierarhije - delo, stran, odstavek, poved, beseda, znak (oziroma črka v ožjem smislu). Pri elektronskih besedilih navadno ni podatkov o mejah strani, ki tudi pri knjižnih verzijah niso stalne - razlikujejo se od izdaje do izdaje. V tabeli 27 je navedeno število teh gradnikov za oba vzorca.

Tabela 27: Število enot v obeh vzorcih

                  Znakov   Besed    Povedi    Odstavkov
                   
Prvi vzorec       16.784.110   2.721.416    201.445    62.493
Drugi vzorec      2.497.308    407.938    37.459    12.710
                   
Skupaj            19.281.418    3.129.354    238.904    75.203

Drugi vzorec, ki vsebuje vsa dela (52) Cirila Kosmača, je po velikosti v znakih približno 15 % prvega vzorca, ki obsega 60 del 41 avtorjev. Oba skupaj sta velika približno stotino največje sedanje besedilne zbirke na svetu - Bank of English, kjer pa je leposlovja malo.

Statistični opis v nalogi je razdeljen na razdelke o znakih, besedah in povedih, ki jim sledi še poglavje o entropiji.


5.1 Znaki

Najmanjši delci pisanega besedila in drugih negovorjenih sporočil, delci, ki se jih ne da še naprej deliti, so znaki. Sem spadajo črke, ločila, med katerimi je najpomembnejši presledek, simboli, kakršen je recimo paragraf, in razne oznake, ki sicer niso del besedila, kot npr. kazalci na opombe. Namesto izraza znaki je v literaturi dostikrat uporabljen tudi izraz simboli.

Tabela 28: Nabor znakov iz obeh vzorcev skupaj, absolutno in v odstotkih

5.1.1 Nabor

V tabeli 28 na prejšnji strani je naveden skupni nabor znakov iz obeh vzorcev. Pri tem niso upoštevana zaglavja pred besedili, so pa zajete oznake meja povedi, odstavkov, premega govora in podobnega, vsi dodatni simboli, ki so že bili navedeni v tabeli 5. Vsega skupaj je v obeh vzorcih nastopalo skupaj 168 različnih znakov, v prvem 165, v drugem pa 128. Največ črk, ki ne nastopajo v slovenski abecedi, so prinesli prevodi, predvsem delo Libuše Moníkove Fasada. V njem je bilo celo nekaj citatov v cirilici, ki so bili označeni kot neslovensko besedilo in nadomeščeni z zvezdico. Trije dodatni znaki, ki jih je v skupni nabor prispeval drugi vzorec, so bili znak za paragraf ter par dvojnih navednic zgoraj in spodaj - simbola § in ş.

Kode znakov iz tabele 28 so kode, kakršne imajo ti znaki v naboru urejevalnika EVA (16-bitni nabor znakov, njegov naslov na internetu je naveden v prilogi D na strani 293). Pari znakov z nizkimi kodami razmejujejo vrsto pisave - par (17, 18) pomeni začetek in konec poudarjenega tiska (skupaj je bilo takih delov tiska 874), par (23, 24) začetek in konec kurzive (966-krat), par (25, 26) pa začetek in konec potenc (predvsem za opombe, 621-krat). Indeksov v besedilih ni bilo, bil pa je, v besedilu prvega vzorca, dvakrat uporabljen poseben znak za kvadrat (2, koda 648).

Znaki od kode 32 do 122 sledijo naboru ASCII, začenši s presledkom, ki ima pogostost 17,96, kar je približno odstotek več kot v primerljivi raziskavi (Kristan idr. 1994); razliko gre pripisati predvsem deležu časopisnega jezika v njej, ki ima opazno daljše besede. Neslovenske črke q, w, x in y s frekvencami 283, 675, 628 in 3.195 (0,02 % celote) se po pogostosti s črkami našega jezika, niti s črko f, ne morejo primerjati, kar je v skladu s pričakovanji. Izredno redki znaki v tem območju, vsi s frekvenco 5 ali manj, so dvojni narekovaj (4), dolar (1), odstotek (5), znak manjše (1) in enačaj (3). Tako malo dvojnih narekovajev v besedilu je zaradi tega, ker jih v tiskanih leposlovnih delih res ni. Povsod tam, kjer ni bilo eksplicitno razvidno, da je bil res mišljen ta znak, npr. pri premem govoru in podobno, je v rabi par >> in <<. Posebno pozornost zasluži še pomišljaj (-) s kodo 45. V besedilih je navadno nastopal v obeh vlogah - kot nestični (npr. v povedi Poglej - žoga!) in kot stični pomišljaj ali vezaj (npr. v izrazu Ve-li-ka ne-de-lja). Da ne bi prihajalo do težav pri prelomu na besede in pri podobnih postopkih, je bil pomišljaj v stični vlogi v obeh vzorcih povsod nadomeščen s posebnim stičnim pomišljajem, ki ima kodo 658. Bilo ga je približno desetkrat manj kot nestičnega (2.711 proti 25.632); nestični pomišljaj je bil zelo pogosto uporabljen za označitev premega govora namesto narekovajev.

V območju kod od 129 do 164 nastopajo črke z diakritičnimi znamenji, ki so v rabi predvsem v zahodni Evropi; med njimi so daleč najpogostejši samoglasniki é, á, í in ó z ostrivcem (2.101, 1.247, 704 in 701), sledi pa jim è s krativcem (565).

Tabela 29: Nabor znakov iz prvega vzorca, absolutno in v odstotkih


Tabela 30: Nabor znakov iz drugega vzorca, absolutno in v odstotkih

Črke z diakritičnimi znamenji, ki se ne uporabljajo v slovenskem jeziku, npr. samoglasniki s preglasi, so spet zelo redke. Na kodah od 166 do 171 sledijo šumniki Č, č, Š, š, Ž, ž, za njimi pa dve črki od štirih s srbskega oziroma hrvaškega govornega področja, ć (86) in Ð (1). Črka đ ne nastopa niti enkrat, kar pomeni da je bila najverjetneje že v originalnih besedilih transkribirana v dj. S kodo 185 malo naprej najdemo trdi presledek, lahko bi mu rekli tudi nedeljivi presledek, s frekvenco 2.057. Z njim je bil nadomeščen navaden presledek v primerih nedeljivih besednih enot, npr. pri krajevnih imenih, kot so Sv. Lucija, New York in podobno. Na kodah od 246 do 267 so simboli za označevanje besedila, razloženi v razdelku 3.1.1 (Dodatni simboli). Iz tega dela tabele sledi, da je bilo v besedilu 9.358 primerov nizov, ki niso besedilo (predvsem oznak vrstic v poglavjih Nove zaveze), 1.344 citatov v drugih jezikih, 75.203 odstavki, 56.240 primerov premega govora, 238.904 povedi, 1.712 vrstic, ki morajo biti pomaknjene na sredino, 3.814 delov besedila, ki se jih ne sme reformatirati (pesmice, lepo zloženi citati), 893 vzdevkov, 556 citatov v slovenskem jeziku in trije deli, ki morajo biti (na internetu) izpisani s črkami fiksne širine. Na koncu je še nekaj redkejših črk, predvsem z diakritičnimi znamenji, tropičje (s frekvenco 10.112), ki je bilo uvedeno zaradi lažjega določevanja meja povedi, ter razne oblike navednic.

V tabelah 28 in 29 na prejšnjih dveh straneh sta navedena nabora črk za prvi in za drugi vzorec posebej. Odstotne vrednosti v obeh tabelah so dokaj blizu, nekaj razlik je pa vendar opaznih. Tako je v prvem vzorcu presledkov 17,78 %, v drugem pa 19,19 %, kar kaže na krajšo dolžino besed v Kosmačevem besedilu; ta bo potrjena v naslednjem razdelku. V prvem vzorcu pride en premi govor na 4,39 povedi, v drugem pa na 3,62, kar kaže na večji delež dialoga pri Kosmaču. V drugem vzorcu opazimo tudi izredno majhno zastopanost števk - skupaj jih je komaj 0,01 % vseh znakov, v prvem vzorcu pa 0,17 %.

5.1.2 Porazdelitve

Na sliki 7 je prikazana porazdelitev najpogostejših črk v obeh vzorcih, kjer so bile velike in male črke združene, deleži pa se nanašajo na vse črke in ne na vse znake. Opazimo, kot je bilo ugotovljeno že v vseh prejšnjih raziskavah, prevlado črke e nad a. Odnos je 7,92 % proti 7,74 % glede na vse znake v obeh vzorcih, kar pomeni, da je e-jev za 2,33 % več kot a-jev. Hipotezi, postavljeni v članku (Kristan idr. 1994), da je odnos med vodilnima samoglasnikoma odvisen od starosti besedila in da je v novejših prevladujoč a, je nekoliko bliže odnos v prevodih, novejših besedilih prvega vzorca (6.128.484 znakov). Tam sicer še vedno prevladuje e, vendar že manj - 7,73 : 7,66. Po mnenju avtorja je odnos med obema bolj odvisen od žanra besedila - v nekaterih pravljicah je zaradi imen glavnih junakov odnos precej porušen v korist a-ja, npr. 7,55 : 8,81 (Jakopin in Musar 1997). Druga razlika je v pogostosti nadaljnjih dveh samoglasnikov, i in o. V predhodni raziskavi je črka i pogostejša od črke o, po

Slika 7: Porazdelitev najpogostejših 25 črk v obeh vzorcih skupaj

rezultatih, dobljenih za oba vzorca skupaj, pa je nekoliko pogostejši o - odnos je 6,72 % : 6,69 %. Porazdelitev drugih črk je v skladu s pričakovanji in ne odstopa bistveno od vrednosti, izmerjenih na manjšem vzorcu v predhodni, že omenjeni raziskavi (Kristan idr. 1994).

Primerjava porazdelitev vseh črk v obeh vzorcih je prikazana na sliki 8. Odstotki se tudi tokrat nanašajo na delež posamezne črke med vsemi črkami in ne med vsemi znaki.

Slika 8: Porazdelitev najpogostejših 25 črk za prvi (črn) in drugi vzorec

Razlike so majhne, pa zanimive. Takoj je videti, da je v drugem vzorcu delež črke a za malenkost večji kot delež črke e, obakrat pa spet večji kot v prvem vzorcu, medtem ko so deleži preostalih treh samoglasnikov, črk i, o in u, v drugem vzorcu opazno manjši kot v prvem - lahko bi rekli, da je Kosmačeva govorica "širša" od govorice v drugih slovenskih leposlovnih besedilih.

Poleg porazdelitve vseh črk sta najbolj zanimivi še dve porazdelitvi - porazdelitev prvih in zadnjih črk v vseh besedah. Prikazani sta na slikah 9 in 10. Na sliki 9 najprej opazimo, v primerjavi s sliko 8, majhne frekvence samoglasnikov in večjo urejenost cele slike. V nasprotju s prejšnjo raziskavo (kjer je prvi p) je najpogostejša prva črka pri obeh vzorcih s (ki je od vseh črk najlažje izgovorljiva), sledijo p, n, j in v. Črke c, e in f so na začetku besed zelo redko.

Slika 9: Porazdelitev prvih črk vseh besed za prvi (črn) in drugi vzorec

Slika 10: Porazdelitev zadnjih črk vseh besed za prvi (črn) in drugi vzorec

Informacijsko še veliko revnejša je porazdelitev zadnjih črk v vseh besedah. Samoglasniki e, a, i in o in pa l, ki se na koncu besede izgovori kot 6, skupaj s pravim u-jem zavzamejo kar 71 % celote. Po drugi strani pa je cela vrsta črk, ki so brez naslednika težko izgovorljive in jih zato na koncih besed najdemo le redko: b, c, f, g, p in ž. V sliko 10 bi po frekvenci sodila tudi črka y (0,06 %), ki presega črko f (0,03 %), a je bila zaradi medsebojne primerljivosti slik 8, 9 in 10 izpuščena.

5.1.3 N-terčki znakov

Znakovni n-terčki, se pravi nizi po 1, 2, 3, 4, 5, ... znakov iz besedila imajo pri kodiranju sporočil veliko uporabno vrednost in tudi sicer o besedilu zelo dosti povedo. Prav pridejo pri krajših mehanizmih za preverjanje pravilnosti besedila, njihovo porazdelitev je mogoče uporabiti tudi pri deljenju besed na koncu vrstic (Jakopin 1995b), na koncu razdelka pa je omenjen njihov pomen za identifikacijo jezika.

Njihovo število z rastočim n izredno hitro narašča, še vedno pa seveda dosti počasneje kot število teoretično možnih kombinacij, ki bi jih dobili, če bi bili vsi znaki na vseh mestih enako pogosti. Hitrost naraščanja n-terčkov je razložena v poglavju o entropiji, na naslednjih dveh straneh pa je v tabelah 31 in 32 naštetih 60 najpogostejših n-terčkov s frekvencami, za n od 1 do 14 in za oba vzorca. Tabeli sta bili napravljeni iz besedil, potem ko so bila že razrezana na povedi, ko so bili izločeni dodatni simboli, tuji citati in razni kazalci (številke opomb in podobno), ki niso besedilo v ožjem smislu; presledek je povsod nadomeščen s podčrtajem (_).

Frekvence najpogostejših n-terčkov v prvem vzorcu za posamezen n: _/ e_/ je_/ ,_da/ _se_je/ _se_je_/ _je_bil_/ _je_bilo_/ _prijatelj/ ,_da_se_je_/ ,<<_je rekel_/ ?<<_je_vprašal in ,_kakor_da_bi_ padajo z zelo spremenljivim tempom: 5,92 : 1, 2,42 : 1, 1,22 : 1, 4,03 : 1, 1,73 : 1, 1,04 : 1, 2,85 : 1, 1,38 : 1, 3,02 : 1, 1,69 : 1, 1,44 : 1, 1,39 : 1 in 1,57 : 1. Hitrost padanja je, poleg največjega skoka na začetku, očitno povezana z redundantnostjo v besedilu. Ker je iz najpogostejšega trojčka je_ in iz dejstva, da je je najpogostejša beseda, utemeljeno sklepati, da bo najpogostejši četverček _je_, je kvocient frekvence med obema le 1,22. Podobno je pri prehodu od šesterčkov na sedmerčke, ko imamo spet niz _se_je, ki se skoraj vedno konča z je in je potem pričakovani najpogostejši sedmerček _se_je_ s kvocientom komaj 1,04. Od deseterčkov naprej se hitrost padanja ustali.

Primerjava obeh vzorcev pokaže precejšnje ujemanje pri nizkih n: pri enojčkih in dvojčkih je 56 istih nizov v obeh vzorcih, pri trojčkih, četverčkih in peterčkih po 51, pri šesterčkih 45, sedmerčkih 44, osmerčkih 35, deveterčkih 29, deseterčkih in enajsterčkih pa po 22. Istih dvanajsterčkov v obeh vzorcih je bilo le 9: ,_ki_je_bil_/ ,_ki_je_bila/ _ki_je_bila_/ ,<<_je_rekel_/ _je_vprašal_/ <<_je_vprašal/ ?<<_je_vpraša/ _pripovedova in se_je_obrnil, trinajsterčkov 7: ,_ki_je_bila_/ <<_je_vprašal_/ ?<<_je_vprašal/ _se_je_obrnil/ _se_je_oglasi/

Tabela 31: Najpogostejši n-terčki v prvem vzorcu s frekvencami; presledek je označen z _

   1    2    3    4    5    6    7    8    9    10    11    12    13    14
   
1.   _2.533.799   e_427.712   je_176.964   _je_144.677   ,_da_35.897   _se_je20.728   _se_je_19.958   _je_bil_6.999   _je_bilo_5.061   _prijatelj1.674   ,_da_se_je_992   ,<<_je_rekel_688   ?<<_je_vprašal495   ,_kakor_da_bi_315
2.   e1.327.337   a_359.407   _je154.998   _in_86.675   e_je_27.153   se_je_20.394   _je_bil17.565   ,_da_je_5.832   _je_bila_4.424   a_je_bila_1.617   ,_kakor_da_983   _pripovedova546   _pripovedoval370   _se_je_zgodilo299
3.   a1.280.028   i_314.040   _po103.531   _se_68.110   a_je_26.354   _je_bi17.676   _kakor_7.241   _je_bilo5.642   _življenj2.572   _življenje1.327   ,_ki_se_je_953   <<_je_vprašal525   _je_odgovoril367   ?<<_je_vprašal_275
4.   o1.125.321   _s313.541   _se100.117   _da_43.182   ,_ki_22.771   je_bil17.588   _da_bi_7.051   ,_da_bi_5.169   _ni_bilo_1.939   _da_bi_se_1.195   ,_ki_je_bil929   ,_ki_je_bil_509   _kakor_da_bi_355   _je_bilo_treba228
5.   i1.113.539   o_308.474   _pr97.320   _pri37.807   _se_j22.703   _tudi_11.008   je_bil_7.006   je_bilo_5.066   _so_bili_1.737   _da_se_je_1.166   <<_je_rekel_887   ?<<_je_vpraša495   _se_je_zgodil324   _je_nadaljeval221
6.   n766.179   je264.492   _na92.672   ,_da36.619   se_je21.179   _tako_10.163   _da_je_6.843   ,_ki_je_5.019   a_je_bila1.728   _je_rekel_1.091   ,<<_je_rekel829   _pripravljen491   ,_ki_je_bila_324   _je_zdelo,_da_204
7.   l643.772   ,_263.668   in_89.305   _bil34.085   _je_b19.466   ,_da_s9.632   _njegov6.192   _je_bila4.616   prijatelj1.703   _kakor_da_1.080   ,_da_bi_se_829   ,_ki_jih_je_437   ,<<_je_odvrnil315   je_bilo_treba_196
8.   r609.580   _p253.713   _in88.407   _na_33.949   _je_p19.111   _bilo_8.803   ,_da_je5.876   je_bila_4.428   _je_rekel1.680   <<_je_rekel1.047   _je_vprašal784   <<_je_odvrnil414   ,_kakor_da_bi315   ,<<_je_odvrnil_191
9.   s606.674   _n217.991   se_76.669   _pre33.803   e_bil18.795   _je_po8.382   je_bilo5.648   ,_da_se_4.331   _prijatel1.674   _se_mu_je_1.009   ,_ki_ga_je_779   _bilo_treba_403   se_je_zgodilo299   <<_je_vzkliknil190
10.   j574.485   _j186.702   _za65.015   _so_32.464   je_bi17.915   _je_pr8.364   _so_se_5.547   a_se_je_4.306   _svojega_1.481   ,_da_se_je995   _življenje_692   _je_vprašal_387   <<_je_vprašal_293   prepričan,_da_182
11.   t516.061   _v168.785   ,_k60.909   e_je28.940   _sem_16.839   kakor_7.835   ,_da_se5.456   ,_kakor_3.884   _odgovori1.332   ,_kakor_da987   ,_potem_pa_638   je_odgovoril381   ega_življenja261   _prepričan,_da182
12.   v455.360   na146.630   _bi59.420   a_je28.018   o_je_16.513   ,_ki_s7.817   e_bilo_5.321   ,_ki_so_3.631   življenje1.328   ,_ki_se_je965   ,_ne_da_bi_610   pripovedoval371   _je_vzkliknil261   ?<<_je_vprašala179
13.   k432.708   ni145.845   la_54.804   ega_26.618   i_je_15.811   e_bil_7.356   ,_da_bi5.184   a_je_bil3.541   ,_vendar_1.312   o_je_bilo_963   _je_odvrnil608   _nekaj_časa_371   _Passepartout242   _drugi_strani_171
14.   d416.032   se143.604   da_54.219   e_bi23.332   a_se_13.530   da_je_7.348   _da_se_5.099   o_se_je_2.890   ,<<_je_rek1.270   _ki_se_je_962   ,_da_je_bil603   Passepartout369   <<_je_odvrnil_241   ,_kar_je_bilo_170
15.   m392.753   _k141.367   _da53.704   _pa_23.320   _svoj13.087   ,_ki_j7.317   _ki_je_5.089   _se_je_z2.646   a,_ki_je_1.256   _ki_je_bil942   _je_prišel_593   _je_odgovori367   ,_ki_so_bili_236   <<_je_odgovoril167
16.   p389.062   _d136.875   _ne53.601   se_j23.215   a_in_13.024   _kakor7.290   ,_ki_je5.061   _življen2.605   da_se_je_1.243   _odgovoril940   _popolnoma_576   _je_pomislil367   _se_je_obrnil231   <<_je_vprašala_160
17.   ,272.482   ra136.715   na_53.373   _ki_23.175   _in_s13.003   _bila_7.237   _in_se_4.871   _vendar_2.603   da_bi_se_1.215   ,_ki_je_bi932   _računalnik569   _je_odvrnil_365   je_bilo_treba228   _se_je_zasmeja156
18.   z247.782   po134.618   em_53.194   _ne_22.922   _tako12.981   da_bi_7.198   _lahko_4.718   življenj2.583   _da_bi_se1.213   ,_da_bi_se843   pripovedova547   ,<<_je_rekla_360   je_nadaljeval228   se_je_zasmejal155
19.   u233.933   st134.288   a_s52.182   ,_ki22.829   i_in_12.833   ,_da_j7.109   e_bila_4.626   i_je_bil2.455   _se_je_za1.202   ,<<_je_reke829   _pripovedov546   kakor_da_bi_355   _je_bilo_treb228   ,_ne_da_bi_se_154
20.   b228.457   al133.657   _v_50.936   je_p22.700   o_se_12.710   ,_kako7.107   je_bila4.620   _se_je_p2.452   _da_se_je1.170   je_vprašal825   <<_je_vpraša525   _kakor_da_bi355   _je_nadaljeva222   _se_je_oglasil153
21.   g196.137   il133.299   ko_50.243   ila_22.546   e_in_12.074   _da_bi7.072   a_se_je4.474   ,_ki_se_2.402   ,_da_bi_s1.165   _računalni818   _ki_je_bil_516   _predstavlja338   Passepartout_214   _je_vzkliknil_149
22.   č178.849   pr129.557   li_49.653   _bi_21.661   _kako11.616   ,_da_b7.012   _je_pri4.420   o_je_bil2.261   _se_je_po1.159   _je_vpraša799   pripravljen513   ,_ki_je_bila330   e_bilo_treba_207   ,_kakor_da_je_142
23.   .154.993   _i128.665   e_p47.600   sem_21.605   _je_z11.515   _da_je6.898   _ga_je_4.354   _ni_bilo2.246   ,_da_se_j1.153   _je_bilo_t794   ,_ki_jo_je_505   _ki_je_bila_328   _drugi_strani207   a_drugi_strani139
24.   h125.750   ko128.468   i_s47.075   ali_20.522   _tudi11.390   _je_za6.613   _nekaj_4.304   _sem_se_2.113   ko_se_je_1.151   _pa_se_je_792   ?<<_je_vpraš499   _pravzaprav_325   je_zdelo,_da_204   !<<_je_vzklikni139
25.   š120.117   in126.556   ga_44.437   je_b20.461   _da_s11.245   _da_se6.375   _mu_je_4.093   ni_bilo_1.940   _se_mu_je1.147   _še_vedno_790   _nadaljeval497   _se_je_zgodi325   _je_zdelo,_da204   _se_je_obrnil_137
26.   ž77.948   re124.223   a,_43.973   e_po20.431   tudi_11.207   o,_da_6.299   ,_kakor3.900   so_bili_1.913   _se_je_na1.138   _ki_ga_je_788   o_življenje491   se_je_zgodil324   _je_vprašala_203   _se_mi_je_zdel136
27.   c77.331   la123.822   pre43.926   ako_19.657   _je_v11.192   njegov6.200   _pa_je_3.840   ,_da_so_1.907   je_rekel_1.133   ,_ki_ga_je788   _pripravlje491   ,_kakor_da_b324   _je_bilo,_da_202   _je_odgovoril_135
28.   <<45.600   _z122.171   o_s43.648   e_pr19.464   _bil_11.096   _njego6.192   _gospod3.743   i_se_je_1.902   o_je_bilo1.125   i_so_bili_744   ,_ki_so_se_490   ,<<_je_dejal_319   <<_je_vprašala191   je_pripovedova133
29.   >>45.600   _t120.900   ne_43.598   _za_19.044   _je_s11.014   e_bilo5.958   _ki_so_3.690   _odgovor1.844   o,_da_je_1.123   _pripravlj744   _bilo_treba481   ,<<_je_odvrni315   <<_je_vzklikni190   <<_je_odvrnila_132
30.   P29.869   n_119.476   ti_42.800   ,_ka18.778   i_so_10.860   i,_da_5.842   ,_ki_so3.668   _zaradi_1.836   ,_ki_se_j1.105   _da_bi_bil740   <<_je_rekla_479   e_je_zgodilo299   prepričan,_da182   se_je_zgodilo_132
31.   T24.728   ne116.207   no_42.627   a_se18.651   o_in_10.825   _je_na5.827   _potem_3.574   _se_je_s1.832   _njegovo_1.103   _katerega_735   _naravnost_476   ,_da_je_bil_283   repričan,_da_182   ,_da_bi_lahko_128
32.   K23.950   li113.499   il_42.449   _sem18.391   tako_10.232   _svoje5.824   a_je_bi3.562   ,_potem_1.819   _so_bile_1.101   _je_bilo_v726   ,_ko_se_je_473   ,_medtem_ko_282   _prepričan,_d182   _se_je_spomnil126
33.   !22.920   _b112.852   _so41.880   o_je17.990   _bilo9.921   _so_se5.806   _ni_bil3.374   _njegove1.815   _se_je_pr1.099   a_je_bilo_725   ,<<_je_dejal471   _je_vprašala275   _kar_je_bilo_181   e_pripovedoval125
34.   N22.823   l_105.090   i,_41.715   prav17.407   _in_p9.816   so_se_5.585   _bi_bil3.253   ,_ko_je_1.798   _kakor_da1.096   _da_je_bil720   _njegovega_467   je_vzkliknil268   _katerega_je_179   _medtem_ko_je_122
35.   S20.634   da105.078   _ka41.669   _tak17.358   je_po9.750   govori5.560   _so_bil3.229   rijatelj1.789   kakor_da_1.080   računalnik712   ,_da_bi_bil460   ega_življenj267   ,_kar_je_bilo178   Jurij_Ljudevit121
36.   V19.123   ti104.037   ,_d41.505   _ni_17.356   je_pr9.700   _in_se5.524   govoril3.228   _so_bili1.777   ,_da_sem_1.068   življenje_692   ,_kakor_je_451   ga_življenja262   tem_trenutku_175   <<_je_nadaljeva120
37.   M17.819   en103.772   aj_41.191   o_se16.969   i_se_9.623   da_se_5.344   ,_kako_3.155   _vprašal1.765   ,_kar_je_1.065   _potem_pa_679   <<_je_dejal_447   em_trenutku_261   drugi_strani_171   _se_je_zdelo,_120
38.   ?15.751   _m103.599   ni_40.863   i_je16.915   _je_n9.604   ki_je_5.318   o_se_je3.135   _se_je_v1.764   _je_bil_p1.053   <<_je_dejal678   _ki_jih_je_442   _je_vzklikni261   i_bilo_treba_169   ,<<_je_odgovori120
39.   A15.472   _o102.415   pri40.525   ala_16.036   _drug9.585   _kater5.264   _svoje_3.048   je_rekel1.751   <<_je_reke1.047   _nekoliko_668   ,<<_je_rekla439   ,_v_katerem_259   <<_je_odgovori167   ega_gospodarja119
40.   B13.255   el101.436   bil39.837   e_na15.958   _pred9.356   _ki_je5.132   _vendar3.046   _ne_more1.734   računalni1.045   _ne_da_bi_668   ,_ki_jih_je438   _je_pogledal253   _po_stopnicah166   j_se_je_zgodil117
41.   I12.565   te97.897   e_s39.438   je_s15.430   _kot_9.313   _lahko5.075   _govori2.989   i_so_se_1.727   _pogledal1.025   ,_kjer_je_662   _tisti,_ki_432   a,_ki_se_je_250   _računalnikov165   aj_se_je_zgodi116
42.   O12.540   ka94.523   e,_38.651   _ga_15.050   _da_b9.144   ga_je_5.022   i_bilo_2.985   _veliko_1.714   ,_kakor_d1.023   i_je_bilo_659   _nekaj_časa425   e_bilo_treba245   _je_pomislila163   _je_pripovedov116
43.   :12.520   ri94.117   _st37.468   o_po14.866   _prav9.074   e,_da_4.973   _bi_se_2.975   prijatel1.703   se_mu_je_1.022   _pa_je_bil658   <<_je_odvrni414   o_življenje_243   _ne_da_bi_se_163   na_drugi_stran115
44.   Z12.468   m_93.476   _ko36.932   _kak14.543   bilo_9.053   ,<<_je_4.972   _vpraša2.946   _jih_je_1.695   ki_se_je_1.021   _ko_se_je_651   _prijatelji410   _Passepartou242   Phileas_Fogg_162   _na_drugi_stra115
45.   f10.719   no93.439   e_b36.523   _pos14.454   akor_8.505   in_se_4.961   _pogled2.935   _je_reke1.680   a_je_bil_1.020   ,_potem_pa649   ,_kakor_bi_406   _življenje,_242   _nisem_mogel_161   se_je_nasmehni113
46.   D10.331   em92.866   _ni36.505   e_za14.181   e_pri8.416   a,_da_4.937   ,_ki_se2.907   _prijate1.674   _gospodar1.009   je_odvrnil643   je_vprašal_405   e_nadaljeval239   ,_da_je_bilo_161   e_je_nasmehnil112
47.   J9.692   ve92.426   ih_36.403   _nje14.120   _da_j8.368   _velik4.936   _človek2.689   _je,_da_1.659   _je_dejal1.006   _življenja641   _je_govoril405   ,_ki_so_bili239   _kakor_da_je_159   _se_je_nasmehn112
48.   -8.651   ov89.293   so_36.274   udi_14.011   <<_je_8.319   je_pri4.921   se_je_z2.664   _da_bi_s1.638   i,_ki_so_1.004   _je_prišel640   bilo_treba_403   _ki_so_bili_238   e_pripovedova158   ,_kakor_da_se_110
49.   L8.590   aj88.774   o,_36.035   ilo_13.868   _ali_8.318   l,_da_4.917   ivljenj2.661   _se_je_o1.626   ,_ki_je_b986   _je_bila_p635   ripovedoval402   se_je_obrnil232   _je_še_vedno_158   _Passepartout_109
50.   ;8.548   ta82.405   ako35.993   a_po13.830   _je_o8.306   a_se_j4.855   vendar_2.648   <<_je_rek1.623   ki_je_bil984   i_je_bila_630   akor_da_bi_394   e_življenje_231   se_je_zasmeja156   ,<<_je_odvrnila109
51.   R7.901   za79.989   _ve35.804   _raz13.767   a_bi_8.279   e_bila4.838   življen2.638   _se_je_n1.623   i_je_bil_983   _ni_mogel_626   e_odgovoril391   Phileas_Fogg231   _se_je_zasmej156   lo_se_mu_je,_d108
52.   G7.300   od79.756   ki_35.764   je_v13.650   _je_t8.142   _in_po4.790   _proti_2.609   _pogleda1.598   ,_ki_jih_977   o_življenj622   _prav_tako_391   _se_je_obrni231   e_je_zasmejal155   o_se_mu_je,_da108
53.   ...6.746   le79.306   o_p35.294   o_pr13.626   bila_8.036   lahko_4.755   _je_pre2.609   _svojega1.516   l,_da_je_975   e_je_bilo_620   _je_odgovor385   je_nadaljeva229   _Phileas_Fogg155   _se_mu_je_zdel108
54.   Č5.643   bi78.900   nje35.076   _svo13.560   kakor8.026   _nekaj4.735   _življe2.607   _njegovi1.504   _ki_se_je974   ,_da_je_bi611   je_odgovori383   _spregovoril229   ,_ne_da_bi_se155   _se_mu_je,_da_108
55.   H4.146   lo78.441   ost34.755   _sta13.552   ,_kak7.958   ko_je_4.719   _je_rek2.539   svojega_1.482   i,_da_je_961   ,_ne_da_bi610   je_odvrnil_382   je_bilo_treb228   se_je_oglasil154   _je_odgovoril:107
56.   E3.496   an76.467   e_n34.430   _še_13.395   _ki_s7.933   _samo_4.622   _ko_je_2.518   ,_ampak_1.478   _ki_je_bi945   _je_odvrni608   _zato,_ker_374   _je_bilo_tre228   je_vzkliknil_153   _ne_more_biti_107
57.   Š3.330   nj75.104   ega33.266   in_s13.318   pravi7.668   _pred_4.611   se_je_p2.504   _najbolj1.475   odgovoril941   je_prišel_604   nekaj_časa_371   a,_ki_je_bil225   _se_je_oglasi153   ,_medtem_ko_je107
58.   F3.254   ja72.310   al_33.245   a_in13.299   _bila7.580   _ga_je4.499   i_je_bi2.460   _govoril1.472   _je_imel_931   ,_tako_da_604   e_življenje370   _je_nadaljev222   ,_da_je_bila_150   je_nadaljeval_106
59.   y3.056   ak69.848   lo_33.147   je_z13.261   je_za7.504   a,_ki_4.493   _ki_se_2.441   _skoraj_1.454   _je_tudi_930   _prepričan603   assepartout369   _mislil,_da_219   <<_je_odvrnila149   elo_se_mu_je,_105
60.   Ť2.980   v_69.639   sta33.002   svoj13.240   govor7.487   _mu_je4.344   _mi_je_2.440   ,_ki_ga_1.424   e,_ki_so_924   _je_dejal_602   Passepartou369   _mu_je_bilo_219   ,_kako_se_je_149   mikroračunalni105


Tabela 32: Najpogostejši n-terčki v drugem vzorcu s frekvencami; presledek je označen z _

   1    2    3    4    5    6    7    8    9    10    11    12    13    14
   
    1.   _376.859   e_67.455   je_28.622   _je_24.198   e_je_5.182   se_je_4.324   _se_je_4.064   ,_kakor_1.160   _je_bila_674   _kakor_bi_654   ,_kakor_bi_635   Peter_Majcen270   _Peter_Majcen180   l_Peter_Majcen151
    2.   e192.105   a_53.644   _je26.105   _in_16.493   ,_da_4.557   _se_je4.207   _je_bil2.409   _je_bil_974   _je_bilo_661   ,_kakor_bi636   eter_Majcen270   ,_kakor_bi_s184   Peter_Majcen_154   ,_kakor_bi_se_136
    3.   a191.828   _s49.407   _se17.599   _se_12.944   a_je_4.478   _je_bi2.418   _kakor_1.995   a_se_je_870   _kakor_bi656   eter_Majce270   Peter_Majce270   _Peter_Majce180   l_Peter_Majce151   ,_kakor_bi_bil89
    4.   i157.435   o_45.161   in_17.019   e_je5.510   se_je4.471   je_bil2.416   _in_se_1.562   ,_ki_je_866   kakor_bi_655   Peter_Majc270   ,_ki_se_je_262   eter_Majcen_154   _kakor_bi_se_139   _Peter_Majcen.79
    5.   o152.863   i_40.325   _in16.524   _da_5.056   _se_j4.402   kakor_2.051   ,_kakor1.161   ,_da_je_864   ,_kakor_b644   ter_Majcen270   ,_ki_je_bil222   l_Peter_Majc151   ,_kakor_bi_se137   _se_je_oglasil73
    6.   n107.030   je39.931   _po16.513   a_je4.785   _je_p3.256   _kakor1.997   je_bil_976   ,_da_bi_790   _življenj374   _je_rekel_269   _kakor_bi_s187   _kakor_bi_se140   ?<<_je_vprašal109   ekleta_strešni70
    7.   l95.889   _p38.248   se_14.573   se_j4.676   _in_s3.245   _in_se1.701   _pa_je_933   _je_bilo711   _je_rekel363   _ki_se_je_264   <<_je_rekel_185   kakor_bi_se_139   _kakor_bi_bil93   kleta_strešnic70
    8.   r93.670   ,_34.612   _pr12.602   _na_4.659   ,_ki_2.962   ,_kako1.681   _da_je_930   _je_bila695   _pogledal330   ,_ki_se_je263   _Peter_Majc180   ,_ki_je_bil_122   ,_kakor_bi_bi89   leta_strešnica70
    9.   s87.342   _j30.257   _na11.795   ,_da4.647   a_in_2.751   _tako_1.620   _da_bi_929   _kakor_b690   je_rekel_311   _pa_se_je_260   ,_da_se_je_172   <<_je_vprašal114   se_je_oglasil88   rekleta_strešn70
    10.   j80.632   _n28.420   _za10.909   _pri4.631   _je_b2.730   in_se_1.606   a_se_je921   je_bila_677   _se_je_po296   a_je_bila_244   _je_vprašal171   i,_kakor_bi_110   <<_je_prikimal81   ?<<_je_vprašal_70
    11.   t68.984   se24.141   la_9.935   _bil4.281   _kako2.686   _je_za1.482   _ki_je_875   akor_bi_664   _Temnikar291   _ki_je_bil223   ,_da_bi_se_162   ?<<_je_vpraša109   Peter_Majcen.79   zmajal_z_glavo69
    12.   k67.293   _v23.768   il_8.537   _pre4.254   _je_z2.571   _je_po1.450   ,_da_je867   je_bilo_663   ,_ki_se_j271   ,_ki_je_bi222   ter_Majcen_154   >>Tantadruj,_107   ,_ki_je_bila_78   _zmajal_z_glav69
    13.   v58.293   in22.032   ,_k7.927   _so_4.167   e_bil2.541   _tudi_1.438   ,_ki_je866   kakor_bi657   er_Majcen270   je_vprašal212   l_Peter_Maj151   _je_prikimal107   majal_z_glavo76   _Peter_Majcen_67
    14.   p56.467   il21.711   _bi7.868   _pa_4.067   je_bi2.446   _je_pr1.405   _pogled824   _se_je_z606   eter_Majc270   <<_je_rekel212   ,_potem_pa_148   e,_kakor_bi_105   _je_prikimal_76   Prekleta_streš65
    15.   m56.054   n_21.353   a_s7.730   ila_4.001   _sem_2.429   ,_da_s1.142   ,_da_bi790   _pogleda581   ki_se_je_270   _da_bi_se_211   akor_bi_se_141   o,_kakor_bi_104   _se_je_oglasi73   zamahnil_z_rok65
    16.   d54.124   ni21.238   e_p7.553   je_p3.742   o_in_2.392   ,_ki_s1.099   _njegov739   ,_da_se_562   Peter_Maj270   _življenje193   _popolnoma_141   ,<<_je_rekel_104   <<_je_vprašal_72   _zamahnil_z_ro65
    17.   z37.076   la21.156   da_7.314   e_po3.380   e_in_2.387   ,_ki_j1.088   ,_da_se733   _se_je_p554   ter_Majce270   kakor_bi_s187   kakor_bi_se140   a,_kakor_bi_98   ekleta_strešn70   avnikarjev_str64
    18.   ,35.978   _k21.028   _v_7.162   in_s3.320   o_je_2.378   ,_da_b1.087   _ga_je_724   a_je_bil490   _ki_se_je265   _pogledal_181   _naravnost_125   kakor_bi_bil93   eta_strešnica70   nikarjev_stric64
    19.   b32.573   _i20.955   em_7.116   e_bi3.216   i_je_2.210   _bilo_1.077   _so_se_723   _vprašal484   a_je_bila262   _Peter_Maj180   _ki_je_bil_122   _kakor_bi_bi93   kleta_strešni70   ravnikarjev_st64
    20.   u29.635   _z20.416   aj_6.985   _bi_3.174   _svoj2.201   e_bil_1.017   je_bilo713   o_se_je_473   pa_se_je_261   _da_se_je_176   _še_enkrat_122   ,_kakor_bi_b93   leta_strešnic70   Travnikarjev_s64
    21.   g28.821   ra20.310   na_6.975   sem_3.150   a_se_2.198   da_je_1.008   _je_pri704   _počasi_469   _pa_se_je261   _glavo_in_173   je_prikimal119   Travnikarjev90   rekleta_streš70   vnikarjev_stri64
    22.   .27.479   l_20.067   _ne6.903   e_pr3.022   _tako2.192   _bila_1.005   je_bila698   ,_ki_so_452   _se_je_za256   _je_vpraša172   ,<<_je_rekel118   e_je_oglasil88   zmajal_z_glav69   amahnil_z_roko63
    23.   č25.993   po19.984   ko_6.658   _ki_2.991   i_in_2.180   ,_da_j1.001   kakor_b694   ,_ki_se_447   ,_ker_je_255   ,_da_se_je172   _nepremično115   se_je_oglasi88   _zmajal_z_gla69   <<_je_prikimal_63
    24.   š17.923   al19.966   _ka6.650   ,_ki2.970   akor_2.132   _pa_je981   e_bila_691   je_rekel425   _se_je_na251   _nasmehnil171   <<_je_vpraša114   _je_vprašal_85   _Travnikarjev68   e_je_popraskal61
    25.   h17.898   re18.778   i_s6.478   _kak2.949   _je_s2.129   _in_po969   _vpraša691   i_se_je_408   _in_se_za244   ,_nato_pa_168   >>Tantadruj,113   <<_je_prikima83   <<_je_ponovil_67   se_je_popraska61
    26.   c12.741   na18.629   al_6.410   ega_2.941   kakor2.055   a_se_j962   e_bilo_688   _se_je_v403   a,_ki_je_241   _se_mu_je_166   Tantadruj,_112   ,_ker_se_je_81   amahnil_z_rok65   _se_je_poprask61
    27.   ž11.443   ko17.723   _da6.406   ala_2.932   <<_je_2.000   pa_je_946   akor_bi666   Temnikar402   e_vprašal239   ,_da_bi_se165   i,_kakor_bi110   je_prikimal_80   Prekleta_stre65   <<_se_je_popras59
    28.   <<7.547   _t17.288   ako6.389   _ga_2.914   _je_v1.966   da_bi_944   kor_bi_664   _se_je_s402   ,_da_bi_s236   er_Majcen_154   ?<<_je_vpraš110   _nepremično_80   zamahnil_z_ro65   la_Temnikarica58
    29.   >>7.547   st17.144   e_s6.374   _ne_2.909   o_se_1.863   _da_je935   _mu_je_664   _skoraj_396   ,_ki_je_b233   _je_stopil154   _je_prikima109   eter_Majcen.79   _zamahnil_z_r65   al_Peter_Majce52
    30.   !6.092   ka16.891   _st6.324   ako_2.904   _in_p1.848   _rekel931   se_je_z652   _se_je_o388   _se_je_pr228   _potem_pa_152   _je_počasi_108   _je_ponovil_79   avnikarjev_st64   e_je_nasmehnil52
    31.   T5.166   pr16.753   ga_6.222   a_se2.889   ,_kak1.803   _da_bi930   pogleda634   <<_se_je_381   ki_je_bil227   l_Peter_Ma151   _je_stopil_108   _ki_je_bila_79   ikarjev_stric64   se_je_nasmehni52
    32.   P4.861   _b16.606   ne_6.206   je_z2.875   in_se1.746   _zdaj_926   _da_se_606   _sem_se_378   _ki_je_bi223   _še_enkrat150   _s_svojimi_106   ,_ki_je_bila79   nikarjev_stri64   il_Peter_Majce51
    33.   N4.044   _d16.213   o_s6.181   je_b2.869   n_se_1.723   ki_je_896   se_je_p574   življenj374   _prikimal218   ,_potem_pa148   e,_kakor_bi105   <<_je_ponovil78   ravnikarjev_s64   Peter_Majcen_j49
    34.   S3.940   ne15.524   no_6.116   e_za2.867   je_za1.665   _svoje893   _je_rek574   _življen374   _da_bi_se215   akor_bi_se142   o,_kakor_bi104   ajal_z_glavo76   Travnikarjev_64   _je_popraskal_49
    35.   -3.931   da15.182   e_j5.947   nil_2.838   je_po1.629   pogled880   _bi_se_568   i_je_bil363   je_vpraša214   _popolnoma142   _Temnikaric104   majal_z_glav76   vnikarjev_str64   _ponovil_Matic49
    36.   K3.562   el14.927   a,_5.925   ,_ka2.830   tako_1.625   _ki_je875   ,_toda_553   _je_reke363   _potegnil214   kor_bi_se_141   Temnikarica102   _se_je_oglas73   mahnil_z_roko63   se_je_oglasil_48
    37.   V3.147   _o14.638   nil5.828   kako2.797   i_se_1.618   !<<_je_861   _svoje_540   pogledal359   da_bi_se_212   popolnoma_141   ,_kakor_je_102   _Temnikarica73   ,_nato_pa_je_62   _obema_rokama_48
    38.   ?3.076   li14.428   o_p5.678   je_s2.780   je_pr1.563   _samo_859   ,_kako_516   _in_se_z340   <<_je_reke212   _potegnil_140   je_vprašal_101   ekleta_streš70   a_Temnikarica61   _se_je_nasmehn48
    39.   M3.060   aj13.635   _pa5.641   _po_2.764   i_so_1.509   _pogle857   _počasi496   l_se_je_339   _s_svojim205   _naravnost137   a,_kakor_bi99   eta_strešnic70   e_je_popraska61   ,<<_se_je_popra48
    40.   I2.494   ri13.544   li_5.553   a_in2.752   _tudi1.494   _in_za846   _rekel_494   _se_je_n335   _je_rekla203   Temnikaric134   e_nasmehnil99   kleta_strešn70   se_je_poprask61   ajpak,<<_se_je_47
    41.   :2.476   _m13.188   e_b5.475   _tak2.745   _bil_1.467   ,_ker_835   o_se_je493   _vendar_333   _je_spet_201   _je_rekla_132   _prav_tako_99   leta_strešni70   _je_popraskal61   eter_Majcen_je47
    42.   Q2.324   en13.156   a_j5.361   _sem2.672   _prav1.454   _je_na823   a_je_bi492   _je_tako328   _ni_bilo_201   ,_kako_je_128   _kakor_bi_b97   rekleta_stre70   _se_je_popras61   Hm,_kajpak,<<_s47
    43.   Z2.223   za13.124   pre5.321   o_je2.620   _je_n1.450   gledal813   vprašal488   _povedal324   i,_kakor_196   _nekoliko_127   ,_da_je_bil97   ta_strešnica70   <<_se_je_popra59   kajpak,<<_se_je47
    44.   O2.178   ti12.966   _so5.293   o_po2.558   tudi_1.441   l,_da_812   ,_ki_se486   <<_je_rek318   _svojega_196   naravnost_125   _je_ponovil95   zmajal_z_gla69   la_Temnikaric58   m,_kajpak,<<_se47
    45.   D1.736   m_12.932   e_z5.279   o_in2.394   _je_t1.393   ga_je_806   _stopil477   e_rekel_317   življenje193   o_je_bilo_125   akor_bi_bil94   _zaničljivo_69   _obema_rokama58   >>Hm,_kajpak,<<_47
    46.   B1.590   ta12.768   ,_d5.224   e_in2.389   _je_o1.387   _spet_800   _nekaj_474   _stopil_312   ,_da_se_j192   ki_je_bil_123   kakor_bi_bi93   _zmajal_z_gl69   _se_je_obrnil57   ter_Majcen_je_47
    47.   A1.520   em12.749   bil5.207   i_je2.373   _in_z1.371   _da_se785   počasi_471   se_je_po307   akor_bi_s190   je_prikima122   ,_ki_ga_je_93   _pripovedova68   _je_nasmehnil56   _kajpak,<<_se_j47
    48.   J1.284   te12.280   i,_5.131   prav2.366   gleda1.306   je_pri780   _pa_se_463   _ker_je_302   Tantadruj188   še_enkrat_122   je_ponovil_92   _Travnikarje68   _in_se_zamakn55   ,_kajpak,<<_se_47
    49.   f1.122   no12.215   e,_5.066   o_se2.347   _da_b1.255   _je_re759   _lahko_459   _Temnika292   il_se_je_187   _nepremičn122   _ker_se_je_91   _zamahnil_z_68   _naravnost_v_53   el_Peter_Majce46
    50.   L988   ak11.796   ila4.982   je_v2.328   e_pri1.239   _vpraš757   _ki_so_456   se_je_za291   _je_tudi_187   _odgovoril122   _življenje_91   _zaradi_tega68   al_Peter_Majc52   e_popraskal_km46
    51.   R960   ve11.355   ni_4.930   _ni_2.318   l_je_1.232   _so_se751   _potem_455   o_je_bil290   e_počasi_185   e_prikimal121   ravnikarjev90   _karabinjerj67   e_je_nasmehni52   je_popraskal_k46
    52.   ;905   ar11.039   e_n4.911   _svo2.242   _da_s1.229   _ga_je750   ,_ki_so452   _da_bi_s290   o,_kakor_184   Tantadruj,120   Travnikarje90   amahnil_z_ro65   se_je_nasmehn52   popraskal_kmet46
    53.   H822   le10.933   o,_4.894   svoj2.209   _bilo1.206   e_bilo742   _ki_se_451   _prikima283   _je_tako_184   _je_takoj_119   _je_oglasil89   mahnil_z_rok65   tem_trenutku_52   z_obema_rokama46
    54.   Č769   bi10.323   pri4.868   tako2.204   l_in_1.201   njegov740   _svojo_448   a_in_se_282   _se_mu_je184   _prikimal_118   e_je_oglasi88   Prekleta_str65   il_Peter_Majc51   _popraskal_kme46
    55.   Ž655   j_10.140   e_v4.864   i_in2.186   nila_1.190   _njego739   e_rekel440   _ki_se_j274   e,_kakor_183   ,<<_je_reke118   se_je_oglas88   se_je_obrnil65   _in_se_obrnil51   _Prekleta_stre46
    56.   G645   od9.890   _ni4.824   e_na2.184   _in_n1.168   i,_da_734   _se_mu_429   ki_se_je271   pogledal_181   _začudeno_116   <<_je_rekla_84   zamahnil_z_r65   eter_Majcen_j49   _z_obema_rokam46
    57.   Š567   lo9.776   a_p4.708   kor_2.169   bila_1.156   la_in_729   _bi_bil428   er_Majce270   da_se_je_180   nepremično115   <<_je_prikim83   ,_ker_je_bil65   je_popraskal_49   ak,<<_se_je_pop45
    58.   -532   ro9.560   ti_4.662   _še_2.163   _pred1.131   so_se_729   _je_pre428   eter_Maj270   _nasmehni180   <<_je_vpraš115   ,_ki_so_se_83   avnikarjev_s64   ponovil_Matic49   jpak,<<_se_je_p45
    59.   U413   v_9.526   so_4.659   akor2.151   _se_p1.115   e_je_z721   _sem_se428   Peter_Ma270   _Peter_Ma180   _kakor_je_115   e_prikimal_81   a_Temnikaric64   _ponovil_Mati49   k,<<_se_je_popr45
    60.   ş378   ga9.458   _bo4.640   _za_2.149   _ki_s1.110   e_bila716   je_reke425   r_Majcen270   o_pogleda177   je_ponovil114   ki_je_bila_81   ikarjev_stri64   e_je_oglasil_48   pak,<<_se_je_po45

se_je_oglasil in tem_trenutku_, štirinajsterčkov pa le še 5 (oziroma še manj): ?<<_je_vprašal_/ _se_je_nasmehn/ e_je_nasmehnil/ se_je_nasmehni in _se_je_oglasil. Splošnost prvega vzorca v celoti vzdrži do n = 10, ko opazimo prvi niz, ki se ga da umestiti v konkretno delo. Kot po navadi je iz prevoda: niz _računalni s frekvenco 818 je iz dela R. Cringelyja Naključni imperiji (ali Kratka zgodovina Silicijeve doline). Vendar so tudi še pri n = 14 le trije "konkretni" nizi med prvimi 60-timi: Jurij_Ljudevit iz novele Ivana Tavčarja: Janez Sonce, _Passepartout_ iz prevoda Julesa Verna V osemdesetih dneh okoli sveta in mikroračunalni iz že omenjenega prevoda R. Cringelyja. Drugi vzorec je manjši in tako najdemo prvi konkretni niz, Temnikar že pri osmerčkih, pri štirinajsterčkih pa jih je kar 22, to je 37 %, od tega 16 iz Balade o trobenti in oblaku.

N-terčke znakov je mogoče uporabiti tudi za identifikacijo jezika, v katerem je besedilo. O tem je poročal Gregory Grefenstette v članku, kjer so bili primerjalno obdelani trojčki iz prvih milijon znakov enakih besedil v desetih jezikih Evropske unije, ki so izšla na cederomu (Grefenstette 1995). Jeziki so angleški, danski, francoski, nizozemski, italijanski, nemški, norveški, portugalski in švedski. V tabeli 33 je najpogostejših 12 trojčkov za slovenski jezik (oba vzorca skupaj) in omenjenih deset jezikov, kjer je bil kot vir upoštevan omenjeni članek.

Tabela 33: Najpogostejših 12 trojčkov v slovenskem in desetih jezikih EU

   Slo    Ang    Dan    Fra    Niz    Ita    Nem    Nor    Por    Špa    Šve
1.   je_    _th    er_    _de    en_    _di    en_    et_    _de    _de    en_
2.   _je    he_    en_    es_    de_    to_    er_    en_    de_    de_    er_
3.   _po    the    for    de_    _de    _de    _de    er_    os_    os_    et_
4.   _se    nd_    et_    ent    et_    di_    der    _de    do_    _la    tt_
5.   _pr    ed_    ing    nt_    an_    _co    ie_    _ha    que    el_    _de
6.   in_    _an    _fo    _le    n_d    la_    ich    an_    _qu    la_    ar_
7.   _in    and    _af    e_d    _he    re_    sch    de_    _co    que    för
8.   _na    _to    _de    le_    er_    ion    ein    det    as_    as_    om_
9.   se_    ing    nde    ion    _va    ent    che    ar_    ent    ue_    _oc
10.   _za    to_    els    s_d    van    e_d    die    _og    ăo_    _qu    ch_
11.   ,_k    ng_    lse    e_l    een    le_    ch_    og_    ue_    _co    de_
12.   _bi    er_    ret    _la    ver    o_d    den    te_    _a_    _en    och

Od 120 trojčkov neslovenskih jezikov iz zgornje tabele je kar 76 različnih. Tistih s frekvenco več kot 1 je 22: _de (9), de_ (6), er_ (6), en_ (5), et_ (4), _co (3), ent (3) in _la, _qu, an_, ar_, as_, ch_, e_d, ing, ion, la_, le_, os_, que, to_, ue_ s frekvenco 2. Med vsemi 76 pa ni niti enega, ki bi ga našli tudi med najpogostejšimi slovenskimi. Zelo zanimiva bi bila še primerjava z jeziki, ki so slovenskemu bolj sorodni od zgornjih germanskih in romanskih, kot se je to delno posrečilo pri primerjavi najpogostejših besed.


5.2 Besede

Čeprav so osnovni gradniki pisanega besedila znaki, so besede tisto, kar nekako sami od sebe najprej povežemo z jezikom. Tudi obseg besedilnih zbirk je bil od prvega, Brownovega korpusa naprej vedno merjen v besedah. Pri dosedanjih kvantitativnih raziskavah slovenskega jezika, tudi zaradi velikosti besedilnih vzorcev, pri besedah ni bilo mogoče dlje kot do obdelave besednih oblik kot takih, samih zase. Iz tabele najpogostejših besednih n-terčkov na strani 70 je videti, da frekvence s povezovanjem več besed izredno hitro padajo in tako tudi ta, doslej največja besedilna zbirka nenadoma ni več tako velika, kot bi si človek želel. V tem razdelku so obravnavane besedne oblike (v nadaljnjem imenovane besede), v poglavju o oblikoslovnem označevanju pa še besedne leme, osnovne oblike, ki jih je avtor poiskal za besedila drugega vzorca. V tabeli 34 je navedenih nekaj splošnih podatkov o besedah iz obeh vzorcev. Po stolpcih si sledijo število vseh besed, število različnih besed, število enkratnic, to je besed, ki nastopajo samo enkrat, povprečna frekvenca besede in povprečna dolžina besed.

Tabela 34: Podatki o besedah v obeh vzorcih

                Vseh    Različnih        Povprečna    Povprečna
                besed    besed    Enkratnic   frekvenca    dolžina
    
Prvi vzorec      2.721.416    174.579    84.800    15,59    4,58
Drugi vzorec      407.938     40.475    20.110    10,08    4,38
    
Skupaj           3.129.354    184.052    87.812    17,01    4,55

Pri štetju različnih besed je bila začetnica besed ohranjena - besede, pisane z veliko začetnico na začetku povedi, so bile štete kot take in niso bile pretvorjene v malo. Ta postopek je bil opravljen kasneje, na besedah drugega vzorca, v poglavju o oblikoslovnem označevanju. Kot je videti iz tabele, se je v prvem vzorcu vsaka beseda pojavila povprečno 16 krat, v drugem pa 10 krat. Glede na to, da je prvi vzorec skoraj osemkrat večji od drugega, kaže ta razmeroma majhna razlika na dokaj veliko pestrost in majhno homogenost prvega. Tudi povprečna dolžina besed kaže na to, da je drugi vzorec, v celoti gledano, bolj gibek od prvega. Skupna povprečna dolžina je za 0.11 manjša od dolžine, ki so jo namerili raziskovalci s fakultete za elektrotehniko (Kristan idr. 1994). Opazen je tudi zelo velik delež besed, ki se pojavijo samo enkrat. V obeh vzorcih je takih med različnimi skoraj polovica.

5.2.1 Rast besednega zaklada

Kako hitro se polni besedni zaklad obeh vzorcev skupaj, se najbolje vidi iz krivulje rasti, ki je prikazana na sliki 11. Krivulja je pollogaritemska -

Slika 11: Krivulja rasti za besede v obeh vzorcih

na osi x so dvojiški logaritmi zaporednih številk besed v seznamu (i), ki je padajoče urejen po pogostostih besed (pi) - najpogostejša beseda je prva, druga najpogostejša druga . . ., na osi y pa je skupna vsota frekvenc besed v odstotkih od celote:

Za boljšo ponazoritev so v tabeli 35 navedene relativne pogostosti (delež od celote) za

Tabela 35: Najpogostejših 64 besed iz obeh vzorcev z relativnimi frekvencami

   je5,63   ne0,90   s0,53   to0,36   kakor0,30   sta0,24   me0,20   nekaj0,16
   in3,31   ki0,84   po0,51   bilo0,36   ali0,29   pri0,23   več0,18   naj0,16
   se2,65   bi0,80   še0,51   od0,34   jo0,28   kar0,23   samo0,18   kako0,16
   v1,86   z0,70   tako0,42   že0,34   bila0,28   kaj0,22   ti0,17   tem0,16
   da1,56   za0,68   bil0,42   bo0,33   mi0,27   o0,22   lahko0,17   ji0,15
   na1,24   sem0,67   tudi0,41   iz0,32   In0,26   če0,21   ker0,17   Ko0,15
   so1,19   ni0,66   si0,41   ko0,32   vse0,26   do0,21   pred0,17   ob0,15
   pa0,91   ga0,59   mu0,41   kot0,31   jih0,25   k0,20   V0,17   potem0,14

najpogostejših 64 besed v seznamu obeh vzorcev. Prva pika na krivulji je delež besede je (5,63 %), druga vsota deležev besed je in in (8,94 %), tretja besed je, in in se (11,58 %) in tako naprej. Iz krivulje je videti, da s prvimi 16 besedami zajamemo 25 % vsega besedila, s 64 besedami (navedene so v tabeli 35) malo manj kot 40 % (37,08 %), z 256 približno polovico, s 4.092 tri četrtine, za 90 % pa je potrebnih že 32 K besed. Potek krivulje je dokaj regularen približno do n = 32, potem sledi hrbet v območju do n = 128 in spet lep potek do približno n = 100.000, potem pa je jasno viden zlom krivulje na mestu (označeno je s kratko pokončno črtico), kjer nastopijo enkratnice, besede s frekvenco 1.

Zanimiva je primerjava te krivulje s krivuljo (Jakopin 1998), ki jo dobimo za besede v korpusu Bank of English (stanje iz leta 1996, seznam besed in frekvenc je odstopil Jeremy Clear).

Slika 12: Krivulja rasti za besede v Bank of English (1996)

V tem korpusu je bilo 203.648.478 besed, od tega 633.165 različnih in od teh 291.133 takih s frekvenco 1 (enkratnic). Povprečna frekvenca besede je bila 322, krivulja pa je navedena na sliki 12. Na njej opazimo v prvem delu podobno nihanje kot na sliki 11, le da je vzpon seveda hitrejši, 90 % doseže že pri 8 K in potem se asimptoti (100 %) zelo počasi približuje na skoraj tretjini svojega poteka. Nepravilnost na koncu, ki pa ni jasno vidna, spet povzročijo enkratnice.

Podobno kot n-terčke znakov je mogoče tudi najpogostejše besede uporabiti za identifikacijo jezika. V že omenjenem članku (Grefenstette 1995) je avtor za statistično ugotavljanje jezika uporabil najpogostejše kratke besede (do 5 črk). V tabeli 36 so navedene najpogostejše kratke besede za slovenski jezik, jezik Bosanskega korpusa na univerzi v Oslu (Leko 1998) in za 10 jezikov Evropske unije, istih kot v tabeli 33.

Tabela 36: Najpogostejših 12 kratkih besed (do 5 črk) v slovenskem in še enajstih jezikih

   Slo    Srh    Ang    Dan    Niz    Fra    Ita    Nem    Nor    Por    Špa    Šve
1.    je    i    the    i    de    de    di    der    og    de    de    och
2.    in    je    and    af    van    la    e    die    det    a    la    i
3.    se    u    to    og    het    le    il    und    han    que    que    att
4.    v    da    of    at    een    et    che    den    i    o    el    som
5.    da    se    a    til    en    des    la    in    er    e    en    en
6.    na    na    in    for    in    les    a    von    på    do    y    är
7.    so    su    was    en    dat    du    in    zu    til    da    a    på
8.    pa    ne    his    om    is    en    per    dem    at    no    los    det
9.    ne    a    that    der    te    un    del    für    som    um    del    av
10.    ki    to    I    er    op    que    un    mit    var    em    se    för
11.    bi    od    he    U    voor    a    non    das    jeg    para    por    med
12.    z    za    as    ikke    met    qui    i    des    med    com    las    den

Slovenske besede so vzete iz obeh vzorcev skupaj in so kar vse - med prvimi dvanajstimi namreč ni nobena daljša kot 2 črki. Tokrat je med 132 besedicami v drugih jezikih 92 različnih. Takih s frekvenco nad 1 je 24: a (6), en (5), i (5), de (4), in (4), la (3), que (3) in at, da, del, den, der, des, det, e, er, med, og, , se, som, til, to, un s frekvenco 2. Kot je ugotovil že Grefenstette, so najpogostejši trojčki vseeno boljši indikator od najpogostejših besed. Presek med slovenskim in drugimi jeziki namreč pri besedah ni prazen - v njem najdemo šest pogostih besedic: da, in, je, na, ne in se. In se pojavi še pri angleškem, italijanskem in nemškem jeziku, da pri portugalskem in srbskem/hrvaškem, se pri srbskem/hrvaškem in španskem, je, na in ne pa še pri srbskem/hrvaškem.

5.2.2 Dolžine besed

Parameter, ki veliko pove o zvrsti besedila, so dolžine besed. V leposlovju so krajše kot v tehničnih besedilih, v delih z dialogom spet krajše kot v opisnih stavkih. V tabeli 37 so navedene poprečne dolžine vseh besed in različnih besed za oba vzorca.

Tabela 37: Povprečne dolžine vseh besed in različnih besed v obeh vzorcih

               Vseh    Povprečna   Standardni    Različnih    Povprečna    Standardni
               besed    dolžina    odklon    besed    dolžina    odklon
 
Prvi vzorec    2.721.416    4,58    2.60    174.579    8,12    2.33
Drugi vzorec    407.938    4,38    2.44     40.475    7,44    2.12
 
Skupaj         3.129.354    4,55    2.57    184.052    8,00    2.31

Še posebej pri povprečnih dolžinah različnih besed je zelo očitna razlika med prvim in drugim vzorcem. Tega ni več mogoče pripisati večji količini premega govora v Kosmačevem opusu, ampak tudi temu, da je njegova pripoved bolj tekoča (Štih 1958). Dobljene vrednosti za različne besede so manjše od tistih za samostalnike iz Slovarja slovenskega knjižnega jezika (Jakopin 1996b).

V tabelah 38, 39 in 40 so navedene najdaljše besede v obeh vzorcih in v Bank of English - pred vsako besedo je izpisana njena dolžina. V tabeli 39 so bila izvzeta večbesedna imena, v tabeli 40 pa je bilo že v viru vse pisano z malo

Tabela 38: Najdaljše besede v prvem vzorcu

1.   57   prijatelj-sovražnik-prijateljsovražnik-sovražnikprijatelj
2.   45   klik-klik-klik-klik-klik-klik-klik-klik-TRESK
3.   37   ti-hojlarija-hojlarija-hojlarija-drom
4.   28   hodi-hodi-prestopi-hodi-hodi
5.   27   ti-hojlarija-hojlarija-drom
6.   27   petnajststošestinpetdesetem
7.   26   pasti-drug-drugemu-v-objem
8.   26   petstošestinsedemdesetkrat
9.   26   petnajstimi-minutami-slave
10.   26   sedemstodevetindvajsetkratTabela 39: Najdaljše besede v drugem vzorcu

1.   30   tisočdevetstodvaintridesetkrat
2.   22   stoštiriinštiridesetih
3.   20   petintridesetletnega
4.   19   literarnokritičnemu
5.   19   petinosemdesetletni
6.   19   dvaindvajsetletnemu
7.   19   kakršnegakolisibodi
8.   18   triinštiridesetega
9.   18   javolheršturmfirer
10.   18   sedemstosedemdesetTabela 40: Najdaljše besede v Bank of English

1.   65   confidenceunderstandingcreativitycollaborationexcellenceenjoyment
2.   60   weeeeeeeeaaaaarrrdddrrraaaaaaannnnggggnnnneeeeaaaarrrrrwwwww
3.   58   llanfairpwyllgwyngyllgogerychwyrndrobwlllantysiliogogogoch
4.   58   officialpeacehappinessstrudelbeerflagscelebrationshysteria
5.   58   whatchurchfestivalinfebruaryiscelebratedwithlightedcandles
6.   54   fightthepowerlouderthanabombblacksteelinthehourofchaos
7.   53   verordnetenfriedefreudestrudelbierfahnenfeierhysterie
8.   52   dandybeanotoppervictorhotspurhornethurricanedianabun
9.   52   takethepowerbackbombtrackfistfulofsteelknowyourenemy
10.   43   pneumoultramicroscopicsilicovolcanoconiosis

začetnico. Po pričakovanju je povsod najti predvsem večbesedne sestavljenke, če sem štejemo tudi števila. Teh je v tabeli prvega vzorca 3, drugega 7, med najdaljšimi besedami zbirke Bank of English pa prav na vrh niso mogla.

Zanimive so še porazdelitve dolžin besed, vseh na sliki 13 in različnih na sliki 14. Stolpci prvega vzorca so spet označeni s črno barvo, drugega pa z belo.

Slika 13: Porazdelitev dolžin vseh besed v obeh vzorcih

Do vključno dolžine 6 so v vseh primerih, razen pri dolžini 3, vrednosti v drugem vzorcu večje kot v prvem, potem pa ves čas do konca nižje. Ker je tudi povprečna dolžina besed v drugem vzorcu manjša (glej tabelo 31) je tak potek pričakovan. Konica pri dolžini 2 (vezniki, pomožni glagol je) je pri obeh vzorcih bistveno višja, kot so jo namerili v predhodni raziskavi (Kristan idr. 1994), sicer pa je potek podoben. Razliko gre pripisati bolj tekočemu jeziku v vzorcih te naloge; predhodni vzorec je vseboval tudi časopisni jezik.

Slika 14: Porazdelitev dolžin različnih besed v obeh vzorcih

Tokrat imamo opravka s precej pravilnima krivuljama, ki pa nimata vrha na istem x. Največ različnih besed pri prvem vzorcu je dolgih 8 črk, pri drugem pa 7.

5.2.3 Najpogostejše besede

V tabelah 42, 43, 44 in 45 na naslednjih straneh so najpogostejše besede iz prvega in drugega vzorca, urejene po frekvencah in po abecedi. Tabeli 42 in 34 odkrivata 250 najpogostejših besednih oblik v vsakem vzorcu. Ker je bil oblikoslovno označen in lematiziran samo drugi vzorec, je treba nekaj sklepov potegniti že iz teh podatkov. Izkaže se, da je prvih 6 besed v obeh seznamih (je, in, se, v, da in na) istih in na istih mestih (brez upoštevanja mest 9 besed), da obsega presek najpogostejših 50 besed v obeh vzorcih 42 besed, presek 100 najpogostejših 86 besed, prvih 250 pa 180 besed. Jezik Cirila Kosmača se je torej razmeroma dobro ujel z jezikom v prvem vzorcu.

Pogled na tabelo 42 tudi razkrije, da je našlo pot v seznam prvih 250 besed eno samo ime (Bog na 147. mestu), ki pa tudi ni značilno samo za eno delo. Absolutne frekvence se začnejo s 150.984 in končajo z 953, relativne frekvence (delež celote) se začnejo pa na 5,55 % (je) in končajo na 0,0350 % (kdaj). Samostalnikov, glagolov in pridevnikov je malo, prevladujejo zaimki, prislovi, vezniki in predlogi.

Drugi vzorec je veliko manjši in se zato ne more pohvaliti s tako splošnim seznamom najpogostejših besed. V tabeli 43 zato najdemo imena Peter, Martin, Matic, Sova, Majcen, Drejc, Temnikar, Tantadruj, Stane in Venc, ki jih z lahkoto umestimo v konkretno črtico ali roman. Absolutne frekvence se začnejo pri 25.798 in končajo pri 161, relativne pa pri 6,32 % in končajo pri 0,0395 %, kar je oboje precej nad vrednostmi v prvem vzorcu. Delež samostalnikov, glagolov in pridevnikov je večji kot pri prvem vzorcu, a še vedno majhen.

V tabeli 41 je navedenih najpogostejših 20 samostalnikov iz obeh vzorcev, pri čemer so bili za prvi vzorec le ocenjeni (iz oblik v tabeli 42), za drugi vzorec pa

Tabela 41: Najpogostejši samostalniki iz vsakega vzorca s frekvencami

1.   dan3.300         1.   roka1.577
2.   ljudje2.939         2.   glava985
3.   roka2.895         3.   oči833
4.   čas2.792         4.   otrok821
5.   oči2.584         5.   dan749
6.   leto2.068         6.   hiša700
7.   človek1.683         7.   leto628
8.   oče1.674         8.   vrata536
9.   glava1.583         9.   beseda513
10.   obraz1.369         10.   oče486
11.   gospod1.354         11.   človek453
12.   življenje1.337         12.   glas438
13.   stran1.298         13.   srce424
14.   pot1.267         14.   vas414
15.   glas1.173         15.   obraz396
16.   noč1.092         16.   miza392
17.   beseda1.071         17.   noga384
18.   mož1.052         18.   življenje373
19.   mati1.033         19.   ljudje369
20.   svet997         20.   voda362

so mesta in frekvence točni, saj izhajajo iz lematiziranega besedila. V obeh seznamih nastopa polovica, to je 10 samostalnikov: beseda, človek, dan, glava, leto, ljudje, oče, oči, roka, in življenje. Enajsti bi utegnil biti vas, a ga v prvem vzorcu ni bilo mogoče enostavno ločiti od enakega zaimka.

V tabelah 44 in 45 so iste besede kot v tabelah 42 in 43, le da so tokrat urejene abecedno in so jim v oklepaju dodani še rangi iz frekvenčno urejenih seznamov. Tako je mogoče za iskano besedo iz prvega ali drugega vzorca takoj ugotoviti, ali je med prvimi 250 in kateri je njen rang po pogostosti.

Tabela 42: Najpogostejše besedne oblike iz prvega vzorca s frekvencami

   1. je150.984   51. lahko5.318   101. imel2.334   151. on1.484   201. glas1.173
   2. in93.314   52. potem5.308   102. ste2.226   152. sicer1.484   202. moral1.173
   3. se69.885   53. nekaj5.211   103. vas2.200   153. toliko1.480   203. rad1.173
   4. v55.564   54. več5.192   104. dan2.182   154. boš1.466   204. vsaj1.169
   5. da45.181   55. pred5.043   105. vam2.180   155. nam1.460   205. pač1.152
   6. na36.699   56. ker5.029   106. bodo2.125   156. vseh1.437   206. njegov1.151
   7. so33.040   57. k5.010   107. zaradi2.101   157. dolgo1.428   207. vsem1.150
   8. ne27.850   58. naj4.993   108. kdo2.092   158. moj1.420   208. misli1.143
   9. pa25.643   59. le4.711   109. njim2.082   159. dejal1.419   209. seboj1.138
   10. ki23.277   60. ob4.587   110. čez2.061   160. časa1.418   210. sedaj1.131
   11. bi21.973   61. tem4.495   111. veliko2.058   161. sebi1.403   211. tisto1.128
   12. za20.480   62. zdaj4.443   112. niti1.996   162. drugega1.400   212. njem1.123
   13. z20.260   63. med4.320   113. tu1.971   163. rekla1.398   213. ravno1.119
   14. ni19.125   64. ji4.271   114. treba1.959   164. čas1.374   214. dni1.118
   15. sem18.517   65. ta4.179   115. zakaj1.951   165. ljudi1.373   215. skupaj1.115
   16. ga15.576   66. prav4.022   116. nad1.936   166. obraz1.369   216. let1.112
   17. še14.788   67. smo3.887   117. sva1.886   167. gospod1.354   217. teh1.097
   18. po14.748   68. nič3.760   118. nas1.860   168. nazaj1.350   218. noč1.092
   19. s14.382   69. te3.719   119. celo1.834   169. življenje1.337   219. svojih1.084
   20. tako13.818   70. a3.679   120. zelo1.824   170. danes1.332   220. svoji1.082
   21. ko13.361   71. jaz3.541   121. ima1.806   171. šel1.320   221. takrat1.078
   22. tudi13.177   72. bili3.465   122. ves1.792   172. mogoče1.313   222. drugo1.074
   23. to13.054   73. vendar3.421   123. prišel1.784   173. vedel1.309   223. besede1.071
   24. bil12.332   74. tega3.279   124. nikoli1.781   174. kadar1.302   224. njimi1.071
   25. ali11.557   75. rekel3.267   125. drugi1.762   175. strani1.298   225. doma1.063
   26. si11.402   76. svoje3.245   126. torej1.707   176. skozi1.297   226. kmalu1.056
   27. mu10.940   77. jim3.083   127. tedaj1.690   177. roke1.293   227. dokler1.053
   28. od10.488   78. toda3.051   128. človek1.683   178. no1.292   228. mož1.052
   29. bilo10.365   79. zato3.015   129. videl1.675   179. njega1.276   229. more1.034
   30. kot9.877   80. bolj3.001   130. oče1.674   180. vprašal1.276   230. mati1.033
   31. že9.537   81. tam3.000   131. morda1.643   181. vem1.271   231. vsa1.027
   32. iz9.474   82. ter2.987   132. skoraj1.637   182. pot1.267   232. daleč1.026
   33. kaj9.066   83. saj2.916   133. vsak1.623   183. namreč1.259   233. hitro1.023
   34. bo8.806   84. pod2.885   134. sploh1.612   184. njih1.247   234. šele1.016
   35. če8.613   85. brez2.873   135. roko1.602   185. dva1.244   235. imela1.005
   36. vse8.149   86. sam2.814   136. glavo1.583   186. mora1.236   236. mene1.005
   37. bila7.957   87. proti2.774   137. nato1.575   187. gre1.227   237. dal1.003
   38. kakor7.943   88. res2.746   138. mogel1.571   188. njo1.217   238. svet997
   39. mi7.911   89. niso2.670   139. ljudje1.566   189. njegovo1.214   239. ona993
   40. pri7.530   90. oči2.584   140. biti1.559   190. svoj1.210   240. pride979
   41. jo7.513   91. vedno2.550   141. naprej1.558   191. kje1.203   241. tri976
   42. kar7.069   92. bom2.543   142. takoj1.557   192. vi1.199   242. vso970
   43. jih7.048   93. vsi2.495   143. tisti1.556   193. čeprav1.192   243. eno969
   44. sta6.720   94. dobro2.494   144. seveda1.553   194. čisto1.192   244. sebe967
   45. o6.155   95. spet2.455   145. svojega1.541   195. okoli1.189   245. najbolj964
   46. do6.008   96. kjer2.448   146. bile1.531   196. pravi1.186   246. videti961
   47. ti5.719   97. nisem2.440   147. Bog1.522   197. lepo1.185   247. prvi960
   48. kako5.674   98. ampak2.425   148. prej1.508   198. sama1.184   248. moje958
   49. samo5.620   99. svojo2.410   149. meni1.498   199. kajti1.182   249. leta956
   50. me5.465   100. malo2.388   150. hotel1.493   200. nihče1.176   250. kdaj953


Tabela 43: Najpogostejše besedne oblike iz drugega vzorca s frekvencami

   1. je25.798   51. pri899   101. stopil361   151. njej233   201. Drejc190
   2. in18.471   52. mi859   102. nad357   152. svoj233   202. vem189
   3. se13.330   53. spet857   103. naglo357   153. vedel231   203. življenje189
   4. v7.809   54. ter852   104. bolj352   154. ozrl230   204. noge185
   5. da5.412   55. ti847   105. Martin348   155. teta230   205. Temnikar185
   6. na5.124   56. kako845   106. dobro347   156. dni228   206. domov184
   7. pa4.625   57. prav831   107. nisem346   157. kadar228   207. vanj184
   8. so4.243   58. me803   108. oče340   158. ljudje228   208. bomo183
   9. ne3.695   59. sta794   109. tega339   159. včasih228   209. glasom183
   10. bi3.221   60. pred765   110. vprašal339   160. povedal227   210. kam181
   11. z3.181   61. potem754   111. seveda338   161. nemara226   211. župnik181
   12. ga3.039   62. res730   112. videl332   162. kje225   212. sama180
   13. ki2.995   63. do696   113. bili329   163. nikdar225   213. stric179
   14. po2.948   64. ob693   114. dan327   164. zaradi225   214. potegnil177
   15. sem2.812   65. več671   115. šel323   165. hišo224   215. sva177
   16. ni2.636   66. glavo661   116. otrok307   166. imel222   216. smrt176
   17. s2.441   67. oči601   117. bodo303   167. zmeraj222   217. šele176
   18. še2.410   68. počasi595   118. brez303   168. hitro219   218. mizo173
   19. za2.327   69. pod583   119. zelo303   169. nas218   219. bile172
   20. tako2.155   70. naj576   120. Matic301   170. prišel217   220. glas172
   21. kakor2.079   71. ji570   121. skozi301   171. obraz216   221. noč172
   22. mu1.952   72. svoje567   122. niso296   172. pravi216   222. Tantadruj172
   23. že1.828   73. nekaj552   123. začel289   173. vasi216   223. vrnil172
   24. tudi1.799   74. roko539   124. vrata285   174. sebi215   224. prikimal171
   25. bo1.776   75. ta539   125. dolgo284   175. dva214   225. srce171
   26. si1.735   76. tam521   126. kdo283   176. rad211   226. nam170
   27. bil1.695   77. zakaj516   127. okrog281   177. hiše210   227. široko170
   28. to1.528   78. lahko513   128. človek278   178. komaj210   228. kdaj169
   29. iz1.470   79. nič504   129. doma272   179. kot208   229. očmi169
   30. kaj1.366   80. no500   130. Sova272   180. pogleda208   230. misli168
   31. k1.355   81. roke497   131. Majcen270   181. čeprav207   231. njem168
   32. zdaj1.350   82. bom490   132. glasno268   182. obrnil207   232. njemu168
   33. vse1.333   83. te487   133. jaz266   183. sredi207   233. svoji168
   34. bilo1.289   84. smo479   134. jim266   184. sebe204   234. danes167
   35. ko1.260   85. vsi475   135. ves266   185. kjer203   235. on167
   36. jo1.246   86. svojo463   136. celo265   186. pob202   236. sonce167
   37. saj1.151   87. sam458   137. let263   187. svojega202   237. obstal166
   38. samo1.129   88. takoj457   138. takrat261   188. šla202   238. svojih166
   39. toda1.127   89. zato455   139. besede259   189. enkrat201   239. dve165
   40. bila1.106   90. med448   140. vsak255   190. mimo201   240. mati165
   41. a1.103   91. Peter438   141. pogledal252   191. otroci201   241. sedel165
   42. ker1.060   92. rekla437   142. niti251   192. kmalu200   242. ponovil164
   43. če1.052   93. njim432   143. ima245   193. tisti199   243. Stane164
   44. kar1.027   94. le429   144. mama244   194. mirno197   244. tedaj164
   45. o1.004   95. tem429   145. vas244   195. reče197   245. tu163
   46. nato993   96. skoraj424   146. lepo243   196. stari196   246. moj162
   47. od952   97. boš389   147. naprej238   197. tiho195   247. mora162
   48. ali947   98. čez380   148. treba236   198. tri193   248. Venc162
   49. rekel947   99. proti379   149. sicer235   199. globoko192   249. govoril161
   50. jih924   100. vendar371   150. vsa234   200. prišla192   250. rokami161


Tabela 44: Abecedno urejene pogoste besedne oblike iz prvega vzorca z rangi in frekvencami

   a (70)3.679   ima (121)1.806   mož (228)1.052   pri (40)7.530   takrat (221)1.078
   ali (25)11.557   imel (101)2.334   mu (27)10.940   pride (240)979   tam (81)3.000
   ampak (98)2.425   imela (235)1.005   na (6)36.699   prišel (123)1.784   te (69)3.719
   besede (223)1.071   in (2)93.314   nad (116)1.936   proti (87)2.774   tedaj (127)1.690
   bi (11)21.973   iz (32)9.474   naj (58)4.993   prvi (247)960   tega (74)3.279
   bil (24)12.332   jaz (71)3.541   najbolj (245)964   rad (203)1.173   teh (217)1.097
   bila (37)7.957   je (1)150.984   nam (155)1.460   ravno (213)1.119   tem (61)4.495
   bile (146)1.531   ji (64)4.271   namreč (183)1.259   rekel (75)3.267   ter (82)2.987
   bili (72)3.465   jih (43)7.048   naprej (141)1.558   rekla (163)1.398   ti (47)5.719
   bilo (29)10.365   jim (77)3.083   nas (118)1.860   res (88)2.746   tisti (143)1.556
   biti (140)1.559   jo (41)7.513   nato (137)1.575   roke (177)1.293   tisto (211)1.128
   bo (34)8.806   k (57)5.010   nazaj (168)1.350   roko (135)1.602   to (23)13.054
   bodo (106)2.125   kadar (174)1.302   ne (8)27.850   s (19)14.382   toda (78)3.051
   Bog (147)1.522   kaj (33)9.066   nekaj (53)5.211   saj (83)2.916   toliko (153)1.480
   bolj (80)3.001   kajti (199)1.182   ni (14)19.125   sam (86)2.814   torej (126)1.707
   bom (92)2.543   kako (48)5.674   nič (68)3.760   sama (198)1.184   treba (114)1.959
   boš (154)1.466   kakor (38)7.943   nihče (200)1.176   samo (49)5.620   tri (241)976
   brez (85)2.873   kar (42)7.069   nikoli (124)1.781   se (3)69.885   tu (113)1.971
   celo (119)1.834   kdaj (250)953   nisem (97)2.440   sebe (244)967   tudi (22)13.177
   čas (164)1.374   kdo (108)2.092   niso (89)2.670   sebi (161)1.403   v (4)55.564
   časa (160)1.418   ker (56)5.029   niti (112)1.996   seboj (209)1.138   vam (105)2.180
   če (35)8.613   ki (10)23.277   njega (179)1.276   sedaj (210)1.131   vas (103)2.200
   čeprav (193)1.192   kje (191)1.203   njegov (206)1.151   sem (15)18.517   več (54)5.192
   čez (110)2.061   kjer (96)2.448   njegovo (189)1.214   seveda (144)1.553   vedel (173)1.309
   čisto (194)1.192   kmalu (226)1.056   njem (212)1.123   si (26)11.402   vedno (91)2.550
   človek (128)1.683   ko (21)13.361   njih (184)1.247   sicer (152)1.484   veliko (111)2.058
   da (5)45.181   kot (30)9.877   njim (109)2.082   skoraj (132)1.637   vem (181)1.271
   dal (237)1.003   lahko (51)5.318   njimi (224)1.071   skozi (176)1.297   vendar (73)3.421
   daleč (232)1.026   le (59)4.711   njo (188)1.217   skupaj (215)1.115   ves (122)1.792
   dan (104)2.182   lepo (197)1.185   no (178)1.292   smo (67)3.887   vi (192)1.199
   danes (170)1.332   let (216)1.112   noč (218)1.092   so (7)33.040   videl (129)1.675
   dejal (159)1.419   leta (249)956   o (45)6.155   spet (95)2.455   videti (246)961
   dni (214)1.118   ljudi (165)1.373   ob (60)4.587   sploh (134)1.612   vprašal (180)1.276
   do (46)6.008   ljudje (139)1.566   obraz (166)1.369   sta (44)6.720   vsa (231)1.027
   dobro (94)2.494   malo (100)2.388   oče (130)1.674   ste (102)2.226   vsaj (204)1.169
   dokler (227)1.053   mati (230)1.033   oči (90)2.584   strani (175)1.298   vsak (133)1.623
   dolgo (157)1.428   me (50)5.465   od (28)10.488   sva (117)1.886   vse (36)8.149
   doma (225)1.063   med (63)4.320   okoli (195)1.189   svet (238)997   vseh (156)1.437
   drugega (162)1.400   mene (236)1.005   on (151)1.484   svoj (190)1.210   vsem (207)1.150
   drugi (125)1.762   meni (149)1.498   ona (239)993   svoje (76)3.245   vsi (93)2.495
   drugo (222)1.074   mi (39)7.911   pa (9)25.643   svojega (145)1.541   vso (242)970
   dva (185)1.244   misli (208)1.143   pač (205)1.152   svoji (220)1.082   z (13)20.260
   eno (243)969   mogel (138)1.571   po (18)14.748   svojih (219)1.084   za (12)20.480
   ga (16)15.576   mogoče (172)1.313   pod (84)2.885   svojo (99)2.410   zakaj (115)1.951
   glas (201)1.173   moj (158)1.420   pot (182)1.267   še (17)14.788   zaradi (107)2.101
   glavo (136)1.583   moje (248)958   potem (52)5.308   šel (171)1.320   zato (79)3.015
   gospod (167)1.354   mora (186)1.236   prav (66)4.022   šele (234)1.016   zdaj (62)4.443
   gre (187)1.227   moral (202)1.173   pravi (196)1.186   ta (65)4.179   zelo (120)1.824
   hitro (233)1.023   morda (131)1.643   pred (55)5.043   tako (20)13.818   že (31)9.537
   hotel (150)1.493   more (229)1.034   prej (148)1.508   takoj (142)1.557   življenje (169)1.337


Tabela 45: Abecedno urejene pogoste besedne oblike iz drugega vzorca z rangi in frekvencami

   a (41)1.103   ji (71)570   nekaj (73)552   reče (195)197   takrat (138)261
   ali (48)947   jih (50)924   nemara (161)226   rekel (49)947   tam (76)521
   besede (139)259   jim (134)266   ni (16)2.636   rekla (92)437   Tantadruj (222)172
   bi (10)3.221   jo (36)1.246   nič (79)504   res (62)730   te (83)487
   bil (27)1.695   k (31)1.355   nikdar (163)225   rokami (250)161   tedaj (244)164
   bila (40)1.106   kadar (157)228   nisem (107)346   roke (81)497   tega (109)339
   bile (219)172   kaj (30)1.366   niso (122)296   roko (74)539   tem (95)429
   bili (113)329   kako (56)845   niti (142)251   s (17)2.441   Temnikar (205)185
   bilo (34)1.289   kakor (21)2.079   njej (151)233   saj (37)1.151   ter (54)852
   bo (25)1.776   kam (210)181   njem (231)168   sam (87)458   teta (155)230
   bodo (117)303   kar (44)1.027   njemu (232)168   sama (212)180   ti (55)847
   bolj (104)352   kdaj (228)169   njim (93)432   samo (38)1.129   tiho (197)195
   bom (82)490   kdo (126)283   no (80)500   se (3)13.330   tisti (193)199
   bomo (208)183   ker (42)1.060   noč (221)172   sebe (184)204   to (28)1.528
   boš (97)389   ki (13)2.995   noge (204)185   sebi (174)215   toda (39)1.127
   brez (118)303   kje (162)225   o (45)1.004   sedel (241)165   treba (148)236
   celo (136)265   kjer (185)203   ob (64)693   sem (15)2.812   tri (198)193
   če (43)1.052   kmalu (192)200   obraz (171)216   seveda (111)338   tu (245)163
   čeprav (181)207   ko (35)1.260   obrnil (182)207   si (26)1.735   tudi (24)1.799
   čez (98)380   komaj (178)210   obstal (237)166   sicer (149)235   v (4)7.809
   človek (128)278   kot (179)208   oče (108)340   skoraj (96)424   vanj (207)184
   da (5)5.412   lahko (78)513   oči (67)601   skozi (121)301   vas (145)244
   dan (114)327   le (94)429   očmi (229)169   smo (84)479   vasi (173)216
   danes (234)167   lepo (146)243   od (47)952   smrt (216)176   včasih (159)228
   dni (156)228   let (137)263   okrog (127)281   so (8)4.243   več (65)671
   do (63)696   ljudje (158)228   on (235)167   sonce (236)167   vedel (153)231
   dobro (106)347   Majcen (131)270   otroci (191)201   Sova (130)272   vem (202)189
   dolgo (125)284   mama (144)244   otrok (116)307   spet (53)857   Venc (248)162
   doma (129)272   Martin (105)348   ozrl (154)230   srce (225)171   vendar (100)371
   domov (206)184   mati (240)165   pa (7)4.625   sredi (183)207   ves (135)266
   Drejc (201)190   Matic (120)301   Peter (91)438   sta (59)794   videl (112)332
   dva (175)214   me (58)803   po (14)2.948   Stane (243)164   vprašal (110)339
   dve (239)165   med (90)448   pob (186)202   stari (196)196   vrata (124)285
   enkrat (189)201   mi (52)859   počasi (68)595   stopil (101)361   vrnil (223)172
   ga (12)3.039   mimo (190)201   pod (69)583   stric (213)179   vsa (150)234
   glas (220)172   mirno (194)197   pogleda (180)208   sva (215)177   vsak (140)255
   glasno (132)268   misli (230)168   pogledal (141)252   svoj (152)233   vse (33)1.333
   glasom (209)183   mizo (218)173   ponovil (242)164   svoje (72)567   vsi (85)475
   glavo (66)661   moj (246)162   potegnil (214)177   svojega (187)202   z (11)3.181
   globoko (199)192   mora (247)162   potem (61)754   svoji (233)168   za (19)2.327
   govoril (249)161   mu (22)1.952   povedal (160)227   svojih (238)166   začel (123)289
   hiše (177)210   na (6)5.124   prav (57)831   svojo (86)463   zakaj (77)516
   hišo (165)224   nad (102)357   pravi (172)216   še (18)2.410   zaradi (164)225
   hitro (168)219   naglo (103)357   pred (60)765   šel (115)323   zato (89)455
   ima (143)245   naj (70)576   pri (51)899   šele (217)176   zdaj (32)1.350
   imel (166)222   nam (226)170   prikimal (224)171   široko (227)170   zelo (119)303
   in (2)18.471   naprej (147)238   prišel (170)217   šla (188)202   zmeraj (167)222
   iz (29)1.470   nas (169)218   prišla (200)192   ta (75)539   že (23)1.828
   jaz (133)266   nato (46)993   proti (99)379   tako (20)2.155   življenje (203)189
   je (1)25.798   ne (9)3.695   rad (176)211   takoj (88)457   župnik (211)181

5.2.4 Besedni n-terčki

Pestrost jezika se kaže prav v veliki svobodi zlaganja besed med seboj in zato raziskave besednih n-terčkov oziroma fraz, kot bi jim rekli jezikoslovci, zahtevajo zelo velike besedilne vzorce. Če je bilo že pri najpogostejših znakovnih n-terčkih z rastočim n opaziti skokovito upadanje frekvenc, to razumljivo še veliko bolj velja za besedne n-terčke. Predvsem prvi vzorec te naloge pa je že tako velik, da je smiselnih nekaj korakov tudi v tej smeri.

V tabeli 46 je naveden pregled števila besednih n-terčkov prvega vzorca za n od 1 do 5, pri čemer je bila tabela pri znakovnih n-terčkih, tvorjena iz besedil, že razrezanih na povedi in očiščenih oznak in tujih citatov.

Tabela 46: Število besednih n-terčkov (1-5) v prvem vzorcu

     Vseh    Različnih       Delež enkr. med   Delež enkr. med
   n-terčkov   n-terčkov   Enkratnic   različnimi v %    vsemi n-terčki v %
  
12.721.416   174.579    84.800    48,57    3,12
22.523.050   1.218.506   999.475    82,02   39,61
32.326.469   1.930.363   1.793.579   92,91   77,09
42.136.579   2.057.833   2.010.939   97,72   94,12
51.955.526   1.937.820   1.923.628   99,27   98,37

Opaziti je predvsem zelo hitro rast deleža n-terčkov s frekvenco 1 (enkratnic) z večanjem števila n. Pri peterčkih je delež enkratnic med vsemi že 98,37 %, kar pomeni, da je fraz z dolžino pet besed že zelo malo. Podobo dopolnjuje še krivulja rasti za besede, dvojčke, trojčke in četverčke besed na sliki 15.

Slika 15: Krivulje rasti za besedne n-terčke (1-4) v prvem vzorcu

Prva krivulja z leve, za besede, ima do približno 97 %, kjer nastopijo enkratnice, razmeroma regularen potek. Z najpogostejšimi 16 besedami pokrijemo 25 % celega vzorca, z 256 slabo polovico, s 4.096 približno 75 % in z 32.768 dobrih 90 %. Pri dvojčkih, naslednji krivulji, potrebujemo za pokritje 25 % besedila že 4 K najpogostejših besednih parov, za 50 % besedila nekaj manj kot 100.000, za 75 % več kot 512 K, za 90 % pa že skoraj milijon. Pri trojčkih je treba za 25 % besedila vse besedne trojčke s frekvenco nad 1 (več kot 128.000), za 50 % že približno 700.000 in tako naprej. Pri četverčkih je še precej slabše - z vsemi, ki imajo frekvenco nad 1, pridemo komaj do 6 % celotnega besedila (mesta, kjer se začnejo enkratnice, so na krivulji označena s kratko pokončno črtico nad ustrezno točko).

V tabelah 47 in 48 na naslednjih straneh so navedeni najpogostejši besedni n-terčki (n = 2-5) za oba vzorca. V njih so močno udeležene najpogostejše besede: pri prvem vzorcu nastopa pomožni glagol je v 54 % dvojčkov, 68 % trojčkov, 74 % četverčkov in 78 % peterčkov. Predvsem pri dvojčkih in trojčkih gre bolj ali manj za vezivo, za povezave veznikov, pomožnih glagolov in prostega glagolskega morfema se, sem in tja pa najdemo še kakšen osebni zaimek. V tabelah prvega vzorca je pri dvojčkih en sam pravi glagol, samostalnik ali pridevnik, v je rekel, pri trojčkih tudi, v se je zgodilo, pri četverčkih že 22, a od tega v kar 15 primerih nastopa glagol zdeti se (ostanejo od časa do časa/ se je zgodilo, da/ Bouvard in Pécuchet sta/ kar se je zgodilo/ iz dneva v dan/ je bil prepričan, da in prišlo na misel, da), pri peterčkih pa 38 (od tega v 18 primerih nastopata zdeti se ali zazdeti se). Konkretnih n-terčkov, za katere lahko takoj ugotovimo izvor, je pri prvem vzorcu malo - v celi tabeli 47 sta samo dva: četverček Bouvard in Pécuchet sta iz Flaubertovega romana z naslovom iz prvih treh besed in peterček in mir od Boga, našega iz Nove zaveze. Frekvence najpogostejših n-terčkov z rastočim n padajo še dosti hitreje kot pri n-terčkih znakov: razmerja so 7,3 : 1 (je : se je), 17,2 : 1 ( se je : da bi se), 7,4 : 1 ( da bi se : ne da bi se) in 3,5 : 1 (ne da bi se : se mi je zdelo, da). Zanimivo je tudi, da ima zadnji, 50. peterček v tabeli 47 frekvenco že komaj 9.

Drugi vzorec je skromnejši in najdemo že med dvojčki 3 take, ki imajo kakšen glagol, samostalnik ali pridevnik: je rekel, je rekla in Peter Majcen. Med trojčki jih je 10: zmajal z glavo, zamahnil z roko, se je popraskal, se je oglasil, se je obrnil, Peter Majcen je, je popraskal kmet, z obema rokama, se je vrnil in in se obrnil. Konkretnih n-terčkov, ki jim lahko zlahka najdemo izvor, je 34 in so vsi iz del Balada o trobenti in oblaku, Potepuh Najdù in Tantadruj. Prekrivanje vzorcev je znatno do n = 3, sicer pa je pri enojčkih med najpogostejšimi 50 42 enakih, pri dvojčkih 37, pri trojčkih 26, pri četverčkih 7 ( da se mu je/ ne da bi se/ potem pa se je/ se je obrnil k/ se mi je, da/ se mu je zdelo in se mu je, da) in pri peterčkih samo 2 ( se mu je zazdelo, da in se mu je zdelo, da).

Tabela 47: Najpogostejši besedni n-terčki (2-4) v prvem vzorcu, s frekvencami

2   3   4   5
   1. se je20.657   da bi se1.202   ne da bi se163   se mi je zdelo, da47
   2. je bil7.297   da se je1.169   se mu je, da108   Zdelo se mi je, da42
   3. da bi7.077   se mu je1.145   se mi je zdelo93   Zdelo se mu je, da41
   4. da je6.903   ki se je972   se je zdelo, da92   se mu je zdelo, da39
   5. je bilo5.643   pa se je809   kaj se je zgodilo79   zdelo se mu je, da35
   6. so se5.609   ki ga je797   se mu je zdelo78   se je zgodilo, da je26
   7. ki je5.136   ne da bi668   se mi je, da73   in zdelo se mu je21
   8. da se5.123   ko se je652   ki se mu je71   ki mu je bilo ime20
   9. in se4.894   se mi je643   da se ne bi70   prišlo na misel, da bi20
   10. je bila4.618   ki je bil524   kakor da bi se65   se mu je, da je20
   11. ga je4.484   ki jo je520   se je, da je64   se mu je, da se20
   12. mu je4.336   ki so se495   da se mu je63   Zdelo se ji je, da19
   13. pa je3.993   se ji je465   Zdelo se mi je62   je bila v tem, da18
   14. ki so3.712   ki jih je443   od časa do časa58   se je zdelo, da je17
   15. bi se3.003   se je v431   Zdi se mi, da57   in zdelo se je, da15
   16. mi je2.690   in se je411   se je zgodilo, da55   je bilo vse, kar je15
   17. ko je2.528   Ko se je359   tako da se je55   je od časa do časa15
   18. je v2.501   kakor da bi355   se je obrnil k54   ne glede na to, ali15
   19. jo je2.474   da bi ga350   Zdelo se mu je53   se je in se je15
   20. ki se2.452   da je bil348   mi je zdelo, da47   se je zdelo, da se15
   21. se mu2.377   ki je bila335   Zdelo se je, da47   se ji je zdelo, da15
   22. sem se2.269   da so se315   in ko se je46   so se odprla vrata in15
   23. da so2.254   da bi bil311   se mi zdi, da46   se mi je, da sem14
   24. ni bilo2.246   se je zgodilo299   ne da bi bil45   tistega, ki me je poslal14
   25. ne bi2.043   ki so ga299   zdi se mi, da45   zdelo se mi je, da14
   26. pa se1.959   je, da je296   zdelo se mu je44   Zdelo se je, da je13
   27. in je1.880   so se mu295   Bouvard in Pécuchet sta43   je bilo jasno, da je12
   28. me je1.783   ki mu je287   je bilo, da je43   je prišlo na misel, da12
   29. so bili1.778   pa je bil278   ki mu je bilo43   ne da bi se bil12
   30. jih je1.763   se je na273   potem pa se je42   je bil prepričan, da je11
   31. ji je1.742   da ne bi272   je, da se je41   je zdelo, da se je11
   32. je rekel1.740   da ga je272   se je in je41   ki so bili z njim11
   33. si je1.685   da se ne268   da bi se bil40   se ji je zazdelo, da11
   34. je, da1.659   se je, da258   pa se mu je40   se ji je, da je11
   35. ne bo1.639   mu je bilo254   mu je zdelo, da39   se mu je zazdelo, da11
   36. je že1.575   ki so bili244   da se mi je38   tri dni in tri noči11
   37. se ne1.567   da se bo239   se ji je, da37   Zazdelo se mu je, da11
   38. se mi1.528   je bil v239   kar se je zgodilo36   da je vse v redu10
   39. ki ga1.462   ne bi bilo233   ki ga je bil36   je prijel za roko in10
   40. je na1.447   se je bil233   iz dneva v dan35   je zgodilo, da se je10
   41. so ga1.402   se je že232   je bilo jasno, da35   milost vam in mir od10
   42. sta se1.387   je bilo treba228   je bil prepričan, da34   ne da bi pri tem10
   43. je še1.386   da je to226   ki si ga je34   ne da bi se bila10
   44. je to1.336   pa so se224   prišlo na misel, da34   okna v zidovih in stenah10
   45. in ga1.334   je bilo v221   se ji je zdelo34   se je odločil, da bo10
   46. in da1.297   je, da se216   je v tem, da33   se je zgodilo, da se10
   47. pa so1.292   da mu je216   je, da bi se33   zdelo se ji je, da10
   48. To je1.269   pa je bilo211   ne glede na to33   Čez nekaj časa se je9
   49. da sem1.225   in da je207   s tem, da je33   ga je obudil od mrtvih9
   50. kar je1.214   ki so jih207   vse, kar je bilo33   in mir od Boga, našega9


Tabela 48: Najpogostejši besedni n-terčki (2-4) v drugem vzorcu, s frekvencami

2   3   4   5
   1. se je4.327   ki se je265   se je popraskal kmet46   kajpak,<< se je popraskal kmet36
   2. in se1.563   pa se je261   kajpak,<< se je popraskal45   kaj hočemo, je že tako22
   3. je bil1.004   da bi se211   ne da bi se38   ne da bi se ozrl19
   4. pa je977   se mu je184   je rekel Peter Majcen32   in rdečega vina, temnih gozdov14
   5. da je935   da se je176   Peter Majcen se je30   rdečega vina, temnih gozdov in14
   6. da bi929   kakor bi se139   se je obrnil k28   temnih gozdov in zelenega morja14
   7. ki je876   ki je bil122   nato pa se je27   vina, temnih gozdov in zelenega14
   8. ga je759   se je v105   hočemo, je že tako26   sonca in rdečega vina, temnih13
   9. so se732   ki ga je93   zmajal z glavo in26   zlatega sonca in rdečega vina13
   10. je bilo712   ker se je91   je zmajal z glavo24   je zmajal z glavo in12
   11. mu je701   ki so se84   kaj hočemo, je že22   je rekel Peter Majcen in11
   12. je bila696   ki je bila80   in se zamaknil v21   ker se je bal, da10
   13. kakor bi655   ko se je80   je ponovil Matic in21   smrt, moj hramček bo zaprt10
   14. da se609   ne da bi73   to se pravi, da21   bo bridka smrt, moj hramček9
   15. bi se574   se je na71   da bi se ozrl20   bridka smrt, moj hramček bo9
   16. pa se464   zmajal z glavo69   da se mu je19   se mu je zdelo, da9
   17. ki so456   se mi je69   zamahnil z roko in19   s svojimi velikimi, nejasnimi 
   18. je v453   da bi ga66   je zamahnil z roko17      očmi8
   19. ki se453   nato pa je64   se je zdrznil in16   se mu je zazdelo, da8
   20. sem se451   z glavo in63   ki se je v15   dvignil kazalec, da bi si7
   21. se mu437   zamahnil z roko63   od hiše do hiše15   in vse je kazalo, da7
   22. je rekel423   se je spet63   rekel Peter Majcen in15   je zamahnil z roko in7
   23. in ga395   so se mu63   gozdov in zelenega morja14   je zmajala z glavo in7
   24. je že353   da ne bi62   in rdečega vina, temnih14   je-e sonce, na zemljici mraz7
   25. ne bi349   se je popraskal61   in zamahnil z roko14   kakor bi smrt švignila mimo7
   26. si je321   se je in58   kako bi se reklo14   nebu je-e sonce, na zemljici7
   27. jo je310   ki jo je54   Peter Majcen in se14   zmajal z glavo in se7
   28. ker je303   da mu je53   potem pa se je14   in spomnila se je, kako6
   29. ne bo292   da se bo53   rdečega vina, temnih    in vsi so za vas6
   30. mi je279   da je bil52      gozdov14   ja-az zvonce in vsi so6
   31. je še272   se je oglasil52   se je ozrl v14   je ponovil Matic in dvignil6
   32. so ga272   ki jih je50   se mu je zdelo14   ne da bi se ozrla6
   33. Peter    je, da je49   temnih gozdov in zelenega14   se je bal, da bo6
        Majcen270   se je obrnil49   vina, temnih gozdov in14   udaril s pestjo po mizi6
   34. je z249   to se pravi48   ker se mu je13   zaradi tega, ker se je6
   35. ter se246   ker je bil48   sonca in rdečega vina13   zvonce in vsi so za6
   36. je rekla245   Peter Majcen je47   zlatega sonca in rdečega13   bi si zapomnil ta ukaz5
   37. me je244   kajpak,<< se je47   k njemu in ga12   če je moje okno še5
   38. ko je243   je popraskal    k njemu in mu12   da bi se ozrl v5
   39. ni bilo241      kmet46   kakor bi se mu12   da bi si zapomnil ta5
   40. je na241   z obema rokama46   kakor šiba na vodi12   imam in ta bo prava5
   41. da so229   potem pa je46   se je bal, da12   in sam ni vedel, kdaj5
   42. in jo224   se je še45   se je nasmehnil in12   in se ozrl okrog sebe5
   43. in si221   se je vrnil45   se mi je, da12   in še ena, pa je5
   44. je s214   da se mu44   se mu je, da12   in zdelo se mi je5
   45. jih je212   mu je bilo44   z glavo in se12   je lase s čela in5
   46. je tako207   se je bil43   in se ozrl po11   je moje okno še zaprto5
   47. je spet206   da bi si43   in se ozrl v11   kakor bi se bala, da5
   48. se ni206   in se obrnil42   je prikimal Peter Majcen11   kakor bi se bal, da5
   49. da bo206   kakor bi ga42   lase s čela in11   kazalec, da bi si zapomnil5
   50. se ne205   ki mu je42   zmajala z glavo in11   ker se mu je zdelo5


Tabela 49: Najpogostejši besedni n-terčki na začetkih povedi v prvem vzorcu

1   2   3   4
   1. In5.034   Ko je1.157   Ko se je356   Zdelo se mi je,48
   2. V4.019   To je850   Potem se je130   Zdelo se je, da47
   3. Ko3.844   Ko se508   To je bilo111   Zdelo se mu je,43
   4. Na2.279   Bil je485   Tedaj se je105   Bouvard in Pécuchet sta39
   5. Ali2.077   Ko so417   Ko so se90   Zdi se mi, da35
   6. Če1.999   Tako je417   Tako se je90   In tako se je28
   7. To1.989   >>To je402   To je bil87   Jezus jim je odgovoril:24
   8. Tako1.639   Ko sem384   In ko je85   Po teh besedah je24
   9. Toda1.512   >>Kaj pa305   Ko pa je85   Videti je bilo, da22
   10. Tudi1.463   Potem je294   Ko sem se74   Zdelo se ji je,22
   11. >>Kaj1.455   Če bi287   Ko je bil67   >>Zdi se mi, da22
   12. Po1.361   Bilo je281   Zdelo se je,63   Tedaj pa se je18
   13. Z1.219   Bila je272   >>Kaj pa je61   >>Kaj pa je to?<<18
   14. Kaj1.216   Tedaj je241   Nato se je58   Ne da bi se17
   15. Potem1.214   Zdelo se217   Zdelo se mi56   Čez nekaj časa se16
   16. Ne1.163   In ko214   To je bila55   Ko pa se je16
   17. Za1.113   Nato je214   Veronika se je53   On pa jim je16
   18. Pa1.056   Potem se211   Zdelo se mu53   Tu in tam je16
   19. >>In1.055   V tem210   Ne da bi51   In ko se je15
   20. >>Ne1.040   Če je208   In tako je49   Od časa do časa15
   21. >>Ali949   In če194   Potem pa je45   Če ne bi bilo14
   22. S911   Ko pa190   Bouvard in Pécuchet44   In tedaj se je14
   23. Ta904   Če pa187   Phileas Fogg je44   Pri tem se je14
   24. Še891   Ker je185   Tu in tam44   Jezus pa jim je13
   25. Ni871   >>Tako je.<<184   Vse je bilo44   Njen obraz je bil13
   26. >>To863   Da bi183   Obrnil se je43   Obrnil se je k13
   27. A847   In tako180   Po teh besedah42   Res pa je, da13
   28. Vse843   Vsi so173   Čez nekaj časa41   V tem trenutku se13
   29. Pri824   Pri tem169   Medtem ko je41   Njegov glas je bil12
   30. Zdaj771   Če se168   V tem trenutku41   Obrnil se je in12
   31. >>Če731   Vse je167   Zdi se mi,41   Po drugi strani pa12
   32. Zato704   Jaz sem165   Jezus jim je40   Potem pa se je12
   33. Tedaj702   Ali je163   Ker je bil40   Pri teh besedah je12
   34. Saj689   Kaj pa160   Če bi se39   V tistem trenutku se12
   35. Od679   Tako se159   Ko je bilo39   Vendar pa se je12
   36. Kako665   Ko sta156   Kakor da bi38   Vrnil se je v12
   37. Da643   Ko bi155   Zato se je38   Bal se je, da11
   38. Ker632   Tam je151   Ko sta se37   Bilo je, kakor da11
   39. Bil621   Zdaj je151   Nenadoma se je37   Bilo je, kot bi11
   40. Jaz613   Ali pa149   Tako je bilo37   Čez nekaj časa je11
   41. Iz604   Sicer pa136   >>Nič se ne37   Jezus mu je rekel:11
   42. >>Saj587   Bouvard je132   Alena se je36   Kakor da bi se11
   43. Vendar577   Ta je131   Ko je prišel36   Kdor ima ušesa, naj11
   44. Ob575   Pécuchet je128   Pécuchet se je36   Med njimi je bil11
   45. Samo572   Zdaj pa128   Zdaj se je36   Njegov obraz je bil11
   46. Nato571   Tedaj se125   In tako se35   Očitno je bilo, da11
   47. Tam564   Zato je125   Ko ga je35   Zazdelo se mu je,11
   48. Kakor563   Kaj je123   On pa je35   Bilo je, kot da10
   49. >>Tako562   S tem121   V tistem trenutku35   Glede na to, da10
   50. >>Kako557   Potem pa117   Vedel je, da35   Jezus mu je odgovoril:10


Tabela 50: Najpogostejši besedni n-terčki na začetkih povedi v drugem vzorcu

1   2   3   4
   1. In1546   Ko je181   Ko se je88   >>Hm, kajpak,<< se je47
   2. V543   To je136   Nato se je54   Peter Majcen se je30
   3. Ko520   Bil je120   Peter Majcen je47   Prekleta strešnica se je11
   4. Toda475   Nato je110   >>Hm, kajpak,<< se47   Raus e patacis, repa10
   5. Nato367   Ko se102   In tako je31   Spomnila se je, kako10
   6. Saj349   Tako je97   Peter Majcen se30   V tem trenutku se9
   7. Na333   Peter Majcen87   Potem se je26   >>Prišla bo bridka smrt,9
   8. >>In304   Nato se85   V tem trenutku25   Nanca in Kati sta8
   9. To298   >>Kaj pa85   Vse je bilo25   Tedaj pa se je8
   10. Pa263   Potem je81   Ozrl se je24   Ozrl se je v7
   11. Zdaj258   In tako73   Martin se je23   >>Na-a nebu je-e sonce,7
   12. A256   Ko so66   Venc se je23   >>Pa kaj hočemo, je7
   13. Tako246   Vse je63   To je bil18   >>Raus e patacis, repa7
   14. Potem233   Zdaj je56   Matic se je17   In tako se je6
   15. Tudi233   Saj je55   Nato si je17   Ko se je Žef6
   16. Vse227   Bila je54   Te besede so17   Naslonil se je na6
   17. >>Saj226   Če bi51   Kaj pa je16   Nato pa se je6
   18. >>Ali208   Očka Orel50   Tantadruj se je16   Na-a-biram ja-az zvonce in6
   19. Samo197   Pa tudi50   Zdaj pa je16   Nenadoma pa se je6
   20. Ali195   Bilo je47   >>Kaj pa je16   Pa kaj hočemo, je6
   21. >>Kaj185   In tudi47   Nato pa je15   Potem pa se je6
   22. Če181   Zdaj pa47   Oče se je15   Segel je v žep6
   23. >>No,179   >>Hm, kajpak,<<47   Ozrl sem se15   To pa je bilo6
   24. Kaj169   Kaj pa46   Pob se je15   To se pravi, da6
   25. Še164   Martin je46   Počasi se je15   Travnikarjev stric se je6
   26. Vsi162   Matic je46   Potem pa je15   Zamaknil se je v6
   27. Bil144   Potem pa46   To je bilo15   Zdaj pa se je6
   28. Peter143   In če44   Venček se je15   >>In kaj je bilo6
   29. Z142   In še44   Bilo mu je14   Bilo je, kakor bi5
   30. Po141   In ker42   Peter se je14   In potem se je5
   31. No,139   Temnikar je41   Zdaj se je14   In tako je tudi5
   32. Za139   In zdaj40   In ker je13   Ko pa se je5
   33. Ta136   Sicer pa40   In res je13   Ko se je vrnil5
   34. Sova127   In prav38   In to je13   Ko so prišli do5
   35. S125   Vsi so38   >>V imenu postave,13   Obrnil se je k5
   36. Tam121   In potem37   In da bi12   Ozrl sem se v5
   37. Kar118   Tam je36   Ko pa je12   Tako je bilo tudi5
   38. >>Tantadruj,107   Venček je36   Stopil je k12   Vedel je, da je5
   39. >>Pa104   Moj Jezus35   Tu pa tam12   Vse je kazalo, da5
   40. Ne101   V tem35   Z obema rokama12   Zamaknil sem se v5
   41. Martin100   In to34   In ko je11   Zdelo se mi je,5
   42. Počasi95   Potem se34   Ko sem se11   Zravnal se je in5
   43. Pri94   Žef je34   Ljudje so se11   >>Javolheršturmfirer!<<  
   44. >>To93   >>To je34   Naslonil se je11      je zagrgral Prekleta5
   45. Iz92   Ko sem33   Nemška smrt je11   >>Kaj pa je?<< je5
   46. >>Ne,92   Nato pa33   Otroci so se11   >>Pha!<< je zaničljivo prhnil5
   47. Ob90   Pa saj33   Prekleta strešnica se11   >>Ti si nor!<< je5
   48. Prav87   Stopil je33   Res je, da11   Bilo mu je tako4
   49. Tedaj87   >>Ali je33   Tedaj pa se11   In ker je bil4
   50. >>Ti87   Otroci so32   Temnikarica se je11   In ko se je4


Tabela 51: Najpogostejši besedni n-terčki na koncih povedi v prvem vzorcu

1   2   3   4
   1. rekel:685   je rekel:290   mu je rekel:66   Jezus jim je odgovoril:24
   2. je.587   >>Tako je.<<184   jim je rekel:62   kaj se je zgodilo.21
   3. oči.500   in rekel:165   se je zgodilo.40   pa jim je rekel:21
   4. več.370   je rekel.142   in mu rekel:38   pa mu je rekel:19
   5. njim.369   z njim.139   je rekel Bouvard.38   je odvrnil Phileas Fogg.15
   6. ne.327   ni bilo.137   jim je odgovoril:36   ki me je poslal.11
   7. je.<<314   na tla.124   je rekla Alica.35   Jezus mu je rekel:11
   8. glavo.298   za njim.114   je rekel Pécuchet.34   Jezus mu je odgovoril:10
   9. rekel.296   je odgovoril:107   ni bilo več.34   našega Gospoda Jezusa Kristusa.9
   10. naprej.277   na svetu.94   in jim rekel:29   je skomignil z rameni.9
   11. roko.256   s seboj.94   mu je odgovoril:27   - je vzkliknil Passepartout.9
   12. je:243   se je.94   pa je rekel:27   Jezus jim je rekel:9
   13. obraz.239   je rekla.90   Rekel jim je:26   ga ni bilo več.8
   14. bilo.236   v oči.85   na vse strani.25   je dejal Mr. Fogg.8
   15. domov.235   k sebi.80   je dejala Alica.24   iz dneva v dan.8
   16. seboj.235   v obraz.76   je pomislila Alica.23   >>Kaj pa je to?<<8
   17. sebi.233   za njo.74   se je zasmejal.23   svojo smrt in vstajenje7
   18. njo.231   v hišo.73   je rekel Winston.22   in Gospoda Jezusa Kristusa.7
   19. dejal:223   z njo.72   Gospoda Jezusa Kristusa.21   je vprašal Mr. Fogg.7
   20. reče:215   je bilo.68   Odgovoril jim je:21   ki je v nebesih.7
   21. nazaj.213   k njemu.68   gor in dol.20   kar se je zgodilo.7
   22. dan.206   in dejal:67   je rekla Martina.20   ni bilo od nikoder.7
   23. sebe.205   reče Orten.67   je rekla Veronika.20   pa jim je odgovoril:7
   24. tla.202   sem rekel.66   ni bilo nikjer.20   je rekel svojim učencem:7
   25. ni.200   z njimi.64   je rekel O'Brien.19   >>V tem imaš prav.<<7
   26. se.197   in rekla:60   po vsem telesu.19   >>Kaj misliš s tem?<<7
   27. življenje.194   je bil.60   se je nasmehnil.19   vam, pismouki in farizeji!6
   28. svetu.192   z glavo.60   >>Kako to misliš?<<19   pri cerkvi sv. Jakoba.6
   29. >>Da.<<191   ali ne?<<58   in tako naprej.18   je dejala Rdeča kraljica.6
   30. ljudi.188   reče Podol.58   >>Tako se zdi.<<18   ne duha ne sluha.6
   31. rekla:188   jim je:57   je rekel Ray.17   od dne do dne.6
   32. Alica.187   je vprašal.56   kakor je pisano:17   je bilo vse tiho.6
   33. drugega.186   ali ne.54   mi je rekel:17   je vse v redu.6
   34. strani.185   je dejal:53   odvrnil Phileas Fogg.17   je rekel Krilati lev.6
   35. njega.184   po sobi.52   in ga vprašal:16   na področju osebnih računalnikov.6
   36. let.183   je rekla:51   na drugo stran.16   - je odvrnil Fix.6
   37. ne?<<183   po tleh.51   na ves glas.16   je rekel Mali Miklavž.6
   38. sam.181   v roki.51   sam pri sebi.16   in jim je rekel:6
   39. nič.179   rekla Alica.49   sam s seboj.16   pa mu je odgovoril:6
   40. srce.173   v njem.49   sem si rekel.16   junij '91, Novo mesto5
   41. pot.170   za seboj.49   so ga vprašali:16   si je rekla Veronika.5
   42. glas.169   iz sobe.48   je vprašala Alica.15   Vrata so se odprla.5
   43. roke.169   pri sebi.48   se je nasmehnila.15   Veronika,<< je rekla Martina.5
   44. doma.165   z menoj.48   v svojo sobo.15   jih ni bilo več.5
   45. besede.164   za to.47   vse v redu.15   in se ne gane.5
   46. hišo.159   na dan.46   in mu rekli:14   to je bilo vse.5
   47. meni.159   pred njim.46   je rekel Timmy.14   od nog do glave.5
   48. njem.156   v sobo.46   sem ter tja.14   je dejal Phileas Fogg.5
   49. noč.155   z rameni.45   drug v drugega.13   je odvrnil Mr. Fogg.5
   50. vprašal.154   je zgodilo.44   je vprašala Anica.13   od glave do nog.5


Tabela 52: Najpogostejši besedni n-terčki na koncih povedi v drugem vzorcu

1   2   3   4
   1. oči.170   Peter Majcen.79   je popraskal kmet.40   se je popraskal kmet.40
   2. je.155   za njim.58   zamahnil z roko.33   hočemo, je že tako!18
   3. glavo.147   z glavo.55   zmajal z glavo.26   je rekel Peter Majcen.17
   4. njim.123   z roko.45   je že tako!19   in zamahnil z roko.11
   5. rekel.114   je rekel.44   rekel Peter Majcen.19   patacis, repa in krompir!11
   6. rekel:112   popraskal kmet.40   in se obrnil.15   gozdov in zelenega morja.10
   7. roko.106   sem rekel.38   in tako dalje.14   kakor šiba na vodi.10
   8. naprej.90   k sebi.35   in se zamislil.13   kajpak,<< se je popraskal.9
   9. več.84   na tla.35   in zaprl oči.13   moj hramček bo zaprt Q9
   10. ni.84   je rekla.33   kakor se reče.12   da bi se ozrl.8
   11. Majcen.79   k njemu.33   se je popraskal.12   je prikimal Peter Majcen.8
   12. vprašal.73   in rekel:32   repa in krompir!11   je zamahnil z roko.7
   13. roke.71   je vprašal.29   se je vprašal.11   je vprašal Peter Majcen.6
   14. vanj.68   okrog sebe.28   in zelenega morja.10   je zmajal z glavo.6
   15. vrata.67   se je.28   ozrl okrog sebe.10   kakor bi hotel reči:6
   16. očmi.63   z njim.28   šiba na vodi.10   kakor griva divjega konja.6
   17. ne.63   iz hiše.27   vrata za sabo.10   sonce, na zemljici mraz.6
   18. teta.63   v hišo.26   ga je prešinilo.9   svojimi velikimi, nejasnimi očmi.6
   19. hišo.62   v izbo.25   hramček bo zaprt Q9   bi smrt švignila mimo.5
   20. otrok.61   v oči.25   in se nasmehnil.9   da bi se ozrla.5
   21. dan.59   v dolino.24   je rekel kamen.9   in zmajal z glavo.5
   22. oče.59   na noge.23   je rekla teta.9   in zmaje z glavo.5
   23. sebe.59   sem vprašal.23   Tako je to!9   iz kota v kot.5
   24. rekla:58   v kuhinjo.23   zmignil z rameni.9   je pomislil Peter Majcen.5
   25. obraz.58   in rekla:22   bi se ozrl.8   kakor oči divje živali.5
   26. hiše.57   na cesto.22   je rekel macesen.8   moje okno še zaprto.5
   27. kmet.56   ni več.21   Matic Enaka Palica.8   od hiše do hiše.5
   28. mama.55   in šel.20   prikimal Peter Majcen.8   ponovil Matic Enaka Palica.5
   29. domov.53   na mizo.20   velikimi, nejasnimi očmi.8   s pestjo po mizi.5
   30. doma.53   ni bilo.20   vprašal Peter Majcen.8   si zapomnil ta ukaz.5
   31. sebi.51   z rameni.20   zmaje z glavo.8   svoje debele, solzave oči.5
   32. besede.50   k njej.19   in zaprla oči.7   vsi so za vas.5
   33. tla.50   pred njim.19   je zagrmel Luka.7   zaprl vrata za sabo.5
   34. pob.49   proti vratom.19   naravnost v oči.7   ga je prekinil pob.4
   35. vprašal:49   v njem.19   pomislil Peter Majcen.7   in glasno požrl slino.4
   36. vasi.49   v obraz.19   z obema rokama.7   in ta bo prava!4
   37. njej.48   in vstal.18   zapomnil ta ukaz.7   je zaničljivo prhnil Furlan.4
   38. glas.48   očka Orel.18   zmajala z glavo.7   ne bele ne črne.4
   39. mizo.47   v vodo.18   >>Kaj pa je?<<7   opotekel, a padel ni.4
   40. stric.44   k mizi.17   bi hotel reči:6   otrpnili na poraščeni bradi.4
   41. glasom:44   po dolini.17   griva divjega konja.6   pritajeno drsi skozi veje.4
   42. Martin.44   >>Hm, kajpak Q17   je ponovil Matic.6   se bo Krist rodil.4
   43. noge.43   in dejal:16   je prikimal Hotejec.6   se ozrl okrog sebe.4
   44. njem.43   in vprašal:16   je rekel oče.6   žalostno zmajal z glavo.4
   45. je!43   pri srcu.16   je rekla jelka.6   in čakali, kaj bo.3
   46. Luka.42   se ozrl.16   je rekla mama.6   iz čistega srebra ulit.3
   47. rekla.42   Travnikarjev stric.16   je vprašal pob.6   je bilo že prepozno.3
   48. hiši.41   za njo.16   Mar ni res?6   je obdržal na nogah.3
   49. njemu.41   o tem.15   na vse grlo:6   je pribil Peter Majcen.3
   50. življenje.40   se nasmehnil.15   na zemljici mraz.6   je prikimal stari mornar.3

Poleg najpogostejših n-terčkov besed kjer koli v povedih je zanimivo še, s kakšnimi besednimi n-terčki oziroma frazami se povedi najpogosteje začnejo in končajo. V tabelah 49 in 50 so navedeni najpogostejši n-terčki na začetkih povedi v prvem in v drugem vzorcu, v tabelah 51 in 52, vse na prejšnjih straneh, pa na koncih povedi za oba vzorca.

Ker je povedi veliko manj kot besed, so manjše tudi frekvence v tabelah od 49 do 52. V tabeli 49, ki se nanaša na začetke povedi in na prvi vzorec, je videti zelo zanimivo strukturo pri enojčkih. Na začetkih povedi najpogosteje najdemo kratke besede, predvsem veznike, predloge in členke. Skoraj polovica (24) jih je dolgih 2 črki ali manj, tri četrtine 3 črke ali manj in le ena beseda, vendar, je dolga 6 črk. Morda malo presenetljivo je odločno na prvem mestu, v drugem vzorcu še veliko bolj, veznik in, ki smo ga sicer vajeni sredi povedi. V celi tabeli 49 najdemo le 12 konkretnih n-terčkov med 200, od katerih jih 11 izvira iz prevodov in le 1 iz izvirnega leposlovja (Veronika se je). Na začetkih povedi se oba vzorca tudi precej dobro ujemata - pri enojčkih je istih 78 %, pri dvojčkih 52 %, pri trojčkih 28 %, pri trojčkih pa le še 14 % ali 7 (In ko se je, In tako se je, Ko pa se je, Obrnil se je k, Potem pa se je, Tedaj pa se je, V tem trenutku se in Zdelo se mi je).

Morda še bolj zanimivi so besedni n-terčki na koncih povedi, ki jih najdemo v tabelah 51 in 52. V nasprotju z začetki povedi tu pri enojčkih najdemo skoraj izključno samostalnike, glagole in zaimke. Če odštejemo ločilo na koncu povedi in navednice premega govora, je v obeh vzorcih na prvem mestu glagolski deležnik rekel, značilen predhodnik povedi s premim govorom, na drugem mestu glagol je, na tretjem mestu pa prvi samostalnik, oči. Pri četrtem mestu se vzorca razideta. Ujemanje je pri enojčkih 52 %, pri dvojčkih 44 %, pri trojčkih in četvorčkih pa ni niti enega, ki bi nastopal med najpogostejšimi 50 v obeh vzorcih. Če pogledamo trojčke prvega vzorca, hitro tudi postane jasno, zakaj. Med njimi jih je namreč kar 14 ali več kot četrtina tipa je rekel Ime: je dejala Alica. je vprašala Alica. je pomislila Alica. je rekla Alica. je vprašala Anica. je rekla Veronika. je rekla Martina. je rekel Bouvard. odvrnil Phileas Fogg. je rekel O'Brien. je rekel Winston. je rekel Pécuchet. je rekel Ray. in je rekel Timmy. Vsi ti n-terčki so seveda konkretni, takoj jih lahko postavimo v konkretno knjigo in v veliki večini spet izvirajo iz prevodov.

Besedni n-terčki na koncih povedi imajo tudi večjo entropijo od tistih na začetku - v prvem vzorcu ima najpogostejši enojček na začetkih (In) relativno frekvenco 3,02 %, na koncih (rekel) pa le 0,49 %. Razporeditev n-terčkov besed na začetkih, še bolj pa na koncih povedi bi utegnila biti zanimiva za ugotavljanje avtorstva.


5.3 Povedi

Povedi so, v nasprotju s črkami in besedami, že zaključene enote besedila. Njihova struktura in raznovrstnost ločita besedila med seboj po kvaliteti in tudi drugače. Zato bi bila kvantitativna raziskava povedi, še posebno v oblikoslovno označenem besedilu, zelo zanimivo in hvaležno opravilo. Žal pa je preskok od besed k povedim še večji od tistega s črk na besede in bi bil za tako raziskavo, kakršna je bila še možna pri besedah, potreben bistveno, vsaj za velikostni razred večji vzorec. Nekaj o povedih je bilo že navedenega v razdelku o besednih n-terčkih, sledi pa še nekaj podatkov o dolžinah povedi in o najpogostejših povedih.

5.3.1 Dolžine povedi

Iz dolžin povedi se da razbrati marsikaj o zvrsti besedila: besedila s kratkimi povedmi so bolj tekoča in lažje berljiva od tistih z dolgimi, dolžine povedi pa veliko povedo tudi o avtorjevem stilu. V tabeli 53 so navedene dolžine povedi za oba vzorca, v besedah.

Tabela 53: Dolžine povedi za oba vzorca v besedah

                          najmanjša    največja    povprečna    standardni
                      povedi    dolžina    dolžina    dolžina    odklon
  
Prvi vzorec          201.445    1    1.002    13,51    11,86
Drugi vzorec          37.459    1    284    10,91    9,51
  
Skupaj               238.904    1    1.002    13,10    11,56

Povprečne dolžine v znakih so 77 za prvi vzorec, 60 za drugi in 75 za oba skupaj. Najdaljša poved v prvem je dolga 6.035 znakov, v drugem pa 1.836. Standardni odklon je bil dodan zaradi zelo velikih razlik med povprečnimi in največjimi dolžinami. Ker je ta odklon v vseh treh primerih skoraj tako velik kot aritmetična sredina, so porazdelitve daleč od normalne. Porazdelitev dolžin za oba vzorca skupaj je na sliki 16. Najbolj pade v oči, da je močno asimetrična v levo. Največ povedi, po približno 6 % celote, je dolgih od 4 do 7 besed, z vrhom pri 5. Porazdelitev se strmo dvigne od skoraj 3 % pri eno besedo dolgih povedih do vrha pri dolžini 5, potem pa vse počasneje pada proti koncu. Aritmetična sredina pri 13 besedah je že precej naprej od vrha.

Na sliki 17 sta prikazani porazdelitvi za vsak vzorec posebej. Stolpci prvega vzorca so označeni s črno barvo, drugega pa z belo. Vrh je pri obeh vzorcih ostal, kjer je bil tudi pri skupnem besedilu (5), opaziti pa je znatno prevlado kratkih povedi v drugem vzorcu, do vključno dolžine 8.

Slika 16: Porazdelitev dolžin povedi v besedah za oba vzorca skupaj

Največ povedi, po več kot 7 %, je dolgih 4, 5 in 6 besed, zelo veliko, bistveno več kot pri prvem vzorcu pa je tudi zelo kratkih povedi, z dolžino 1, 2 in 3. Očitno je v drugem vzorcu veliko več premega govora, kar lahko preverimo s pomočjo podatkov o premem govoru v tabelah 29 in 30. V prvem vzorcu je 45.887 pojavitev oznak za začetek in konec premega govora, v drugem vzorcu pa 10.353. V prvem pride torej 4,39 povedi na en premi govor, v drugem vzorcu pa le 3,62.

Slika 17: Porazdelitev dolžin povedi v besedah za vsak vzorec posebej

Najkrajše povedi so lepo razvidne iz tabel 57 in 58 v naslednjem razdelku, po 5 najdaljših povedi za oba vzorca pa je navedenih v tabelah 54 in 55. V prvem vzorcu je vseh 5 iz istega dela - Zmot dijaka Tjaža Florjana Lipuša, v drugem vzorcu pa so 1., 3. in 5. med najdaljšimi povedmi iz Hiše št. 14, 2. iz Balade o trobenti in oblaku, 4. pa iz Življenja in dela Venca Poviškaja.

Tabela 54: Najdaljših 5 povedi iz prvega vzorca

1. (1002 besedi) Brez rjuh se odeje doma ne smejo uporabljati, med spanjem mora biti blazina obrnjena, da se le ne umaže ali preveč izrabi, bi moral vsakdo imeti med blazino in rjuho, lastno odejo ali kaj podobnega, prvi torek v mesecu mora vsak pustiti rjuhe na postelji, prevleke pa mora vsak sneti z zglavnika zastran menjave, če so rjuhe popackane zaradi nočnih izlivov semena, je treba taka mesta skriti na ljubo nunam, ki pobirajo rjuhe, v kopalnicah je treba že pred slačenjem vsakikrat previdno uporabiti plastično zaveso, poleg tega prha ne sme biti preveč in predolgo odprta, da se voda ne trati, če se je kaj vode razlilo, jo mora vsak takoj obrisati s cunjo, po kopanju je treba pustiti kopalnico tako snažno, kakor bi jo hotel najti vsak, zato jo je treba osnažiti z gobo ali metlico in paziti, da ne ostane odtok zamašen z lasmi, isto pravilo mora veljati tudi v straniščih, da se le-ta ne zamašijo, se smejo riti brisati le s toaletnim papirjem, za odpiranje hlačnega razporka je treba uporabljati levo roko, tisto reč je treba izvleči in držati s tremi prsti levice, curek je treba usmeriti v školjko in pri tem paziti, da se ne razpršuje, zadnje kaplje je treba otresti z roko, na tleh ne sme biti ne koščka papirja in ne kapljice vode, med scanjem naj bo pogled uprt naprej, torej pokončno, naravnost, zavodar je naraven in pokončen človek, še vedno smo pri dobesednem navajanju, obiskovanje stranišč in kopalnic je treba vključiti v vsakodnevno izpraševanje vesti, ker so dijaki tu najbolj izpostavljeni nečistosti, izpraševanje vesti mora potekati po določenem izpraševalnem pravilniku: se nečisto slačil, dotikal, opazoval, gledal, kupoval, daroval v nesramne namene, nesramno pisal ali risal ali hotel nesramno pisati in risati, nesramno govoril, pel, pripovedoval, se smejal, mežikal, namigoval, poslušal, vohal, k nesramnosti spodbujal, dajal povod, svojega bližnjega ne odvračal od nje, se ji ne javno uprl, nečisto mislil, želel, hrepenel, si predstavljal, delal ali tudi samo hotel nečisto misliti, govoriti, peti, pripovedovati, se smejati, želeti, hrepeneti, si predstavljati, pogledovati, mežikati, namigovati, poslušati, vohati, k nesramnosti spodbujati, dajati povod, svojega bližnjega ne odvračati od nje, se ji ne javno upreti, nečistovati, sam ali z drugimi, s kom, s fantom ali deklico, s kakim starim fantom in kako mlado deklico, fantom ali deklico kakšnega rodu, premožnega ali revnega stanu, je uspelo, ni uspelo, kolikokrat in kako pogosto, kako dolgo vsega skupaj in kako dolgo posamič, in tako naprej, zapomni si: kar je za čistočo in telesno zdravje potrebno, to je tudi dovoljeno, vse, kar se s tvojim telesom dogodi, ne da bi bil to sam hotel ali sam zakrivil, vse to ni greh, temveč božja volja, vidiš taka je božja volja, bog te je iz svoje neskončne milosti ustvaril takega, izkaži se vrednega tega, posnemaj dobre zglede, ugašaj luč, luč ne sme nikjer goreti brez potrebe, kaditi je prepovedano, tudi odraslim ni dovoljeno kaditi, ker gre dim v kapelo in Jezus ne prenese kajenja, ako je v kapeli služba božja, naj je nihče ne moti z glasnim govorjenjem, če se sliši na hodnike zborovsko petje, petje korala, odpevov, ljudsko petje in tako dalje, ga je treba spoštljivo poslušati, služba božja je božja služba, v dvorani je televizor vključen navadno od pol osmih do desetih, pomembne oddaje izven tega časa bodo oznanjene na oglasni deski, tam, kjer je nabito tudi oznanilo tedenskih božjih služb, torej red svetih maš, televizorja se ne sme dotikati nihče razen tistega, ki je za dotikanje pooblaščen, časa za gledanje televizije ne bo na pretek, vsak stanovalec doma je dolžan prispevati nekaj svojega prostega časa za skupne potrebe, poleti na primer nabiranje črnic po farovških gozdovih v soseščini, doma je treba obirati sadje, ki ga stiskamo in sok prodamo, da se z izkupičkom more znižati zavodnina, vsak je dolžan nabrati določeno količino teh sadežev za skupnost, kdor bo nabral več, bo javno pohvaljen in nabit na oglasni deski, pri nabiranju mora vladati red, pred očmi je treba imeti občo blaginjo, nabirati je treba vzorno in marljivo, več kot sto metrov se nihče ne sme oddaljiti od zbiralnega tovornjaka, kajti zgodilo se je že, da so se nekateri preveč oddaljili, izginili v grmovju in podraščeni, se tam slekli ali pa tudi ne in kar tako občevali v črničju, ali pa so drug drugemu segali v hlačne žepe in se šlatali, dokler ni prišlo, to je seve prepovedano in zdravju škodljivo, zato bo upoštevanje teh navodil strogo nadzorovano, kajti marsikatera ženska zaman čaka na izliv semena, tu pa igračkanje in potrata, to ne gre več, vodstvo doma tega ne bo trpelo več, zato tisto določilo o sto metrih, to mora zadostovati, poleti črnice, kot smo rekli, jeseni pa pobiramo krompir pri večjih okoliških kmetih, če imajo kmetje hčere ali druge nastavljenke, pobirajo te na drugi njivi ali ob drugem času, zato kmetje dajo domu zastonj nekaj stotov krompirja, za kmete je treba moliti, da jim bog da dobro letino, kadar pobiramo krompir na grofovskih poljih, je treba pobirati urno in natančno, misliti je treba na to, da se pri gospodu grofu zapusti dober vtis, grof je ugleden gospod in ima vpliv, počasi prihajamo h koncu dobesednega navajanja hišnega reda, kdor se pregreši proti hišnemu redu, pa četudi samo proti eni sami določbi, dobi za kazensko nalogo spis pod naslovom >>Krščanske vrline hišnega reda<<, kdor je tak spis že pisal in se vnovič pregreši ter mora to nalogo pisati vdrugič, bo izključen iz doma, dva taka spisa pomenita torej isto kot odpust iz doma, to je Tjaž dobro vedel, za to imamo dokaz in to je Tjažev svojeročni spis o krščanskih vrlinah hišnega reda, ki ga hranimo kot dragocen spomenik med njegovimi dokumenti v trezorju, kljub temu se je znova pregrešil in bi bil moral spis pisati vdrugič, tega seveda ni več storil in ga tudi nismo silili v to, sam si je izrekel sodbo, njegova izključitev iz doma je bila torej vseskozi postavna, torej v skladu z določili hišnega reda in smo imeli potemtakem vso pravico do nje, sam nam je potisnil v roke pravne prijeme.

2. (659 besed) Da bo čez nekaj časa tako končal, tega ni nihče mogel predvidevati in tudi ne slutiti, tega tudi nismo nameravali, Tjaž pač ni bil človek za zavod in je bolj zašel kot prišel sem, predolgo se je zadrževal pri nas, zaradi njegovega socialnega položaja smo ga vzeli, iz krščanskega usmiljenja tako rekoč, nobene prave vzgoje, nobenih dobrih zgledov, nobenega ugleda, brez idealov, in to, starši na slabem glasu, oče odstavljen drvar in zapit cestni pometač, mati kacetovka, podpirala je partizane, tega bi ji ne bilo treba, takih in podobnih svinjarij si je nakopala, vso okolico je okužila, sama je bila kriva in prav se ji je godilo, zločince je treba odstraniti iz človeške družbe in jo zavarovati pred njimi, izdajalce je treba uničiti, iz teh vzrokov smo ga vzeli v dom, samomor pa nima z domom sploh nič opraviti, o samomoru ni nikoli govoril, samomorilskih misli ni nikoli razlagal, tudi njegovo vedenje ni dopuščalo tega sklepa, čeprav je bilo nekoliko čudaško, predaleč bi šel, kdor bi spravil njegov samomor kakor koli v zvezo z zavodom, človek njegove sorte pač ni mogel končati drugače kot tako, kot je končal, kaznoval se je sam, ker je zašel na kriva pota in se nepripravljen znašel pred nesmiselnostjo svojega početja, njegova vest je bila tankočutno vzgojena, to se nam je v teh kratkih letih z božjo pomočjo posrečilo, s takšno vestjo je do zadnjih odtenkov spregledal svojo zanikrnost, presedlo mu je dolgočasje tako votlega životarjenja iz dneva v dan in si je zato sodil sam, to je treba jasno pribiti, ne da bi odobravali njegovega koraka, nikakor, čeprav odpade zdaj neka skrb in smo se z njegovim koncem znebili spet neke odgovornosti, skrb in odgovornost manj, tudi to je nekaj, kar je treba videti, neko breme nam je bilo odvzeto, ljudje delamo in bog naredi, ljudje pripravljamo in bog izvrši, ljudje stopamo, bog stopi, breme nosimo in omahujemo pod njim, pa nas razbremeni on, ki je neskončno dobrotljiv, odvali od bremen breme, katero najmanj pričakujemo, da ga bo, pa ga, težkim bremenom sami ne moremo do živega, on pa jih odpihne, slava in čast mu za to, naše ljudstvo ni zastonj verno ljudstvo, božja volja je bila, da je umrl, preden je mogel storiti še večje hudobije, prav gotovo bi jih bil storil in je bilo tako za vse najboljše, da se je tako rešil, bog mu bodi dober sodnik, ni imel kaj prida na tem svetu, molili bomo za zveličanje njegove duše, to bo potrebno, jutri bomo s tem začeli, kajti njegova krivda vpije v nebo, res žal za črnilo in papir, saj je vsak lahko vnaprej vedel, da se bo postavil proti nam, vrgel je senco na zavod, ponižal nas je, ki smo bili njegovi prijatelji in smo mu želeli samo dobro, slekel nam je kožo, da bi nas očrnil, vendar mu odpuščamo, nismo se umaknili v stolp samozadovoljnosti in se obdali z užaljenostjo, nismo ga samo vrgli iz doma, kakor je po pravici zaslužil, temveč smo mu tudi odpustili, Malharju je tako rekoč odsekal uho, mi pa smo ga ozdravili, brez ušesa ne more biti, Malhar ne more biti brez njega in uhelj ne more biti brez Malharja, kajti uho brez Malharja ni uho in Malhar brez uhlja ni Malhar, vsaka stvar se mora družiti s pravo stvarjo, vsaka stvar mora biti na pravem mestu, vedno smo bili pripravljeni, da ga ozdravimo, ako bi se vrnil, čut in ljubezen do bližnjega sta nam branila, da bi ga dokončno odstranili, kot bi po pravici zaslužil, ne da bi se nam ne bil maral, kdo to pravi, nismo zaprli vseh poti do njega, vedno bi se bil lahko vrnil iz noči v nerazbiten, svetal dan, če bi bil hotel, pa ni, čudovite izraze premore zavod, nerazbiten svetal dan, besede se ti stopijo na jeziku, ni se vrnil in se je vrnil, vidite, to je tisto, vrnil se je samo toliko, da registriramo njegovo smrt, naredimo križec pri njegovem imenu, niti pozdravil ni več.

3. (591 besed) Zavod je storil vse, kar je bilo v Tjaževem primeru mogoče storiti, vzgajal ga je in mu zaradi težje vzgojljivosti in trdosrčnega vztrajanja v slabem posvetil neznansko veliko skrbi in časa, lahko trdimo, da več kot vsem drugim, ki jih je moral zategadelj zanemariti, dajal mu je nasvete, delil koristne nauke za življenje, poskušal zlepa in poskušal zgrda, skratka, storil je vse, ne samo da bi Tjaž živel, temveč da bi živel, kot se za krščenega človeka spodobi, in če bi zdaj še živel, bi ga lahko sami vprašali, ali se je teh naukov držal, zakaj se jih ni, če se jih ni, in tako dalje, od svojih krivih poti ni obogatel, zavod zaradi njih ni obubožal, Tjaž je ostal takšen, kot se je mislil spremeniti, samo da se je prej že osramotil, za isto mero je klecnil v kolenih, za katero se je hotel povzpeti, ljudje so nerodni in se zunaj sami le redkokdaj znajdejo, posebno še, če dom ni imel dovolj prilike, da bi človeka za to pripravljal, zavod njegove smrti ni zakrivil, pri nas se tega ni naučil, take stvari preprečujemo, kolikor je v naši moči, nismo pogrebni klub ali pokopališko društvo, če se tako vzame, vsega je kriv sam, ker si ni znal naložiti prave količine svobode, pri nas jo je prejemal po malem, vsakič prav toliko, da si je poželiš za kanec več, ko jo umaknejo, zadostila te je in te spet ni zadostila, ker si je prav zaradi tistega pridržanega kanca znova zaželiš, dozirano tako rekoč, po toliko, kolikor je človek prenese, ne da bi pretrpel škodo, v pravi količini torej, tako kot hoče bog, Tjaž pa se je svobode nažrl, drugače njegovih pustolovščin ni mogoče imenovati kot s to grdo besedo nažrl, to so bili tudi vzroki, da je šel rakom žvižgat, zdaj žvižga rakom, kakor je zaslužil, zaradi žrtja se je pretegnil, vedel se je kakor svinja z mehom, ni bil kos življenju v svobodi, ni našel mere in sredine, zato je videl rešitev v samomoru, mislil je, da se samo tako more za svoje presedlanje opravičiti pred lastno vestjo in pred javnim mnenjem, verjetno so vplivali na tako vedenje tudi določeni kompleksi, ki so bili povezani s poklicno neuravnovešenostjo, kar je treba upoštevati kot olajševalne okoliščine, svobodo besede, mnenja, mišljenja, odločanja in ravnanja smo mu dajali tudi mi, seveda v smislu hišnega reda, red mora biti, v njegovih mejah so bile možne vse svoboščine, v tem okviru si je lahko dovolil najbolj si nasprotujoče razlage določil in predpisov, ki vsi izvirajo iz krščanske skrbi za našo mladino, kar je obče znano, in ki so za mlačne kristjane prav zato precej zahtevni, to uvidimo in upoštevamo, kolikor se da, sicer pa je treba vedno več zahtevati, da se malo doseže, sami se lahko prepričate o krščanskem duhu, ki veje iz vseh določil in predpisov hišnega reda, temu v dokaz citiramo dobesedno od škofijstva potrjena sveta besedila, tako dobesedno citiranje se nam zdi umestno, da tako razodenemo hišni red iz prve roke, torej v nedotaknjeni in neomadeževani, tako rekoč v deviški obliki, kolikor široki javnosti še ni znan, in nam nihče ne more podtakniti, da smo ga po svoje zasukali, narobe, takšen tekst bo poznavalca snovi napotil do sklepa, kako lahko bi se ga bilo držati in kako lahkomiselno so ravnali tisti, ki se ga niso držali, težko je priti do drugih sklepov, sploh ne moreš priti do njih vpričo nevarnosti, da bodo dobesedni citati mogoče spačili slog in pokvarili barvitost našega stališča, vendar je kaj takega pač treba stvari na ljubo vzeti nase.

4. (587 besed) Hišni red torej zelo nazorno zahteva, da se morajo vsi v domu stanujoči počutiti kot družina, zdaj že začenjamo z dobesednim citiranjem, zato mora vsak skrbeti za dobre medsebojne odnose, takšne, kakršne hoče bog, od vsakega stanovalca se zahteva pošteno obnašanje v domu in zunaj njega ter vestno upoštevanje hišnega reda ob vseh prilikah, kakor tudi slučajnih predpisov, stanovska dolžnost vsakogar je, da se pridno uči in da pravočasno opravlja izpite, poleg tega pa skrbi za dušni blagor, grobo zanemarjanje te dolžnosti bi imelo za posledico tudi izključitev iz doma, zaradi nevarnosti izgubljanja časa ni dovoljeno, da se kdo mudi v sobi koga drugega dalj časa kot deset minut, za daljši razgovor so na voljo številni skupni prostori, za skupno učenje v privatni sobi je potrebno izrecno dovoljenje, obiski so dovoljeni le v pritličnih prostorih in le do pol desetih zvečer, brez posebnega dovoljenja ne sme nihče nikogar pripeljati v stanovanjske prostore ali ga sprejeti v sobi razen lastnih staršev, vendar je treba tudi v tem primeru obvestiti vodstvo doma, služkinje, ki stanujejo v domu, imajo prost vhod le za opravke v uradu doma, vstop v prostore zunaj lastne sobe jim je strogo prepovedan, enako je prepovedan tudi fantom vstop v prostore uslužbencev, v sobah in v vsem domu morata vladati red in snaga in je treba paziti, da se nič ne poškoduje, v čitalnicah in skupnih prostorih je treba pustiti vsako stvar po uporabi na svojem mestu, kdor povzroči kako škodo v domu, jo mora poravnati, če krivec ostane neznan, bodo stroški popravila naloženi vsem, pribijati ali lepiti slike na zidove ali opremo je strogo prepovedano, kdor želi obesiti na steno kak okrasek, potrebuje za to posebno dovoljenje, v vsaki sobi mora viseti razpelo, v razpelo se je treba večkrat ozreti, paziti je treba tudi, da se tok, plin in voda ne uporabljajo po nepotrebnem, za sušenje perila se lahko napelje trak nad umivalnikom med vijakoma, prilepljene ali z zrakom pritrjene plastične kljuke povzročajo škodo in so zato prepovedane, bivanje v domu bo toliko bolj prijetno, kolikor bolj se bo vsak zavzel za dobro obnašanje, zato naj vsak te predpise in hišni red nosi pri sebi ali hrani na priročnem kraju in jih prebira, tudi premišljuje naj o njih, vsak naj skrbi za dober glas med tovariši v hiši in zunaj nje, obrekovanje zavoda in njegovega vodstva ni dovoljeno, ponoči mora imeti vsak največjo skrb, da nikakor ne moti nočne tišine, vrata je treba zapirati zelo počasi, da ne treskajo, kljuke ni dovoljeno nenadoma izpustiti, ker drugače v železju zaškrta, tudi ključe je treba obračati počasi, da se prepreči ropot, tekanje po stopnicah in hodnikih je prepovedano, hoditi je treba na moč potiho, prav tako ni dovoljeno glasno govorjenje, vsak naj večkrat pomete svojo sobo in jo obriše z mokro cunjo, ki naj meri 20 x 15 cm, po navoščenem podu je treba hoditi v copatah, vsak kos obleke ali papirja mora biti v sobi na pravem mestu, vsako soboto je treba umiti okna z mokro cunjo in obrisati s časopisnim papirjem, za zračenje sobe navadno zadostuje, da je odprta vrhnja oknica, vsak je odgovoren za morebitno poškodbo šip ali zaves, da se pozimi prepreči nepotrebno izgubljanje toplote, je treba sobo zračiti le kratek čas, oknice je treba premikati zelo previdno, da se ne poškodujejo, raba hladilnika je omejena na določeno plastično škatlo, ki stane 39 šilingov, in na pollitersko steklenico, v hladilniku ne sme biti navadno nič drugega, zdaj smo sredi dobesednega navajanja, vsak naj ima svojo odejo, ki jo sme uporabljati, da na njej leži ali sedi.

5. (564 besed) Nunam je najino poznanstvo ostalo še prikrito, potlej sva tvegala zmeraj več, doživel je prve vrhunce z menoj, ostajal do jutra, zdaj ko je mrtev, to lahko povem, pustila sem mu, ker mi je ugajalo, za šalo in iz radovednosti, pomagala sem mu, da je vse zamujeno in zapravljeno spravil pod streho, skraja je odhajal zelo pobit in zaskrbljen, pekla ga je vest in obujal je kes, ob misli na zavod se ga je polaščal živalski nemir, toda počasi se je navadil, mirila sem ga, mu razlagala in ga prepričevala, skupno sva krotila božjast in privide in šlo je, nekaj v njem se je prelomilo na dvoje, nekaj se je obrnilo, kar čutila sem, kako se v njem obrača in presnavlja, kot v kvasu je delovalo v njem, ljubil me je iz odpora, nalašč in iz kljubovanja, v meni je našel sredstvo, da je krenil iz brazde, nikoli ni grdo ravnal z menoj, surovosti ni poznal, to moram priznati in bi priznala tudi v primeru, ko bi še živel, ne govorim samo zaradi njegove smrti tako o njem, bil je dober z menoj, v dokaz navajam, da mi je, čeprav je bil brez denarja, kupil uro, verižico, knjige in druge stvari, ki sem jih potrebovala ali si jih želela, znal je uganiti, vselej je bil nežen in obziren, poniževal me je samo občutek, da mu nisem bila namen, temveč sredstvo, mogoče sem si to samo domišljala, opravičuje pa me dejstvo, da nisva mislila nič resnega, nazadnje me to ni več motilo, sprijaznila sem se, nisem tega storila zastonj, sama sem skrbela, da nisem ostajala prikrajšana, ni bil prvi in ne zadnji moški, bil je eden od tistih, ki so bili po svoji usodi edinstveni in zato nekako vendarle prvi in hkrati zadnji, hočem reči, ta mladi moški je z mojo pomočjo uresničil samega sebe, postal je Tjaž, kakor še nikoli pred menoj in nikoli za menoj, najbolj resnični, prvobitni in izvirni Tjaž, kot ga poleg njega ni bilo drugega, prepričana sem, da nikjer na svetu, kot ga ni bilo drugače in ob drugem času in iz drugih razlogov in z drugih vidikov in v drugi nakladi, pri tem dvomim, da ponovim domnevo, da je ta čudaški človek kdaj prej prekopal svojo naravo res za vsemi duhovnimi in telesnimi dobrinami in z njimi tvegal strast, in če jih je bil izkopal, komu naj bi jih bil izkazal, vse to je imel za preveliko nedostojnost in greh, raje se jim je odpovedal in jih s silo zatrl, junak Tjaž ni bil, manjkalo mu je poguma in samozavesti, bal se je, da bi ga strast ljubljenja ne razvnela tako, da bi zraven od naporov in razburjenja crknil, ugasnil kot sveča, pobodlo bi, mogoče bi v dolžini četrt kolesa zapeklo in najbrž bi zamudil, da je mimo, da je život dotrajal in se enkrat za vselej zavozlal ravno v trenutku, ko bi se pričel orgazem, tako da njegovega konca ne bi več pričakal, pred to možnostjo je vselej trepetal in se zgrozil, čeprav bi bil to lep in lahek konec, kar nasladna, pravljična smrt bi ga doletela, ne, junak Tjaž nikakor ni bil, kvečjemu je bil junak tisto uro, ko se je odločil za skok z najvišje stolpnice celega mesta, a to je bilo pozneje in čisto ob koncu, toliko da se je še tik pred svojim koncem nalezel junaškega slovesa, junak ali nejunak, naj bo, kakor hoče.Tabela 55: Najdaljših 5 povedi iz drugega vzorca

1. (284 besed) Na vse zadnje so se socialno čuteči, po sami rimski in božji previdnosti postavljeni tržaški občinski svetniki do grla nasitili, gledati in poslušati brezposelne, na cesto pognane družinske očete, zapuščene vdove in onemogle starce, ki so slabokrvni in jetični od lakote, garjavi, nadušljivi in polni revmatizma od prenočevanja po zatohlih kavernah in zasmrajenih mestnih podzemskih kanalih, skrhani in sključeni, razjedeni in oglodani od trdega življenja, vsak dan v večjih trumah prihajali na magistrat ter krevljali po dolgih svetlih hodnikih, puščali na preprogah rjave odtise svojih blatnih, pošvedranih obutev, pobirali čike izza pljuvalnikov, se vsekavali kar s prsti, zamolklo kašljali, grkali, smrkali in metali široke pljunke kamor je naneslo, stresali bolhe, uši in stenice, zaudarjali po kislem smradu raztrganih in gnilih cunj, prijemali s svojimi umazanimi lopatastimi rokami za svetle medene kljuke na vratih, vstopali v sobe in se raztezavali po njih kakor smradljiv, dušeč dim, se obešali za suknje gospodom uradnikom, ki so tako lepo dišali po milu, se odkrivali, držali raztrgana pokrivala z obema rokama nizko na kolenih ter dokazovali, da niso divjaki, temveč ljudje, ustvarjeni po božji podobi in volji, trdili, da so Italijani od pamtiveka, fašisti od vsega začetka, državljani, udani Mussoliniju, kralju in papežu, ter prosili košček strehe svojim prezeblim otrokom in bolnim ženam: saj morajo vendar živeti, dokler jim je usojeno; ali naj se mar lepo zleknejo ob cesti in mirno počakajo na ljubo smrt; ali naj se pobesijo na hlačne jermene; ali naj svoje otroke pobijejo, pokoljejo, pomečejo v morje; ali naj noseče žene usmajajo ponoči po cestah in ponujajo po dve liri svoje kosti - o, saj bi jih, toda nihče se ne zmeni zanje, ker je dovolj bolje ohranjenih žensk; ali naj začnejo krasti, pobijati - ali kaj?

2. (240 besed) In zakaj je ne bi dokazali, če se nudi priložnost? - mrzlo in uradno dokazujejo, da je ločila postavljal smiselno, čeprav jih ni postavljal po splošno veljavnih pravilih; da je njegov jezik živ, lep in tekoč, čeprav ne bi mogli trditi, da bi bil kremenit; da je bil dober stilist, nemara celo predober, saj ga je včasih zaneslo v drugo skrajnost, v artizem; da je bil mojster verističnega, realističnega dialoga, čeprav ga ne moremo prištevati k čistim realistom; da je v njegovih delih precej pristnih epičnih momentov, a da se nikdar ni povzpel do pravega epičnega pisanja; da je bil zakrknjen lirik s precejšnjim romantičnim navdihom; da je bila njegova satirična žila tako močna, da je včasih brizgnilo iz nje tudi tam, kjer ne bi bilo treba; da so njegove misli kar lepo zaokrožene, večkrat celo izvirne, čeprav niso nenavadno globoke; da je bil miselno napreden, čeprav z lahkoto zasledimo, da se ni ukvarjal s proučevanjem družboslovnih del; da so njegovi značaji doživeti in živi, ljudje iz mesa in krvi, čeprav niso monumentalne, enkratne figure; da je gledal na svet nekoliko zviška in z rahlim posmehom, čeprav je bil v resnici prežet s humanizmom; da je napisal zelo malo, a da je njegovo pisanje kulturno, dokaj svojsko in sugestivno, čeprav mu naposled vendarle nekaj manjka; da so Q da je Q skratka, vsemu navzlicu navkljub je bil mož človek in umetnik in zato je prav res škoda, ker je legel v prerani grob Q

3. (164 besed) Odprla je svoja težka okovana hrastova vrata in začela požirati stare črvive omare z neštevilnimi predali; škripajoče postelje s trhlimi nogami; polomljene stole; raztrgane divane, iz katerih je silila vlažna in umazana morska trava in ki so bili v tej gneči tako podobni ranjencem s preparanimi trebuhi; kolesa otroškega vozička, pribita k navadnemu zaboju s širokim napisom § Cirio zmerom in povsodş ali pa §Vzemite po kosilu pomarančo Gaddi, ki Vas osveži in Vam pospešuje prebavoş in v njem jokajoč, koščen otrok; razklane kovčege, pisane cule, raztrgane vreče in podobno slikovito ljudsko bogastvo; požirala je hiša starce z redkimi, ščetinastimi, sivimi bradami; upognjene ženice s pridušenim stokanjem na ustih; trde, zarjavele može, ki so preklinjali pod težkimi bremeni; žene s širokimi nosečimi trebuhi in z dojenčki na mlahavih, cunjastih prsih; otroke, ki so venomer vreščali, hlipali in smrkali; hihitajoče se blodnice po ljudskih cenah in žvižgajoče potepuhe, ki so mirno prihajali s kapo postrani, s pisano kričečo ruto za vratom, in kadili svoje večne čike.

4. (156 besed) Poslovil se je od nadaljnjih radosti in tegob življenja na zemlji, od norčavih južnih vetrov, ki so razigrano pihali od vseh štirih strani na vse štiri strani sveta, veselo oznanjali pomlad in naravnost z otroško razigranostjo vneto tlačili dim iz dimnikov nazaj v kuhinje, da so se gospodinje cmerile okrog ognjišč in s solzami zalivale jedi, ki so se kuhale po piskrih; poslovil se je od zemlje, ki se je dramila iz zimskega spanja, od teloha, ki je že odcvetal in se vdano pripravljal na smrt, od cvetočega resja, od čebel, od vrb in njihovih mačic, od mladik, ki so se vijugale k mlademu soncu in naglo poganjale očesca, od vonja po pravkar nakidanem gnoju, od bližajočih se velikonočnih praznikov in od otrok, ki so se podili po lužah, se lasali, se obdelovali s pestmi in proti ter se vselej, kadar koli so zagledali Venca Poviškaja, z novimi močmi grabili za trebuhe in kričali za njim.

5. (138 besed) O, tudi njim od skrbi sivijo lasje: delnice N. G. I. rapidno padajo; delnice Cosulich Line so že brez vsake vrednosti in jih lahko mirne duše vzamejo s sabo na stranišče; je v obupnem položaju - treba bo napovedati prisilno poravnavo, da se nekoliko opomorejo; se ne obrestuje; žena ima kamne v mehurju in hoče na vsak način v Viareggio; služkinja je razbila dragoceno japonsko vazo in milostljiva bo prav gotovo dobila živčni napad, ko bo to zvedela; hči je zbežala s centurionom milice in zdaj pošilja pisma ter grozi z družabnim škandalom, če ji ne odštejejo mastne dote; v gimnaziji je afera s sinom, ki je pokazal več talenta za zvodništvo mladih deklet kakor za Risorgimento; Lola, §angel plaviş, zahteva sto lir na večer, in če jih ne dobi, odpotuje - težko je dati stotak, toda še težje je biti brez Lole.


5.3.2 Najpogostejše povedi

Povedi je za velikostni red manj kot besed. Iz tega in iz dejstva, da je največ vsaj nekajbesednih, bi bilo pričakovati, da bo najpogostejša poved imela že precej nizko frekvenco. V tabelah 57 in 58 je navedenih približno 100 (do zaključene meje neke frekvence) najpogostejših povedi iz prvega in iz drugega vzorca. Po pričakovanju prevladujejo kratke povedi, vzete iz premega govora ali povezane z njim. V prvem vzorcu je približno desetina (13) konkretnih, od tega 9 iz Nove zaveze ( Jezus je odgovoril: Jezus ji reče: Jezus jim je odgovoril: Jezus jim je rekel: Jezus mu je odgovoril: Jezus mu je rekel: Jezus mu odvrne: Jezus pa jim je rekel: Jezus pa mu je rekel:), v drugem pa še dosti več, predvsem iz Balade o trobenti in oblaku in iz Tantadruja.

Po zvrsti je v prvem vzorcu med prvimi 109 32 % pritrdilnih (npr. Da. Tako je. Vsekakor.), 22 % vprašalnih (npr. Kako? Ali ne? Kako to misliš?), 18 % takih, ki uvajajo premi govor (npr. Rekel jim je: Krpan odgovori: Odgovorili so mu:), 13 % nikalnih (npr. Ne. Ne vem. Mislim, da ne.), 9 % velelnih (npr. Lahko noč! Ha, ha! Ne boj se!) in samo 6 % povednih (npr. Nič. Zasmejal se je.).

Pri drugem vzorcu je podoba precej drugačna: pritrdilnih povedi je 13 %, vprašalnih je 22 %, takih, ki uvajajo premi govor sploh ni, nikalnih je 6 %, velelnih 39 %, povednih pa 20 % (npr. Tišina. >>Hm, kajpak,<< se je popraskal kmet. Tišina. >>Na nebu je sonce, na zemljici mraz.).

V preseku med obema vzorcema (naveden je v tabeli 56) je le 16 povedi, ki so vse zelo kratke in stereotipne.

Tabela 56: Presek najpogostejših povedi obeh vzorcev

>>Da.      Kam?    >>Ne!    >>Seveda.
Kaj?      >>Kje?<<    >>Ne, ne!    >>Tako!
>>Kaj?     Ne!    Nič!    >>Tako je!
>>Kako?    >>Ne.    Nič.    Zakaj?Tabela 57: Najpogostejše povedi v prvem vzorcu s frekvencami

   1. >>Da.<<191   38. >>Ne vem.<<14   75. >>Da, tako je.<<8
   2. >>Tako je.<<184   39. >>Strinjam se.<<14   76. Odgovorili so:8
   3. >>Vsekakor.<<86   40. Rekel je:14   77. >>Kaj pa je to?<<8
   4. >>Seveda.<<71   41. >>Jasno.<<13   78. >>Kje?<<8
   5. >>Gotovo.<<54   42. >>Pravilno.<<13   79. >>Ne boj se!8
   6. >>Ne.<<47   43. >>Zakaj?13   80. >>Ne, ne!8
   7. >>Kako?<<46   44. Ne!12   81. >>Nič.8
   8. Doktor Pipec.38   45. >>Popolnoma pravilno.<<12   82. >>Pridi!<<8
   9. Doktorand Kolenec.35   46. >>Se strinjam.<<12   83. >>Tako je!8
   10. Ali ne?<<34   47. Dejal je:11   84. Jezus jim je rekel:7
   11. >>Prav gotovo.<<33   48. Jezus mu je rekel:11   85. Jezus ji reče:7
   12. >>Nikakor ne.<<32   49. Kaj?11   86. Jezus pa mu je rekel:7
   13. >>Nujno.<<32   50. Lahko noč!<<11   87. Je tako?<<7
   14. Ne.31   51. Odgovoril je:11   88. Kajne?<<7
   15. >>Kaj?30   52. Jezus je odgovoril:10   89. Kaj je to?7
   16. >>Kaj?<<28   53. Jezus mu je odgovoril:10   90. Nikakor ne!7
   17. >>Zakaj?<<26   54. >>Ja.10   91. Odgovorili so mu:7
   18. Rekel jim je:26   55. >>Nikakor ne!<<10   92. >>Dobro.<<7
   19. Jezus jim je odgovoril:24   56. >>Prav.<<10   93. >>Kaj misliš s tem?<<7
   20. >>Očitno.<<24   57. >>Veronika!<<10   94. >>Kako misliš to?<<7
   21. >>Dobro.23   58. >>Zakaj ne?<<10   95. >>Kateri?<<7
   22. Odgovoril jim je:21   59. Da.9   96. >>Kdo?7
   23. >>Ne.21   60. Ha, ha!<<9   97. >>Mislim, da ne.<<7
   24. >>Ne!20   61. Jezus pa jim je rekel:9   98. >>Ne!<<7
   25. >>Kako to misliš?<<19   62. >>Da!9   99. >>Res?7
   26. Amen.18   63. >>Gotovo.9   100. >>Sem.<<7
   27. >>Tako se zdi.<<18   64. >>Jaz?9   101. >>Seveda!7
   28. >>Kako?17   65. >>Nič!<<9   102. >>Tako!7
   29. Zakaj?17   66. On pa jim je rekel:9   103. >>Vsekakor.7
   30. >>Brez dvoma.<<16   67. >>Štiri!<<9   104. >>V tem imaš prav.<<7
   31. >>Seveda.16   68. >>Tako?9   105. Prav.7
   32. >>Da.15   69. Zasmejal se je.9   106. Rekli so mu:7
   33. >>Dobro!15   70. Jezus mu odvrne:8   107. Seveda!7
   34. >>Res je.<<15   71. Kam?8   108. Tako!7
   35. Nič.14   72. Krpan odgovori:8   109. Vprašali so ga:7
   36. >>Ja.<<14   73. Ne vem.8
   37. >>Ne vem.14   74. Nič!8


Tabela 58: Najpogostejše povedi v drugem vzorcu s frekvencami

   1. >>Hm, kajpak,<< se je popraskal kmet.32   42. >>Pa kaj hočemo, je že tako! Q5
   2. Tišina.24   43. >>Stane!5
   3. >>Hm, kajpak Q22   44. Aha!4
   4. >>Kaj?22   45. Ali razumeš?<<4
   5. >>Ne!18   46. Hahaha!<<4
   6. Tak!14   47. Halo!4
   7. >>Aha!14   48. Halo!<<4
   8. Hm?12   49. In kajne, gospod?<<4
   9. Ne!12   50. Kaj še!4
   10. Mhm Q11   51. Kaj?4
   11. >>Pha!11   52. Kje pa!4
   12. A?10   53. Nič!4
   13. >>Seveda.10   54. Nič.4
   14. Tako je to!9   55. Pa kaj hočemo, je že tako! Q<<4
   15. >>Hm, kajpak,<< se je popraskal.9   56. Peter je molčal.4
   16. >>Prišla bo bridka smrt,    57. Pijte! Q<<4
          moj hramček bo zaprt Q<<9   58. Raus e patacis, repa in krompir!<<4
   17. >>Tak!9   59. Stane!4
   18. Zakaj?8   60. Ta-a-ta-an ta-a-ta-an ta-a-an-ta-druj.4
   19. >>Drejc!8   61. Top!4
   20. >>Tako je!8   62. Trenutek tišine.4
   21. Kam?7   63. V Obrekarjevi izbi.4
   22. No!7   64. Vidiš,<<4
   23. >>Halo!7   65. >>Ana!4
   24. >>Raus e patacis, repa in krompir!<<7   66. >>A?!4
   25. A?<<6   67. >>Bom!4
   26. Ju-u-hu-u, ju-u-hu-u ju-hu-hu-hu-huj Q<<6   68. >>Da.4
   27. Mar ni res?6   69. >>Ha!4
   28. Uuu!6   70. >>Kaj pa je?<<4
   29. >>Boga mi!6   71. >>Kje?<<4
   30. >>Na!6   72. >>Ne, ne!4
   31. >>Na-a nebu je-e sonce, na zemljici mraz.6   73. >>Ne.4
   32. >>Saplater!6   74. >>No!4
   33. >>Stric!6   75. >>Pha!<< je zaničljivo prhnil Furlan.4
   34. Ali me poslušaš?5   76. >>Pijte!<< je rekel.4
   35. Molk.5   77. >>Poslušam Q4
   36. Na!5   78. >>Saj!4
   37. Na-a-biram ja-az zvonce in vsi so za vas.5   79. >>Saplater?4
   38. Seveda.5   80. >>Tako!4
   39. >>A!5   81. >>Tako.4
   40. >>Kako?5   82. >>Zakaj pa?4
   41. >>Ooo-hooo Q<<5

5.3.3 Lipogramske povedi

Pri povedih so zanimivi še lipogramski pojavi, to je deli besedila brez ene ali več črk. Primera sta npr. angleška poved

        Youth, throughout all history, had had a champion to stand up for it; to show a doubting world that a child can think; and, possibly, do it practically; you would constantly run across folks today who claim that 'a child don't know anything'. (Wright 1939)

in francoska

        ... Ton bouton, ou tout va mourir, ton bouton, bastion final ou j'irai m'annulant, ou j'irai m'absorbant, m'abolissant dans un amour toujours a accomplir, dans l'absolu sursaut ou nous vivrons un jour, confondus a jamais, dans la passion ou dans l'oubli, dans la nuit ou tout disparaît, dans l'infini instant ou nous n'aurons qu'un corps! (Perec 1969).

Oba primera sta vzeta iz del, ki sta bili napisani brez uporabe črke e. Niti v prvem niti v drugem vzorcu ni kakega takega dela, je pa precej povedi, ki so zanimive s tega vidika. V tabelah 59 in 60 je navedenih po pet najdaljših povedi iz prvega in iz drugega vzorca, ki ne vsebujejo črke e. Vsega skupaj je v prvem vzorcu 9.102 takih povedi ali 4.52%, v drugem pa 2.958 ali 7.90%.

Tabela 59: Najdaljše povedi iz prvega vzorca brez črke e z dolžinami v znakih


Tabela 60: Najdaljše povedi iz drugega vzorca brez črke e z dolžinami v znakih

V tabeli 59 sta 1. in 4. poved iz prevoda Flaubertovega romana Bouvard in Pécuchet, 3. in 5. iz Nove zaveze, druga pa iz novele Boj na požiralniku Prežihovega Voranca. Zanimive so še povedi, ki vsebujejo največji delež najpogostejše črke. V tabelah 61 in 62 je navedenih po prvih pet takih povedi v prvem in drugem vzorcu, ki imajo vsaj štiri besede (največje deleže imajo medmeti v zelo kratkih povedih).

Tabela 61: Vsaj 4 besede dolge povedi iz prvega vzorca z deležem črke e v odstotkih


Tabela 62: Vsaj 4 besede dolge povedi iz drugega vzorca z deležem črke e v odstotkih

Popolnoma drug zven kot povedi brez črke e imajo povedi brez črke a. Najdaljše za oba vzorca so navedene v tabelah 63 in 64. 1., 3. in 5. poved v tabeli 63 sta iz Nove zaveze, 2. iz Platonove Države, 4. pa iz Cankarjeve Hiše Marije Pomočnice.

Tabela 63: Najdaljše povedi iz prvega vzorca brez črke a z dolžinami v znakih


Tabela 64: Najdaljše povedi iz drugega vzorca brez črke a z dolžinami v znakih

Po pet povedi, daljših kot tri besede in z največjim deležem črke a za oba vzorca najdemo v tabelah 65 in 66. Zanimivo je, da je v tabeli 65 le ena taka, ki nima črke e, v tabeli 66 so pa take kar 4.

Tabela 65: Vsaj 4 besede dolge povedi iz prvega vzorca z deležem črke a v odstotkih


Tabela 66: Vsaj 4 besede dolge povedi iz drugega vzorca z deležem črke a v odstotkih

 


Naslov strani: http://www.jakopin.net/primoz/disertacija/statopis.php        Datum: 26. junij 1999. Zadnja sprememba: 27. marec 2017.             2203

Naprej: Entropija      Nazaj: Oblikoslovno označevanje      Kazalo    Začetek    Konec