tirsdag 6. september 2011

E/e

I dag handler bloggen ikke om ord, men om bokstaver. Nærmere bestemt om den urettferdige behandlingen noen bokstaver får av oss språkbrukere. For bokstavene er langt fra like populære. Hittil har jeg f.eks. brukt ni a-er, bare én å og ingen ø. (Scrabble-spillere kjenner igjen logikken: a-er bruker man støtt, men de er lite verdt; å-er og ø-er er gull verdt, men kan være vanskelige å kvitte seg med.)

Hvordan hadde alfabetet sett ut hvis vi hadde rangert bokstavene etter popularitet? For å finne ut av det har jeg gjennomført et lite eksperiment. Jeg har valgt en middels lang tekst, Fakta om norsk språk av Lars S. Vikør, som ligger ute på Språkrådets nettsider. Denne teksten har jeg så kjørt gjennom en s.k. character frequency analyzer på nett. Her er resultatet:

e 1082
r 756
t 648
a 610
n 603
i 591
s 564
o 494 
l 462
k 431
d 418
m 349
g 323
v 213
å 201
f 200
p 131
u 109
b 93
h 67
j 61
ø 56
y 47
æ 23
c 11
q, w, z 0  

Vikørs tekst består av i alt 8543 bokstaver. I en rettferdig verden ville hver bokstav ha blitt brukt omtrent 300 ganger. Slik er det ikke: bokstaven e alene forekommer over 1000 ganger i denne teksten, altså hver 8. bokstav. Stakkars lille e.

Hvilken bokstav kan du ikke klare deg uten?


Ingen kommentarer:

Legg inn en kommentar