# HG changeset patch # User Steve Losh # Date 1470529006 0 # Node ID 7399fa9ab3319b83eda2e59b5cd5656dcb0a0764 # Parent d573472fbf5e79dd4c851c56ed67952a250b10b9 Syllables diff -r d573472fbf5e -r 7399fa9ab331 scripts/syllables.py --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/scripts/syllables.py Sun Aug 07 00:16:46 2016 +0000 @@ -0,0 +1,12 @@ +import sys + +def syls(word, n): + for i in range(0, len(line) - n): + print word[i:i+n].encode('utf-8') + +for l in sys.stdin: + line = l.decode('utf-8') + syls(line, 3) + syls(line, 4) + syls(line, 5) + syls(line, 6) diff -r d573472fbf5e -r 7399fa9ab331 scripts/syllables.sh --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/scripts/syllables.sh Sun Aug 07 00:16:46 2016 +0000 @@ -0,0 +1,7 @@ +#!/usr/bin/env bash + +echo '(' + +cat written-to-be-spoken.txt books.txt laws.txt school_essays.txt | rstrip | grep . | cut -f1 | grep ... | lower | python syllables..py | grep '[aeioyuáóýúíé]' |grep -v '[.!,]' | sort | uniq -c | sort -nr | head -500 | lstrip | cuts -f2 + +echo ')' diff -r d573472fbf5e -r 7399fa9ab331 syllables.txt --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/syllables.txt Sun Aug 07 00:16:46 2016 +0000 @@ -0,0 +1,502 @@ +( +inn +ann +sem +ver +ing +ein +til +var +han +við +nna +nar +nni +ndi +num +leg +ekk +and +sta +gar +ega +hann +ður +kki +fyr +ekki +það +enn +sam +ins +nin +með +rir +yri +nga +tur +yrir +fyri +fyrir +ess +all +aði +haf +nda +inu +man +erð +tir +þess +þes +ngu +ast +ist +rði +rin +sin +lei +anna +und +þei +eit +því +lega +ski +eir +stu +inga +inni +lan +rei +tar +hve +eða +hei +rið +lag +gin +ning +fti +tta +fra +andi +eim +upp +hún +ðin +ram +eru +tti +sér +ynd +hver +eng +ndu +átt +nnar +ðar +egar +fram +kom +una +end +ftir +eft +rna +efti +eftir +ara +ald +ngi +ingu +ger +eins +ett +rey +kur +hef +tin +eið +gur +unn +ari +tað +mann +æði +þeir +arf +rða +gum +dur +rðu +orð +efn +fði +myn +rum +ngar +ama +arn +svo +nir +gja +þar +rni +mynd +rinn +fur +itt +þeg +ldi +gre +nað +þega +eri +era +ina +ska +ingar +vor +okk +lin +þegar +lla +veg +vei +mál +inna +rra +ðum +min +mar +ust +lda +kar +afa +hug +aða +ang +far +frá +land +lík +ild +hva +ill +nnu +verð +ert +gun +dar +hen +lli +tak +gan +ldu +est +sti +grei +enni +dir +ars +star +men +vað +sjá +eig +din +ögu +heim +kin +kil +ran +bar +afn +gði +ans +sins +eik +lau +fir +etta +kip +hlu +ttu +nan +lut +menn +aga +sag +unu +skip +ita +jór +efu +ðan +fin +étt +tun +æri +efur +eld +vel +sig +erk +onu +fer +hvað +ráð +þetta +þett +þet +ber +álf +len +gna +lit +vin +erið +ljó +tum +aðu +alla +tarf +hafa +eil +hefur +hefu +yfi +unum +ðis +veri +lum +afð +jál +hlut +aður +lið +verið +nig +afði +ðið +hafð +for +íða +egi +tjó +ile +hafði +fni +sku +kja +anns +stað +lað +tan +kku +eitt +iðu +rét +arð +lar +aman +kið +kan +jón +stjó +dum +tjór +stjór +nið +slu +fan +rnar +mið +agð +ndur +mil +get +ste +rein +ndin +hin +ótt +nun +ssu +ileg +rétt +yfir +henn +tið +starf +ygg +jar +ssa +ndir +arl +mun +fél +tím +mér +aka +iði +eyt +tal +ana +sto +unni +undi +ind +iki +hel +unar +sle +bre +irr +oru +sama +leið +rau +nle +uri +egu +mik +sla +minn +ule +einn +sín +dan +íma +síð +egn +sky +voru +kka +rður +jóð +þeirr +ísl +eirr +órn +urin +agði +urinn +rar +grein +jálf +ákv +engi +auð +enna +dag +ðir +kum +éla +ninga +llu +mað +allt +iss +þeim +sinn +arna +ala +kri +fna +reg +vera +sum +manna +tjórn +stjórn +jórn +leik +nnin +sve +rle +ern +aus +élag +gerð +félag +féla +yndi +heil +uga +iti +ssi +set +rfi +hal +erði +sjál +ags +vir +tíma +skil +jár +endu +sjálf +essu +ker +kon +hon +ndar +rif +aug +ung +erðu +tek +run +nur +maður +maðu +líf +afi +seg +okku +irra +kkur +stó +onum +ngur +þeirra +eirra +þessu +agn +etu +veit +ila +nleg +erða +ona +ferð +urð +ers +dre +iður +stur +sagð +aft +uðu +ndum +jaf +inum +tof +væri +ínu +mur +iða +þau +sagði +ningu +íka +honum +honu +kve +efni +kal +ipt +)