Hoe makkest in wurdboek?

De gong fan saken by it wurkjen mei Concordancer for Windows* / Werom nei: Frysk
* De side http://www.ifs.tu-darmstadt.de/sprachlit/wconcord.htm bestiet net mear. Wconcord is no lykwols noch del te laden fan in Thaiske side
http://pioneer.chula.ac.th/~awirote/2241605.htm
Sykje dr tusken de Thaiske tekens om de lokale kopy wconcord.zip

(Part fan myn lzing op 'e wurdboekmiddei fan 'e Fryske Akademy op 6 jan. 2001).

It begjin is de digitale tekst (sa'n 9 miljoen letterkes - sels typt of OCR-wurk), nderbrocht yn in grut tal bestannen neffens it boek of de kassette dr't in stik tekst t komt. Concordancer hat wol wat muoite mei dy grutte protte tekst, om't it programma yn dizze earste ferzje yn ien kear net mear as 16.000 fynplakken ferwurkje kin. Om dy reden haw ik de letter G yn sn parten ferdiele moatten, dy't dan elk wer t in tal formules fan it type ga*, 'ga* ensfh. besteane, dy't mei in keunstje op in handige wize generearre wurde kinne.

It programma siket dan alle wurden mei sa'n begjin der t en kin dy ek noch alfabet sette. Sjoch hjir nder:

Sa't te sjen is, haw ik by dy foarbylden in hiele rigel tekst ta myn foldwaan, mar faak docht bliken, dat men dochs noch mear omtekst sjen wol. No hat WinConcord de moaie eigenskip dat it troch in ienfldige klik oant tsien siden omtekst sichtber meitsje kin (sjoch hjirboppe 3, ynset), mar dan moatte de betreffende konkordnsjes wol generearre wze. En foar it earste stik fan G duorret dan dan wol sa'n healoere, dat ik lit de kompjter faak nachts mar 'op standby' oan stean. Dr docht t bliken dat in moderne PC ditsoarte wurk ek noch mar krekt oan kin!

Troch it grutte tal staveringswizen fan it Sealtersk kinne de sa generearre konkordnsjes net snder mear brkt wurde, want it giet derom, foarmen byinoar te krijen lykas Gst, Gst, Jst, Jst, dy't dan ek noch mei of e skreaun wze kinne. Om dy reden haw ik alle konkordnsjes fan'e letter G kopiearre nei de tekstferwurker (WP6.0a) en dr alles byinoar brocht wat byinoar heart (sjoch hjirnder, boppeste helte). Dr typ ik dan ek de fermelding t it lde kaartsysteem by fan boarnen dy't noch net yn 'e kompjter sitte. Yn dat tige grutte bestn meitsje ik dan it wurdboek (sjoch hjirnder, nderste helte). De net brkte sitaten smyt ik net fuort, mar ferlytsje se ta 6-punts, om se letter nochris besjen te kinnen.

WinConcord hat it foardiel dat it in hiel sjou tekstbestannen tagelyk oankin en de nammen fan dy bestannen ek oanjout. Wat it net oanjout, binne sidenmers. Om dr yn te foarsjen, generearje ik mei makro's fan myn tekstferwurker yn 'e oarspronklike tekstbestannen sidenmers, dy't dan mei de omtekst yn WinConcord sichtber wurde.

Dizze suver ideale sitewaasje betsjut in grutte foartgong, net allinne wat it beskikber wzen fan omtekst oangiet, mar ek om't men fan gns wurden no wat better sjen kin hokker fariaasjes yn gebrk en betsjutting foarkomme. Sa kaam ik by it wurd gail ta sn nderbetsjuttings.
Dat foardiel slacht lykwols om yn in neidiel by de wat frekwintere wurden. Sa siet ik by gngelje op side 41 fan myn bestn en by Gant ynienen op side 154. Dr tuskenyn sitte dan 110 siden mei it wurd gans 'hiel', ofwol sa'n 3300 fermeldingen. Myn grutte probleem is, om dr struktuer yn te krijen. WinConcord jout wol de mglikheid om te selektearjen neffens earste oant en mei tsiende folgjende of foargeande wurd, mar ik sjoch noch net goed wat ik drmei dwaan kin; boppedat wurdt dat wer wat fertsjustere troch alle staveringsferskaat.
Faak brk ik ek oare wurdboeken om nderbetsjuttings te definiearjen, oant it WNT ta - en net te ferjitten in synonymewurdboek - mar dat is lang altyd net fan tapassing op'e Sealter kontekst. Dus dat is ek noch net ideaal.
P.K., 15-1-2001.

 

Set stekwurd fet.
Lykas boppe te sjen slacht WinConcord it stekwurd op tusken it teken | . Dr kin ek wat oars foar keazen wurde, mar it bliuwt altyd nopfallend. Ik haw drom yn WordPerfect 9 de makro fet.wcm makke, dy't " | wurd " ferfangt troch " wurd". Troch yn WinConcord op te slaan tusken "|" en " " levert dat alle stekwurden tsjk, dat dat is dan daliks klear foar myn wurdboek-opmaak. Hjir fergees op te heljen as fet.zip en dan t te pakken (allinne as *.zip ferstjoerber).
P.K., 27-12-2003.

 

 

It wurdboek klear,
de wille oer!

'Grutte' wurden (mei tank oan Anne Dykstra).

Lykas boppe sein, ntsteane praktyske problemen by 'grutte' wurden, dat is te sizzen wurden dy't tige faak foarkomme. Dat wurdt no s oanpakt:

Nei't de fynplakken fan sokke wurden yn 'e tekstferwurker gearbrocht binne, wurdt earst in foarriedige betsjut tingsferdieling makke. As foarbyld jou ik it wurd gjucht/ rjucht 'rjocht' ens. De betsjuttings komme yn dit gefal t myn Dtsk-Ingelsk wurdboek1,wat it grutte foardiel hat, dat it tagelyk de oersetting yn twa talen jout en boppedat troch dy beide talen ta in skerpe ferdieling twongen wurdt. By 13/14 richtich is ek noch in foarriedige Fryske nderskieding oanbrocht.

Foarriedige betsjuttingsferdieling.
Adj.
1 (Gegensatz: links) // right
2 richtig/ krekt, goed/ accurate, correct
3 geeignet, passend/ krekt passend, presys/ proper, fitting, suitable
4 schuldig// due
5 wirklich// real
6 echt// genuine
7 gesetzlich// lawfull, legitimate
8 angenehm// agreable
9 gehrig// thorough
10 tchtig//solid, sound

Adv.
11 right(ly), well
12 wirklich// really, quite
13 richtich/ ynoarder/ correctly
14 richtich/ krekt, lykjend op
15 richtich/ krekt passend, presys
16 sehr// very; much; pretty
17 rechte Hand// right hand
18 aufrecht/ rjochtop/ upright, erect
19 RESERVE

No wurdt de betsjuttingsferdieling yn ien finster fan 'e tekstferwurker toand en in pear rigels fan de fynplakken yn in lytser finster dr nder. Op dy wize kinne de fynplakken oan ien foar ien foarsjoen wurde fan it nmer fan de betsjutting, wat ik foaroan yn 'e rigel set2. Yn 'e bak RESERVE komt alles wat yn 'e oare bakken gjin plak fine kin.

Is dat klear, dan wurdt it sa behannele artikel opslein as in DOS-bestn, wat dan troch WinConcord ferwurke wurde kin. As dan by de "File List Settings" de sifers as "Word separators" skrast wurde, dan wurdt alles mei mask = "*" kreas neffens betsjuttingsskift oardere. Ien en oar wurdt dan wer nei de testferwurker kopiearre en kin dan maklik fierder yn detail bewurke wurde, mei't dan ek maklik opfalt wat bysnder is en wat net.

Foarbyld [2 komt nei 19]:

11 Hahn. "d h'nekm". h:ft, det - das Haupt, der Kopf: "'t izz m nit | rucht | in't h:ft, in d pltte". h:'gde u. h:'gte, dj - die H
12 _______ sik k rucht wet t g^'de, n helde h sn hart k nssen | rucht | op! n quadd h: disk, dcke d ! sg'une wer th'pe
12 k ben s rucht w'lg un d s'nne sgnt b'te s froi, 't izz m | rucht | , azz sgll k un 'lden be- kende wer s!' "na, quad
12backnes Backwerk, welches leicht zerbricht. R. "kros". "wan d pnkke | rucht | lcker smeke sgell, mt h krs w:'ze". kr:dg - keck, verw
12 machnnelbm n sik t bw:'g^jen un d t'g^e r'etene sik ltde | rucht | fnnern un dan wer th'pe, s rucht, azz wan sik aen
12r ^'dje. 'r^dje verabreden. rekje treffen, erreichen. den hbb' k | rucht | , cht reked, den habe ich ordentlich getroffen. R. r'kj
12w :'zen h'de un d dk medd d knke wazz weg. Marl'neken wazz n s | rucht | ligt un w'lg, rucht azz wan d br'er nog l'ede, d
13twnne ; quadd d mon, k ben s rucht tr:'rg, det izz dag^g^ nit | rucht | , h hde j 'sgd fon m n'me sglld.' Medds faengde h n t
13gter h'nde (fr: rgte h'nde) meine rechte Hand. richtig: "'t izz | rucht | ". - "rugt un slugt". - "rugts" auch: rugs" rechts. "si
14edd d knke wazz weg. Marl'neken wazz n s rucht ligt un w'lg, | rucht | azz wan d br'er nog l'ede, d g^ng ze g^ants l'stg i
14 rucht g^d t m'de!' "na, quadd dj m'er, k ben s ngstg, s | rucht | azz wan der un sw:r w:'der kumt." - marl'neken 'vers s
14 t'g^e r'etene sik ltde rucht fnnern un dan wer th'pe, s | rucht | , azz wan sik aen s rucht fraut un mdde h'nde s dedd
16 : 'wet d:'vel, w kumst d in min tm?' d sold't, d kende den br | rucht | g^d un wsde k, det h den 'zel k'ped h'de, quadd: "
16 'neken b 'n disk un d f'er quadd: 'och, wet wd' k ligt, k ben s | rucht | g^d t m'de!' "na, quadd dj m'er, k ben s ngstg,
16 rucht fnnern un dan wer th'pe, s rucht, azz wan sik aen s | rucht | fraut un mdde h'nde s dedd. medds tg der s'n n:'vel
16det bld fell nnen sn. - ochd! quadd det wmaenske, un mmede s | rucht | hg op un sag^g^ det bld far sik lzzen un wazz s rucht t
16i nm sin bebbe un marl'neken b d h'nde un j w'rne lle tr s | rucht | ferg^n:'g^ed un g^ngene in 't hz b disk un 'tene. D b
16n , d h'de'n flug^g^, frm w'maenske, un j h'dene sik lle be | rucht | l; man j h'dene nn b'dene, un j wnskedene sik g
16p wl bs''rg^je[,] du kannst die Bot- schaft wohl ausrichten. k ben | rucht | bs''rged m him, ich bin recht besorgt fr ihn. s'pnkerj
2 un azz h r de s'le g^ng, s lt h :n m:'le b:'te; hi g^ng s | rucht | mdden ppe str'te, :n m:'le un :n z'cke an, sm sg'
2esungen hast, oder ich schlage dich todt;' dan d past'r h'de 't nit | rucht | ferst'n; d krg^ d fent s 'n sgrek un song detslg^e nog^ :'
3g ^el dj g^'ldne ktte flle un dj fell den mon j:st 'men hals, s | rucht | der'me, det ze rucht s krek pssede, d g^ng h bnne
3t un mdde h'nde s dedd. medds tg der s'n n:'vel fnne g^rnd un | rucht | in den n:'vel d:r bddende't azz f

P.K., 5-4-2001.

1. Schfler-Weis, Taschenwrterbuch der englischen und deutschen Sprache II, Deutsch-Englisch, Stuttgart 1951.
2. By tekst dy't ek noch gns oare sifers befettet, kin dat ta betizing liede. Dan kin foar elk sifer in teken set wurde, b.g. #, wat dan letter socht wurdt mei mask = "#*". It is ek nuttich om "]" te brken as "Sentence separator", mei't dan automatysk de generearre rigels begjinne mei "#" en de nmers.