Hebrejsko-český GNU-GPL slovník - Úvod, nápověda
Dnes tento slovník obsahuje 23926 tvarů (19 % trivialit) v 5875 trsech (slovníkových heslech), tzn. 4.07 tvarů na trs.
Hebrejština je velmi složitý jazyk, pro našince zcela nepřirozený. Jednotlivá slova se ohýbáním mění natolik, že ztrácejí vcelku jakoukoli podobnost se základním tvarem, navíc existuje několik způsobů zápisu výslovnosti jednoho slova. Například מלבך se začátečníkovi jeví jako jednoduché, základní slovo třeba jako מַלְאָךְ (mal'ach - anděl), ale ve skutečnosti je to složenina מ-לב-ך [mi-lib-chá] "ze srdce tvého". Nebo u slova "kritika" בקרת v praxi najdeme minimálně tyto tři způsoby zápisu výslovnosti בִּקֹּרֶת ביקורת בִּיקּוֹרֶת.
Kvůli této tvarové proměnlivosti začátečníci jako já potřebují slovník, který zaznamenává každý jednotlivý tvar včetně jeho výslovnosti. Zářným příkladem tohoto přístupu, které patří velký obdiv a dík, je stránka www.pealim.com, jenže ta je v angličtině a navíc neobsahuje zkratky ani příklady užití, zaměřuje se na převážně na slovesa a nejde do ní přidávat další slova. Další problém při vytváření takové stranky je potřeba zaznamenat asi tak 20 tvarů daného slova, takže to by člověk nedělal nic jiného, než vytvářel slovník. Co s tím?
Protože jsem neměl si kam zaznamenávat slovíčka, která se právě učím. Rozhodl jsem se vytvořit si hebrejsko-český slovník byvše inspirován botanikou, jmenovitě rostlinami s oddenky, jako je jahodník, pýr nebo bambus. Ty vždy mají nějaký trs lístků, které jsou se sousedními trsy spojené oddenky:
Ukažme si to na českém podstatném jméně žena. To je základní či výchozí slovo pro daný trs. K němu existují různé lístky, které vznikají ohybáním, flexí: ženy, ženou, ženám, ženami. Ty tedy tvoří jeden trs. Tento trs pak můžeme propojit oddenkem na nějaký jiný trs, třeba na přídavné jméno ženský, ženskými, ženská.
Oddenky přirozené a umělé, vlastní a nevlastní
Oddenky jsou dvojího druhu. Oddenek přirozený vzniká v hebrejštině kořenem, v češtině kmenem slova. Ten vzniká tím, že ve menu Hledání zadáte kořen slova, nebo v menu Procházení si můžete nechat vypsat slova se stejným kořenem. V jednom trsu by až na výjímky neměly být dva různé kořeny, ale jeden kořen může spojovat mnoho trsů.
Dále jsou oddenky úmělé, které můžete zadat, abyste provázali slovo s nějakým odlehlým příkladem či jinak zajímavým slovem. Například pletou se slova כדי [kedej] a כדאי [kedaj], tak je propojíme oddenkem, aby se zobrazovala kontrastně vedle sebe. Umělý oddenek tedy na rozdíl od kořene neříká, že slova jsou nějak etymologicky příbuzná.
Příklad trsu 857 s vlastními i nevlastními oddenky
V trsu 857 vidíme tři listy, kde výchozí je list stejného čísla, tzn. 857. Výchozí list má jeden vlastní a dva nevlastní oddenky, které jsou vypsány s příslušným symbolem (>, <) a nejsou tedy součástí tohoto trsu. Vlastně ani být nemohou protože jsou to odlišné slovní druhy, nebo mají jiný kořen. Každopádně je zcela na uživateli, jestli ke slovu vytvoří vlastní či nevlastní oddenek.
לְהִתְנַדֵּב [lehitnadev] נדב {ver inf htp} dobrovolničit; to volunteer, to enlist; >856 857/857 >860 871
>הִתְנַדְּבוּת [hitnadvut] נדב {sub fem sin} dobrovolnictví; volunteering; 856/856
<מתנגב, מִתְנַדֵב; נדב {sub mas sin} dobrovolník; >857 860/860
<לְהֵירָתֵם [leheratem] רתם {ver inf nif} být zapřažen, dobrovolnit; to be harnessed; to volunteer; >857 871/871
מִתְנַדֵּב [mitnadev] נדב {ver mas sin 123p prs act htp} on dobrovolně pracuje, "dobrovolní"; he volunteers; 868/857
אֶתְנַדֵּב [etnadev] נדב {ver mas sin 1p ftr act htp} budu dobrovolničit; I will volunteer; 869/857
Každý tvar může mít jeden vlastní a neomezeně nevlastních oddenků. Jinými slovy, dané slovo se samo může vztahovat k jednomu jinému slovu (vlastní oddenek), ale k němu se může vztahovat neomezený počet oddenků jiných slov (nevlastní oddenky).
Trsy gramatické a významové
Pokud je trs budován na základě gramatiky, měl by obsahovat pouze slova odvozené od jednoho kořene. Nicméně občas přijde vhodné sloučit slova do trsu podle jiné logiky. Například když zakládáte trs Tora, tak je vhodné, abyste do tohoto trsu sdružili všechny knihy Pentateuchu, i když jsou to slova gramaticky nepříbuzná. Prostě hodí se to, má to nějaký užitečný smysl.
Například často potřebujeme k archaickému slovu přiřadit dnešní synonymum. K tomu je právě určen oddenek. Máme ne zrovna běžné slovo שָׁאוֹן [ša'on] hluk, tak k němu přiřadíme jako oddenek dnešní slovo: >רַעַשׁ [ra'aš]. Tato jsou gramaticky nepříbuzná, ale hodí se je mít pospolu.
Číslování trsů, tvarů a oddenků
Databáze je plochá, je to jedna velká tabulka bez propojení join ap. Můžete si ji celou vypsat a stáhnout v menu Výpisy a používat off-line, když nejste na Internetu. Čísla, které vidíte ve výpisu, jsou v podstatě čísla řádek této tabulky, které jsou všelijak propojené (id, idtrs, oddenek ap.). Čísla řádek (id) se většinou v databázových aplikacích skrývají, aby nerušila uživatele. Ale tady jsou zachována, protože odkazovat na hebrejská slova s nekudot by bylo pro našince zcela nepřehledné.
Zlomek 587/589 značí tvar č. 587 v trsu 589, např. tvar "ženami" v trsu "žena". Pokud jsou tato dvě čísla stejná (id=idtrs), pak se jedná o výchozí slovo daného trsu. Které slovo má být v trsu výchozí se dá nastavit při editaci slova a ve výpisech pak vyčuhuje z trsu.
Umělé oddenky jsou ve výpisech značeny znaky ">", popř. "<". Vlastní oddenek je ten, který jde od slova pryč, takže se značí "toto_slovo > cílové_slovo". Nevlastní oddenek naopak směřuje k tomuto slovu, takže se značí "toto_slovo < slovo_odkazující_sem".
Když tedy uvidíte: >856 857/857 <860 862. Můžete z toho vyčíst, že se jedná o výchozí tvar trsu 857, jehož vlastní oddenek směřuje ke slovu 856, a naopak k němu se vztahují oddenky od slov 860 a 862. Toto je technická záležitost konstrukce databáze, prostě oddenky mají charakter vektoru - jdou od někud někam. Ve Výpisu a při Procházení si můžete zobrazit oba typy oddenků - vlastní i nevlastní.
O trsu rozhoduje především slovní druh, který určuje i gramatický vzor. Například skloňování slova čas (זְמַן) je jeden trs včetně příkladů jako včas (בַּזְמַן), protože v hebrejštině je to předložková vazba a ne příslovce. Naproti tomu slovo "dočasný" (זְמַנִּי) je už jiný trs, protože to už není podstatné jmeno. Tyto dva trsy jsou přirozeně spojeny kořenem (זמן), nemusíte se tedy starat o další propojení umělým oddenkem. Umělý oddenek použijete, když chcete propojit slovo זמני se slovem ארעי. To také znamená dočasný, přeletavý, ale je odvozeno od jiného kmene.
Výhodou tohoto přítupu, že slovník vzniká, jak člověk čte či píše. Napíše si jeden tvar, který právě čte či používá, a ostatní neřeší. Ty přijdou časem, jak bude potřeba. Důležité je, aby ten tvar, který byl zadán, byl zadán správně, byť neúplně. Například víte, že podstatné jméno jednotné, ale pokud si nejste opravdu jistí, žak nevkládejte, jestli je mužské či ženské, nebo zda má koncovu "im" nebo "ot". Prostě nevkládáme domněnky.
Příklad na hebrejských slovech. Čtyři písmena: אוכל mohou být slovo: אוכל [ochel] jídlo, nebo slovo אוכל [uchal] mohl. Přes písmennou podobu jsou to zcela rozdílná slova, patřící gramaticky do odlišných trsů. Tento fakt předkládáný slovník respektuje a zachávává, i když je jinak zákonitě neúplný a vlastně vzniká za pochodu, jak si do něj vkládáme svá slovíčka.
Otevřená licence GNU-GPL
Druhým mým důležitým cílem bylo, aby tento slovník byl volně dostupný všem, tzn. každý uživatel jej může rozvíjet a kdokoli si může stáhnout celou jeho zdrojovou databasi. Vhodný je tedy pro školy, kde si do něj studenti zadají těch pár slovíček, které se právě učí. Je vhodný pro začátečníky, kteří si do něho průzběžně vkládají slova, na které narazili, aby se k nim později mohli vrátit. Každý člověk má soubor slov, které s oblibou používá, např. já nadužívám slovo "každopádně", jsem rád, když ho mám při ruce v této své databázi.
Tento slovník je tedy pracovní, příruční slovník určený pro studenty. Není to profesionální dílo lingvistů, proto využití slovníku je samozřejmě na Vaše vlastní riziko. Na mé znalosti hebrejštiny bych opravdu nikomu nedoporučoval spoléhat.
Zde právní hatlamatilka: Licence GNU-GPL
Otázka bezpečnosti a princip přesnosti
Slovník je v zásadě bezpečný, protože uživatel není schopen žádné slovo smazat. Pokud staré slovo edituje či jej formálně smaže odkazem "delete". Tak starý záznam se uloží do archivu a editované údaje se vloží jako nový záznam (změní se číslo, ID slova). Případné defektní akce či hackerské útoky se pak podle IP adresy všechny odstraní jedním příkazem. Přesto se držte zásady přesnosti - méně je více. Pokud si s nějakou informací nejste jisti, nevkládejte ji. Slovo דרישה je pravděpodobně ženského rodu, ale pokud to nevíte jistě, nepište to tam. Stejně tak pokud nevíte, zda-li mužské podstatné jméno má v množném čísle jistě koncovku -ים a ne -ות, tak nic netipujte a nechejte tento trs bez plurálu. Nedoplňujte nekudot podle svého uvážení. Jen je kopírujte podle nějakého oficiálního slovníku, který píší rodilí mluvčí nebo jazykozpyti. Už tak v tom mají zmatky - jsou dva až tři způsoby zápisu. Proto například nepřepisuji výslovnost z nekudot do české transkripce, opravdu nejsem znalcem, na kterého se dá spolehnout. Transkripci jen přepisuji z jiných slovníků - většinou těch, které jsou odkazech. Používám jich stabilně vcelku pět, šest (viz menu Odkazy), takže slova jsou většinou kompilátem z různých zdrojů. U vzácných rarit, například slovo mlat či vějička, odkazuji na zdroj, ze kterého jsem čerpal. Každopádně všem většinou anonymním autorům těchto zdrojů patří velký dík.
Příklad
Příklady, sousloví, věty i zkratky (ארה"ב = USA) vkládáme jakoby "Příklad". Apropos příklad poznáme podle toho, že je to slousloví či věta, tedy utvar, který nemá běžné mluvnické kategorie. Například "olejem" je tvar v trsu "olej". Ale sousloví "slunečnicový olej" je příklad, protože nemohu určit, zda je to podstatné jméno či přídavné.
Vyjímku z tohoto pravidla tvoří vázaný stav čili smichut. Pokud narazím na smichut ve nějaké vazbě s jiným slovem, tak je vložím oba, ale kategorie se vztahují pouze k vázanému stavu. Přesněji řečeno vztahují se k tomu slovu, které je součástí daného trsu (to se nejčastěji pozná podle kořene). Například:
צִיר [cir] צור
{sub; mIM; sin; s=a;} osa, pant; axis; 7104/7104
Poznámka "sin; s=a;", čili smichut=absolut nám říká, že v jednotném čísle (sin, singulár) je vázaný stav stejný jako absolutní, a to včetně diakritiky, nekudot. Dále:
צִיר סִיבוּב [cir sivuv] צור
{podstatné jméno; mužský rod s IM; jednotné číslo; vázaný stav;} osa otáčení; rotation axis; 7103/7104
Protože toto sousloví má kořen צור [cur], tak patří do trsu osa, proto i gramatické poznámky ve složených závorkách {} se vztahují pouze k ose, ציר [cir] a ne k podstatnému jménu otáčení, סיבוב [sivuv], protože to je ženského rodu a je v absolutním stavu.
Nevkládejte do trsu příklady, které sami didakticky vymyslíte. Vložené příklady byste měli kopírovat z autentických hebrejských zdrojů, samozřejmě nejlépe, pokud jsou s nekudot. Jedním prohřeškem proti tomuto pravidlu jsou automatické nekudot (viz odkaz Nakdan), která k autentickým textům přidávám, abych je mohl vůbec přečíst. To je samozřejmě potenciálně nebezpečný zdroj chyb. Tak prosím nekudot v příkladech berte s reservou. Pokud najdete chybu, tak mě upozorněte, nebo sami opravte, jste-li již zaregistrovaní.
Gramatika, Poznámka, vzkazy
Do položky Gramatika vkládejte gramatické informace o slově, např. u podstatných jmen vzor, kuriozity, etymologická upozornění, poznámku, že se jedná o Biblickou hebrejštinu, jinou variantu daného slova ap. Používané zkratky najdete v menu Výpisy.
Do položky Poznámka vkládejte informace o hesle, např. nejisté nekudot, původ informace, tedy webou adresu či odkaz na slovník, pokud si myslíte, že to má nějaký praktický smysl. Například pokud si myslíte, že slovo je špatně zadané, ale sami si nejste jisti, tak právě na to je určena poznámka ke slovu: "Tady ty nekudot asi odpovídají jinému slovu, ale jistá si nejsem," nebo "Můžete někdo doplnit zdroj?"
Jako v každém databázovém systému, platí zásada do každé položky právě jedna informace. Nevkládejte například do položky Ivrit slovo a jeho zkratku: "ארצות הברית (ארה"ב)". To je chyba. Je třeba vložit dva tvary - jednou sousloví, jednou zkratku. To je důležité pro vyhledávání či řazení podle abecedy.
Vzkazy mě o programu ala "odmítá to opravit kořen" ap. raději pošlete na email, nebo vložte do poznámkového bloku, který najdete v menu Odkazy. Prosím nepište mi na Facebook, Whatsup ap. Systematicky je nesleduji, ergo ani neodpovídám.
Procházení
Procházení je hlavní zobrazování nástroj. Trsy se v něm podle vzoru Pealim zobrazují v tabulkách, kam se dají i zasouvat nové tvary vzaté z nějakých textů s nekudot. Procházení je chronologické - podle ID, abecedně podle trsů a podle kořene (zobrazují se jen výchozí tvary).
Programátorsky se jedná o jednu z nejtěžších částí slovníku, protože slovo se z databaze převede do XML a to se následně zpracuje skriptem XSL, který se následně zobrazí v PHP skriptu. Právě programování v XSL je dost abstraktní a obtížné, ale má své kouzlo, protože generuje i celkový výstup. Běží to několik minut, než se to celé vyexportuje.
Mluvnické kategorie a zkratky
Mluvnické kategorie jsou shrnuty v tomto odkazu, popř. v menu výpisy. Musím říci, že jsem z nich docela zoufalý, protože při programování přirozeně používám takovou hatlamatilku anglických, českých, latinských, německých, hebrejských, ruských a často všelijak zkomolených slov. Pak se to snažím ujednotit, ale v hlavě to ujednocené nemám, takže mi neustále vychází jen a jen ta chaotická hatlamatilka. Například v odkazu "Smichut=Absolut" je slovo "Smichut" hebrejské slovo, ale Absolut je latinské. Jenže jak to úsporně zapsat, když latinsky je to "status constructus", česky "vázaný stav"? Takže nakonec je stejně paskvil "Smichut=Absolut" nejúspornější zkratka. Já nevím, co s tím.
Latinu už málokdo umí, ale byla by nejlepší. Anglické termíny jsou taková zmršenina latiny. Asi to nakonec sjednotím na čistě českou verzi, i když to zase není přenositelné. Navíc české názvy jsou většinou sousloví (např. jednoslovné "masculinum" je lepší než "rod jmenný mužský"). Zkouším používat jen jedno slovo místo celého sousloví, např. "minulý" místo "minulý čas" či zkratky m.č., která se navíc plete s "množným číslem".
Zatím je to nastaveno tak, aby se u aktuálního slova (tučné v trsu) objevily vždy plné české názvy, a aby latinské zkratky byly u ostatních tvarů daného trsu. Tento slovník t.č. nemá žádné jazykové mutace, je to opravdu jen hebrejsko-český slovník. Každopádně prosím o shovívavost s tímto zatroleným problémem.
Mluvnické kategorie jsem vybíral z pohledu praktičnosti, hojnosti a přenositelnosti. Praktické - aby byly užitečné pro začátečníky a rychle se zadávaly. Hojné, aby pokrývaly nejčastější jevy. Přenositelné - aby se daly počítačově zpracovat bez ztráty informace. Například osoba 123 je zkratka "dělám, ty (muži) děláš, on/to dělá" - aby se nemusely vytvářet tři tvary, je tam tato zkratka a inteligentní uživatel pochopí, že si musí zbývající tvary odvodit sám z informace, že se jedná o sloveso, přítomný čas, jednotné číslo a všechny tři osoby. Každopádně zanesená informace je přesná, pokud nějaký uživatel má potřebu zanést individuální tvar třeba pro druhou osobu, může, není to naškodu. Já osobně jedu podle pravidla - čtu, když něco nechápu, jdu do slovníku. Když to tam najdu, ale v mírně odlišné formě. Tak tam zanesu i tu stávající, abych si to jednak procvičil a dále ulehčil dalším uživatelům. Jinými slovy dlouho trvalo, než se ve slovníku objevilo slovo pes (כלב), protože psa znám. Na Duolingu byl na sto způsobů. Ani mou ženu (אִשְׁתִי) v něm nenajdete, protože tu už mám taky prokouklou. :-)
Podobně jako zkratka 123, znamená všechny tři osoby, tak existují podobné zkratky pro zrychlení zápisu. Smichut=Absolut je zkratka, která říká, že v daném čísle je stejný vázaný i samostatný stav (včetně nekudot). To se týká většinou jen jednotného čísla podstatných jmen. Častý případ, kde toto jedno kliknutí nahradí vložení dalšího tvaru slova.
Další zkratka je 2m+3f (popř. 23pr), čili druhá osoba mužského rodu je stejná jako třetí osoba ženského rodu, čili אתה והיא תַּחְבִּיר - ty spojíš, ona spojí, opět týká se snad výlučně jen budoucího času sloves.
Pro podstatná jména jsou určené zkratky: mužský IM, ženský OT, mužský OT, které říkají, že dané slovo v množném čísle má koncovku -im, či -ot. Pozor tyto zkratky už neříkají, zda se slovo v množném čísle nevyslovuje trochu jinak než v jednotném, např. אוֹת [ot] אוֹתִיּוֹת [otijot] znak-znaky, tedy kategorie "ženský rod s OT [fOT]" říká, že to jistě nebude otim, ale něco s -ot na konci, ale už nám neřekne, zda to bude "otot" či "otijot". To se už opravdu musí zadat nový tvar slova. V takových případech osobně většinou tento odlišný tvar vložím, ale povinnost to není, prostě tento slovník je zákonitě neúplný.
Při zadávání můžeme předdefinované kategorie vymazat tlačítkem Reset. Ty se kopírují z předchozího tvaru.
Ivrit versus biblická hebrejština
Tento slovník je zaměřen primárně na dnešní hebrejštinu, čili ivrit. Vkládat archaická slova není problém, jen pokud chcete zanést biblické slovo, které se nějak výrazně liší od dnešní formy, vyznačte to v položce Gramatika. Stejně tak vyznačte v této kolonce i aramejský či řecký původ.
Automatické opravy
Neplatí to při aktualizacích již vloženého slova, ale při vkládání zcela nového slova to dělá základní úklid - z hebrejských tvarů a kořene se vyháží nadbytečné pomlčky, vlnovky, mezery ap. Pokud by to bylo na škodu, je možné to vypnout či upravit, rozšířit.
U kořene převádím všechna písmena z koncových na běžná, a to hlavně kvůli vyhledávání. Kódování Unicode nepovažuje tyto dva znaky za totožné. Tedy pokud vyhledáváte podle kořene (platí pouze u kořene) je jedno, jestli zadáte הלכ, nebo הכך, protože se to stejně převádí na הלכ.
Při zadávání kategorií to obecně dělá minimální kontrolu. Například po zadání infinitivu, zapne sloveso, vypne kategorie, které neurčitek vylučuje (osobu, čas ap.). To urychluje zadávání, ale je mi jasné, že existuje i minulý infinitiv ap., prostě kdyby to dělalo neplechu, tak to vypnu.
Limity a přednosti slovníku
Ještě jednou zdůrazňuji, že hebrejsky neumím, proto tento slovník je výtvor žáka, ne rodilého mluvčího. Když vkládám nové slovo, tak ho neznám z lidové mluvy, jen beru anglické slovníky a překládám je do češtiny, hledám synonyma. Jsou to ale synonyma k angličtině, ne k hebrejštině. Proto je to z principu amatérský, studentský přístup, kde výhodou je, že informace z pěti zdrojů si dáte na jedno místo.
Další výhodou tohoto slovníku je, že to a) můžete opravit, b) můžete si vytvořit svůj soubor slovíček. Například když luštím články z Wikipedie, tak si sem vkládám tvary slov, které jsem četl. Když se pak po čase k tomu článku vracím, nacházím zde právě ty tvary slovíček, které jsem už zapomněl a které byly v tom článku. Nemusím je hledat znova. To je výhodné i pro cvičení či články z učebnice, protože takto se ve slovníku objevují ty tvary, které právě probíráte. Stejně tak lidé se svéráznými koníčky si zde mohou poznamenat samorostlé termíny, například pokud jste blázni do gladiol, tak si zde můžete uložit všechny hebrejské názvy chřestotvarých (אספרגאים) či kosatcovitých (אירוסיים). Pokud vím, tak žádný podobný hebrejský slovník t. č. na Internetu není dostupný. Navíc si ho můžete stáhnout do počítače a používat off-line, třeba na cestách.
Vlastnost, která se může hodit, je vyhledávání podle gramatických kategorií. Například pokud nevíte, jak vypadá u sloves 1 os. množného čísla v minulý čase, tak si to dáte do vyhledávání, hned vám vyběhne pár příkladů, pokud tam samozřejmě jsou. Jinak odkazy na různé gramatiky jsou v Odkazech.
Při vyhledávání neustále optimalizujeme počet nalezených tvarů. Velký počet je nepřehledný. Přísné vyhledávání zase nanajde přímo naše slovo. Proto máte na výběr mezi dvěma základními způsoby vyhledávání:
A) Přísné či přesné (výchozí tlačítko Přesné hledání). Vyhledává přesně sekvenci hebrejských písmen bez ohledu na nekudot, kterou jste zadali v daném sloupci - ivrit, nekudot, kořen. Často najde méně než chceme.
Například když zadáte do kolonky Ivrit סתר, tak to najde slova, která obsahují někde tuto trojici písmen bez ohledu na nekudot, tzn. dnes toliko jedno slovo לְהִסָּתֵר [lehisater, být ukryt], protože to v kolence ivrit má přepis להיסתר kvůli jud, které se v úplném přepisu přidává. Jak vidíte sloupec s nekudot toto hledání ignoruje.
Když do kolonky nekudot napíšete סתר, tak to najde už asi deset slov s touto trojicí písmen bez ohledu na nekudot. Pokud chcete jen tuto trojici, zaškrtněte, že slovo jimi musí začínat i končit.
Pokud dáte písmena סתר do kolonky kořen, najde to všechna slova s tímto kořenem. Těch většinou ale bývá více než dvacet, proto je dobré upřesnit níže, zda hledáte sloveso či podstatné jméno ap.
B) Rozšířené hledání se zadává pouze do kolonky ivrit nebo do kolonky česky. Po stištění tlačítka Sjednotit se slovo samo překopíruje do nekudot, kořene a kolonky anglicky. Když tlačítko Sjednotit zmáčnete podruhé, odstraní se navíc nekudot v kolonce nekudot. Pokud to nalezne více než 20 záznamů, je vhodné vymazat kolonku kořen a zkusit přísné vyhledávání, viz výše.
Vyhledávání se skládá ze dvou částí. Modrá část je textová, položky jsou pospojovány spojkou NEBO, takže přidáváním rozšiřujete výběr. Zelená část jsou mluvnické kategorie, jejich položky jsou pospojovány spojkou A, takže čím více podmínek zadáte, tím menší počet nalezených slov. Každá z těchto částí má vlastní resetovací tlačítko.
V každém políčku v modré části dávejte minimum znaků. Méně znaků v políčku najde více výsledků. Naopak políčka sama jsou spojená spojkou 'nebo', takže když do každého políčka dáte něco, nalezne to více výsledků než, když vyplníte jenom jedno políčko. Proto jsou k dispozici sjednocující tlačítka S. Vyzkoušejte zadat jedno nebo obě políčka Kořen(זמן) a Česky(čas).
Při vyhledávání nejčastěji využívám tento postup:
A) Zkusím odhadnout kořen, např. odříznu od slova obvyklé předpony: ב, ל, א, תה ,ה, מ ,נ a obvyklé přípony: א, ה, ות, ים, ון, י, ת, a pronominální přípony.
B) Předpokládaný kořen zadám do červeného políčka Ivrit.
C) Zmáčknu červené tlačítko Sjednotit. Toto pomocné tlačítko zkopíruje údaj do podobných políček a spustí hledání. Pokud chcete hledat pouze v jednom vybraném políčku, kam jste zadali slovo, tak klepejte na tlačítko Hledat.
D) Když to nic nenajde, zkusím tlačítko Volné hledání. Naopak když to najde příliš mnoho výsledků: Tipnu si slovní druh hledaného slova - podstatné jméno. Smažu kořen, použiji přísné hledání.
V políčkách česky, anglicky a výslovnost můžeme zadávat kódy regex. Např. zadejte do políčka česky "dě.*c", tedy dě{cokoli}c. Najde dědic či čarodějnice.
Vyhledávání podle výslovnosti
Hledám povědomé slovo, znělo jako "tifaret, nebo tifteret", tak zadám do výslovnosti "tif" a zatrhnu volbu začátek slova. A mám to: תִּפְאֶרֶת [tif'eret] פאר {sub fem sin} krása, nádhera. Naštěstí toto slovo mělo vyplněnou položku výslovnost, což není pravidlem. Na hledání výslovnosti nemá vliv nastavení tolerance, ta se týká jen hebrejských políček.
Vyhledávání podle gramatických kategorií
Vyhledávání podle gramatických kategorií je dobré, pokud chcete ohýbat nějaké slovo a nejste si jisti. Tak si vyhledáte jiná slova se stejnými kategoriemi a podle nich upravíte to vaše.
Vyhledávání podle kořene
Do kořene v tomto vyhledávání nezadávejte nekudot, tedy šin/sin vkládejte jako prosté ש. Samo to změní na ש a jeden znak (koren like \"ש_\"). Lépe jsem to nevymyslel - regexp vyhledávání nekudot mi stále nefunguje.
Pouze u kořene můžete využít jedné rozšířené možnosti. Když zadáte kořen ve tvaru "%ת" najde to všechny kořeny, které končí na tet, ת a naopak "ת%", které na tet začínají. K čemu je to například dobré. Neurčitě tuším, že slovesa končící na tet mají v 2. osobě přítomného tvaru nějaký divný tvar. Dám do formuláře: kořen končí na tet: "%ת", kategorie sloveso, 2. osoba (já/ty): Najde to: כָּרַתְּ [karatet] כרת {ver fem sin 2pr prs act pal} kácíš♀. Píše se jedno ת, ale vyslovuje se zdvojeně ("tet"), protože תְּ s dagešem se čte "tet". Ano, ale kdo si to má pamatovat, že?
- - -
Když vyhledávání pomocí tohoto formuláře nevede k cíli, zkuste v nejhorším celotextové vyhledávání v menu Výpis.
Když se přesvědčím, že ve slovníku hledané slovo není, zadám ho v menu Nové slovo. Tak každý den přibude pár nových slovíček. Pokud každý den zadáme 5-6 slovíček, tak jich za rok přibude 2000, takže poměrně rychle můžeme mít po ruce vcelku obsáhlý slovník.
Šrotovač je jednoduchý překladač a zároveň i nástroj na rychlé zádávání trivialit, zejména pokud překládáte z textu s nekudot. Do Šrotovače zadáte větu s nekudot (až 20 slov). Šrotovač ji rozřeže na slova a každé se pokusí najít ve slovníku. Vypíše, co našel. U trivialit jako jsou členy a běžné předložky můžeme tento tvar okamžitě přiřadit k výchozímu tvaru. Například u jména Jakub (יַעֲקֹב) je zadán i aglutinovaný tvar (וְיַעֲקֹב ve jakov - "a Jakub"), což je triviální rozšíření. Pomocí Šrotovače se dají denně zařadit do tabulek desítky tvarů a variant bez většího úsilí.
Takto se v Android mobilu dá zobrazit lokální, stažený html soubor:
file:///storage/sdcard0/download/vypis_slovy%20(1).html
Každopádně v tomto souboru můžete vyhledávat offline pouze full-textově.
V této verzi MySQL vyhledávání Unicode znaků v hebrejštině přes regexp nefunguje spolehlivě. Musíme počkat na nějakou další verzi. Pokud znáte nějakého znalce MySQL, který by zvládl i hebrejská nekudot, tak mi dejte vědět. V Linuxu se odfiltrují nekudot podle Unicode (např. remove Vowels: s.replace(/[\u05B0-\u05BB]/g,\"\"). V programu sed v Bash mi to funguje, ale do MySQL to nemohu za žádnou cenu dostat. Možná je to starou verzí MySQL, nevím... Takže to zatím řeším tímto primitivním \"like znak a cosi\", což je dost nepřesné.
Programátorské technikálie a chyby
Na slovníku občas ještě pracuji, takže se může stát, že to den nepoběží, jak má. Kdyby nějaké podivnosti trvaly déle než den, napište mi.
Slovník nepočítá s velkým provozem. Tedy jedno heslo mohou zároveň editovat dva uživatelé. Uloží se verze toho, kdo první stiskne Enter. Slovník též netestuje zdublování hesla - prostě ho uloží a budou ve slovníku dvě stejná slova. Občas se mi to už podařilo. Když tak mě upozorněte, pokud je třeba nějaké dva trsy sloučit.
Program běží na mých stránkách u www.webzdarma.cz, kde mám i zákaznický účet. Technicky je to MySQL, Javascript, prosté PHP a HTML protokol. Jak jsem zvyklý z 8-bitových počítačů, snažím se o co nejjednodušší, tedy nejrychlejší kód, bez zbytečných dekorací a efektů (zkuste CTRL-U). Pokud by to ale bylo na úkor čitelnosti, je možné cokoli upravit.
Testováno: Primárně Firefox Linux Lubuntu 18.04, starý android telefon s prasklým sklíčkem. Na Windows jsem viděl, že to běželo, ale netestoval jsem, páč Windows nemám. Vzhled tedy je do značné míry určen mým telefonem, abych do slovníku mohl zadávat nová slovíčka na cestách či v posteli. To se může změnit, pokud by byla potřeba.
Je tedy pár věcí, se kterými si programátorsky nevím rady. Je to hlavně vyhledávání a odfiltrovávání nekudot v databasi MySQL. Například u kořene se rozlišuje a zadává šin/sin (שׂ a שׁ ) , ale nerozlišuje se fe a pe (פ a פּ) a podobné změny u ražených a třených hlásek. Každopádně je to oříšek při programování vyhledávání pomocí kořene - jak odfiltrovat v MySQL dageš, ale zachovat šin/sin.
Vysvětlení kódování hebrejského textu
V Linuxu se dá pracovat s hebrejským textem bez větších problémů, ale je třeba konstatovat, že Linux se ještě zcela nevzpamatoval z přechodu z ASCII na Unicode, a to se netýká jen hebrejštiny, ale třeba i českých znaků v Bash.
Každé písmeno můžeme převést na byty [bajty] čili čísla do 255. Ty se tradičně zapisují hexadecimálně (např. 0a je deset a je to konec odstavce, který vkládá klávesa Enter). Dřív odpovídal jednomu anglickému písmenu jeden byte. Jak šel čas, příbývalo nových jazyků a nových písmen, vytvořilo se kódování Unicode, které na zápis jednoho písmena využívá až tuším 4 byty (znak € má například tři, česká písmena dva, ř=c5 99).
Například písmeno "ř" je jeden Unicode znak, hexadecimálně dva byty: "c5 99", ale שׁ jsou dva Unicode odlišné dvojbytové znaky (d7 a9) a (d7 81). Sice je to při variabilitě hebrejských písmen s nekudot pochopitelné, ale přesto je to zdroj problémů při vyhledávání a odfiltrovávání právě těch nekudot. Každý program a prostředí si pracuje s těmito nekudot jinak, proto regexp, které fungují v programu sed v Linuxu, nefungují v PHP či MySQL.
Zpracování takového textu je mnohem složitější a jak jsem řekl, Linux se ze přechodu na Unicode dodnes ještě plně nevzpamatoval. Náš problém je, že Slovník běží na zřejmě starším MySQL serveru, takže vyhledávací funkce pro Unicode tam nejsou funkční. Používám náhradní, provizorní řešení, že diakritické znaky zkouším přeskočit s nějakou tolerancí.
Na každý hebrejský znak jsou třeba dva byty. Hebrejská písmena začínají vždy d7 (písmeno מ jsou dva byty: d7 9e), diakritika většinou začíná na d6.
echo -n "משנת" | hd # příkaz, který převádí písmena na byty. d7 9e d7 a9 d7 a0 d7 aa # 8 bytů, ergo čtyři písmena bez nekudot: ת______נ_____ש_____מ Jenže když přidáme diakritiku, tak se celý řetězec nafoukne: echo -n "מִשְּׁנַת" | hd d7 9e d6 b4 d7 a9 d6 bc d7 81 d6 b0 d7 a0 d6 b7 d7 aa מ_____D_____ש_____D______D_____D_____נ______D_____ת_____
Vidíme, že mezi ש a נ leží tři diakritická znaménka, tedy 6 bytů, proto musíme nastavit toleranci na 6, pokud má najít slovo מִשְּׁנַת [mišnat, "od roku"]. Výchozí nastavení tolerance jsou 4 byty, tedy při vyhledávání toleruje až do dvou diakritických znamének. Právě u šin to občas nestačí.
Autobiografická poznámka
S Židy nemám pokrevně či rodově společného nic než to, že jsem členem jedné tradiční židovské sekty zvané katolická církev. Ke studiu hebrejštiny mě navedl francouzský filosof Claude Tresmontant, což je i vysvětleno v tomto článku. Teologicky mě zajímá historický Ježíš, jmenovitě jeho dětství. Učím se primárně soudobou hebrejštinu proto, abych uměl živý, semitský jazyk, ne jen pár hebrejských archaických slovíček vytržených z kontextu. Jak vidíte, je to koníček zcela neužitečný, obávám se, že ho ani nemohu nikomu doporučit (na rozdíl např. od přírodních věd či psychologie). Hrozně moc práce, hubený výsledek, protože v mém věku už nový jazyk do hlavy leze jen velmi neochotně. Tak snad z této práce budou mít užitek jiní.
Pešita
Z uvedeného důvodu je v Menu i odkaz na doslovný překlad aramejské Pešity do češtiny (sesterský projekt). Se slovníkem souvisí jen autobiograficky. Můžete ignorovat.
Poděkování
Až na vyjímky pod slovníky nejsou uvedeni žádní jmenovití autoři. Přesto patří dík právě těm anonymním autorům a přispěvovatelům nejrůznějších slovníků a zdrojů, co jsou uvedeny v Odkazech, zejména Wikislovníky a Pealim. V Gramatice jsem se snažil zachovat obvyklou citaci, ale bohužel jsou dost nedůsledné, protože jsou to opravdu jen příruční poznámky a ne ucelený text.
Kontaktní informace
Pokud vás zlobí přihlašování, chtěli byste změnit heslo ap. Napište mi. Nemám pro všechno vyrobené formuláře.
Tato stránka řeší jen používání hebrejsko-českého GNU-GPL slovníku, pokud ale máte problémy s hebrejštinou v Linuxu (klávesnice, fonty), napište mi. Co budu vědět, rád Vám řeknu.
PhDr. Mgr. Jeroným Klimeš, Ph.D.
jeronym.klimes@seznam.cz
http://www.klimes.us