12 komentářů k článku Jak na přelkepy 2: standardizace pomocí fonetických algoritmů:

  1. Karel

    Špatný příklad (arabština)

    Použití příkladu jména Muammar Kaddafi sice vypadá jako vhodný příklad, ale stejně jako tomu bylo u Ussamy bin Ládina – dává smysl jen v „anglofonních“ zemích. Rozpis přes soundex je sice fajn, ale jeho jméno se takhle nevyslovuje. To, co uvádíte jako fonetický přepis, je ve skutečnosti zkomolenina vyprodukovaná lidmi, kteří originál neumí vyslovit.

    Nic si z toho nedělejte. Arabštinu jsem se učil rok a ačkoliv jsem se naučil obstojně psát, tak vyslovit to jméno správně také neumím. Na to tam těch chrochtacích a neznělých hlásek mají příliš. Pak to jméno slyšíte od araba tak, jak se správně vyslovuje, a vůbec vás nenapadne, že to je právě ono. On ani ten Korán vlastně není korán, protože „o“ nemají a „rá“ nevysloví spojeně. Prostě se arabštině v příkladech vyhněte. A čínštině také. Obecně čemukoliv, co ani neumíte správně vyslovit, natož napsat.

    1. Martin Hassman

      Re: Špatný příklad (arabština)

      Já si naopak myslím, že slova, která se (obecně často) neumí správně vyslovit či zapsat jsou z praktického pohledu skvělou oblastí pro překlepy. Můžeme slovíčkařit, co je to ještě „překlep“ a kdy tomu už říkat nějak jinak, ale z pohledu algoritmů a programování, na tom nesejde.

    2. Peter BrejčákAutor příspěvku

      Re: Špatný příklad (arabština)

      Děkuji za připomínku, ale řešíme jiný problém. Vám jde o správný zápis. To v článku neřeším. Pro programátora je vstupem mnoho textových zápisů v latince a nemůže se vyhnout slovům arabského původu. Uvedené algoritmy pomáhají ve vyhledávání jiných zápisů stejného slova. Neřeším, co je správné a lepší, ale hledám podobnosti. A proto je naopak takové použití vhodné (jak uvádí Martin Hassman).
      Uvedený příklad je z praxe a přiznám se, že nevím, jaký je jednoznačný a správný přepis jména a zda vůbec existuje. Neřeším to.

      1. Karel

        Re: Špatný příklad (arabština)

        Rozumím, řešíte jiný problém. Já jen upozorňuji, že jako příklad jste si vybral něco, kde jsou ty problémy ve skutečnosti dva. Jeden jsou různé zápisy a druhý je ten, že přepis arabštiny prostě není zvládnutý. Soundex je příkladem naprosto nevhodného algoritmu, protože nerespektuje tvorbu slov v arabštině. Oni pouhým zdvojením souhlásky (d vs dd), záměnou délky samohlásky nebo záměnou znělé hlásky za neznělou tvoří jiné slovo s diametrálně jiným významem. Jako kdyby v češtině „svatba“ znamenana svatbu a „svadba“ potápění. Nehledě na to, že plno těhle nuancí se do zápisu v latince ani nedostane. Takže právě to „jiný zápis stejného slova“ je pro arabštinu zatím neřešitelný problém už jen proto, že neexistuje ani kvalitní přepis arabštiny do latinky. Vyhnul bych se jí obloukem a třebas čínštině hned dvěma oblouky.

    3. petr_p

      Re: Špatný příklad (arabština)

      Chcete říct, že Arabové nemají standardizovaný přepis do latinky? Zrovna vámi vybraná čínština ho má. Má jich několik, některé jsou lepší a některé jsou posvěcené čínskou vládou. Takže čínštinu bych za vyřešenou viděl (teď neřeším rozdílnou výslovnost ideografů, ale přepis fonetiky).

  2. Biktop

    Anatoliy Tymoshchuk? (off topic)

    A jak se má takováto perverznost správně přečíst, když angličtina nemá fonetický pravopis, hm? Nebo naopak zapsat do angličtiny neanglické slovo, chci-li, aby ho přečetli co nejsprávněji? Na vyslovení ruských jmen rezignují i anglofónní, když to vidějí v psané podobě. Kombinace „shch“ je pro anglicky mluvícího už od pohledu nevyslovitelná, „chuk“ může jeden vyslovit jako „čuk“ a jiný zase jako „čak“, „tymo“ zas jeden vysloví jako „tymo“ a druhý „tajmo“. Neboli nejen že to nedokáže správně přečíst/zapsat autor, pan Peter Breychak (nebo Breychuk?), jak přiznává, ale oni to nedokážou ani samotní uživatelé těch jazyků. Navíc to není nic nového pod sluncem, stačí si vzpomenout na nejednoznačnosti psaných podob jmen v našich zemích v dobách česko-německé bilinguality.

    Jen pro úplnost, v českých textech nemá místo jiná psaná podoba, než dle ČSN o transliteraci a transkripci azbuky do české latinky, tj. Anatolij Tymoščuk. S tím našinec problém mít nebude a vysloví to přesně stejně, jako nositel toho jména.
    A ještě pro zajímavost, českou transliteraci azbuky používají i anglofónní lingvisté, neboť pochopili, že ta anglická je nepoužitelná.

        1. to máš fuk

          Re: Anatoliy Tymoshchuk? (off topic)

          to sice ano, ale např. v ruských pasech se uvádí se i přepis do latinky. Předpokládám, že to platí i pro jiná „obrázková“ písma

Napsat komentář

Tato diskuse je již příliš stará, pravděpodobně již vám nikdo neodpoví. Pokud se chcete na něco zeptat, použijte diskusní server Devel.cz

Zdroj: https://www.zdrojak.cz/?p=3660