Lexikální podobnost

V lingvistice je lexikální podobnost míra podobnosti slovní zásoby dvou daných jazyků. Lexikální podobnost hodnoty 1 (nebo 100 %) by znamenala úplné překrytí slovní zásoby, zatímco 0 znamená, že neexistují žádná společná slova.

Existují různé definice lexikální podobnosti, které dávají rozdílné výsledky. Například metoda Etnologue spočívá ve srovnání standardizovaných množin seznamů slov a počítání těch, které jsou si podobné jak formou, tak významem. Podle této metody je podobnost angličtiny s němčinou 60 % a s francouzštinou 27 %.

Lexikální podobnost může být použita k odhadnutí genetické příbuznosti mezi dvěma jazyky. Hodnoty vyšší než 85 % většinou znamenají, že porovnávané jazyky jsou příbuzné dialekty.[1]

Lexikální podobnost je jenom jedním z indikátorů vzájemné srozumitelnosti dvou jazyků, protože ta záleží také na stupni fonetické, morfologické (tvarosloví) a syntaktické (větná skladba) podobnosti. Dlužno podotknout, že je to ovlivněno variacemi ve váze různých seznamů slov. Například lexikální podobnost francouzštiny s angličtinou je velmi vysoká co se lexikálních oblastí souvisejících s kulturou týče, zatímco jejich podobnost je menší co se týče základních (funkčních) slov. Na rozdíl od vzájemné srozumitelnosti je být lexikální podobnost výlučně symetrická.

Indoevropské jazyky

Tabulka níže ukazuje hodnoty lexikální podobnosti pro dvojice vybraných románských, germánských a slovanských jazyků tak, jak byly publikovány Ethnologuem.

Kód
jazyka
Jazyk 1
Koeficienty lexikální podobnosti
KatalánštinaAngličtinaFrancouzštinaNěmčinaItalštinaPortugalštinaRumunštinaRétorománštinaRuštinaSardinštinaŠpanělština
catKatalánština1-0,85-0,870,850,730,76-0,760,85
engAngličtina-10,270,60----0,24--
fraFrancouzština0,850,2710,290,890,750,750,78-0,800,75
deuNěmčina-0,600,291-------
itaItalština0,87-0,89-1-0,770,78-0,850,82
porPortugalština0,85-0,75--10,720,74--0,89
ronRumunština0,73-0,75-0,770,7210,72-0,740,71
rohRétorománština0,76-0,78-0,780,740.721-0,740,74
rusRuština-0.24------1--
srdSardinština0,76-0,80-0,85-0,740,74-10,76
spaŠpanělština0,85-0,75-0,820,890,710,74-0,761
KatalánštinaAngličtinaFrancouzštinaNěmčinaItalštinaPortugalštinaRumunštinaRétorománštinaRuštinaSardinštinaŠpanělština
Jazyk 2 →catengfradeuitaporronrohrussrdspa

Poznámky:

  • Jazykové kódy jsou ze standardu ISO 639-3.
  • Ethnologue neuvádí, pro kterou variantu sardinštiny byla lexikální podobnost vypočítána.
  • „-“ značí že data nejsou dostupná.

Související články

Reference

V tomto článku byl použit překlad textu z článku Lexical similarity na anglické Wikipedii.

  • Ethnologue.com (lexical similarity values available at some of the individual language entries)
  • Definition of lexical similarity at Ethnologue.com
  • Rensch, Calvin R. 1992. "Calculating lexical similarity." In Eugene H. Casad (ed.), Windows on bilingualism , 13-15. (Summer Institute of Linguistics and the University of Texas at Arlington Publications in Linguistics, 110). Dallas: Summer Institute of Linguistics and the University of Texas at Arlington.

Externí odkazy