Zipfs-Law-Language-Detector/data/alphabets.json
2024-07-30 04:18:46 -04:00

1052 lines
11 KiB
JSON
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"alphabets:": [
"A",
"B",
"C",
"D",
"E",
"F",
"G",
"H",
"I",
"J",
"K",
"L",
"M",
"N",
"O",
"P",
"Q",
"R",
"S",
"T",
"U",
"V",
"W",
"X",
"Y",
"Z",
"a",
"b",
"c",
"d",
"e",
"f",
"g",
"h",
"i",
"j",
"k",
"l",
"m",
"n",
"o",
"p",
"q",
"r",
"s",
"t",
"u",
"v",
"w",
"x",
"y",
"z"
],
"greek": [
"Α",
"Β",
"Γ",
"Δ",
"Ε",
"Ζ",
"Η",
"Θ",
"Ι",
"Κ",
"Λ",
"Μ",
"Ν",
"Ξ",
"Ο",
"Π",
"Ρ",
"Σ",
"Τ",
"Υ",
"Φ",
"Χ",
"Ψ",
"Ω",
"α",
"β",
"γ",
"δ",
"ε",
"ζ",
"η",
"θ",
"ι",
"κ",
"λ",
"μ",
"ν",
"ξ",
"ο",
"π",
"ρ",
"σ",
"τ",
"υ",
"φ",
"χ",
"ψ",
"ω"
],
"arabic": [
"ا",
"ب",
"ت",
"ث",
"ج",
"ح",
"خ",
"د",
"ذ",
"ر",
"ز",
"س",
"ش",
"ص",
"ض",
"ط",
"ظ",
"ع",
"غ",
"ف",
"ق",
"ك",
"ل",
"م",
"ن",
"ه",
"و",
"ي",
"أ",
"إ",
"آ",
"ى",
"ة",
"ﻉ",
"ﻍ",
"ﺯ",
"ﺱ",
"ﺷ",
"ﺹ",
"ﺽ",
"ﻁ",
"ﻅ",
"ﻋ",
"ﻏ",
"ﻓ",
"ﻗ",
"ﻛ",
"ﻝ",
"ﻡ",
"ﻥ",
"",
"ﻭ",
"ﻳ",
"ـ",
"ﻻ",
"ﻷ",
"ﻹ",
"ﻵ",
"ﻺ",
"",
"ﺏ",
"ﺕ",
"ﺙ",
"ﺟ",
"ﺣ",
"ﺧ",
"ﺩ",
"ﺫ",
"ﺭ",
"ﺯ",
"ﺱ",
"ﺷ",
"ﺹ",
"ﺽ",
"ﻁ",
"ﻇ",
"ﻉ",
"ﻍ",
"ﺑ",
"",
"ﺕ",
"ﺙ",
"ﺝ",
"ﺣ",
"ﺧ",
"ﺩ",
"ﺫ",
"ﺭ",
"ﺯ",
"ﺱ",
"ﺷ",
"ﺹ",
"ﺽ",
"ﻁ",
"ﻇ",
"ﻉ",
"ﻍ",
"ﻑ",
"ﻕ",
"ﻙ",
"ﻝ",
"ﻡ",
"ﻥ",
"",
"ﻭ",
"ﻳ"
],
"": [
"у",
"г",
"р",
"о",
"ф",
"и",
"н",
"с",
"к",
"ј",
"е",
"з",
"ц",
"д",
"м",
"т",
"л",
"а",
"в",
"х",
"џ",
"ш",
"ч",
"п"
],
"extended": [
"À",
"Á",
"Â",
"Ã",
"Ä",
"Å",
"Æ",
"Ç",
"È",
"É",
"Ê",
"Ë",
"Ì",
"Í",
"Î",
"Ï",
"Ð",
"Ñ",
"Ò",
"Ó",
"Ô",
"Õ",
"Ö",
"Ø",
"Ù",
"Ú",
"Û",
"Ü",
"Ý",
"Þ",
"ß",
"à",
"á",
"â",
"ã",
"ä",
"å",
"æ",
"ç",
"è",
"é",
"ê",
"ë",
"ì",
"í",
"î",
"ï",
"ð",
"ñ",
"ò",
"ó",
"ô",
"õ",
"ö",
"ø",
"ù",
"ú",
"û",
"ü",
"ý",
"þ",
"ÿ",
"Ē",
"ē",
"Ĕ",
"ĕ",
"Ė",
"ė",
"Ę",
"ę",
"Ě",
"ě",
"Ĝ",
"ĝ",
"Ğ",
"ğ",
"Ġ",
"ġ",
"Ģ",
"ģ",
"Ĥ",
"ĥ",
"Ħ",
"ħ",
"Ĩ",
"ĩ",
"Ī",
"ī",
"Ĭ",
"ĭ",
"Į",
"į",
"IJ",
"ij",
"Ĵ",
"ĵ",
"Ķ",
"ķ",
"ĸ",
"Ĺ",
"ĺ",
"Ļ",
"ļ",
"Ľ",
"ľ",
"Ŀ",
"ŀ",
"Ł",
"ł",
"Ń",
"ń",
"Ņ",
"ņ",
"Ň",
"ň",
"ʼn",
"Ŋ",
"ŋ",
"Ō",
"ō",
"Ŏ",
"ŏ",
"Ő",
"ő",
"Œ",
"œ",
"Ŕ",
"ŕ",
"Ŗ",
"ŗ",
"Ř",
"ř",
"Ś",
"ś",
"Ŝ",
"ŝ",
"Ş",
"ş",
"Š",
"š",
"Ţ",
"ţ",
"Ť",
"ť",
"Ŧ",
"ŧ",
"Ũ",
"ũ",
"Ū",
"ū",
"Ŭ",
"ŭ",
"Ů",
"ů",
"Ű",
"ű",
"Ų",
"ų",
"Ŵ",
"ŵ",
"Ŷ",
"ŷ",
"Ÿ",
"Ź",
"ź",
"Ż",
"ż",
"Ž",
"ž",
"Ɓ",
"Ƃ",
"ƃ",
"Ƅ",
"ƅ",
"Ɔ",
"Ƈ",
"ƈ",
"Ɖ",
"Ɗ",
"Ƌ",
"ƌ",
"ƍ",
"Ǝ",
"Ə",
"Ɲ",
"ƞ",
"Ɵ",
"Ơ",
"ơ",
"Ơ",
"ơ",
"Ƣ",
"ƣ",
"Ƥ",
"ƥ",
"Ʀ",
"Ƨ",
"ƨ",
"Ʃ",
"ƪ",
"ƫ",
"Ƭ",
"ƭ",
"Ʈ",
"Ư",
"ư",
"Ʊ",
"Ʋ",
"Ƴ",
"ƴ",
"Ƶ",
"ƶ",
"Ʒ",
"Ƹ",
"ƹ",
"ƺ",
"ƻ",
"Ƽ",
"ƽ",
"ƾ",
"ƿ",
"Ǎ",
"ǎ",
"Ǐ",
"ǐ",
"Ǔ",
"ǔ",
"Ǖ",
"ǖ",
"Ǘ",
"ǘ",
"Ǚ",
"ǚ",
"Ǜ",
"ǜ",
"ǝ",
"Ǟ",
"ǟ",
"Ǡ",
"ǡ",
"Ǣ",
"ǣ",
"Ǥ",
"ǥ",
"Ǧ",
"ǧ",
"Ǩ",
"ǩ",
"Ǫ",
"ǫ",
"Ǭ",
"ǭ",
"Ǯ",
"ǯ",
"ǰ",
"Ǵ",
"ǵ",
"Ƕ",
"Ƿ",
"Ǹ",
"ǹ",
"Ǻ",
"ǻ",
"Ǽ",
"ǽ",
"Ǿ",
"ǿ",
"Ȁ",
"ȁ",
"Ȃ",
"ȃ",
"Ȅ",
"ȅ",
"Ȇ",
"ȇ",
"Ȉ",
"ȉ",
"Ȋ",
"ȋ",
"Ȍ",
"ȍ",
"Ȏ",
"ȏ",
"Ȑ",
"ȑ",
"Ȓ",
"ȓ",
"Ȕ",
"ȕ",
"Ȗ",
"ȗ",
"Ș",
"ș",
"Ț",
"ț",
"Ȝ",
"ȝ",
"Ȟ",
"ȟ",
"Ƞ",
"ȡ",
"Ȣ",
"ȣ",
"Ȥ",
"ȥ",
"Ȧ",
"ȧ",
"Ȩ",
"ȩ",
"Ȫ",
"ȫ",
"Ȭ",
"ȭ",
"Ȯ",
"ȯ",
"Ȱ",
"ȱ",
"Ȳ",
"ȳ",
"ȴ",
"ȵ",
"ȶ",
"ȷ",
"ȸ",
"ȹ",
"Ⱥ",
"Ȼ",
"ȼ",
"Ƚ",
"Ⱦ",
"ɀ",
"ɂ",
"Ƀ",
"Ʉ",
"Ʌ",
"Ɇ",
"ɇ",
"Ɉ",
"ɉ",
"Ɋ",
"ɋ",
"Ɍ",
"ɍ",
"Ɏ",
"ɏ",
"ɐ",
"ɑ",
"ɒ",
"ɓ",
"ɔ",
"ƃ",
"ƅ",
"ɖ",
"ɗ",
"ɘ",
"ə",
"ɚ",
"ɛ",
"ɜ",
"ɝ",
"ɞ",
"ɟ",
"ɠ",
"ɡ",
"ɢ",
"ɣ",
"ɤ",
"ɥ",
"ɦ",
"ɧ",
"ɨ",
"ɩ",
"ɪ",
"ɫ",
"ɬ",
"ɭ",
"ɮ",
"ɯ",
"ɰ",
"ɱ",
"ɲ",
"ɳ",
"ŋ",
"ɴ",
"ɵ",
"ɶ",
"ɷ",
"ɸ",
"ɹ",
"ɺ",
"ɻ",
"ɼ",
"ɽ",
"ɾ",
"ɿ",
"ʀ",
"ʁ",
"ʂ",
"ʃ",
"ʄ",
"ʅ",
"ʆ",
"ʇ",
"ʈ",
"ʉ",
"ʊ",
"ʋ",
"ʌ",
"ʍ",
"ʎ",
"ʏ",
"ʐ",
"ʑ",
"ʒ",
"ʓ",
"ʔ",
"ʕ",
"ʖ",
"ʗ",
"ʘ",
"ʙ",
"ʚ",
"ʛ",
"ʜ",
"ʝ",
"ʞ",
"ʟ",
"ʠ",
"ʡ",
"ʢ",
"ʣ",
"ʤ",
"ʥ",
"ʦ",
"ʧ",
"ʨ",
"ʩ",
"ʪ",
"ʫ",
"ʬ",
"ʭ",
"ʮ",
"ʯ"
],
"cryilic": [
"А",
"Б",
"В",
"Г",
"Д",
"Е",
"Ё",
"Ж",
"З",
"И",
"Й",
"К",
"Л",
"М",
"Н",
"О",
"П",
"Р",
"С",
"Т",
"У",
"Ф",
"Х",
"Ц",
"Ч",
"Ш",
"Щ",
"Ъ",
"Ы",
"Ь",
"Э",
"Ю",
"Я"
],
"Japanese": [
"あ",
"い",
"う",
"え",
"お",
"か",
"き",
"く",
"け",
"こ",
"さ",
"し",
"す",
"せ",
"そ",
"た",
"ち",
"つ",
"て",
"と",
"な",
"に",
"ぬ",
"ね",
"の",
"は",
"ひ",
"ふ",
"へ",
"ほ",
"ま",
"み",
"む",
"め",
"も",
"や",
"ゆ",
"よ",
"ら",
"り",
"る",
"れ",
"ろ",
"わ",
"を",
"ん",
"が",
"ぎ",
"ぐ",
"げ",
"ご",
"ざ",
"じ",
"ず",
"ぜ",
"ぞ",
"だ",
"ぢ",
"づ",
"で",
"ど",
"ば",
"び",
"ぶ",
"べ",
"ぼ",
"ぱ",
"ぴ",
"ぷ",
"ぺ",
"ぽ",
"ア",
"イ",
"ウ",
"エ",
"オ",
"カ",
"キ",
"ク",
"ケ",
"コ",
"サ",
"シ",
"ス",
"セ",
"ソ",
"タ",
"チ",
"ツ",
"テ",
"ト",
"ナ",
"ニ",
"ヌ",
"ネ",
"",
"ハ",
"ヒ",
"フ",
"ヘ",
"ホ",
"マ",
"ミ",
"ム",
"メ",
"モ",
"ヤ",
"ユ",
"ヨ",
"ラ",
"リ",
"ル",
"レ",
"ロ",
"ワ",
"ヲ",
"ン",
"ャ",
"ュ",
"ョ",
"ゃ",
"ゅ",
"ょ"
],
"Indian": [
"ऄ",
"अ",
"आ",
"इ",
"ई",
"उ",
"ऊ",
"ऋ",
"ऌ",
"ऍ",
"ऎ",
"ए",
"ऐ",
"ऑ",
"ऒ",
"ओ",
"औ",
"क",
"ख",
"ग",
"घ",
"ङ",
"च",
"छ",
"ज",
"झ",
"ञ",
"ट",
"ठ",
"ड",
"ढ",
"ण",
"त",
"थ",
"द",
"ध",
"न",
"ऩ",
"प",
"फ",
"ब",
"भ",
"म",
"य",
"र",
"ऱ",
"ल",
"ळ",
"ऴ",
"व",
"श",
"ष",
"स",
"ह",
"ऽ",
"क़",
"ख़",
"ग़",
"ज़",
"ड़",
"ढ़",
"फ़",
"य़",
"ॠ",
"ॡ",
"३",
"४",
"५",
"६",
"७",
"८",
"९"
],
"Lao": [
"ກ",
"ຂ",
"ຄ",
"ງ",
"ຈ",
"ຉ",
"ຊ",
"ຍ",
"ຎ",
"ຏ",
"ຐ",
"ຑ",
"ຒ",
"ຓ",
"ດ",
"ຝ",
"ຟ",
"ຠ",
"ມ",
"ຢ",
"ຣ",
"຤",
"ລ",
"຦",
"ວ",
"ຨ",
"ຩ",
"ສ",
"ອ",
"ຬ"
],
"Odia": [
"ଅ",
"ଆ",
"ଇ",
"ଉ",
"ଋ",
"ୠ",
"ଌ",
"୪",
"ଏ",
"ଐ",
"ଓ",
"ଔ",
"କ",
"ଖ",
"ଗ",
"ଘ",
"ଙ",
"ଚ",
"ଛ",
"ଜ",
"ଝ",
"ଞ",
"ଟ",
"",
"ଡ",
"ଢ",
"ଣ",
"ତ",
"ଥ",
"ଦ",
"ଧ",
"ନ",
"ପ",
"ଫ",
"ବ",
"ଭ",
"ମ",
"ଯ",
"ର",
"ଲ",
"ୱ",
"ଶ",
"ଷ",
"ସ",
"ହ"
],
"Khmer": [
"ក",
"ខ",
"គ",
"ឃ",
"ង",
"ច",
"ឆ",
"ជ",
"ឈ",
"ញ",
"ដ",
"ឋ",
"ឌ",
"ឍ",
"ណ",
"ត",
"ថ",
"ទ",
"ធ",
"ន",
"ប",
"ផ",
"ព",
"ភ",
"ម",
"យ",
"រ",
"ល",
"វ",
"ឝ",
"ឞ",
"ស",
"ហ",
"ឡ",
"អ",
"ឣ",
"ឤ",
"ឥ",
"ឦ",
"ឧ",
"ឨ",
"ឩ",
"ឪ",
"ឫ",
"ឬ",
"ឭ",
"ឮ",
"ឯ",
"ឰ",
"ឱ",
"ឲ",
"ឳ"
]
}