|
1
|
|
|
<?php |
|
2
|
|
|
|
|
3
|
|
|
namespace Onoi\Tesa; |
|
4
|
|
|
|
|
5
|
|
|
/** |
|
6
|
|
|
* Romanization and transliteration support for a selected group of characters. |
|
7
|
|
|
* |
|
8
|
|
|
* @see http://www.loc.gov/catdir/cpso/roman.html |
|
9
|
|
|
* @see https://en.wikipedia.org/wiki/List_of_ISO_transliterations |
|
10
|
|
|
* |
|
11
|
|
|
* @license GNU GPL v2+ |
|
12
|
|
|
* @since 0.1 |
|
13
|
|
|
* |
|
14
|
|
|
* @author mwjames |
|
15
|
|
|
*/ |
|
16
|
|
|
class Transliterator { |
|
17
|
|
|
|
|
18
|
|
|
/** |
|
19
|
|
|
* Any change to the mapping of this file should be reflected in a version |
|
20
|
|
|
* change (the version number does not necessarily correlate with the |
|
21
|
|
|
* library version) |
|
22
|
|
|
*/ |
|
23
|
|
|
const VERSION = '0.2'; |
|
24
|
|
|
|
|
25
|
|
|
/** |
|
26
|
|
|
* Transliterator supported option flags |
|
27
|
|
|
*/ |
|
28
|
|
|
const NONE = 0x1; |
|
29
|
|
|
const DIACRITICS = 0x2; |
|
30
|
|
|
const GREEK = 0x4; |
|
31
|
|
|
|
|
32
|
|
|
/** |
|
33
|
|
|
* Convert diacritics (e.g. accents) of a string to a Latin representation |
|
34
|
|
|
* |
|
35
|
|
|
* @see http://jsperf.com/latinize |
|
36
|
|
|
* |
|
37
|
|
|
* - Changed the German conversion rules for the diaeresis representation |
|
38
|
|
|
* (Ü to Ue, Ä to ae etc.) |
|
39
|
|
|
* - Added ß/ss |
|
40
|
|
|
* |
|
41
|
|
|
* |
|
42
|
|
|
* @var array |
|
43
|
|
|
*/ |
|
44
|
|
|
private static $diacriticsMap = array( |
|
45
|
|
|
"Á" => "A", "Ă" => "A", "Ắ" => "A", "Ặ" => "A", "Ằ" => "A", "Ẳ" => "A", "Ẵ" => "A", |
|
46
|
|
|
"Ǎ" => "A", "Â" => "A", "Ấ" => "A", "Ậ" => "A", "Ầ" => "A", "Ẩ" => "A", "Ẫ" => "A", |
|
47
|
|
|
"Ä" => "AE", "Ǟ" => "A", "Ȧ" => "A", "Ǡ" => "A", "Ạ" => "A", "Ȁ" => "A", "À" => "A", |
|
48
|
|
|
"Ả" => "A", "Ȃ" => "A", "Ā" => "A", "Ą" => "A", "Å" => "A", "Ǻ" => "A", "Ḁ" => "A", |
|
49
|
|
|
"Ⱥ" => "A", "Ã" => "A", "Ꜳ" => "AA", "Æ" => "AE", "Ǽ" => "AE", "Ǣ" => "AE", "Ꜵ" => "AO", |
|
50
|
|
|
"Ꜷ" => "AU", "Ꜹ" => "AV", "Ꜻ" => "AV", "Ꜽ" => "AY", "Ḃ" => "B", "Ḅ" => "B", "Ɓ" => "B", |
|
51
|
|
|
"Ḇ" => "B", "Ƀ" => "B", "Ƃ" => "B", "Ć" => "C", "Č" => "C", "Ç" => "C", "Ḉ" => "C", |
|
52
|
|
|
"Ĉ" => "C", "Ċ" => "C", "Ƈ" => "C", "Ȼ" => "C", "Ď" => "D", "Ḑ" => "D", "Ḓ" => "D", |
|
53
|
|
|
"Ḋ" => "D", "Ḍ" => "D", "Ɗ" => "D", "Ḏ" => "D", "Dz" => "D", "Dž" => "D", "Đ" => "D", |
|
54
|
|
|
"Ƌ" => "D", "DZ" => "DZ", "DŽ" => "DZ", "É" => "E", "Ĕ" => "E", "Ě" => "E", "Ȩ" => "E", |
|
55
|
|
|
"Ḝ" => "E", "Ê" => "E", "Ế" => "E", "Ệ" => "E", "Ề" => "E", "Ể" => "E", "Ễ" => "E", |
|
56
|
|
|
"Ḙ" => "E", "Ë" => "E", "Ė" => "E", "Ẹ" => "E", "Ȅ" => "E", "È" => "E", "Ẻ" => "E", |
|
57
|
|
|
"Ȇ" => "E", "Ē" => "E", "Ḗ" => "E", "Ḕ" => "E", "Ę" => "E", "Ɇ" => "E", "Ẽ" => "E", |
|
58
|
|
|
"Ḛ" => "E", "Ꝫ" => "ET", "Ḟ" => "F", "Ƒ" => "F", "Ǵ" => "G", "Ğ" => "G", "Ǧ" => "G", |
|
59
|
|
|
"Ģ" => "G", "Ĝ" => "G", "Ġ" => "G", "Ɠ" => "G", "Ḡ" => "G", "Ǥ" => "G", "Ḫ" => "H", |
|
60
|
|
|
"Ȟ" => "H", "Ḩ" => "H", "Ĥ" => "H", "Ⱨ" => "H", "Ḧ" => "H", "Ḣ" => "H", "Ḥ" => "H", |
|
61
|
|
|
"Ħ" => "H", "Í" => "I", "Ĭ" => "I", "Ǐ" => "I", "Î" => "I", "Ï" => "I", "Ḯ" => "I", |
|
62
|
|
|
"İ" => "I", "Ị" => "I", "Ȉ" => "I", "Ì" => "I", "Ỉ" => "I", "Ȋ" => "I", "Ī" => "I", |
|
63
|
|
|
"Į" => "I", "Ɨ" => "I", "Ĩ" => "I", "Ḭ" => "I", "Ꝺ" => "D", "Ꝼ" => "F", "Ᵹ" => "G", |
|
64
|
|
|
"Ꞃ" => "R", "Ꞅ" => "S", "Ꞇ" => "T", "Ꝭ" => "IS", "Ĵ" => "J", "Ɉ" => "J", "Ḱ" => "K", |
|
65
|
|
|
"Ǩ" => "K", "Ķ" => "K", "Ⱪ" => "K", "Ꝃ" => "K", "Ḳ" => "K", "Ƙ" => "K", "Ḵ" => "K", |
|
66
|
|
|
"Ꝁ" => "K", "Ꝅ" => "K", "Ĺ" => "L", "Ƚ" => "L", "Ľ" => "L", "Ļ" => "L", "Ḽ" => "L", |
|
67
|
|
|
"Ḷ" => "L", "Ḹ" => "L", "Ⱡ" => "L", "Ꝉ" => "L", "Ḻ" => "L", "Ŀ" => "L", "Ɫ" => "L", |
|
68
|
|
|
"Lj" => "L", "Ł" => "L", "LJ" => "LJ", "Ḿ" => "M", "Ṁ" => "M", "Ṃ" => "M", "Ɱ" => "M", |
|
69
|
|
|
"Ń" => "N", "Ň" => "N", "Ņ" => "N", "Ṋ" => "N", "Ṅ" => "N", "Ṇ" => "N", "Ǹ" => "N", |
|
70
|
|
|
"Ɲ" => "N", "Ṉ" => "N", "Ƞ" => "N", "Nj" => "N", "Ñ" => "N", "NJ" => "NJ", "Ó" => "O", |
|
71
|
|
|
"Ŏ" => "O", "Ǒ" => "O", "Ô" => "O", "Ố" => "O", "Ộ" => "O", "Ồ" => "O", "Ổ" => "O", |
|
72
|
|
|
"Ỗ" => "O", "Ö" => "OE", "Ȫ" => "O", "Ȯ" => "O", "Ȱ" => "O", "Ọ" => "O", "Ő" => "O", |
|
73
|
|
|
"Ȍ" => "O", "Ò" => "O", "Ỏ" => "O", "Ơ" => "O", "Ớ" => "O", "Ợ" => "O", "Ờ" => "O", |
|
74
|
|
|
"Ở" => "O", "Ỡ" => "O", "Ȏ" => "O", "Ꝋ" => "O", "Ꝍ" => "O", "Ō" => "O", "Ṓ" => "O", |
|
75
|
|
|
"Ṑ" => "O", "Ɵ" => "O", "Ǫ" => "O", "Ǭ" => "O", "Ø" => "O", "Ǿ" => "O", "Õ" => "O", |
|
76
|
|
|
"Ṍ" => "O", "Ṏ" => "O", "Ȭ" => "O", "Ƣ" => "OI", "Ꝏ" => "OO", "Ɛ" => "E", "Ɔ" => "O", |
|
77
|
|
|
"Ȣ" => "OU", "Ṕ" => "P", "Ṗ" => "P", "Ꝓ" => "P", "Ƥ" => "P", "Ꝕ" => "P", "Ᵽ" => "P", |
|
78
|
|
|
"Ꝑ" => "P", "Ꝙ" => "Q", "Ꝗ" => "Q", "Ŕ" => "R", "Ř" => "R", "Ŗ" => "R", "Ṙ" => "R", |
|
79
|
|
|
"Ṛ" => "R", "Ṝ" => "R", "Ȑ" => "R", "Ȓ" => "R", "Ṟ" => "R", "Ɍ" => "R", "Ɽ" => "R", |
|
80
|
|
|
"Ꜿ" => "C", "Ǝ" => "E", "Ś" => "S", "Ṥ" => "S", "Š" => "S", "Ṧ" => "S", "Ş" => "S", |
|
81
|
|
|
"Ŝ" => "S", "Ș" => "S", "Ṡ" => "S", "Ṣ" => "S", "Ṩ" => "S", "ß" => "ss", |
|
82
|
|
|
"Ť" => "T", "Ţ" => "T", |
|
83
|
|
|
"Ṱ" => "T", "Ț" => "T", "Ⱦ" => "T", "Ṫ" => "T", "Ṭ" => "T", "Ƭ" => "T", "Ṯ" => "T", |
|
84
|
|
|
"Ʈ" => "T", "Ŧ" => "T", "Ɐ" => "A", "Ꞁ" => "L", "Ɯ" => "M", "Ʌ" => "V", "Ꜩ" => "TZ", |
|
85
|
|
|
"Ú" => "U", "Ŭ" => "U", "Ǔ" => "U", "Û" => "U", "Ṷ" => "U", "Ü" => "UE", "Ǘ" => "U", |
|
86
|
|
|
"Ǚ" => "U", "Ǜ" => "U", "Ǖ" => "U", "Ṳ" => "U", "Ụ" => "U", "Ű" => "U", "Ȕ" => "U", |
|
87
|
|
|
"Ù" => "U", "Ủ" => "U", "Ư" => "U", "Ứ" => "U", "Ự" => "U", "Ừ" => "U", "Ử" => "U", |
|
88
|
|
|
"Ữ" => "U", "Ȗ" => "U", "Ū" => "U", "Ṻ" => "U", "Ų" => "U", "Ů" => "U", "Ũ" => "U", |
|
89
|
|
|
"Ṹ" => "U", "Ṵ" => "U", "Ꝟ" => "V", "Ṿ" => "V", "Ʋ" => "V", "Ṽ" => "V", "Ꝡ" => "VY", |
|
90
|
|
|
"Ẃ" => "W", "Ŵ" => "W", "Ẅ" => "W", "Ẇ" => "W", "Ẉ" => "W", "Ẁ" => "W", "Ⱳ" => "W", |
|
91
|
|
|
"Ẍ" => "X", "Ẋ" => "X", "Ý" => "Y", "Ŷ" => "Y", "Ÿ" => "Y", "Ẏ" => "Y", "Ỵ" => "Y", |
|
92
|
|
|
"Ỳ" => "Y", "Ƴ" => "Y", "Ỷ" => "Y", "Ỿ" => "Y", "Ȳ" => "Y", "Ɏ" => "Y", "Ỹ" => "Y", |
|
93
|
|
|
"Ź" => "Z", "Ž" => "Z", "Ẑ" => "Z", "Ⱬ" => "Z", "Ż" => "Z", "Ẓ" => "Z", "Ȥ" => "Z", |
|
94
|
|
|
"Ẕ" => "Z", "Ƶ" => "Z", "IJ" => "IJ", "Œ" => "OE", "ᴀ" => "A", "ᴁ" => "AE", "ʙ" => "B", |
|
95
|
|
|
"ᴃ" => "B", "ᴄ" => "C", "ᴅ" => "D", "ᴇ" => "E", "ꜰ" => "F", "ɢ" => "G", "ʛ" => "G", |
|
96
|
|
|
"ʜ" => "H", "ɪ" => "I", "ʁ" => "R", "ᴊ" => "J", "ᴋ" => "K", "ʟ" => "L", "ᴌ" => "L", |
|
97
|
|
|
"ᴍ" => "M", "ɴ" => "N", "ᴏ" => "O", "ɶ" => "OE", "ᴐ" => "O", "ᴕ" => "OU", "ᴘ" => "P", |
|
98
|
|
|
"ʀ" => "R", "ᴎ" => "N", "ᴙ" => "R", "ꜱ" => "S", "ᴛ" => "T", "ⱻ" => "E", "ᴚ" => "R", |
|
99
|
|
|
"ᴜ" => "U", "ᴠ" => "V", "ᴡ" => "W", "ʏ" => "Y", "ᴢ" => "Z", "á" => "a", "ă" => "a", |
|
100
|
|
|
"ắ" => "a", "ặ" => "a", "ằ" => "a", "ẳ" => "a", "ẵ" => "a", "ǎ" => "a", "â" => "a", |
|
101
|
|
|
"ấ" => "a", "ậ" => "a", "ầ" => "a", "ẩ" => "a", "ẫ" => "a", "ä" => "ae", "ǟ" => "a", |
|
102
|
|
|
"ȧ" => "a", "ǡ" => "a", "ạ" => "a", "ȁ" => "a", "à" => "a", "ả" => "a", "ȃ" => "a", |
|
103
|
|
|
"ā" => "a", "ą" => "a", "ᶏ" => "a", "ẚ" => "a", "å" => "a", "ǻ" => "a", "ḁ" => "a", |
|
104
|
|
|
"ⱥ" => "a", "ã" => "a", "ꜳ" => "aa", "æ" => "ae", "ǽ" => "ae", "ǣ" => "ae", "ꜵ" => "ao", |
|
105
|
|
|
"ꜷ" => "au", "ꜹ" => "av", "ꜻ" => "av", "ꜽ" => "ay", "ḃ" => "b", "ḅ" => "b", "ɓ" => "b", |
|
106
|
|
|
"ḇ" => "b", "ᵬ" => "b", "ᶀ" => "b", "ƀ" => "b", "ƃ" => "b", "ɵ" => "o", "ć" => "c", |
|
107
|
|
|
"č" => "c", "ç" => "c", "ḉ" => "c", "ĉ" => "c", "ɕ" => "c", "ċ" => "c", "ƈ" => "c", |
|
108
|
|
|
"ȼ" => "c", "ď" => "d", "ḑ" => "d", "ḓ" => "d", "ȡ" => "d", "ḋ" => "d", "ḍ" => "d", |
|
109
|
|
|
"ɗ" => "d", "ᶑ" => "d", "ḏ" => "d", "ᵭ" => "d", "ᶁ" => "d", "đ" => "d", "ɖ" => "d", |
|
110
|
|
|
"ƌ" => "d", "ı" => "i", "ȷ" => "j", "ɟ" => "j", "ʄ" => "j", "dz" => "dz", "dž" => "dz", |
|
111
|
|
|
"é" => "e", "ĕ" => "e", "ě" => "e", "ȩ" => "e", "ḝ" => "e", "ê" => "e", "ế" => "e", |
|
112
|
|
|
"ệ" => "e", "ề" => "e", "ể" => "e", "ễ" => "e", "ḙ" => "e", "ë" => "e", "ė" => "e", |
|
113
|
|
|
"ẹ" => "e", "ȅ" => "e", "è" => "e", "ẻ" => "e", "ȇ" => "e", "ē" => "e", "ḗ" => "e", |
|
114
|
|
|
"ḕ" => "e", "ⱸ" => "e", "ę" => "e", "ᶒ" => "e", "ɇ" => "e", "ẽ" => "e", "ḛ" => "e", |
|
115
|
|
|
"ꝫ" => "et", "ḟ" => "f", "ƒ" => "f", "ᵮ" => "f", "ᶂ" => "f", "ǵ" => "g", "ğ" => "g", |
|
116
|
|
|
"ǧ" => "g", "ģ" => "g", "ĝ" => "g", "ġ" => "g", "ɠ" => "g", "ḡ" => "g", "ᶃ" => "g", |
|
117
|
|
|
"ǥ" => "g", "ḫ" => "h", "ȟ" => "h", "ḩ" => "h", "ĥ" => "h", "ⱨ" => "h", "ḧ" => "h", |
|
118
|
|
|
"ḣ" => "h", "ḥ" => "h", "ɦ" => "h", "ẖ" => "h", "ħ" => "h", "ƕ" => "hv", "í" => "i", |
|
119
|
|
|
"ĭ" => "i", "ǐ" => "i", "î" => "i", "ï" => "i", "ḯ" => "i", "ị" => "i", "ȉ" => "i", |
|
120
|
|
|
"ì" => "i", "ỉ" => "i", "ȋ" => "i", "ī" => "i", "į" => "i", "ᶖ" => "i", "ɨ" => "i", |
|
121
|
|
|
"ĩ" => "i", "ḭ" => "i", "ꝺ" => "d", "ꝼ" => "f", "ᵹ" => "g", "ꞃ" => "r", "ꞅ" => "s", |
|
122
|
|
|
"ꞇ" => "t", "ꝭ" => "is", "ǰ" => "j", "ĵ" => "j", "ʝ" => "j", "ɉ" => "j", "ḱ" => "k", |
|
123
|
|
|
"ǩ" => "k", "ķ" => "k", "ⱪ" => "k", "ꝃ" => "k", "ḳ" => "k", "ƙ" => "k", "ḵ" => "k", |
|
124
|
|
|
"ᶄ" => "k", "ꝁ" => "k", "ꝅ" => "k", "ĺ" => "l", "ƚ" => "l", "ɬ" => "l", "ľ" => "l", |
|
125
|
|
|
"ļ" => "l", "ḽ" => "l", "ȴ" => "l", "ḷ" => "l", "ḹ" => "l", "ⱡ" => "l", "ꝉ" => "l", |
|
126
|
|
|
"ḻ" => "l", "ŀ" => "l", "ɫ" => "l", "ᶅ" => "l", "ɭ" => "l", "ł" => "l", "lj" => "lj", |
|
127
|
|
|
"ſ" => "s", "ẜ" => "s", "ẛ" => "s", "ẝ" => "s", "ḿ" => "m", "ṁ" => "m", "ṃ" => "m", |
|
128
|
|
|
"ɱ" => "m", "ᵯ" => "m", "ᶆ" => "m", "ń" => "n", "ň" => "n", "ņ" => "n", "ṋ" => "n", |
|
129
|
|
|
"ȵ" => "n", "ṅ" => "n", "ṇ" => "n", "ǹ" => "n", "ɲ" => "n", "ṉ" => "n", "ƞ" => "n", |
|
130
|
|
|
"ᵰ" => "n", "ᶇ" => "n", "ɳ" => "n", "ñ" => "n", "nj" => "nj", "ó" => "o", "ŏ" => "o", |
|
131
|
|
|
"ǒ" => "o", "ô" => "o", "ố" => "o", "ộ" => "o", "ồ" => "o", "ổ" => "o", "ỗ" => "o", |
|
132
|
|
|
"ö" => "oe", "ȫ" => "o", "ȯ" => "o", "ȱ" => "o", "ọ" => "o", "ő" => "o", "ȍ" => "o", |
|
133
|
|
|
"ò" => "o", "ỏ" => "o", "ơ" => "o", "ớ" => "o", "ợ" => "o", "ờ" => "o", "ở" => "o", |
|
134
|
|
|
"ỡ" => "o", "ȏ" => "o", "ꝋ" => "o", "ꝍ" => "o", "ⱺ" => "o", "ō" => "o", "ṓ" => "o", |
|
135
|
|
|
"ṑ" => "o", "ǫ" => "o", "ǭ" => "o", "ø" => "o", "ǿ" => "o", "õ" => "o", "ṍ" => "o", |
|
136
|
|
|
"ṏ" => "o", "ȭ" => "o", "ƣ" => "oi", "ꝏ" => "oo", "ɛ" => "e", "ᶓ" => "e", "ɔ" => "o", |
|
137
|
|
|
"ᶗ" => "o", "ȣ" => "ou", "ṕ" => "p", "ṗ" => "p", "ꝓ" => "p", "ƥ" => "p", "ᵱ" => "p", |
|
138
|
|
|
"ᶈ" => "p", "ꝕ" => "p", "ᵽ" => "p", "ꝑ" => "p", "ꝙ" => "q", "ʠ" => "q", "ɋ" => "q", |
|
139
|
|
|
"ꝗ" => "q", "ŕ" => "r", "ř" => "r", "ŗ" => "r", "ṙ" => "r", "ṛ" => "r", "ṝ" => "r", |
|
140
|
|
|
"ȑ" => "r", "ɾ" => "r", "ᵳ" => "r", "ȓ" => "r", "ṟ" => "r", "ɼ" => "r", "ᵲ" => "r", |
|
141
|
|
|
"ᶉ" => "r", "ɍ" => "r", "ɽ" => "r", "ↄ" => "c", "ꜿ" => "c", "ɘ" => "e", "ɿ" => "r", |
|
142
|
|
|
"ś" => "s", "ṥ" => "s", "š" => "s", "ṧ" => "s", "ş" => "s", "ŝ" => "s", "ș" => "s", |
|
143
|
|
|
"ṡ" => "s", "ṣ" => "s", "ṩ" => "s", "ʂ" => "s", "ᵴ" => "s", "ᶊ" => "s", "ȿ" => "s", |
|
144
|
|
|
"ɡ" => "g", "ᴑ" => "o", "ᴓ" => "o", "ᴝ" => "u", "ť" => "t", "ţ" => "t", "ṱ" => "t", |
|
145
|
|
|
"ț" => "t", "ȶ" => "t", "ẗ" => "t", "ⱦ" => "t", "ṫ" => "t", "ṭ" => "t", "ƭ" => "t", |
|
146
|
|
|
"ṯ" => "t", "ᵵ" => "t", "ƫ" => "t", "ʈ" => "t", "ŧ" => "t", "ᵺ" => "th", "ɐ" => "a", |
|
147
|
|
|
"ᴂ" => "ae", "ǝ" => "e", "ᵷ" => "g", "ɥ" => "h", "ʮ" => "h", "ʯ" => "h", "ᴉ" => "i", |
|
148
|
|
|
"ʞ" => "k", "ꞁ" => "l", "ɯ" => "m", "ɰ" => "m", "ᴔ" => "oe", "ɹ" => "r", "ɻ" => "r", |
|
149
|
|
|
"ɺ" => "r", "ⱹ" => "r", "ʇ" => "t", "ʌ" => "v", "ʍ" => "w", "ʎ" => "y", "ꜩ" => "tz", |
|
150
|
|
|
"ú" => "u", "ŭ" => "u", "ǔ" => "u", "û" => "u", "ṷ" => "u", "ü" => "ue", "ǘ" => "u", |
|
151
|
|
|
"ǚ" => "u", "ǜ" => "u", "ǖ" => "u", "ṳ" => "u", "ụ" => "u", "ű" => "u", "ȕ" => "u", |
|
152
|
|
|
"ù" => "u", "ủ" => "u", "ư" => "u", "ứ" => "u", "ự" => "u", "ừ" => "u", "ử" => "u", |
|
153
|
|
|
"ữ" => "u", "ȗ" => "u", "ū" => "u", "ṻ" => "u", "ų" => "u", "ᶙ" => "u", "ů" => "u", |
|
154
|
|
|
"ũ" => "u", "ṹ" => "u", "ṵ" => "u", "ᵫ" => "ue", "ꝸ" => "um", "ⱴ" => "v", "ꝟ" => "v", |
|
155
|
|
|
"ṿ" => "v", "ʋ" => "v", "ᶌ" => "v", "ⱱ" => "v", "ṽ" => "v", "ꝡ" => "vy", "ẃ" => "w", |
|
156
|
|
|
"ŵ" => "w", "ẅ" => "w", "ẇ" => "w", "ẉ" => "w", "ẁ" => "w", "ⱳ" => "w", "ẘ" => "w", |
|
157
|
|
|
"ẍ" => "x", "ẋ" => "x", "ᶍ" => "x", "ý" => "y", "ŷ" => "y", "ÿ" => "y", "ẏ" => "y", |
|
158
|
|
|
"ỵ" => "y", "ỳ" => "y", "ƴ" => "y", "ỷ" => "y", "ỿ" => "y", "ȳ" => "y", "ẙ" => "y", |
|
159
|
|
|
"ɏ" => "y", "ỹ" => "y", "ź" => "z", "ž" => "z", "ẑ" => "z", "ʑ" => "z", "ⱬ" => "z", |
|
160
|
|
|
"ż" => "z", "ẓ" => "z", "ȥ" => "z", "ẕ" => "z", "ᵶ" => "z", "ᶎ" => "z", "ʐ" => "z", |
|
161
|
|
|
"ƶ" => "z", "ɀ" => "z", "ff" => "ff", "ffi" => "ffi", "ffl" => "ffl", "fi" => "fi", |
|
162
|
|
|
"fl" => "fl", "ij" => "ij", "œ" => "oe", "st" => "st", "ₐ" => "a", "ₑ" => "e", "ᵢ" => "i", |
|
163
|
|
|
"ⱼ" => "j", "ₒ" => "o", "ᵣ" => "r", "ᵤ" => "u", "ᵥ" => "v", "ₓ" => "x" |
|
164
|
|
|
); |
|
165
|
|
|
|
|
166
|
|
|
/** |
|
167
|
|
|
* @see http://en.wikipedia.org/wiki/ISO_843 |
|
168
|
|
|
* @see https://en.wikipedia.org/wiki/Romanization_of_Greek |
|
169
|
|
|
* |
|
170
|
|
|
* Resolving diacritic letters can be done using it with option ( |
|
171
|
|
|
* Transliterator::DIACRITICS | Transliterator::GREEK ) |
|
172
|
|
|
* |
|
173
|
|
|
* @var array |
|
174
|
|
|
*/ |
|
175
|
|
|
private static $greekMap = array( |
|
176
|
|
|
|
|
177
|
|
|
"ου"=> "ou", |
|
178
|
|
|
"Ου"=> "Ou", |
|
179
|
|
|
"Οι"=> "Oi", |
|
180
|
|
|
"οι"=> "oi", |
|
181
|
|
|
"Υι"=> "Yi", |
|
182
|
|
|
"υι"=> "yi", |
|
183
|
|
|
"Ού"=> "Oú", |
|
184
|
|
|
"ού"=> "oú", |
|
185
|
|
|
|
|
186
|
|
|
"Α" => "A", |
|
187
|
|
|
"Ά" => "Á", |
|
188
|
|
|
"Β" => "V", |
|
189
|
|
|
"Γ" => "G", |
|
190
|
|
|
"Δ" => "D", |
|
191
|
|
|
"Ε" => "E", |
|
192
|
|
|
"Έ" => "É", |
|
193
|
|
|
"Ζ" => "Z", |
|
194
|
|
|
"Η" => "Ī", |
|
195
|
|
|
"Ή" => "Ī́", |
|
196
|
|
|
"Θ" => "Th", |
|
197
|
|
|
"Ι" => "I", |
|
198
|
|
|
"Ί" => "Í", |
|
199
|
|
|
"Ϊ" => "Ï", |
|
200
|
|
|
"ΐ" => "ḯ", |
|
201
|
|
|
"Κ" => "K", |
|
202
|
|
|
"Λ" => "L", |
|
203
|
|
|
"Μ" => "M", |
|
204
|
|
|
"Ν" => "N", |
|
205
|
|
|
"Ξ" => "X", |
|
206
|
|
|
"Ο" => "O", |
|
207
|
|
|
"Ό" => "Ó", |
|
208
|
|
|
"Π" => "P", |
|
209
|
|
|
"Ρ" => "R", |
|
210
|
|
|
"Σ" => "S", |
|
211
|
|
|
"ς" => "s", |
|
212
|
|
|
"Τ" => "T", |
|
213
|
|
|
"Υ" => "Y", |
|
214
|
|
|
"Ύ" => "Ý", |
|
215
|
|
|
"Ϋ" => "Ÿ", |
|
216
|
|
|
"ΰ" => "ÿ́", |
|
217
|
|
|
"Φ" => "F", |
|
218
|
|
|
"Χ" => "Ch", |
|
219
|
|
|
"Ψ" => "Ps", |
|
220
|
|
|
"Ω" => "Ō", |
|
221
|
|
|
"Ώ" => "Ṓ", |
|
222
|
|
|
"α" => "a", |
|
223
|
|
|
"ά" => "á", |
|
224
|
|
|
"β" => "v", |
|
225
|
|
|
"γ" => "g", |
|
226
|
|
|
"δ" => "d", |
|
227
|
|
|
"ε" => "e", |
|
228
|
|
|
"έ" => "é", |
|
229
|
|
|
"ζ" => "z", |
|
230
|
|
|
"η" => "ī", |
|
231
|
|
|
"ή" => "ī́", |
|
232
|
|
|
"θ" => "th", |
|
233
|
|
|
"ι" => "i", |
|
234
|
|
|
"ί" => "í", |
|
235
|
|
|
"ϊ" => "ï", |
|
236
|
|
|
"κ" => "k", |
|
237
|
|
|
"λ" => "l", |
|
238
|
|
|
"μ" => "m", |
|
239
|
|
|
"ν" => "n", |
|
240
|
|
|
"ξ" => "x", |
|
241
|
|
|
"ο" => "o", |
|
242
|
|
|
"ό" => "ó", |
|
243
|
|
|
"π" => "p", |
|
244
|
|
|
"ρ" => "r", |
|
245
|
|
|
"σ" => "s", |
|
246
|
|
|
"τ" => "t", |
|
247
|
|
|
"υ" => "y", |
|
248
|
|
|
"ύ" => "ý", |
|
249
|
|
|
"ϋ" => "ÿ", |
|
250
|
|
|
"φ" => "f", |
|
251
|
|
|
"χ" => "ch", |
|
252
|
|
|
"ψ" => "ps", |
|
253
|
|
|
"ω" => "ō", |
|
254
|
|
|
"ώ" => "ṓ", |
|
255
|
|
|
); |
|
256
|
|
|
|
|
257
|
|
|
/** |
|
258
|
|
|
* @var array |
|
259
|
|
|
*/ |
|
260
|
|
|
private static $transliterationMap = array(); |
|
261
|
|
|
|
|
262
|
|
|
/** |
|
263
|
|
|
* @since 0.1 |
|
264
|
|
|
* |
|
265
|
|
|
* @param string $string |
|
266
|
|
|
* @param integer $flag |
|
267
|
|
|
* |
|
268
|
|
|
* @return string |
|
269
|
|
|
*/ |
|
270
|
21 |
|
public static function transliterate( $string, $flag = self::DIACRITICS ) { |
|
271
|
|
|
|
|
272
|
21 |
|
if ( $flag === ( $flag | self::NONE ) ) { |
|
273
|
1 |
|
return $string; |
|
274
|
|
|
} |
|
275
|
|
|
|
|
276
|
20 |
|
if ( !isset( self::$transliterationMap[$flag] ) ) { |
|
277
|
3 |
|
$transliterationMap = array(); |
|
278
|
|
|
|
|
279
|
3 |
|
if ( $flag === ( $flag | self::GREEK ) ) { |
|
280
|
2 |
|
$transliterationMap += self::$greekMap; |
|
281
|
2 |
|
} |
|
282
|
|
|
|
|
283
|
3 |
|
if ( $flag === ( $flag | self::DIACRITICS ) ) { |
|
284
|
1 |
|
$transliterationMap += self::$diacriticsMap; |
|
285
|
1 |
|
} |
|
286
|
|
|
|
|
287
|
|
|
// Keep it static for the duration of a request to avoid negative |
|
288
|
|
|
// performance impact |
|
289
|
3 |
|
self::$transliterationMap[$flag]['k'] = array_keys( $transliterationMap ); |
|
290
|
3 |
|
self::$transliterationMap[$flag]['v'] = array_values( $transliterationMap ); |
|
291
|
|
|
|
|
292
|
3 |
|
unset( $transliterationMap ); |
|
293
|
3 |
|
} |
|
294
|
|
|
|
|
295
|
20 |
|
return str_replace( |
|
296
|
20 |
|
self::$transliterationMap[$flag]['k'], |
|
297
|
20 |
|
self::$transliterationMap[$flag]['v'], |
|
298
|
|
|
$string |
|
299
|
20 |
|
); |
|
300
|
|
|
} |
|
301
|
|
|
|
|
302
|
|
|
} |
|
303
|
|
|
|