@@ -14,40 +14,40 @@ |
||
14 | 14 | */ |
15 | 15 | class Pronoun extends WordList |
16 | 16 | { |
17 | - /** |
|
18 | - * Возвращает список слов. |
|
19 | - * |
|
20 | - * @return array |
|
21 | - */ |
|
22 | - public function getWords() |
|
23 | - { |
|
24 | - return array( |
|
25 | - // русские местоимения |
|
26 | - 'я', 'меня', 'мне', 'мной', 'мною', 'обо мне', 'мы', 'нас', 'нам', 'нами', 'о нас', 'ты', 'тебя', 'тебе', 'тобой', 'тобою', 'вы', 'вас', |
|
27 | - 'вам', 'вами', 'он', 'его', 'него', 'ему', 'нему', 'им', 'ним', 'нём', 'о нём', 'нем', 'она', 'её', 'ее', 'неё', 'нее', 'ей', 'ней', 'ею', |
|
28 | - 'нею', 'оно', 'они', 'их', 'них', 'ими', 'ними', 'о них', 'себя', 'себе', 'собой', 'собою', 'мой', 'моего', 'моему', 'моё', 'мое', 'моём', |
|
29 | - 'о моём', 'моем', 'моя', 'моей', 'мою', 'мои', 'моих', 'моим', 'моими', 'наш', 'нашего', 'нашим', 'нашем', 'наша', 'нашей', 'нашу', 'наше', |
|
30 | - 'о нашем', 'наши', 'наших', 'нашими', 'твой', 'твоего', 'твоему', 'твоим', 'твоём', 'о твоём', 'твоем', 'твоя', 'твоей', 'твою', 'твое', |
|
31 | - 'ваш', 'вашего', 'вашему', 'вашим', 'вашем', 'о вашем', 'ваша', 'вашей', 'вашу', 'ваше', 'свой', 'своих', 'своим', 'своими', 'своя', 'своей', |
|
32 | - 'свою', 'своё', 'свое', 'своего', 'своему', 'своём', 'о своём', 'своем', 'свои', 'о своих', 'кто', 'что', 'каков', 'чей', 'который', 'какой', |
|
33 | - 'какое', 'какая', 'какие', 'какого', 'каких', 'какому', 'каким', 'какую', 'какою', 'какими', 'каком', 'сколько', 'столько', 'этот', 'тот', |
|
34 | - 'такой', 'таков', 'такова', 'сей', 'весь', 'всякий', 'сам', 'самый', 'каждый', 'любой', 'другой', 'иной', 'никто', 'ничто', 'некого', |
|
35 | - 'нечего', 'нисколько', 'никакой', 'ничей', 'некто', 'нечто', 'некий', 'некоторый', 'несколько', 'это', 'эта', 'эти', 'этого', 'этой', 'этих', |
|
36 | - 'этому', 'этим', 'эту', 'этою', 'этими', 'этом', 'сие', 'сия', 'сии', 'сего', 'сих', 'сему', 'сим', 'сию', 'сею', 'сиею', 'сими', 'сём', 'то', |
|
37 | - 'та', 'те', 'того', 'той', 'тех', 'тому', 'тем', 'ту', 'тою', 'теми', 'данный', 'данное', 'данная', 'данного', 'данной', 'данному', 'данную', |
|
38 | - 'данною', 'данном', 'всё', 'вся', 'все', 'всего', 'всей', 'всех', 'всему', 'всем', 'всю', 'всею', 'всеми', 'всём', 'вот', 'кому', 'этакий', |
|
39 | - 'этакое', 'этакая', 'этакие', 'этакого', 'этакой', 'этаких', 'этакому', 'этаким', 'этакую', 'этакою', 'этакими', 'этаком', 'другие', |
|
40 | - 'какой-то', 'оба', 'тот или другой', 'и тот и другой', 'мало', 'немногие', 'себя,', 'сама', 'ёё', 'само,', 'немного', 'много', 'многие', |
|
41 | - 'ни тот', 'ни другой', 'нет', 'ни один', 'друг друга', 'некоторые', 'тот же самый', 'сами', 'что бы ни', |
|
42 | - 'какой бы ни', 'кто бы ни', 'которого', 'которому', 'ваши', |
|
43 | - 'кое-*', '*-то', '*-либо', '*-нибудь', |
|
44 | - '/^том$/u', // местоимение, а не имя Том |
|
17 | + /** |
|
18 | + * Возвращает список слов. |
|
19 | + * |
|
20 | + * @return array |
|
21 | + */ |
|
22 | + public function getWords() |
|
23 | + { |
|
24 | + return array( |
|
25 | + // русские местоимения |
|
26 | + 'я', 'меня', 'мне', 'мной', 'мною', 'обо мне', 'мы', 'нас', 'нам', 'нами', 'о нас', 'ты', 'тебя', 'тебе', 'тобой', 'тобою', 'вы', 'вас', |
|
27 | + 'вам', 'вами', 'он', 'его', 'него', 'ему', 'нему', 'им', 'ним', 'нём', 'о нём', 'нем', 'она', 'её', 'ее', 'неё', 'нее', 'ей', 'ней', 'ею', |
|
28 | + 'нею', 'оно', 'они', 'их', 'них', 'ими', 'ними', 'о них', 'себя', 'себе', 'собой', 'собою', 'мой', 'моего', 'моему', 'моё', 'мое', 'моём', |
|
29 | + 'о моём', 'моем', 'моя', 'моей', 'мою', 'мои', 'моих', 'моим', 'моими', 'наш', 'нашего', 'нашим', 'нашем', 'наша', 'нашей', 'нашу', 'наше', |
|
30 | + 'о нашем', 'наши', 'наших', 'нашими', 'твой', 'твоего', 'твоему', 'твоим', 'твоём', 'о твоём', 'твоем', 'твоя', 'твоей', 'твою', 'твое', |
|
31 | + 'ваш', 'вашего', 'вашему', 'вашим', 'вашем', 'о вашем', 'ваша', 'вашей', 'вашу', 'ваше', 'свой', 'своих', 'своим', 'своими', 'своя', 'своей', |
|
32 | + 'свою', 'своё', 'свое', 'своего', 'своему', 'своём', 'о своём', 'своем', 'свои', 'о своих', 'кто', 'что', 'каков', 'чей', 'который', 'какой', |
|
33 | + 'какое', 'какая', 'какие', 'какого', 'каких', 'какому', 'каким', 'какую', 'какою', 'какими', 'каком', 'сколько', 'столько', 'этот', 'тот', |
|
34 | + 'такой', 'таков', 'такова', 'сей', 'весь', 'всякий', 'сам', 'самый', 'каждый', 'любой', 'другой', 'иной', 'никто', 'ничто', 'некого', |
|
35 | + 'нечего', 'нисколько', 'никакой', 'ничей', 'некто', 'нечто', 'некий', 'некоторый', 'несколько', 'это', 'эта', 'эти', 'этого', 'этой', 'этих', |
|
36 | + 'этому', 'этим', 'эту', 'этою', 'этими', 'этом', 'сие', 'сия', 'сии', 'сего', 'сих', 'сему', 'сим', 'сию', 'сею', 'сиею', 'сими', 'сём', 'то', |
|
37 | + 'та', 'те', 'того', 'той', 'тех', 'тому', 'тем', 'ту', 'тою', 'теми', 'данный', 'данное', 'данная', 'данного', 'данной', 'данному', 'данную', |
|
38 | + 'данною', 'данном', 'всё', 'вся', 'все', 'всего', 'всей', 'всех', 'всему', 'всем', 'всю', 'всею', 'всеми', 'всём', 'вот', 'кому', 'этакий', |
|
39 | + 'этакое', 'этакая', 'этакие', 'этакого', 'этакой', 'этаких', 'этакому', 'этаким', 'этакую', 'этакою', 'этакими', 'этаком', 'другие', |
|
40 | + 'какой-то', 'оба', 'тот или другой', 'и тот и другой', 'мало', 'немногие', 'себя,', 'сама', 'ёё', 'само,', 'немного', 'много', 'многие', |
|
41 | + 'ни тот', 'ни другой', 'нет', 'ни один', 'друг друга', 'некоторые', 'тот же самый', 'сами', 'что бы ни', |
|
42 | + 'какой бы ни', 'кто бы ни', 'которого', 'которому', 'ваши', |
|
43 | + 'кое-*', '*-то', '*-либо', '*-нибудь', |
|
44 | + '/^том$/u', // местоимение, а не имя Том |
|
45 | 45 | |
46 | - // английские местоимения |
|
47 | - 'all', 'another', 'any', 'both', 'each', 'either', 'every', 'herself', 'himself', 'he', 'she', 'it', 'him', 'her', 'we', 'you', 'they', |
|
48 | - 'us', 'them', 'this', 'thet', 'these', 'thos', 'his', 'its', 'hers', 'our', 'your', 'their', 'ours', 'yours', 'theis', 'much', 'many', |
|
49 | - 'little', 'few', 'lot', 'i', 'itself', 'me', 'mine', 'my', 'myself', 'neither', 'none', 'one another', 'oneself', 'some', 'such', |
|
50 | - 'that', 'the same', 'themselves', 'those', 'what', 'whatever', 'which', 'whichever', 'who', 'whoever', 'whom', 'whose', 'yourself', |
|
51 | - ); |
|
52 | - } |
|
46 | + // английские местоимения |
|
47 | + 'all', 'another', 'any', 'both', 'each', 'either', 'every', 'herself', 'himself', 'he', 'she', 'it', 'him', 'her', 'we', 'you', 'they', |
|
48 | + 'us', 'them', 'this', 'thet', 'these', 'thos', 'his', 'its', 'hers', 'our', 'your', 'their', 'ours', 'yours', 'theis', 'much', 'many', |
|
49 | + 'little', 'few', 'lot', 'i', 'itself', 'me', 'mine', 'my', 'myself', 'neither', 'none', 'one another', 'oneself', 'some', 'such', |
|
50 | + 'that', 'the same', 'themselves', 'those', 'what', 'whatever', 'which', 'whichever', 'who', 'whoever', 'whom', 'whose', 'yourself', |
|
51 | + ); |
|
52 | + } |
|
53 | 53 | } |
@@ -20,160 +20,160 @@ |
||
20 | 20 | */ |
21 | 21 | abstract class WordList extends Filter |
22 | 22 | { |
23 | - /** |
|
24 | - * Простые слова. |
|
25 | - * |
|
26 | - * @var array |
|
27 | - */ |
|
28 | - private $simple = array(); |
|
29 | - |
|
30 | - /** |
|
31 | - * Составные слова. |
|
32 | - * |
|
33 | - * Составные слова о части которого нам известно. |
|
34 | - * Например слово пишется через тирэ |
|
35 | - * |
|
36 | - * @var array |
|
37 | - */ |
|
38 | - private $composite = array(); |
|
39 | - |
|
40 | - /** |
|
41 | - * Последовательности из набора слов. |
|
42 | - * |
|
43 | - * @var array |
|
44 | - */ |
|
45 | - private $sequence = array(); |
|
46 | - |
|
47 | - /** |
|
48 | - * Конструктор |
|
49 | - * |
|
50 | - * @param \AnalyzerText\Text $iterator Текст |
|
51 | - */ |
|
52 | - public function __construct(Text $iterator) |
|
53 | - { |
|
54 | - parent::__construct($iterator); |
|
55 | - $this->repackWordList(); |
|
56 | - } |
|
57 | - |
|
58 | - /** |
|
59 | - * Проверяет, является ли текущее слово допустимым |
|
60 | - * |
|
61 | - * @return bool |
|
62 | - */ |
|
63 | - public function accept() |
|
64 | - { |
|
65 | - $word = $this->current(); |
|
66 | - |
|
67 | - return $this->isSequence($word) || $this->isSimple($word) || $this->isComposite($word); |
|
68 | - } |
|
69 | - |
|
70 | - /** |
|
71 | - * Это последовательность. |
|
72 | - * |
|
73 | - * @param \AnalyzerText\Text\Word $word Слово |
|
74 | - * |
|
75 | - * @return bool |
|
76 | - */ |
|
77 | - public function isSequence(Word $word) |
|
78 | - { |
|
79 | - $plain = $word->getPlain(); |
|
80 | - foreach ($this->sequence as $sequence) { |
|
81 | - if ($sequence[0] == $plain) { |
|
82 | - for ($i = 1; $i < count($sequence); ++$i) { |
|
83 | - if (!($word = $this->getNextWord($i)) || $word->getPlain() != $sequence[$i]) { |
|
84 | - return false; |
|
85 | - } |
|
86 | - } |
|
87 | - // удаляем слова из последовательности |
|
88 | - $key = $this->getText()->key(); |
|
89 | - for ($i = 1; $i < count($sequence); ++$i) { |
|
90 | - $this->getText()->seek($key + $i); |
|
91 | - $this->getText()->remove(); |
|
92 | - } |
|
93 | - $this->getText()->seek($key); |
|
94 | - |
|
95 | - return true; |
|
96 | - } |
|
97 | - } |
|
98 | - |
|
99 | - return false; |
|
100 | - } |
|
101 | - |
|
102 | - /** |
|
103 | - * Это простое слово. |
|
104 | - * |
|
105 | - * @param \AnalyzerText\Text\Word $word Слово |
|
106 | - * |
|
107 | - * @return bool |
|
108 | - */ |
|
109 | - public function isSimple(Word $word) |
|
110 | - { |
|
111 | - return in_array($word->getPlain(), $this->simple); |
|
112 | - } |
|
113 | - |
|
114 | - /** |
|
115 | - * Это составное слово. |
|
116 | - * |
|
117 | - * @param \AnalyzerText\Text\Word $word Слово |
|
118 | - * |
|
119 | - * @return bool |
|
120 | - */ |
|
121 | - public function isComposite(Word $word) |
|
122 | - { |
|
123 | - foreach ($this->composite as $reg) { |
|
124 | - if (preg_match($reg, $word->getWord())) { |
|
125 | - return true; |
|
126 | - } |
|
127 | - } |
|
128 | - |
|
129 | - return false; |
|
130 | - } |
|
131 | - |
|
132 | - /** |
|
133 | - * Возвращает список слов. |
|
134 | - * |
|
135 | - * Возвращает список слов которые необходимо удалить или оставить |
|
136 | - * Если слово составное и пишестся через тире, но одна из частей может менятся например: |
|
137 | - * <code> |
|
138 | - * подай-ка, налей-ка, молоко-то сбежало, наценка-с |
|
139 | - * </code> |
|
140 | - * то нужно писать шаблон вида: |
|
141 | - * <code> |
|
142 | - * [ '*-ка', '*-то', '*-с' ] |
|
143 | - * </code> |
|
144 | - * Для удаления последовательности слов ячейка слова должна представляться в виде набора слов разделенных пробелом |
|
145 | - * <code> |
|
146 | - * [ 'вовсе не', 'несмотря на то что' ] |
|
147 | - * </code> |
|
148 | - * Так же есть возможность указывать регулярные выражения для отлавливания сложных конструкций |
|
149 | - * <code> |
|
150 | - * // ААааа Аааа-а-а |
|
151 | - * [ '/^а+(\-а+)*$/ui' ] |
|
152 | - * </code> |
|
153 | - * В регулярное выражение передается оригинальное слово, а не урощенная форма |
|
154 | - * |
|
155 | - * @return array |
|
156 | - */ |
|
157 | - abstract public function getWords(); |
|
158 | - |
|
159 | - /** |
|
160 | - * Разбор набора шаблонов слов и составление условий поиска соответствий. |
|
161 | - */ |
|
162 | - private function repackWordList() |
|
163 | - { |
|
164 | - $words = $this->getWords(); |
|
165 | - // разбор на категории |
|
166 | - foreach ($words as $word) { |
|
167 | - if ($word[0] == '/') { // регулярное выражение |
|
168 | - $this->composite[] = $word; |
|
169 | - } elseif (strpos($word, ' ') !== false) { // последовательность |
|
170 | - $this->sequence[] = explode(' ', $word); |
|
171 | - } elseif (strpos($word, '*') !== false) { // псевдо регулярка |
|
172 | - // из записи *-то делаем регулярное выражение вида: /^.+?\-то$/ui |
|
173 | - $this->composite[] = '/^'.str_replace('\*', '.+?', preg_quote($word, '/')).'$/ui'; |
|
174 | - } else { // простое слово |
|
175 | - $this->simple[] = $word; |
|
176 | - } |
|
177 | - } |
|
178 | - } |
|
23 | + /** |
|
24 | + * Простые слова. |
|
25 | + * |
|
26 | + * @var array |
|
27 | + */ |
|
28 | + private $simple = array(); |
|
29 | + |
|
30 | + /** |
|
31 | + * Составные слова. |
|
32 | + * |
|
33 | + * Составные слова о части которого нам известно. |
|
34 | + * Например слово пишется через тирэ |
|
35 | + * |
|
36 | + * @var array |
|
37 | + */ |
|
38 | + private $composite = array(); |
|
39 | + |
|
40 | + /** |
|
41 | + * Последовательности из набора слов. |
|
42 | + * |
|
43 | + * @var array |
|
44 | + */ |
|
45 | + private $sequence = array(); |
|
46 | + |
|
47 | + /** |
|
48 | + * Конструктор |
|
49 | + * |
|
50 | + * @param \AnalyzerText\Text $iterator Текст |
|
51 | + */ |
|
52 | + public function __construct(Text $iterator) |
|
53 | + { |
|
54 | + parent::__construct($iterator); |
|
55 | + $this->repackWordList(); |
|
56 | + } |
|
57 | + |
|
58 | + /** |
|
59 | + * Проверяет, является ли текущее слово допустимым |
|
60 | + * |
|
61 | + * @return bool |
|
62 | + */ |
|
63 | + public function accept() |
|
64 | + { |
|
65 | + $word = $this->current(); |
|
66 | + |
|
67 | + return $this->isSequence($word) || $this->isSimple($word) || $this->isComposite($word); |
|
68 | + } |
|
69 | + |
|
70 | + /** |
|
71 | + * Это последовательность. |
|
72 | + * |
|
73 | + * @param \AnalyzerText\Text\Word $word Слово |
|
74 | + * |
|
75 | + * @return bool |
|
76 | + */ |
|
77 | + public function isSequence(Word $word) |
|
78 | + { |
|
79 | + $plain = $word->getPlain(); |
|
80 | + foreach ($this->sequence as $sequence) { |
|
81 | + if ($sequence[0] == $plain) { |
|
82 | + for ($i = 1; $i < count($sequence); ++$i) { |
|
83 | + if (!($word = $this->getNextWord($i)) || $word->getPlain() != $sequence[$i]) { |
|
84 | + return false; |
|
85 | + } |
|
86 | + } |
|
87 | + // удаляем слова из последовательности |
|
88 | + $key = $this->getText()->key(); |
|
89 | + for ($i = 1; $i < count($sequence); ++$i) { |
|
90 | + $this->getText()->seek($key + $i); |
|
91 | + $this->getText()->remove(); |
|
92 | + } |
|
93 | + $this->getText()->seek($key); |
|
94 | + |
|
95 | + return true; |
|
96 | + } |
|
97 | + } |
|
98 | + |
|
99 | + return false; |
|
100 | + } |
|
101 | + |
|
102 | + /** |
|
103 | + * Это простое слово. |
|
104 | + * |
|
105 | + * @param \AnalyzerText\Text\Word $word Слово |
|
106 | + * |
|
107 | + * @return bool |
|
108 | + */ |
|
109 | + public function isSimple(Word $word) |
|
110 | + { |
|
111 | + return in_array($word->getPlain(), $this->simple); |
|
112 | + } |
|
113 | + |
|
114 | + /** |
|
115 | + * Это составное слово. |
|
116 | + * |
|
117 | + * @param \AnalyzerText\Text\Word $word Слово |
|
118 | + * |
|
119 | + * @return bool |
|
120 | + */ |
|
121 | + public function isComposite(Word $word) |
|
122 | + { |
|
123 | + foreach ($this->composite as $reg) { |
|
124 | + if (preg_match($reg, $word->getWord())) { |
|
125 | + return true; |
|
126 | + } |
|
127 | + } |
|
128 | + |
|
129 | + return false; |
|
130 | + } |
|
131 | + |
|
132 | + /** |
|
133 | + * Возвращает список слов. |
|
134 | + * |
|
135 | + * Возвращает список слов которые необходимо удалить или оставить |
|
136 | + * Если слово составное и пишестся через тире, но одна из частей может менятся например: |
|
137 | + * <code> |
|
138 | + * подай-ка, налей-ка, молоко-то сбежало, наценка-с |
|
139 | + * </code> |
|
140 | + * то нужно писать шаблон вида: |
|
141 | + * <code> |
|
142 | + * [ '*-ка', '*-то', '*-с' ] |
|
143 | + * </code> |
|
144 | + * Для удаления последовательности слов ячейка слова должна представляться в виде набора слов разделенных пробелом |
|
145 | + * <code> |
|
146 | + * [ 'вовсе не', 'несмотря на то что' ] |
|
147 | + * </code> |
|
148 | + * Так же есть возможность указывать регулярные выражения для отлавливания сложных конструкций |
|
149 | + * <code> |
|
150 | + * // ААааа Аааа-а-а |
|
151 | + * [ '/^а+(\-а+)*$/ui' ] |
|
152 | + * </code> |
|
153 | + * В регулярное выражение передается оригинальное слово, а не урощенная форма |
|
154 | + * |
|
155 | + * @return array |
|
156 | + */ |
|
157 | + abstract public function getWords(); |
|
158 | + |
|
159 | + /** |
|
160 | + * Разбор набора шаблонов слов и составление условий поиска соответствий. |
|
161 | + */ |
|
162 | + private function repackWordList() |
|
163 | + { |
|
164 | + $words = $this->getWords(); |
|
165 | + // разбор на категории |
|
166 | + foreach ($words as $word) { |
|
167 | + if ($word[0] == '/') { // регулярное выражение |
|
168 | + $this->composite[] = $word; |
|
169 | + } elseif (strpos($word, ' ') !== false) { // последовательность |
|
170 | + $this->sequence[] = explode(' ', $word); |
|
171 | + } elseif (strpos($word, '*') !== false) { // псевдо регулярка |
|
172 | + // из записи *-то делаем регулярное выражение вида: /^.+?\-то$/ui |
|
173 | + $this->composite[] = '/^'.str_replace('\*', '.+?', preg_quote($word, '/')).'$/ui'; |
|
174 | + } else { // простое слово |
|
175 | + $this->simple[] = $word; |
|
176 | + } |
|
177 | + } |
|
178 | + } |
|
179 | 179 | } |
@@ -87,7 +87,7 @@ |
||
87 | 87 | // удаляем слова из последовательности |
88 | 88 | $key = $this->getText()->key(); |
89 | 89 | for ($i = 1; $i < count($sequence); ++$i) { |
90 | - $this->getText()->seek($key + $i); |
|
90 | + $this->getText()->seek($key+$i); |
|
91 | 91 | $this->getText()->remove(); |
92 | 92 | } |
93 | 93 | $this->getText()->seek($key); |
@@ -18,77 +18,77 @@ |
||
18 | 18 | */ |
19 | 19 | class Text extends \ArrayIterator |
20 | 20 | { |
21 | - /** |
|
22 | - * Спиок всех слов в тексте в простой форме. |
|
23 | - * |
|
24 | - * @var array |
|
25 | - */ |
|
26 | - protected $plains = array(); |
|
21 | + /** |
|
22 | + * Спиок всех слов в тексте в простой форме. |
|
23 | + * |
|
24 | + * @var array |
|
25 | + */ |
|
26 | + protected $plains = array(); |
|
27 | 27 | |
28 | - /** |
|
29 | - * Конструктор |
|
30 | - * |
|
31 | - * @param string $text Текст |
|
32 | - */ |
|
33 | - public function __construct($text) |
|
34 | - { |
|
35 | - $words = array(); |
|
36 | - // слово не может начинаться с тире и не может содержать только его |
|
37 | - if (preg_match_all('/[[:alnum:]]+(?:[-\'][[:alnum:]]+)*/u', trim(strip_tags($text)), $match)) { |
|
38 | - $words = $match[0]; |
|
39 | - // получение списка слов в нижнем регистре |
|
40 | - $this->plains = explode(' ', mb_strtolower(implode(' ', $words), 'utf8')); |
|
41 | - } |
|
42 | - parent::__construct($words); |
|
43 | - } |
|
28 | + /** |
|
29 | + * Конструктор |
|
30 | + * |
|
31 | + * @param string $text Текст |
|
32 | + */ |
|
33 | + public function __construct($text) |
|
34 | + { |
|
35 | + $words = array(); |
|
36 | + // слово не может начинаться с тире и не может содержать только его |
|
37 | + if (preg_match_all('/[[:alnum:]]+(?:[-\'][[:alnum:]]+)*/u', trim(strip_tags($text)), $match)) { |
|
38 | + $words = $match[0]; |
|
39 | + // получение списка слов в нижнем регистре |
|
40 | + $this->plains = explode(' ', mb_strtolower(implode(' ', $words), 'utf8')); |
|
41 | + } |
|
42 | + parent::__construct($words); |
|
43 | + } |
|
44 | 44 | |
45 | - /** |
|
46 | - * Возвращает список слов. |
|
47 | - * |
|
48 | - * @return array |
|
49 | - */ |
|
50 | - public function getWords() |
|
51 | - { |
|
52 | - return $this->getArrayCopy(); |
|
53 | - } |
|
45 | + /** |
|
46 | + * Возвращает список слов. |
|
47 | + * |
|
48 | + * @return array |
|
49 | + */ |
|
50 | + public function getWords() |
|
51 | + { |
|
52 | + return $this->getArrayCopy(); |
|
53 | + } |
|
54 | 54 | |
55 | - /** |
|
56 | - * Возвращает текущий элемент |
|
57 | - * |
|
58 | - * @return \AnalyzerText\Text\Word |
|
59 | - */ |
|
60 | - public function current() |
|
61 | - { |
|
62 | - return new Word(parent::current(), $this->plains[$this->key()]); |
|
63 | - } |
|
55 | + /** |
|
56 | + * Возвращает текущий элемент |
|
57 | + * |
|
58 | + * @return \AnalyzerText\Text\Word |
|
59 | + */ |
|
60 | + public function current() |
|
61 | + { |
|
62 | + return new Word(parent::current(), $this->plains[$this->key()]); |
|
63 | + } |
|
64 | 64 | |
65 | - /** |
|
66 | - * Удаляет слово из текста. |
|
67 | - */ |
|
68 | - public function remove() |
|
69 | - { |
|
70 | - $this->offsetUnset($this->key()); |
|
71 | - unset($this->plains[$this->key()]); |
|
72 | - } |
|
65 | + /** |
|
66 | + * Удаляет слово из текста. |
|
67 | + */ |
|
68 | + public function remove() |
|
69 | + { |
|
70 | + $this->offsetUnset($this->key()); |
|
71 | + unset($this->plains[$this->key()]); |
|
72 | + } |
|
73 | 73 | |
74 | - /** |
|
75 | - * Заменяет слово в тексте. |
|
76 | - * |
|
77 | - * @param \AnalyzerText\Text\Word $word Слово |
|
78 | - */ |
|
79 | - public function replace(Word $word) |
|
80 | - { |
|
81 | - $this->offsetSet($this->key(), $word->getWord()); |
|
82 | - $this->plains[$this->key()] = $word->getPlain(); |
|
83 | - } |
|
74 | + /** |
|
75 | + * Заменяет слово в тексте. |
|
76 | + * |
|
77 | + * @param \AnalyzerText\Text\Word $word Слово |
|
78 | + */ |
|
79 | + public function replace(Word $word) |
|
80 | + { |
|
81 | + $this->offsetSet($this->key(), $word->getWord()); |
|
82 | + $this->plains[$this->key()] = $word->getPlain(); |
|
83 | + } |
|
84 | 84 | |
85 | - /** |
|
86 | - * Возвращает текст |
|
87 | - * |
|
88 | - * @return string |
|
89 | - */ |
|
90 | - public function __toString() |
|
91 | - { |
|
92 | - return implode(' ', $this->getWords()); |
|
93 | - } |
|
85 | + /** |
|
86 | + * Возвращает текст |
|
87 | + * |
|
88 | + * @return string |
|
89 | + */ |
|
90 | + public function __toString() |
|
91 | + { |
|
92 | + return implode(' ', $this->getWords()); |
|
93 | + } |
|
94 | 94 | } |
@@ -14,59 +14,59 @@ |
||
14 | 14 | */ |
15 | 15 | class Word |
16 | 16 | { |
17 | - /** |
|
18 | - * Слово в тексте. |
|
19 | - * |
|
20 | - * @var string |
|
21 | - */ |
|
22 | - protected $word = ''; |
|
17 | + /** |
|
18 | + * Слово в тексте. |
|
19 | + * |
|
20 | + * @var string |
|
21 | + */ |
|
22 | + protected $word = ''; |
|
23 | 23 | |
24 | - /** |
|
25 | - * Простая форма слова в тексте. |
|
26 | - * |
|
27 | - * @var string |
|
28 | - */ |
|
29 | - protected $plain = ''; |
|
24 | + /** |
|
25 | + * Простая форма слова в тексте. |
|
26 | + * |
|
27 | + * @var string |
|
28 | + */ |
|
29 | + protected $plain = ''; |
|
30 | 30 | |
31 | - /** |
|
32 | - * Конструктор |
|
33 | - * |
|
34 | - * @param string $word Слово в тексте |
|
35 | - * @param string $lower_case Простая форма слова в тексте |
|
36 | - */ |
|
37 | - public function __construct($word, $plain) |
|
38 | - { |
|
39 | - $this->word = $word; |
|
40 | - $this->plain = $plain; |
|
41 | - } |
|
31 | + /** |
|
32 | + * Конструктор |
|
33 | + * |
|
34 | + * @param string $word Слово в тексте |
|
35 | + * @param string $lower_case Простая форма слова в тексте |
|
36 | + */ |
|
37 | + public function __construct($word, $plain) |
|
38 | + { |
|
39 | + $this->word = $word; |
|
40 | + $this->plain = $plain; |
|
41 | + } |
|
42 | 42 | |
43 | - /** |
|
44 | - * Возвращает слово из текста. |
|
45 | - * |
|
46 | - * @return string |
|
47 | - */ |
|
48 | - public function getWord() |
|
49 | - { |
|
50 | - return $this->word; |
|
51 | - } |
|
43 | + /** |
|
44 | + * Возвращает слово из текста. |
|
45 | + * |
|
46 | + * @return string |
|
47 | + */ |
|
48 | + public function getWord() |
|
49 | + { |
|
50 | + return $this->word; |
|
51 | + } |
|
52 | 52 | |
53 | - /** |
|
54 | - * Возвращает простую форму слова из текста. |
|
55 | - * |
|
56 | - * @return string |
|
57 | - */ |
|
58 | - public function getPlain() |
|
59 | - { |
|
60 | - return $this->plain; |
|
61 | - } |
|
53 | + /** |
|
54 | + * Возвращает простую форму слова из текста. |
|
55 | + * |
|
56 | + * @return string |
|
57 | + */ |
|
58 | + public function getPlain() |
|
59 | + { |
|
60 | + return $this->plain; |
|
61 | + } |
|
62 | 62 | |
63 | - /** |
|
64 | - * Возвращает слово. |
|
65 | - * |
|
66 | - * @return string |
|
67 | - */ |
|
68 | - public function __toString() |
|
69 | - { |
|
70 | - return $this->getWord(); |
|
71 | - } |
|
63 | + /** |
|
64 | + * Возвращает слово. |
|
65 | + * |
|
66 | + * @return string |
|
67 | + */ |
|
68 | + public function __toString() |
|
69 | + { |
|
70 | + return $this->getWord(); |
|
71 | + } |
|
72 | 72 | } |