@@ -18,40 +18,40 @@ |
||
18 | 18 | */ |
19 | 19 | class Pronoun extends WordList { |
20 | 20 | |
21 | - /** |
|
22 | - * Возвращает список слов |
|
23 | - * |
|
24 | - * @return array |
|
25 | - */ |
|
26 | - public function getWords() { |
|
27 | - return array( |
|
28 | - // русские местоимения |
|
29 | - 'я', 'меня', 'мне', 'мной', 'мною', 'обо мне', 'мы', 'нас', 'нам', 'нами', 'о нас', 'ты', 'тебя', 'тебе', 'тобой', 'тобою', 'вы', 'вас', |
|
30 | - 'вам', 'вами', 'он', 'его', 'него', 'ему', 'нему', 'им', 'ним', 'нём', 'о нём', 'нем', 'она', 'её', 'ее', 'неё', 'нее', 'ей', 'ней', 'ею', |
|
31 | - 'нею', 'оно', 'они', 'их', 'них', 'ими', 'ними', 'о них', 'себя', 'себе', 'собой', 'собою', 'мой', 'моего', 'моему', 'моё', 'мое', 'моём', |
|
32 | - 'о моём', 'моем', 'моя', 'моей', 'мою', 'мои', 'моих', 'моим', 'моими', 'наш', 'нашего', 'нашим', 'нашем', 'наша', 'нашей', 'нашу', 'наше', |
|
33 | - 'о нашем', 'наши', 'наших', 'нашими', 'твой', 'твоего', 'твоему', 'твоим', 'твоём', 'о твоём', 'твоем', 'твоя', 'твоей', 'твою', 'твое', |
|
34 | - 'ваш', 'вашего', 'вашему', 'вашим', 'вашем', 'о вашем', 'ваша', 'вашей', 'вашу', 'ваше', 'свой', 'своих', 'своим', 'своими', 'своя', 'своей', |
|
35 | - 'свою', 'своё', 'свое', 'своего', 'своему', 'своём', 'о своём', 'своем', 'свои', 'о своих', 'кто', 'что', 'каков', 'чей', 'который', 'какой', |
|
36 | - 'какое', 'какая', 'какие', 'какого', 'каких', 'какому', 'каким', 'какую', 'какою', 'какими', 'каком', 'сколько', 'столько', 'этот', 'тот', |
|
37 | - 'такой', 'таков', 'такова', 'сей', 'весь', 'всякий', 'сам', 'самый', 'каждый', 'любой', 'другой', 'иной', 'никто', 'ничто', 'некого', |
|
38 | - 'нечего', 'нисколько', 'никакой', 'ничей', 'некто', 'нечто', 'некий', 'некоторый', 'несколько', 'это', 'эта', 'эти', 'этого', 'этой', 'этих', |
|
39 | - 'этому', 'этим', 'эту', 'этою', 'этими', 'этом', 'сие', 'сия', 'сии', 'сего', 'сих', 'сему', 'сим', 'сию', 'сею', 'сиею', 'сими', 'сём', 'то', |
|
40 | - 'та', 'те', 'того', 'той', 'тех', 'тому', 'тем', 'ту', 'тою', 'теми', 'данный', 'данное', 'данная', 'данного', 'данной', 'данному', 'данную', |
|
41 | - 'данною', 'данном', 'всё', 'вся', 'все', 'всего', 'всей', 'всех', 'всему', 'всем', 'всю', 'всею', 'всеми', 'всём', 'вот', 'кому', 'этакий', |
|
42 | - 'этакое', 'этакая', 'этакие', 'этакого', 'этакой', 'этаких', 'этакому', 'этаким', 'этакую', 'этакою', 'этакими', 'этаком', 'другие', |
|
43 | - 'какой-то', 'оба', 'тот или другой', 'и тот и другой', 'мало', 'немногие', 'себя,', 'сама', 'ёё', 'само,', 'немного', 'много', 'многие', |
|
44 | - 'ни тот', 'ни другой', 'нет', 'ни один', 'друг друга', 'некоторые', 'тот же самый', 'сами', 'что бы ни', |
|
45 | - 'какой бы ни', 'кто бы ни', 'которого', 'которому', 'ваши', |
|
46 | - 'кое-*', '*-то', '*-либо', '*-нибудь', |
|
47 | - '/^том$/u', // местоимение, а не имя Том |
|
21 | + /** |
|
22 | + * Возвращает список слов |
|
23 | + * |
|
24 | + * @return array |
|
25 | + */ |
|
26 | + public function getWords() { |
|
27 | + return array( |
|
28 | + // русские местоимения |
|
29 | + 'я', 'меня', 'мне', 'мной', 'мною', 'обо мне', 'мы', 'нас', 'нам', 'нами', 'о нас', 'ты', 'тебя', 'тебе', 'тобой', 'тобою', 'вы', 'вас', |
|
30 | + 'вам', 'вами', 'он', 'его', 'него', 'ему', 'нему', 'им', 'ним', 'нём', 'о нём', 'нем', 'она', 'её', 'ее', 'неё', 'нее', 'ей', 'ней', 'ею', |
|
31 | + 'нею', 'оно', 'они', 'их', 'них', 'ими', 'ними', 'о них', 'себя', 'себе', 'собой', 'собою', 'мой', 'моего', 'моему', 'моё', 'мое', 'моём', |
|
32 | + 'о моём', 'моем', 'моя', 'моей', 'мою', 'мои', 'моих', 'моим', 'моими', 'наш', 'нашего', 'нашим', 'нашем', 'наша', 'нашей', 'нашу', 'наше', |
|
33 | + 'о нашем', 'наши', 'наших', 'нашими', 'твой', 'твоего', 'твоему', 'твоим', 'твоём', 'о твоём', 'твоем', 'твоя', 'твоей', 'твою', 'твое', |
|
34 | + 'ваш', 'вашего', 'вашему', 'вашим', 'вашем', 'о вашем', 'ваша', 'вашей', 'вашу', 'ваше', 'свой', 'своих', 'своим', 'своими', 'своя', 'своей', |
|
35 | + 'свою', 'своё', 'свое', 'своего', 'своему', 'своём', 'о своём', 'своем', 'свои', 'о своих', 'кто', 'что', 'каков', 'чей', 'который', 'какой', |
|
36 | + 'какое', 'какая', 'какие', 'какого', 'каких', 'какому', 'каким', 'какую', 'какою', 'какими', 'каком', 'сколько', 'столько', 'этот', 'тот', |
|
37 | + 'такой', 'таков', 'такова', 'сей', 'весь', 'всякий', 'сам', 'самый', 'каждый', 'любой', 'другой', 'иной', 'никто', 'ничто', 'некого', |
|
38 | + 'нечего', 'нисколько', 'никакой', 'ничей', 'некто', 'нечто', 'некий', 'некоторый', 'несколько', 'это', 'эта', 'эти', 'этого', 'этой', 'этих', |
|
39 | + 'этому', 'этим', 'эту', 'этою', 'этими', 'этом', 'сие', 'сия', 'сии', 'сего', 'сих', 'сему', 'сим', 'сию', 'сею', 'сиею', 'сими', 'сём', 'то', |
|
40 | + 'та', 'те', 'того', 'той', 'тех', 'тому', 'тем', 'ту', 'тою', 'теми', 'данный', 'данное', 'данная', 'данного', 'данной', 'данному', 'данную', |
|
41 | + 'данною', 'данном', 'всё', 'вся', 'все', 'всего', 'всей', 'всех', 'всему', 'всем', 'всю', 'всею', 'всеми', 'всём', 'вот', 'кому', 'этакий', |
|
42 | + 'этакое', 'этакая', 'этакие', 'этакого', 'этакой', 'этаких', 'этакому', 'этаким', 'этакую', 'этакою', 'этакими', 'этаком', 'другие', |
|
43 | + 'какой-то', 'оба', 'тот или другой', 'и тот и другой', 'мало', 'немногие', 'себя,', 'сама', 'ёё', 'само,', 'немного', 'много', 'многие', |
|
44 | + 'ни тот', 'ни другой', 'нет', 'ни один', 'друг друга', 'некоторые', 'тот же самый', 'сами', 'что бы ни', |
|
45 | + 'какой бы ни', 'кто бы ни', 'которого', 'которому', 'ваши', |
|
46 | + 'кое-*', '*-то', '*-либо', '*-нибудь', |
|
47 | + '/^том$/u', // местоимение, а не имя Том |
|
48 | 48 | |
49 | - // английские местоимения |
|
50 | - 'all', 'another', 'any', 'both', 'each', 'either', 'every', 'herself', 'himself', 'he', 'she', 'it', 'him', 'her', 'we', 'you', 'they', |
|
51 | - 'us', 'them', 'this', 'thet', 'these', 'thos', 'his', 'its', 'hers', 'our', 'your', 'their', 'ours', 'yours', 'theis', 'much', 'many', |
|
52 | - 'little', 'few', 'lot', 'i', 'itself', 'me', 'mine', 'my', 'myself', 'neither', 'none', 'one another', 'oneself', 'some', 'such', |
|
53 | - 'that', 'the same', 'themselves', 'those', 'what', 'whatever', 'which', 'whichever', 'who', 'whoever', 'whom', 'whose', 'yourself', |
|
54 | - ); |
|
55 | - } |
|
49 | + // английские местоимения |
|
50 | + 'all', 'another', 'any', 'both', 'each', 'either', 'every', 'herself', 'himself', 'he', 'she', 'it', 'him', 'her', 'we', 'you', 'they', |
|
51 | + 'us', 'them', 'this', 'thet', 'these', 'thos', 'his', 'its', 'hers', 'our', 'your', 'their', 'ours', 'yours', 'theis', 'much', 'many', |
|
52 | + 'little', 'few', 'lot', 'i', 'itself', 'me', 'mine', 'my', 'myself', 'neither', 'none', 'one another', 'oneself', 'some', 'such', |
|
53 | + 'that', 'the same', 'themselves', 'those', 'what', 'whatever', 'which', 'whichever', 'who', 'whoever', 'whom', 'whose', 'yourself', |
|
54 | + ); |
|
55 | + } |
|
56 | 56 | |
57 | 57 | } |
58 | 58 | \ No newline at end of file |
@@ -18,20 +18,20 @@ |
||
18 | 18 | */ |
19 | 19 | class Union extends WordList { |
20 | 20 | |
21 | - /** |
|
22 | - * Возвращает список слов |
|
23 | - * |
|
24 | - * @return array |
|
25 | - */ |
|
26 | - public function getWords() { |
|
27 | - return array( |
|
28 | - 'как', 'словно', 'так', 'для', 'того', 'чтобы', 'тоже', 'зато', 'потому', |
|
29 | - 'что', 'и', 'а', 'или', 'но', 'однако', 'ни', 'если', 'то', 'да', 'не', |
|
30 | - 'только', 'или', 'либо', 'ли', 'же', 'все', 'столько', 'также', 'притом', |
|
31 | - 'причём', 'причем', 'есть', 'именно', 'когда', 'лишь', 'едва', 'будто', |
|
32 | - 'точно', 'бы', 'коли', 'ежели', 'несмотря', 'на', 'хотя', 'хоть', 'пускай', |
|
33 | - 'дабы', 'c', 'тем', 'ведь', 'чем', 'в то же время' |
|
34 | - ); |
|
35 | - } |
|
21 | + /** |
|
22 | + * Возвращает список слов |
|
23 | + * |
|
24 | + * @return array |
|
25 | + */ |
|
26 | + public function getWords() { |
|
27 | + return array( |
|
28 | + 'как', 'словно', 'так', 'для', 'того', 'чтобы', 'тоже', 'зато', 'потому', |
|
29 | + 'что', 'и', 'а', 'или', 'но', 'однако', 'ни', 'если', 'то', 'да', 'не', |
|
30 | + 'только', 'или', 'либо', 'ли', 'же', 'все', 'столько', 'также', 'притом', |
|
31 | + 'причём', 'причем', 'есть', 'именно', 'когда', 'лишь', 'едва', 'будто', |
|
32 | + 'точно', 'бы', 'коли', 'ежели', 'несмотря', 'на', 'хотя', 'хоть', 'пускай', |
|
33 | + 'дабы', 'c', 'тем', 'ведь', 'чем', 'в то же время' |
|
34 | + ); |
|
35 | + } |
|
36 | 36 | |
37 | 37 | } |
38 | 38 | \ No newline at end of file |
@@ -18,29 +18,29 @@ |
||
18 | 18 | */ |
19 | 19 | class Particle extends WordList { |
20 | 20 | |
21 | - /** |
|
22 | - * Возвращает список слов |
|
23 | - * |
|
24 | - * @return array |
|
25 | - */ |
|
26 | - public function getWords() { |
|
27 | - return array( |
|
28 | - // русские междометья |
|
29 | - 'пусть', 'пускай', 'давайте', 'да', 'давай', 'бы,', 'б', 'бывало', 'не', 'ни', 'ли', 'неужели', 'разве', 'вот', 'вон', |
|
30 | - 'именно', 'только', 'лишь', 'исключительно', 'единственно', 'как', 'даже', 'же', 'ведь', 'уж', 'все-таки', |
|
31 | - 'пусть', 'бишь', 'вишь', 'де', 'дескать', 'ин', |
|
32 | - 'ишь', 'мол', 'небось', 'нет', 'неужели', 'нехай', 'ну-с', 'сём', 'сем', 'таки', 'те', 'уж', |
|
33 | - 'а', 'благо', 'более', 'больше', 'буквально', 'бывает', 'бывало', 'было', 'будто', 'ведь', 'во', 'вовсе', 'вон', 'вот', 'вроде', |
|
34 | - 'всё', 'все', 'всего', 'где', 'гляди', 'да', 'давай', 'давайте', 'даже', 'дай', 'дайте', 'действительно', 'единственно', 'если', |
|
35 | - 'ещё', 'знай', 'и', 'или', 'менно', 'как', 'какое', 'куда', 'ладно', 'ли', 'лучше', 'никак', 'ничего', 'нечего', 'однако', |
|
36 | - 'окончательно', 'оно', 'поди', 'положительно', 'просто', 'прямо', 'пусть', 'пускай', 'разве', 'решительно', 'ровно', 'самое', |
|
37 | - 'себе', 'скорее', 'словно', 'совершенно', 'спасибо', 'так', 'там', 'тебе', 'тоже', 'только', 'точно', 'хоть', 'чего', 'чисто', |
|
38 | - 'что', 'чтоб', 'чтобы', 'эк', 'это', |
|
39 | - '*-ка', '*-то', '*-с', |
|
40 | - 'вовсе не', 'далеко не', 'отнюдь не', 'почти что', 'как раз', 'что за', 'вряд ли', 'едва ли', |
|
21 | + /** |
|
22 | + * Возвращает список слов |
|
23 | + * |
|
24 | + * @return array |
|
25 | + */ |
|
26 | + public function getWords() { |
|
27 | + return array( |
|
28 | + // русские междометья |
|
29 | + 'пусть', 'пускай', 'давайте', 'да', 'давай', 'бы,', 'б', 'бывало', 'не', 'ни', 'ли', 'неужели', 'разве', 'вот', 'вон', |
|
30 | + 'именно', 'только', 'лишь', 'исключительно', 'единственно', 'как', 'даже', 'же', 'ведь', 'уж', 'все-таки', |
|
31 | + 'пусть', 'бишь', 'вишь', 'де', 'дескать', 'ин', |
|
32 | + 'ишь', 'мол', 'небось', 'нет', 'неужели', 'нехай', 'ну-с', 'сём', 'сем', 'таки', 'те', 'уж', |
|
33 | + 'а', 'благо', 'более', 'больше', 'буквально', 'бывает', 'бывало', 'было', 'будто', 'ведь', 'во', 'вовсе', 'вон', 'вот', 'вроде', |
|
34 | + 'всё', 'все', 'всего', 'где', 'гляди', 'да', 'давай', 'давайте', 'даже', 'дай', 'дайте', 'действительно', 'единственно', 'если', |
|
35 | + 'ещё', 'знай', 'и', 'или', 'менно', 'как', 'какое', 'куда', 'ладно', 'ли', 'лучше', 'никак', 'ничего', 'нечего', 'однако', |
|
36 | + 'окончательно', 'оно', 'поди', 'положительно', 'просто', 'прямо', 'пусть', 'пускай', 'разве', 'решительно', 'ровно', 'самое', |
|
37 | + 'себе', 'скорее', 'словно', 'совершенно', 'спасибо', 'так', 'там', 'тебе', 'тоже', 'только', 'точно', 'хоть', 'чего', 'чисто', |
|
38 | + 'что', 'чтоб', 'чтобы', 'эк', 'это', |
|
39 | + '*-ка', '*-то', '*-с', |
|
40 | + 'вовсе не', 'далеко не', 'отнюдь не', 'почти что', 'как раз', 'что за', 'вряд ли', 'едва ли', |
|
41 | 41 | |
42 | - // английские междометья |
|
43 | - ); |
|
44 | - } |
|
42 | + // английские междометья |
|
43 | + ); |
|
44 | + } |
|
45 | 45 | |
46 | 46 | } |
47 | 47 | \ No newline at end of file |
@@ -19,53 +19,53 @@ |
||
19 | 19 | */ |
20 | 20 | abstract class Analyzer { |
21 | 21 | |
22 | - /** |
|
23 | - * Текст |
|
24 | - * |
|
25 | - * @var \AnalyzerText\Text |
|
26 | - */ |
|
27 | - protected $text; |
|
22 | + /** |
|
23 | + * Текст |
|
24 | + * |
|
25 | + * @var \AnalyzerText\Text |
|
26 | + */ |
|
27 | + protected $text; |
|
28 | 28 | |
29 | 29 | |
30 | - /** |
|
31 | - * Устанавливает аналезируемый текст |
|
32 | - * |
|
33 | - * @param \AnalyzerText\Text $text Текст |
|
34 | - * |
|
35 | - * @return \AnalyzerText\Analyzer\Analyze |
|
36 | - */ |
|
37 | - public function setText(Text $text) { |
|
38 | - $this->clear(); |
|
39 | - $this->text = $text; |
|
40 | - return $this; |
|
41 | - } |
|
30 | + /** |
|
31 | + * Устанавливает аналезируемый текст |
|
32 | + * |
|
33 | + * @param \AnalyzerText\Text $text Текст |
|
34 | + * |
|
35 | + * @return \AnalyzerText\Analyzer\Analyze |
|
36 | + */ |
|
37 | + public function setText(Text $text) { |
|
38 | + $this->clear(); |
|
39 | + $this->text = $text; |
|
40 | + return $this; |
|
41 | + } |
|
42 | 42 | |
43 | - /** |
|
44 | - * Возвращает список слов |
|
45 | - * |
|
46 | - * @return \AnalyzerText\Text |
|
47 | - */ |
|
48 | - public function getText() { |
|
49 | - return $this->text; |
|
50 | - } |
|
43 | + /** |
|
44 | + * Возвращает список слов |
|
45 | + * |
|
46 | + * @return \AnalyzerText\Text |
|
47 | + */ |
|
48 | + public function getText() { |
|
49 | + return $this->text; |
|
50 | + } |
|
51 | 51 | |
52 | - /** |
|
53 | - * Очищает анализатор |
|
54 | - * |
|
55 | - * @return \AnalyzerText\Analyzer\Analyze |
|
56 | - */ |
|
57 | - public function clear() { |
|
58 | - $this->text = null; |
|
59 | - return $this; |
|
60 | - } |
|
52 | + /** |
|
53 | + * Очищает анализатор |
|
54 | + * |
|
55 | + * @return \AnalyzerText\Analyzer\Analyze |
|
56 | + */ |
|
57 | + public function clear() { |
|
58 | + $this->text = null; |
|
59 | + return $this; |
|
60 | + } |
|
61 | 61 | |
62 | - /** |
|
63 | - * Возвращает фабрику фильтров для применения их |
|
64 | - * |
|
65 | - * @return AnalyzerText\Filter\Factory |
|
66 | - */ |
|
67 | - public function applyFilters() { |
|
68 | - return new Factory($this); |
|
69 | - } |
|
62 | + /** |
|
63 | + * Возвращает фабрику фильтров для применения их |
|
64 | + * |
|
65 | + * @return AnalyzerText\Filter\Factory |
|
66 | + */ |
|
67 | + public function applyFilters() { |
|
68 | + return new Factory($this); |
|
69 | + } |
|
70 | 70 | |
71 | 71 | } |
72 | 72 | \ No newline at end of file |
@@ -18,63 +18,63 @@ |
||
18 | 18 | */ |
19 | 19 | class Frequency extends Analyzer { |
20 | 20 | |
21 | - /** |
|
22 | - * Список слов с частотой их появления |
|
23 | - * |
|
24 | - * @var array |
|
25 | - */ |
|
26 | - protected $frequencies = array(); |
|
21 | + /** |
|
22 | + * Список слов с частотой их появления |
|
23 | + * |
|
24 | + * @var array |
|
25 | + */ |
|
26 | + protected $frequencies = array(); |
|
27 | 27 | |
28 | - /** |
|
29 | - * Список слов с частотой их появления в процентах |
|
30 | - * |
|
31 | - * @var array |
|
32 | - */ |
|
33 | - protected $percent = array(); |
|
28 | + /** |
|
29 | + * Список слов с частотой их появления в процентах |
|
30 | + * |
|
31 | + * @var array |
|
32 | + */ |
|
33 | + protected $percent = array(); |
|
34 | 34 | |
35 | 35 | |
36 | - /** |
|
37 | - * Очищает анализатор |
|
38 | - * |
|
39 | - * @return \AnalyzerText\Analyzer\Frequency |
|
40 | - */ |
|
41 | - public function clear() { |
|
42 | - $this->frequencies = array(); |
|
43 | - $this->percent = array(); |
|
44 | - return parent::clear(); |
|
45 | - } |
|
36 | + /** |
|
37 | + * Очищает анализатор |
|
38 | + * |
|
39 | + * @return \AnalyzerText\Analyzer\Frequency |
|
40 | + */ |
|
41 | + public function clear() { |
|
42 | + $this->frequencies = array(); |
|
43 | + $this->percent = array(); |
|
44 | + return parent::clear(); |
|
45 | + } |
|
46 | 46 | |
47 | - /** |
|
48 | - * Определяет частоту появления слов |
|
49 | - * |
|
50 | - * @return array |
|
51 | - */ |
|
52 | - public function getFrequency() { |
|
53 | - if (!$this->frequencies && $this->getText()->count()) { |
|
54 | - foreach ($this->getText() as $word) { |
|
55 | - if (!isset($this->frequencies[$word->getPlain()])) { |
|
56 | - $this->frequencies[$word->getPlain()] = 0; |
|
57 | - } |
|
58 | - $this->frequencies[$word->getPlain()]++; |
|
59 | - } |
|
60 | - arsort($this->frequencies); |
|
61 | - } |
|
62 | - return $this->frequencies; |
|
63 | - } |
|
47 | + /** |
|
48 | + * Определяет частоту появления слов |
|
49 | + * |
|
50 | + * @return array |
|
51 | + */ |
|
52 | + public function getFrequency() { |
|
53 | + if (!$this->frequencies && $this->getText()->count()) { |
|
54 | + foreach ($this->getText() as $word) { |
|
55 | + if (!isset($this->frequencies[$word->getPlain()])) { |
|
56 | + $this->frequencies[$word->getPlain()] = 0; |
|
57 | + } |
|
58 | + $this->frequencies[$word->getPlain()]++; |
|
59 | + } |
|
60 | + arsort($this->frequencies); |
|
61 | + } |
|
62 | + return $this->frequencies; |
|
63 | + } |
|
64 | 64 | |
65 | - /** |
|
66 | - * Получение проуентное отнашение частоты слов из списка частот слов |
|
67 | - * |
|
68 | - * @return array |
|
69 | - */ |
|
70 | - public function getPercent() { |
|
71 | - if (!$this->percent && ($frequencies = $this->getFrequency())) { |
|
72 | - $ratio = max($frequencies)/100; |
|
73 | - foreach ($frequencies as $word => $frequency) { |
|
74 | - $this->percent[$word] = $frequency/$ratio; |
|
75 | - } |
|
76 | - } |
|
77 | - return $this->percent; |
|
78 | - } |
|
65 | + /** |
|
66 | + * Получение проуентное отнашение частоты слов из списка частот слов |
|
67 | + * |
|
68 | + * @return array |
|
69 | + */ |
|
70 | + public function getPercent() { |
|
71 | + if (!$this->percent && ($frequencies = $this->getFrequency())) { |
|
72 | + $ratio = max($frequencies)/100; |
|
73 | + foreach ($frequencies as $word => $frequency) { |
|
74 | + $this->percent[$word] = $frequency/$ratio; |
|
75 | + } |
|
76 | + } |
|
77 | + return $this->percent; |
|
78 | + } |
|
79 | 79 | |
80 | 80 | } |