@@ -18,20 +18,20 @@ |
||
| 18 | 18 | */ |
| 19 | 19 | class Union extends WordList { |
| 20 | 20 | |
| 21 | - /** |
|
| 22 | - * Возвращает список слов |
|
| 23 | - * |
|
| 24 | - * @return array |
|
| 25 | - */ |
|
| 26 | - public function getWords() { |
|
| 27 | - return array( |
|
| 28 | - 'как', 'словно', 'так', 'для', 'того', 'чтобы', 'тоже', 'зато', 'потому', |
|
| 29 | - 'что', 'и', 'а', 'или', 'но', 'однако', 'ни', 'если', 'то', 'да', 'не', |
|
| 30 | - 'только', 'или', 'либо', 'ли', 'же', 'все', 'столько', 'также', 'притом', |
|
| 31 | - 'причём', 'причем', 'есть', 'именно', 'когда', 'лишь', 'едва', 'будто', |
|
| 32 | - 'точно', 'бы', 'коли', 'ежели', 'несмотря', 'на', 'хотя', 'хоть', 'пускай', |
|
| 33 | - 'дабы', 'c', 'тем', 'ведь', 'чем', 'в то же время' |
|
| 34 | - ); |
|
| 35 | - } |
|
| 21 | + /** |
|
| 22 | + * Возвращает список слов |
|
| 23 | + * |
|
| 24 | + * @return array |
|
| 25 | + */ |
|
| 26 | + public function getWords() { |
|
| 27 | + return array( |
|
| 28 | + 'как', 'словно', 'так', 'для', 'того', 'чтобы', 'тоже', 'зато', 'потому', |
|
| 29 | + 'что', 'и', 'а', 'или', 'но', 'однако', 'ни', 'если', 'то', 'да', 'не', |
|
| 30 | + 'только', 'или', 'либо', 'ли', 'же', 'все', 'столько', 'также', 'притом', |
|
| 31 | + 'причём', 'причем', 'есть', 'именно', 'когда', 'лишь', 'едва', 'будто', |
|
| 32 | + 'точно', 'бы', 'коли', 'ежели', 'несмотря', 'на', 'хотя', 'хоть', 'пускай', |
|
| 33 | + 'дабы', 'c', 'тем', 'ведь', 'чем', 'в то же время' |
|
| 34 | + ); |
|
| 35 | + } |
|
| 36 | 36 | |
| 37 | 37 | } |
| 38 | 38 | \ No newline at end of file |
@@ -18,29 +18,29 @@ |
||
| 18 | 18 | */ |
| 19 | 19 | class Particle extends WordList { |
| 20 | 20 | |
| 21 | - /** |
|
| 22 | - * Возвращает список слов |
|
| 23 | - * |
|
| 24 | - * @return array |
|
| 25 | - */ |
|
| 26 | - public function getWords() { |
|
| 27 | - return array( |
|
| 28 | - // русские междометья |
|
| 29 | - 'пусть', 'пускай', 'давайте', 'да', 'давай', 'бы,', 'б', 'бывало', 'не', 'ни', 'ли', 'неужели', 'разве', 'вот', 'вон', |
|
| 30 | - 'именно', 'только', 'лишь', 'исключительно', 'единственно', 'как', 'даже', 'же', 'ведь', 'уж', 'все-таки', |
|
| 31 | - 'пусть', 'бишь', 'вишь', 'де', 'дескать', 'ин', |
|
| 32 | - 'ишь', 'мол', 'небось', 'нет', 'неужели', 'нехай', 'ну-с', 'сём', 'сем', 'таки', 'те', 'уж', |
|
| 33 | - 'а', 'благо', 'более', 'больше', 'буквально', 'бывает', 'бывало', 'было', 'будто', 'ведь', 'во', 'вовсе', 'вон', 'вот', 'вроде', |
|
| 34 | - 'всё', 'все', 'всего', 'где', 'гляди', 'да', 'давай', 'давайте', 'даже', 'дай', 'дайте', 'действительно', 'единственно', 'если', |
|
| 35 | - 'ещё', 'знай', 'и', 'или', 'менно', 'как', 'какое', 'куда', 'ладно', 'ли', 'лучше', 'никак', 'ничего', 'нечего', 'однако', |
|
| 36 | - 'окончательно', 'оно', 'поди', 'положительно', 'просто', 'прямо', 'пусть', 'пускай', 'разве', 'решительно', 'ровно', 'самое', |
|
| 37 | - 'себе', 'скорее', 'словно', 'совершенно', 'спасибо', 'так', 'там', 'тебе', 'тоже', 'только', 'точно', 'хоть', 'чего', 'чисто', |
|
| 38 | - 'что', 'чтоб', 'чтобы', 'эк', 'это', |
|
| 39 | - '*-ка', '*-то', '*-с', |
|
| 40 | - 'вовсе не', 'далеко не', 'отнюдь не', 'почти что', 'как раз', 'что за', 'вряд ли', 'едва ли', |
|
| 21 | + /** |
|
| 22 | + * Возвращает список слов |
|
| 23 | + * |
|
| 24 | + * @return array |
|
| 25 | + */ |
|
| 26 | + public function getWords() { |
|
| 27 | + return array( |
|
| 28 | + // русские междометья |
|
| 29 | + 'пусть', 'пускай', 'давайте', 'да', 'давай', 'бы,', 'б', 'бывало', 'не', 'ни', 'ли', 'неужели', 'разве', 'вот', 'вон', |
|
| 30 | + 'именно', 'только', 'лишь', 'исключительно', 'единственно', 'как', 'даже', 'же', 'ведь', 'уж', 'все-таки', |
|
| 31 | + 'пусть', 'бишь', 'вишь', 'де', 'дескать', 'ин', |
|
| 32 | + 'ишь', 'мол', 'небось', 'нет', 'неужели', 'нехай', 'ну-с', 'сём', 'сем', 'таки', 'те', 'уж', |
|
| 33 | + 'а', 'благо', 'более', 'больше', 'буквально', 'бывает', 'бывало', 'было', 'будто', 'ведь', 'во', 'вовсе', 'вон', 'вот', 'вроде', |
|
| 34 | + 'всё', 'все', 'всего', 'где', 'гляди', 'да', 'давай', 'давайте', 'даже', 'дай', 'дайте', 'действительно', 'единственно', 'если', |
|
| 35 | + 'ещё', 'знай', 'и', 'или', 'менно', 'как', 'какое', 'куда', 'ладно', 'ли', 'лучше', 'никак', 'ничего', 'нечего', 'однако', |
|
| 36 | + 'окончательно', 'оно', 'поди', 'положительно', 'просто', 'прямо', 'пусть', 'пускай', 'разве', 'решительно', 'ровно', 'самое', |
|
| 37 | + 'себе', 'скорее', 'словно', 'совершенно', 'спасибо', 'так', 'там', 'тебе', 'тоже', 'только', 'точно', 'хоть', 'чего', 'чисто', |
|
| 38 | + 'что', 'чтоб', 'чтобы', 'эк', 'это', |
|
| 39 | + '*-ка', '*-то', '*-с', |
|
| 40 | + 'вовсе не', 'далеко не', 'отнюдь не', 'почти что', 'как раз', 'что за', 'вряд ли', 'едва ли', |
|
| 41 | 41 | |
| 42 | - // английские междометья |
|
| 43 | - ); |
|
| 44 | - } |
|
| 42 | + // английские междометья |
|
| 43 | + ); |
|
| 44 | + } |
|
| 45 | 45 | |
| 46 | 46 | } |
| 47 | 47 | \ No newline at end of file |
@@ -19,53 +19,53 @@ |
||
| 19 | 19 | */ |
| 20 | 20 | abstract class Analyzer { |
| 21 | 21 | |
| 22 | - /** |
|
| 23 | - * Текст |
|
| 24 | - * |
|
| 25 | - * @var \AnalyzerText\Text |
|
| 26 | - */ |
|
| 27 | - protected $text; |
|
| 22 | + /** |
|
| 23 | + * Текст |
|
| 24 | + * |
|
| 25 | + * @var \AnalyzerText\Text |
|
| 26 | + */ |
|
| 27 | + protected $text; |
|
| 28 | 28 | |
| 29 | 29 | |
| 30 | - /** |
|
| 31 | - * Устанавливает аналезируемый текст |
|
| 32 | - * |
|
| 33 | - * @param \AnalyzerText\Text $text Текст |
|
| 34 | - * |
|
| 35 | - * @return \AnalyzerText\Analyzer\Analyze |
|
| 36 | - */ |
|
| 37 | - public function setText(Text $text) { |
|
| 38 | - $this->clear(); |
|
| 39 | - $this->text = $text; |
|
| 40 | - return $this; |
|
| 41 | - } |
|
| 30 | + /** |
|
| 31 | + * Устанавливает аналезируемый текст |
|
| 32 | + * |
|
| 33 | + * @param \AnalyzerText\Text $text Текст |
|
| 34 | + * |
|
| 35 | + * @return \AnalyzerText\Analyzer\Analyze |
|
| 36 | + */ |
|
| 37 | + public function setText(Text $text) { |
|
| 38 | + $this->clear(); |
|
| 39 | + $this->text = $text; |
|
| 40 | + return $this; |
|
| 41 | + } |
|
| 42 | 42 | |
| 43 | - /** |
|
| 44 | - * Возвращает список слов |
|
| 45 | - * |
|
| 46 | - * @return \AnalyzerText\Text |
|
| 47 | - */ |
|
| 48 | - public function getText() { |
|
| 49 | - return $this->text; |
|
| 50 | - } |
|
| 43 | + /** |
|
| 44 | + * Возвращает список слов |
|
| 45 | + * |
|
| 46 | + * @return \AnalyzerText\Text |
|
| 47 | + */ |
|
| 48 | + public function getText() { |
|
| 49 | + return $this->text; |
|
| 50 | + } |
|
| 51 | 51 | |
| 52 | - /** |
|
| 53 | - * Очищает анализатор |
|
| 54 | - * |
|
| 55 | - * @return \AnalyzerText\Analyzer\Analyze |
|
| 56 | - */ |
|
| 57 | - public function clear() { |
|
| 58 | - $this->text = null; |
|
| 59 | - return $this; |
|
| 60 | - } |
|
| 52 | + /** |
|
| 53 | + * Очищает анализатор |
|
| 54 | + * |
|
| 55 | + * @return \AnalyzerText\Analyzer\Analyze |
|
| 56 | + */ |
|
| 57 | + public function clear() { |
|
| 58 | + $this->text = null; |
|
| 59 | + return $this; |
|
| 60 | + } |
|
| 61 | 61 | |
| 62 | - /** |
|
| 63 | - * Возвращает фабрику фильтров для применения их |
|
| 64 | - * |
|
| 65 | - * @return AnalyzerText\Filter\Factory |
|
| 66 | - */ |
|
| 67 | - public function applyFilters() { |
|
| 68 | - return new Factory($this); |
|
| 69 | - } |
|
| 62 | + /** |
|
| 63 | + * Возвращает фабрику фильтров для применения их |
|
| 64 | + * |
|
| 65 | + * @return AnalyzerText\Filter\Factory |
|
| 66 | + */ |
|
| 67 | + public function applyFilters() { |
|
| 68 | + return new Factory($this); |
|
| 69 | + } |
|
| 70 | 70 | |
| 71 | 71 | } |
| 72 | 72 | \ No newline at end of file |
@@ -18,63 +18,63 @@ |
||
| 18 | 18 | */ |
| 19 | 19 | class Frequency extends Analyzer { |
| 20 | 20 | |
| 21 | - /** |
|
| 22 | - * Список слов с частотой их появления |
|
| 23 | - * |
|
| 24 | - * @var array |
|
| 25 | - */ |
|
| 26 | - protected $frequencies = array(); |
|
| 21 | + /** |
|
| 22 | + * Список слов с частотой их появления |
|
| 23 | + * |
|
| 24 | + * @var array |
|
| 25 | + */ |
|
| 26 | + protected $frequencies = array(); |
|
| 27 | 27 | |
| 28 | - /** |
|
| 29 | - * Список слов с частотой их появления в процентах |
|
| 30 | - * |
|
| 31 | - * @var array |
|
| 32 | - */ |
|
| 33 | - protected $percent = array(); |
|
| 28 | + /** |
|
| 29 | + * Список слов с частотой их появления в процентах |
|
| 30 | + * |
|
| 31 | + * @var array |
|
| 32 | + */ |
|
| 33 | + protected $percent = array(); |
|
| 34 | 34 | |
| 35 | 35 | |
| 36 | - /** |
|
| 37 | - * Очищает анализатор |
|
| 38 | - * |
|
| 39 | - * @return \AnalyzerText\Analyzer\Frequency |
|
| 40 | - */ |
|
| 41 | - public function clear() { |
|
| 42 | - $this->frequencies = array(); |
|
| 43 | - $this->percent = array(); |
|
| 44 | - return parent::clear(); |
|
| 45 | - } |
|
| 36 | + /** |
|
| 37 | + * Очищает анализатор |
|
| 38 | + * |
|
| 39 | + * @return \AnalyzerText\Analyzer\Frequency |
|
| 40 | + */ |
|
| 41 | + public function clear() { |
|
| 42 | + $this->frequencies = array(); |
|
| 43 | + $this->percent = array(); |
|
| 44 | + return parent::clear(); |
|
| 45 | + } |
|
| 46 | 46 | |
| 47 | - /** |
|
| 48 | - * Определяет частоту появления слов |
|
| 49 | - * |
|
| 50 | - * @return array |
|
| 51 | - */ |
|
| 52 | - public function getFrequency() { |
|
| 53 | - if (!$this->frequencies && $this->getText()->count()) { |
|
| 54 | - foreach ($this->getText() as $word) { |
|
| 55 | - if (!isset($this->frequencies[$word->getPlain()])) { |
|
| 56 | - $this->frequencies[$word->getPlain()] = 0; |
|
| 57 | - } |
|
| 58 | - $this->frequencies[$word->getPlain()]++; |
|
| 59 | - } |
|
| 60 | - arsort($this->frequencies); |
|
| 61 | - } |
|
| 62 | - return $this->frequencies; |
|
| 63 | - } |
|
| 47 | + /** |
|
| 48 | + * Определяет частоту появления слов |
|
| 49 | + * |
|
| 50 | + * @return array |
|
| 51 | + */ |
|
| 52 | + public function getFrequency() { |
|
| 53 | + if (!$this->frequencies && $this->getText()->count()) { |
|
| 54 | + foreach ($this->getText() as $word) { |
|
| 55 | + if (!isset($this->frequencies[$word->getPlain()])) { |
|
| 56 | + $this->frequencies[$word->getPlain()] = 0; |
|
| 57 | + } |
|
| 58 | + $this->frequencies[$word->getPlain()]++; |
|
| 59 | + } |
|
| 60 | + arsort($this->frequencies); |
|
| 61 | + } |
|
| 62 | + return $this->frequencies; |
|
| 63 | + } |
|
| 64 | 64 | |
| 65 | - /** |
|
| 66 | - * Получение проуентное отнашение частоты слов из списка частот слов |
|
| 67 | - * |
|
| 68 | - * @return array |
|
| 69 | - */ |
|
| 70 | - public function getPercent() { |
|
| 71 | - if (!$this->percent && ($frequencies = $this->getFrequency())) { |
|
| 72 | - $ratio = max($frequencies)/100; |
|
| 73 | - foreach ($frequencies as $word => $frequency) { |
|
| 74 | - $this->percent[$word] = $frequency/$ratio; |
|
| 75 | - } |
|
| 76 | - } |
|
| 77 | - return $this->percent; |
|
| 78 | - } |
|
| 65 | + /** |
|
| 66 | + * Получение проуентное отнашение частоты слов из списка частот слов |
|
| 67 | + * |
|
| 68 | + * @return array |
|
| 69 | + */ |
|
| 70 | + public function getPercent() { |
|
| 71 | + if (!$this->percent && ($frequencies = $this->getFrequency())) { |
|
| 72 | + $ratio = max($frequencies)/100; |
|
| 73 | + foreach ($frequencies as $word => $frequency) { |
|
| 74 | + $this->percent[$word] = $frequency/$ratio; |
|
| 75 | + } |
|
| 76 | + } |
|
| 77 | + return $this->percent; |
|
| 78 | + } |
|
| 79 | 79 | |
| 80 | 80 | } |