Duplicate code is one of the most pungent code smells. A rule that is often used is to re-structure code once it is duplicated in three or more places.
Common duplication problems, and corresponding solutions are:
Complex classes like FirstNamesInflection often do a lot of different things. To break such a class down, we need to identify a cohesive component within that class. A common approach to find such a component is to look for fields/methods that share the same prefixes, or suffixes. You can also have a look at the cohesion graph to spot any un-connected, or weakly-connected components.
Once you have determined the fields that belong together, you can apply the Extract Class refactoring. If the component makes sense as a sub-class, Extract Subclass is also a candidate, and is often faster.
While breaking up the class, it is a good idea to analyze how other classes use FirstNamesInflection, and based on these observations, apply Extract Interface, too.
| 1 | <?php |
||
| 10 | class FirstNamesInflection extends \morphos\NamesInflection implements Cases |
||
| 11 | { |
||
| 12 | use RussianLanguage, CasesHelper; |
||
| 13 | |||
| 14 | protected static $exceptions = [ |
||
| 15 | 'лев' => [ |
||
| 16 | self::IMENIT => 'Лев', |
||
| 17 | self::RODIT => 'Льва', |
||
| 18 | self::DAT => 'Льву', |
||
| 19 | self::VINIT => 'Льва', |
||
| 20 | self::TVORIT => 'Львом', |
||
| 21 | self::PREDLOJ => 'Льве', |
||
| 22 | ], |
||
| 23 | 'павел' => [ |
||
| 24 | self::IMENIT => 'Павел', |
||
| 25 | self::RODIT => 'Павла', |
||
| 26 | self::DAT => 'Павлу', |
||
| 27 | self::VINIT => 'Павла', |
||
| 28 | self::TVORIT => 'Павлом', |
||
| 29 | self::PREDLOJ => 'Павле', |
||
| 30 | ] |
||
| 31 | ]; |
||
| 32 | |||
| 33 | protected static $menNames = [ |
||
| 34 | 'абрам', 'аверьян', 'авраам', 'агафон', 'адам', 'азар', 'акакий', 'аким', 'аксён', 'александр', 'алексей', |
||
| 35 | 'альберт', 'анатолий', 'андрей', 'андрон', 'антип', 'антон', 'аполлон', 'аристарх', 'аркадий', 'арнольд', |
||
| 36 | 'арсений', 'арсентий', 'артем', 'артём', 'артемий', 'артур', 'аскольд', 'афанасий', 'богдан', 'борис', |
||
| 37 | 'борислав', 'бронислав', 'вадим', 'валентин', 'валерий', 'варлам', 'василий', 'венедикт', 'вениамин', |
||
| 38 | 'веньямин', 'венцеслав', 'виктор', 'виген', 'вилен', 'виталий', 'владилен', 'владимир', 'владислав', 'владлен', |
||
| 39 | 'вова', 'всеволод', 'всеслав', 'вячеслав', 'гавриил', 'геннадий', 'георгий', 'герман', 'глеб', 'григорий', |
||
| 40 | 'давид', 'даниил', 'данил', 'данила', 'демьян', 'денис', 'димитрий', 'дмитрий', 'добрыня', 'евгений', 'евдоким', |
||
| 41 | 'евсей', 'егор', 'емельян', 'еремей', 'ермолай', 'ерофей', 'ефим', 'захар', 'иван', 'игнат', 'игорь', |
||
| 42 | 'илларион', 'иларион', 'илья', 'иосиф', 'казимир', 'касьян', 'кирилл', 'кондрат', 'константин', 'кузьма', |
||
| 43 | 'лавр', 'лаврентий', 'лазарь', 'ларион', 'лев', 'леонард', 'леонид', 'лука', 'максим', 'марат', 'мартын', |
||
| 44 | 'матвей', 'мефодий', 'мирон', 'михаил', 'моисей', 'назар', 'никита', 'николай', 'олег', 'осип', 'остап', |
||
| 45 | 'павел', 'панкрат', 'пантелей', 'парамон', 'пётр', 'петр', 'платон', 'потап', 'прохор', 'роберт', 'ростислав', |
||
| 46 | 'савва', 'савелий', 'семён', 'семен', 'сергей', 'сидор', 'спартак', 'тарас', 'терентий', 'тимофей', 'тимур', |
||
| 47 | 'тихон', 'ульян', 'фёдор', 'федор', 'федот', 'феликс', 'фирс', 'фома', 'харитон', 'харлам', 'эдуард', |
||
| 48 | 'эммануил', 'эраст', 'юлиан', 'юлий', 'юрий', 'яков', 'ян', 'ярослав', |
||
| 49 | ]; |
||
| 50 | |||
| 51 | protected static $womenNames = [ |
||
| 52 | 'авдотья', 'аврора', 'агата', 'агния', 'агриппина', 'ада', 'аксинья', 'алевтина', 'александра', 'алёна', |
||
| 53 | 'алена', 'алина', 'алиса', 'алла', 'альбина', 'амалия', 'анастасия', 'ангелина', 'анжела', 'анжелика', 'анна', |
||
| 54 | 'антонина', 'анфиса', 'арина', 'белла', 'божена', 'валентина', 'валерия', 'ванда', 'варвара', 'василина', |
||
| 55 | 'василиса', 'вера', 'вероника', 'виктория', 'виола', 'виолетта', 'вита', 'виталия', 'владислава', 'власта', |
||
| 56 | 'галина', 'глафира', 'дарья', 'диана', 'дина', 'ева', 'евгения', 'евдокия', 'евлампия', 'екатерина', 'елена', |
||
| 57 | 'елизавета', 'ефросиния', 'ефросинья', 'жанна', 'зиновия', 'злата', 'зоя', 'ивонна', 'изольда', 'илона', 'инга', |
||
| 58 | 'инесса', 'инна', 'ирина', 'ия', 'капитолина', 'карина', 'каролина', 'кира', 'клавдия', 'клара', 'клеопатра', |
||
| 59 | 'кристина', 'ксения', 'лада', 'лариса', 'лиана', 'лидия', 'лилия', 'лина', 'лия', 'лора', 'любава', 'любовь', |
||
| 60 | 'людмила', 'майя', 'маргарита', 'марианна', 'мариетта', 'марина', 'мария', 'марья', 'марта', 'марфа', 'марьяна', |
||
| 61 | 'матрёна', 'матрена', 'матрона', 'милена', 'милослава', 'мирослава', 'муза', 'надежда', 'настасия', 'настасья', |
||
| 62 | 'наталия', 'наталья', 'нелли', 'ника', 'нина', 'нинель', 'нонна', 'оксана', 'олимпиада', 'ольга', 'пелагея', |
||
| 63 | 'полина', 'прасковья', 'раиса', 'рената', 'римма', 'роза', 'роксана', 'руфь', 'сарра', 'светлана', 'серафима', |
||
| 64 | 'снежана', 'софья', 'софия', 'стелла', 'степанида', 'стефания', 'таисия', 'таисья', 'тамара', 'татьяна', |
||
| 65 | 'ульяна', 'устиния', 'устинья', 'фаина', 'фёкла', 'фекла', 'феодора', 'хаврония', 'христина', 'эвелина', |
||
| 66 | 'эдита', 'элеонора', 'элла', 'эльвира', 'эмилия', 'эмма', 'юдифь', 'юлиана', 'юлия', 'ядвига', 'яна', |
||
| 67 | 'ярослава', |
||
| 68 | ]; |
||
| 69 | |||
| 70 | protected static $immutableNames = [ |
||
| 71 | 'николя', |
||
| 72 | ]; |
||
| 73 | |||
| 74 | /** |
||
| 75 | * Checks if name is mutable |
||
| 76 | * @param string $name |
||
| 77 | * @param null|string $gender |
||
| 78 | * @return bool |
||
| 79 | */ |
||
| 80 | 716 | public static function isMutable($name, $gender = null) |
|
| 120 | |||
| 121 | /** |
||
| 122 | * @param $name |
||
| 123 | * @return string |
||
| 124 | */ |
||
| 125 | 510 | public static function detectGender($name) |
|
| 126 | { |
||
| 127 | 510 | $name = S::lower($name); |
|
| 128 | 510 | if (in_array($name, self::$menNames, true)) { |
|
| 129 | 121 | return self::MALE; |
|
| 130 | 390 | } elseif (in_array($name, self::$womenNames, true)) { |
|
| 131 | 111 | return self::FEMALE; |
|
| 132 | } |
||
| 133 | |||
| 134 | 279 | $man = $woman = 0; |
|
| 135 | 279 | $last1 = S::slice($name, -1); |
|
| 136 | 279 | $last2 = S::slice($name, -2); |
|
| 137 | 279 | $last3 = S::slice($name, -3); |
|
| 138 | |||
| 139 | // try to detect gender by some statistical rules |
||
| 140 | // |
||
| 141 | 279 | if ($last1 == 'й') { |
|
| 142 | 48 | $man += 0.9; |
|
| 143 | } |
||
| 144 | 279 | if ($last1 == 'ь') { |
|
| 145 | $man += 0.02; |
||
| 146 | } |
||
| 147 | 279 | if (in_array($last1, self::$consonants, true)) { |
|
| 148 | 199 | $man += 0.01; |
|
| 149 | } |
||
| 150 | 279 | if (in_array($last2, ['он', 'ов', 'ав', 'ам', 'ол', 'ан', 'рд', 'мп'], true)) { |
|
| 151 | 47 | $man += 0.3; |
|
| 152 | } |
||
| 153 | 279 | if (in_array($last2, ['вь', 'фь', 'ль'], true)) { |
|
| 154 | $woman += 0.1; |
||
| 155 | } |
||
| 156 | 279 | if (in_array($last2, ['ла'], true)) { |
|
| 157 | 4 | $woman += 0.04; |
|
| 158 | } |
||
| 159 | 279 | if (in_array($last2, ['то', 'ма'], true)) { |
|
| 160 | $man += 0.01; |
||
| 161 | } |
||
| 162 | 279 | View Code Duplication | if (in_array($last3, ['лья', 'вва', 'ока', 'ука', 'ита'], true)) { |
| 163 | 2 | $man += 0.2; |
|
| 164 | } |
||
| 165 | 279 | if (in_array($last3, ['има'], true)) { |
|
| 166 | $woman += 0.15; |
||
| 167 | } |
||
| 168 | 279 | View Code Duplication | if (in_array($last3, ['лия', 'ния', 'сия', 'дра', 'лла', 'кла', 'опа'], true)) { |
| 169 | 3 | $woman += 0.5; |
|
| 170 | } |
||
| 171 | 279 | if (in_array(S::slice($name, -4), ['льда', 'фира', 'нина', 'лита', 'алья'], true)) { |
|
| 172 | $woman += 0.5; |
||
| 173 | } |
||
| 174 | |||
| 175 | 279 | return $man === $woman ? null |
|
| 176 | 279 | : ($man > $woman ? self::MALE : self::FEMALE); |
|
| 177 | } |
||
| 178 | |||
| 179 | /** |
||
| 180 | * @param string $name |
||
| 181 | * @param null|string $gender |
||
| 182 | * @return array |
||
| 183 | */ |
||
| 184 | 140 | public static function getCases($name, $gender = null) |
|
| 231 | |||
| 232 | /** |
||
| 233 | * @param string $name |
||
| 234 | * @return array|null |
||
| 235 | */ |
||
| 236 | 84 | protected static function getCasesMan($name) |
|
| 309 | |||
| 310 | /** |
||
| 311 | * @param string $name |
||
| 312 | * @return array|null |
||
| 313 | */ |
||
| 314 | 26 | protected static function getCasesWoman($name) |
|
| 315 | { |
||
| 316 | 26 | if (S::slice($name, -1) == 'а' && !self::isVowel($before = (S::slice($name, -2, -1)))) { |
|
| 317 | 17 | $prefix = S::name(S::slice($name, 0, -1)); |
|
| 318 | 17 | if ($before != 'ц') { |
|
| 319 | 14 | $postfix = (RussianLanguage::isHissingConsonant($before) || in_array($before, ['г', 'к', 'х'], true)) ? 'и' : 'ы'; |
|
| 320 | return [ |
||
| 321 | 14 | self::IMENIT => $prefix.'а', |
|
| 322 | 14 | self::RODIT => $prefix.$postfix, |
|
| 323 | 14 | self::DAT => $prefix.'е', |
|
| 324 | 14 | self::VINIT => $prefix.'у', |
|
| 325 | 14 | self::TVORIT => $prefix.'ой', |
|
| 326 | 14 | self::PREDLOJ => $prefix.'е', |
|
| 327 | ]; |
||
| 328 | View Code Duplication | } else { |
|
| 329 | return [ |
||
| 330 | 3 | self::IMENIT => $prefix.'а', |
|
| 331 | 3 | self::RODIT => $prefix.'ы', |
|
| 332 | 3 | self::DAT => $prefix.'е', |
|
| 333 | 3 | self::VINIT => $prefix.'у', |
|
| 334 | 3 | self::TVORIT => $prefix.'ей', |
|
| 335 | 3 | self::PREDLOJ => $prefix.'е', |
|
| 336 | ]; |
||
| 337 | } |
||
| 338 | 9 | View Code Duplication | } elseif (S::slice($name, -1) == 'ь' && self::isConsonant(S::slice($name, -2, -1))) { |
| 339 | 4 | $prefix = S::name(S::slice($name, 0, -1)); |
|
| 340 | return [ |
||
| 341 | 4 | self::IMENIT => $prefix.'ь', |
|
| 342 | 4 | self::RODIT => $prefix.'и', |
|
| 343 | 4 | self::DAT => $prefix.'и', |
|
| 344 | 4 | self::VINIT => $prefix.'ь', |
|
| 345 | 4 | self::TVORIT => $prefix.'ью', |
|
| 346 | 4 | self::PREDLOJ => $prefix.'и', |
|
| 347 | ]; |
||
| 348 | 5 | } elseif (RussianLanguage::isHissingConsonant(S::slice($name, -1))) { |
|
| 349 | 5 | $prefix = S::name($name); |
|
| 350 | return [ |
||
| 351 | 5 | self::IMENIT => $prefix, |
|
| 352 | 5 | self::RODIT => $prefix.'и', |
|
| 353 | 5 | self::DAT => $prefix.'и', |
|
| 354 | 5 | self::VINIT => $prefix, |
|
| 355 | 5 | self::TVORIT => $prefix.'ью', |
|
| 356 | 5 | self::PREDLOJ => $prefix.'и', |
|
| 357 | ]; |
||
| 358 | } |
||
| 359 | return null; |
||
| 360 | } |
||
| 361 | |||
| 362 | /** |
||
| 363 | * @param string $name |
||
| 364 | * @param string $case |
||
| 365 | * @param null|string $gender |
||
| 366 | * @return string |
||
| 367 | * @throws \Exception |
||
| 368 | */ |
||
| 369 | 52 | public static function getCase($name, $case, $gender = null) |
|
| 375 | } |
||
| 376 |
If a method or function can return multiple different values and unless you are sure that you only can receive a single value in this context, we recommend to add an additional type check:
If this a common case that PHP Analyzer should handle natively, please let us know by opening an issue.