Multiprocessing - Code Metrics - Inspection of "Merge branch 'master' into dev" - SimonBlanke/Hyperactive - Measure and Improve Code Quality continuously with Scrutinizer

Passed

Push — master ( ef01f2...fd3757 )

by Simon

created 2019-12-09 16:35 UTC

Multiprocessing A

↳ Parent: Project

Complexity

Total Complexity

Size/Duplication

Total Lines	87
Duplicated Lines	42.53 %

Importance

Changes

Metric	Value
wmc	3
eloc	66
dl	37
loc	87
rs	10
c	0
b	0
f	0

3 Functions

Rating	Name	Duplication	Size	Complexity
A	model1()	12	12	1
A	model0()	12	12	1
A	model2()	13	13	1

How to fix Duplicated Code

import numpy as np
from sklearn.model_selection import cross_val_score
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.ensemble import ExtraTreesClassifier
from sklearn.datasets import load_breast_cancer
from hyperactive import Hyperactive

data = load_breast_cancer()
X, y = data.data, data.target


def model0(para, X, y):

    etc = ExtraTreesClassifier(
        n_estimators=para["n_estimators"],
        criterion=para["criterion"],
        max_features=para["max_features"],
        min_samples_split=para["min_samples_split"],
        min_samples_leaf=para["min_samples_leaf"],
        bootstrap=para["bootstrap"],
    )
    scores = cross_val_score(etc, X, y, cv=3)

    return scores.mean()


def model1(para, X, y):

    rfc = RandomForestClassifier(
        n_estimators=para["n_estimators"],
        criterion=para["criterion"],
        max_features=para["max_features"],
        min_samples_split=para["min_samples_split"],
        min_samples_leaf=para["min_samples_leaf"],
        bootstrap=para["bootstrap"],
    )
    scores = cross_val_score(rfc, X, y, cv=3)

    return scores.mean()


def model2(para, X, y):

    gbc = GradientBoostingClassifier(
        n_estimators=para["n_estimators"],
        learning_rate=para["learning_rate"],
        max_depth=para["max_depth"],
        min_samples_split=para["min_samples_split"],
        min_samples_leaf=para["min_samples_leaf"],
        subsample=para["subsample"],
        max_features=para["max_features"],
    )
    scores = cross_val_score(gbc, X, y, cv=3)

    return scores.mean()


search_config = {
    model0: {
        "n_estimators": range(10, 200, 10),
        "criterion": ["gini", "entropy"],
        "max_features": np.arange(0.05, 1.01, 0.05),
        "min_samples_split": range(2, 21),
        "min_samples_leaf": range(1, 21),
        "bootstrap": [True, False],
    },
    model1: {
        "n_estimators": range(10, 200, 10),
        "criterion": ["gini", "entropy"],
        "max_features": np.arange(0.05, 1.01, 0.05),
        "min_samples_split": range(2, 21),
        "min_samples_leaf": range(1, 21),
        "bootstrap": [True, False],
    },
    model2: {
        "n_estimators": range(10, 200, 10),
        "learning_rate": [1e-3, 1e-2, 1e-1, 0.5, 1.0],
        "max_depth": range(1, 11),
        "min_samples_split": range(2, 21),
        "min_samples_leaf": range(1, 21),
        "subsample": np.arange(0.05, 1.01, 0.05),
        "max_features": np.arange(0.05, 1.01, 0.05),
    },
}


opt = Hyperactive(X, y)
opt.search(search_config, n_iter=30, n_jobs=4)


1		import numpy as np
2		from sklearn.model_selection import cross_val_score
3		from sklearn.ensemble import GradientBoostingClassifier
4		from sklearn.ensemble import RandomForestClassifier
5		from sklearn.ensemble import ExtraTreesClassifier
6		from sklearn.datasets import load_breast_cancer
7		from hyperactive import Hyperactive
8
9		data = load_breast_cancer()
10		X, y = data.data, data.target
11
12
13	View Code Duplication	def model0(para, X, y):
		0 ignored issues – show Duplication introduced 2019-12-09 16:37 UTC by Report Bug Copy Issue Report This code seems to be duplicated in your project. Loading history...
14		etc = ExtraTreesClassifier(
15		n_estimators=para["n_estimators"],
16		criterion=para["criterion"],
17		max_features=para["max_features"],
18		min_samples_split=para["min_samples_split"],
19		min_samples_leaf=para["min_samples_leaf"],
20		bootstrap=para["bootstrap"],
21		)
22		scores = cross_val_score(etc, X, y, cv=3)
23
24		return scores.mean()
25
26
27	View Code Duplication	def model1(para, X, y):
		0 ignored issues – show Duplication introduced 2019-12-09 16:37 UTC by Report Bug Copy Issue Report This code seems to be duplicated in your project. Loading history...
28		rfc = RandomForestClassifier(
29		n_estimators=para["n_estimators"],
30		criterion=para["criterion"],
31		max_features=para["max_features"],
32		min_samples_split=para["min_samples_split"],
33		min_samples_leaf=para["min_samples_leaf"],
34		bootstrap=para["bootstrap"],
35		)
36		scores = cross_val_score(rfc, X, y, cv=3)
37
38		return scores.mean()
39
40
41	View Code Duplication	def model2(para, X, y):
		0 ignored issues – show Duplication introduced 2019-12-09 16:37 UTC by Report Bug Copy Issue Report This code seems to be duplicated in your project. Loading history...
42		gbc = GradientBoostingClassifier(
43		n_estimators=para["n_estimators"],
44		learning_rate=para["learning_rate"],
45		max_depth=para["max_depth"],
46		min_samples_split=para["min_samples_split"],
47		min_samples_leaf=para["min_samples_leaf"],
48		subsample=para["subsample"],
49		max_features=para["max_features"],
50		)
51		scores = cross_val_score(gbc, X, y, cv=3)
52
53		return scores.mean()
54
55
56		search_config = {
57		model0: {
58		"n_estimators": range(10, 200, 10),
59		"criterion": ["gini", "entropy"],
60		"max_features": np.arange(0.05, 1.01, 0.05),
61		"min_samples_split": range(2, 21),
62		"min_samples_leaf": range(1, 21),
63		"bootstrap": [True, False],
64		},
65		model1: {
66		"n_estimators": range(10, 200, 10),
67		"criterion": ["gini", "entropy"],
68		"max_features": np.arange(0.05, 1.01, 0.05),
69		"min_samples_split": range(2, 21),
70		"min_samples_leaf": range(1, 21),
71		"bootstrap": [True, False],
72		},
73		model2: {
74		"n_estimators": range(10, 200, 10),
75		"learning_rate": [1e-3, 1e-2, 1e-1, 0.5, 1.0],
76		"max_depth": range(1, 11),
77		"min_samples_split": range(2, 21),
78		"min_samples_leaf": range(1, 21),
79		"subsample": np.arange(0.05, 1.01, 0.05),
80		"max_features": np.arange(0.05, 1.01, 0.05),
81		},
82		}
83
84
85		opt = Hyperactive(X, y)
86		opt.search(search_config, n_iter=30, n_jobs=4)
87

SimonBlanke / Hyperactive

Push — master ( ef01f2...fd3757 )

Multiprocessing A

Complexity

Size/Duplication

Importance

3 Functions

How to fix Duplicated Code

Duplicated Code

Duplication Side-by-Side

Filter issues like