multiple_different_optimizers - Code Metrics - Inspection of "add example with multiple different optimization a..." - SimonBlanke/Hyperactive - Measure and Improve Code Quality continuously with Scrutinizer

Passed

Push — master ( 9fb2c3...5be519 )

by Simon

created 2024-11-13 16:44 UTC

multiple_different_optimizers A

↳ Parent: Project

Complexity

Total Complexity

Size/Duplication

Total Lines	86
Duplicated Lines	29.07 %

Importance

Changes

Metric	Value
eloc	63
dl	25
loc	86
rs	10
c	0
b	0
f	0
wmc	2

2 Functions

Rating	Name	Duplication	Size	Complexity
A	model_gbc()	13	13	1
A	model_rfc()	12	12	1

How to fix Duplicated Code

import numpy as np

from sklearn.model_selection import cross_val_score
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_breast_cancer

from hyperactive import Hyperactive
from hyperactive.optimizers import (
    HillClimbingOptimizer,
    RandomRestartHillClimbingOptimizer,
)

data = load_breast_cancer()
X, y = data.data, data.target


def model_rfc(opt):

    rfc = RandomForestClassifier(
        n_estimators=opt["n_estimators"],
        criterion=opt["criterion"],
        max_features=opt["max_features"],
        min_samples_split=opt["min_samples_split"],
        min_samples_leaf=opt["min_samples_leaf"],
        bootstrap=opt["bootstrap"],
    )
    scores = cross_val_score(rfc, X, y, cv=3)

    return scores.mean()


def model_gbc(opt):

    gbc = GradientBoostingClassifier(
        n_estimators=opt["n_estimators"],
        learning_rate=opt["learning_rate"],
        max_depth=opt["max_depth"],
        min_samples_split=opt["min_samples_split"],
        min_samples_leaf=opt["min_samples_leaf"],
        subsample=opt["subsample"],
        max_features=opt["max_features"],
    )
    scores = cross_val_score(gbc, X, y, cv=3)

    return scores.mean()


search_space_rfc = {
    "n_estimators": list(range(10, 200, 10)),
    "criterion": ["gini", "entropy"],
    "max_features": list(np.arange(0.05, 1.01, 0.05)),
    "min_samples_split": list(range(2, 21)),
    "min_samples_leaf": list(range(1, 21)),
    "bootstrap": [True, False],
}


search_space_gbc = {
    "n_estimators": list(range(10, 200, 10)),
    "learning_rate": [1e-3, 1e-2, 1e-1, 0.5, 1.0],
    "max_depth": list(range(1, 11)),
    "min_samples_split": list(range(2, 21)),
    "min_samples_leaf": list(range(1, 21)),
    "subsample": list(np.arange(0.05, 1.01, 0.05)),
    "max_features": list(np.arange(0.05, 1.01, 0.05)),
}

optimizer1 = HillClimbingOptimizer()
optimizer2 = RandomRestartHillClimbingOptimizer()


hyper = Hyperactive()
hyper.add_search(
    model_rfc,
    search_space_rfc,
    n_iter=50,
    optimizer=optimizer1,
)
hyper.add_search(
    model_gbc,
    search_space_gbc,
    n_iter=50,
    optimizer=optimizer2,
    n_jobs=2,
)
hyper.run(max_time=5)


1		import numpy as np
2
3		from sklearn.model_selection import cross_val_score
4		from sklearn.ensemble import GradientBoostingClassifier
5		from sklearn.ensemble import RandomForestClassifier
6		from sklearn.datasets import load_breast_cancer
7
8		from hyperactive import Hyperactive
9		from hyperactive.optimizers import (
10		HillClimbingOptimizer,
11		RandomRestartHillClimbingOptimizer,
12		)
13
14		data = load_breast_cancer()
15		X, y = data.data, data.target
16
17
18	View Code Duplication	def model_rfc(opt):
		0 ignored issues – show Duplication introduced 2024-11-13 16:46 UTC by Report Bug Copy Issue Report This code seems to be duplicated in your project. Loading history...
19		rfc = RandomForestClassifier(
20		n_estimators=opt["n_estimators"],
21		criterion=opt["criterion"],
22		max_features=opt["max_features"],
23		min_samples_split=opt["min_samples_split"],
24		min_samples_leaf=opt["min_samples_leaf"],
25		bootstrap=opt["bootstrap"],
26		)
27		scores = cross_val_score(rfc, X, y, cv=3)
28
29		return scores.mean()
30
31
32	View Code Duplication	def model_gbc(opt):
		0 ignored issues – show Duplication introduced 2024-11-13 16:46 UTC by Report Bug Copy Issue Report This code seems to be duplicated in your project. Loading history...
33		gbc = GradientBoostingClassifier(
34		n_estimators=opt["n_estimators"],
35		learning_rate=opt["learning_rate"],
36		max_depth=opt["max_depth"],
37		min_samples_split=opt["min_samples_split"],
38		min_samples_leaf=opt["min_samples_leaf"],
39		subsample=opt["subsample"],
40		max_features=opt["max_features"],
41		)
42		scores = cross_val_score(gbc, X, y, cv=3)
43
44		return scores.mean()
45
46
47		search_space_rfc = {
48		"n_estimators": list(range(10, 200, 10)),
49		"criterion": ["gini", "entropy"],
50		"max_features": list(np.arange(0.05, 1.01, 0.05)),
51		"min_samples_split": list(range(2, 21)),
52		"min_samples_leaf": list(range(1, 21)),
53		"bootstrap": [True, False],
54		}
55
56
57		search_space_gbc = {
58		"n_estimators": list(range(10, 200, 10)),
59		"learning_rate": [1e-3, 1e-2, 1e-1, 0.5, 1.0],
60		"max_depth": list(range(1, 11)),
61		"min_samples_split": list(range(2, 21)),
62		"min_samples_leaf": list(range(1, 21)),
63		"subsample": list(np.arange(0.05, 1.01, 0.05)),
64		"max_features": list(np.arange(0.05, 1.01, 0.05)),
65		}
66
67		optimizer1 = HillClimbingOptimizer()
68		optimizer2 = RandomRestartHillClimbingOptimizer()
69
70
71		hyper = Hyperactive()
72		hyper.add_search(
73		model_rfc,
74		search_space_rfc,
75		n_iter=50,
76		optimizer=optimizer1,
77		)
78		hyper.add_search(
79		model_gbc,
80		search_space_gbc,
81		n_iter=50,
82		optimizer=optimizer2,
83		n_jobs=2,
84		)
85		hyper.run(max_time=5)
86

SimonBlanke / Hyperactive

Push — master ( 9fb2c3...5be519 )

multiple_different_optimizers A

Complexity

Size/Duplication

Importance

2 Functions

How to fix Duplicated Code

Duplicated Code

Duplication Side-by-Side

Filter issues like