NeuralNetwork - Code Metrics - Inspection of "Changed dataset" - zomux/deepy - Measure and Improve Code Quality continuously with Scrutinizer

Completed

Push — master ( f73e69...91b7c0 )

by Raphael

created 2016-05-23 15:37 UTC

NeuralNetwork B

↳ Parent: Project

Complexity

Total Complexity

Size/Duplication

Total Lines	252
Duplicated Lines	0 %

Importance

Changes	3
Bugs	0	Features	0

Metric	Value
dl	0
loc	252
rs	8.3673
c	3
b	0
f	0
wmc	45

22 Methods

Rating	Name	Size	Complexity
A	stack_layer()	17	3
A	stack()	7	2
A	test_cost()	6	1
D	load_params()	32	8
A	test_output()	6	1
A	register()	8	2
A	compute()	6	1
A	cost()	6	1
A	register_layer()	20	2
A	first_layer()	5	2
A	monitor_layer_outputs()	7	2
B	__init__()	27	1
A	_compile()	5	3
A	testing_callback()	6	2
A	report()	8	1
A	training_callback()	6	2
A	save_params()	13	3
A	all_parameters()	10	1
A	epoch_callback()	6	2
A	output()	6	1
A	prepare_training()	5	1
A	setup_variables()	14	3

How to fix Complexity

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import logging as loggers
import gzip
import cPickle as pickle
import os
from threading import Thread

import numpy as np
import theano.tensor as T
import theano

import deepy
from deepy.layers.layer import NeuralLayer
from deepy.layers.block import Block
from deepy.utils import dim_to_var, TrainLogger

logging = loggers.getLogger(__name__)

DEEPY_MESSAGE = "deepy version = %s" % deepy.__version__

def save_network_params(params, path):
    if path.endswith('gz'):
        opener = gzip.open if path.lower().endswith('.gz') else open
        handle = opener(path, 'wb')
        pickle.dump(params, handle)
        handle.close()
    elif path.endswith('uncompressed.npz'):
        np.savez(path, *params)
    elif path.endswith('.npz'):
        np.savez_compressed(path, *params)
    else:
        raise Exception("File format of %s is not supported, use '.gz' or '.npz' or '.uncompressed.gz'" % path)

class NeuralNetwork(object):
    """
    The base class of neural networks.
    """

    def __init__(self, input_dim, input_tensor=None):
        logging.info(DEEPY_MESSAGE)
        self.input_dim = input_dim
        self.input_tensor = input_tensor
        self.parameter_count = 0

        self.parameters = []
        self.free_parameters = []

        self.training_updates = []
        self.updates = []

        self.input_variables = []
        self.target_variables = []

        self.training_callbacks = []
        self.testing_callbacks = []
        self.epoch_callbacks = []

        self.layers = []

        self._hidden_outputs = []
        self.training_monitors = []
        self.testing_monitors = []

        self.setup_variables()
        self.train_logger = TrainLogger()

    def stack_layer(self, layer, no_setup=False):
        """
        Stack a neural layer.
        :type layer: NeuralLayer
        :param no_setup: whether the layer is already initialized
        """
        if layer.name:
            layer.name += "%d" % (len(self.layers) + 1)
        if not self.layers:
            layer.initialize(self.input_dim, no_prepare=no_setup)
        else:
            layer.initialize(self.layers[-1].output_dim, no_prepare=no_setup)
        self._output = layer.compute_tensor(self._output)
        self._test_output = layer.compute_test_tesnor(self._test_output)
        self._hidden_outputs.append(self._output)
        self.register_layer(layer)
        self.layers.append(layer)

    def register(self, *layers):
        """
        Register multiple layers as the components of the network.
        The parameter of those layers will be trained.
        But the output of the layer will not be stacked.
        """
        for layer in layers:
            self.register_layer(layer)

    def register_layer(self, layer):
        """
        Register the layer so that it's param will be trained.
        But the output of the layer will not be stacked.
        """
        if type(layer) == Block:
            layer.fix()
        self.parameter_count += layer.parameter_count
        self.parameters.extend(layer.parameters)
        self.free_parameters.extend(layer.free_parameters)
        self.training_monitors.extend(layer.training_monitors)
        self.testing_monitors.extend(layer.testing_monitors)
        self.updates.extend(layer.updates)
        self.training_updates.extend(layer.training_updates)
        self.input_variables.extend(layer.external_inputs)
        self.target_variables.extend(layer.external_targets)

        self.training_callbacks.extend(layer.training_callbacks)
        self.testing_callbacks.extend(layer.testing_callbacks)
        self.epoch_callbacks.extend(layer.epoch_callbacks)

    def first_layer(self):
        """
        Return first layer.
        """
        return self.layers[0] if self.layers else None

    def stack(self, *layers):
        """
        Stack layers.
        """
        for layer in layers:
            self.stack_layer(layer)
        return self

    def prepare_training(self):
        """
        This function will be called before training.
        """
        self.report()

    def monitor_layer_outputs(self):
        """
        Monitoring the outputs of each layer.
        Useful for troubleshooting convergence problems.
        """
        for layer, hidden in zip(self.layers, self._hidden_outputs):
            self.training_monitors.append(('mean(%s)' % (layer.name), abs(hidden).mean()))

    @property
    def all_parameters(self):
        """
        Return all parameters.
        """
        params = []
        params.extend(self.parameters)
        params.extend(self.free_parameters)

        return params

    def setup_variables(self):
        """
        Set up variables.
        """
        if self.input_tensor:
            if type(self.input_tensor) == int:
                x = dim_to_var(self.input_tensor, name="x")
            else:
                x = self.input_tensor
        else:
            x = T.matrix('x')
        self.input_variables.append(x)
        self._output = x
        self._test_output = x

    def _compile(self):
        if not hasattr(self, '_compute'):
            self._compute = theano.function(
                filter(lambda x: x not in self.target_variables, self.input_variables),
                self.test_output, updates=self.updates, allow_input_downcast=True)

    def compute(self, *x):
        """
        Return network output.
        """
        self._compile()
        return self._compute(*x)

    @property
    def output(self):
        """
        Return output variable.
        """
        return self._output

    @property
    def test_output(self):
        """
        Return output variable in test time.
        """
        return self._test_output

    @property
    def cost(self):
        """
        Return cost variable.
        """
        return T.constant(0)

    @property
    def test_cost(self):
        """
        Return cost variable in test time.
        """
        return self.cost

    def save_params(self, path, new_thread=False):
        """
        Save parameters to file.
        """
        logging.info("saving parameters to %s" % path)
        param_variables = self.all_parameters
        params = [p.get_value().copy() for p in param_variables]
        if new_thread:
            thread = Thread(target=save_network_params, args=(params, path))
            thread.start()
        else:
            save_network_params(params, path)
        self.train_logger.save(path)

    def load_params(self, path, exclude_free_params=False):
        """
        Load parameters from file.
        """
        if not os.path.exists(path): return;
        logging.info("loading parameters from %s" % path)
        # Decide which parameters to load
        if exclude_free_params:
            params_to_load = self.parameters
        else:
            params_to_load = self.all_parameters
        # Load parameters
        if path.endswith(".gz"):
            opener = gzip.open if path.lower().endswith('.gz') else open
            handle = opener(path, 'rb')
            saved_params = pickle.load(handle)
            handle.close()
            # Write parameters
            for target, source in zip(params_to_load, saved_params):
                logging.info('%s: setting value %s', target.name, source.shape)
                target.set_value(source)
        elif path.endswith(".npz"):
            arrs = np.load(path)
            # Write parameters
            for target, idx in zip(params_to_load, range(len(arrs.keys()))):
                source = arrs['arr_%d' % idx]
                logging.info('%s: setting value %s', target.name, source.shape)
                target.set_value(source)
        else:
            raise Exception("File format of %s is not supported, use '.gz' or '.npz' or '.uncompressed.gz'" % path)

        self.train_logger.load(path)

    def report(self):
        """
        Print network statistics.
        """
        logging.info("network inputs: %s", " ".join(map(str, self.input_variables)))
        logging.info("network targets: %s", " ".join(map(str, self.target_variables)))
        logging.info("network parameters: %s", " ".join(map(str, self.all_parameters)))
        logging.info("parameter count: %d", self.parameter_count)

    def epoch_callback(self):
        """
        Callback for each epoch.
        """
        for cb in self.epoch_callbacks:
            cb()

    def training_callback(self):
        """
        Callback for each training iteration.
        """
        for cb in self.training_callbacks:
            cb()

    def testing_callback(self):
        """
        Callback for each testing iteration.
        """
        for cb in self.training_callbacks:
            cb()


1			#!/usr/bin/env python
2			# -- coding: utf-8 --
3
4			import logging as loggers
5			import gzip
6			import cPickle as pickle
7			import os
8			from threading import Thread
9
10			import numpy as np
11			import theano.tensor as T
12			import theano
13
14			import deepy
15			from deepy.layers.layer import NeuralLayer
16			from deepy.layers.block import Block
17			from deepy.utils import dim_to_var, TrainLogger
18
19			logging = loggers.getLogger(__name__)
20
21			DEEPY_MESSAGE = "deepy version = %s" % deepy.__version__
22
23			def save_network_params(params, path):
24			if path.endswith('gz'):
25			opener = gzip.open if path.lower().endswith('.gz') else open
26			handle = opener(path, 'wb')
27			pickle.dump(params, handle)
28			handle.close()
29			elif path.endswith('uncompressed.npz'):
30			np.savez(path, *params)
31			elif path.endswith('.npz'):
32			np.savez_compressed(path, *params)
33			else:
34			raise Exception("File format of %s is not supported, use '.gz' or '.npz' or '.uncompressed.gz'" % path)
35
36			class NeuralNetwork(object):
37			"""
38			The base class of neural networks.
39			"""
40
41			def __init__(self, input_dim, input_tensor=None):
42			logging.info(DEEPY_MESSAGE)
43			self.input_dim = input_dim
44			self.input_tensor = input_tensor
45			self.parameter_count = 0
46
47			self.parameters = []
48			self.free_parameters = []
49
50			self.training_updates = []
51			self.updates = []
52
53			self.input_variables = []
54			self.target_variables = []
55
56			self.training_callbacks = []
57			self.testing_callbacks = []
58			self.epoch_callbacks = []
59
60			self.layers = []
61
62			self._hidden_outputs = []
63			self.training_monitors = []
64			self.testing_monitors = []
65
66			self.setup_variables()
67			self.train_logger = TrainLogger()
68
69			def stack_layer(self, layer, no_setup=False):
70			"""
71			Stack a neural layer.
72			:type layer: NeuralLayer
73			:param no_setup: whether the layer is already initialized
74			"""
75			if layer.name:
76			layer.name += "%d" % (len(self.layers) + 1)
77			if not self.layers:
78			layer.initialize(self.input_dim, no_prepare=no_setup)
79			else:
80			layer.initialize(self.layers[-1].output_dim, no_prepare=no_setup)
81			self._output = layer.compute_tensor(self._output)
82			self._test_output = layer.compute_test_tesnor(self._test_output)
83			self._hidden_outputs.append(self._output)
84			self.register_layer(layer)
85			self.layers.append(layer)
86
87			def register(self, *layers):
88			"""
89			Register multiple layers as the components of the network.
90			The parameter of those layers will be trained.
91			But the output of the layer will not be stacked.
92			"""
93			for layer in layers:
94			self.register_layer(layer)
95
96			def register_layer(self, layer):
97			"""
98			Register the layer so that it's param will be trained.
99			But the output of the layer will not be stacked.
100			"""
101			if type(layer) == Block:
102			layer.fix()
103			self.parameter_count += layer.parameter_count
104			self.parameters.extend(layer.parameters)
105			self.free_parameters.extend(layer.free_parameters)
106			self.training_monitors.extend(layer.training_monitors)
107			self.testing_monitors.extend(layer.testing_monitors)
108			self.updates.extend(layer.updates)
109			self.training_updates.extend(layer.training_updates)
110			self.input_variables.extend(layer.external_inputs)
111			self.target_variables.extend(layer.external_targets)
112
113			self.training_callbacks.extend(layer.training_callbacks)
114			self.testing_callbacks.extend(layer.testing_callbacks)
115			self.epoch_callbacks.extend(layer.epoch_callbacks)
116
117			def first_layer(self):
118			"""
119			Return first layer.
120			"""
121			return self.layers[0] if self.layers else None
122
123			def stack(self, *layers):
124			"""
125			Stack layers.
126			"""
127			for layer in layers:
128			self.stack_layer(layer)
129			return self
130
131			def prepare_training(self):
132			"""
133			This function will be called before training.
134			"""
135			self.report()
136
137			def monitor_layer_outputs(self):
138			"""
139			Monitoring the outputs of each layer.
140			Useful for troubleshooting convergence problems.
141			"""
142			for layer, hidden in zip(self.layers, self._hidden_outputs):
143			self.training_monitors.append(('mean(%s)' % (layer.name), abs(hidden).mean()))
144
145			@property
146			def all_parameters(self):
147			"""
148			Return all parameters.
149			"""
150			params = []
151			params.extend(self.parameters)
152			params.extend(self.free_parameters)
153
154			return params
155
156			def setup_variables(self):
157			"""
158			Set up variables.
159			"""
160			if self.input_tensor:
161			if type(self.input_tensor) == int:
162			x = dim_to_var(self.input_tensor, name="x")
163			else:
164			x = self.input_tensor
165			else:
166			x = T.matrix('x')
167			self.input_variables.append(x)
168			self._output = x
169			self._test_output = x
170
171			def _compile(self):
172			if not hasattr(self, '_compute'):
173			self._compute = theano.function(
174			filter(lambda x: x not in self.target_variables, self.input_variables),
175			self.test_output, updates=self.updates, allow_input_downcast=True)
176
177			def compute(self, *x):
178			"""
179			Return network output.
180			"""
181			self._compile()
182			return self._compute(*x)
183
184			@property
185			def output(self):
186			"""
187			Return output variable.
188			"""
189			return self._output
190
191			@property
192			def test_output(self):
193			"""
194			Return output variable in test time.
195			"""
196			return self._test_output
197
198			@property
199			def cost(self):
200			"""
201			Return cost variable.
202			"""
203			return T.constant(0)
204
205			@property
206			def test_cost(self):
207			"""
208			Return cost variable in test time.
209			"""
210			return self.cost
211
212			def save_params(self, path, new_thread=False):
213			"""
214			Save parameters to file.
215			"""
216			logging.info("saving parameters to %s" % path)
217			param_variables = self.all_parameters
218			params = [p.get_value().copy() for p in param_variables]
219			if new_thread:
220			thread = Thread(target=save_network_params, args=(params, path))
221			thread.start()
222			else:
223			save_network_params(params, path)
224			self.train_logger.save(path)
225
226			def load_params(self, path, exclude_free_params=False):
227			"""
228			Load parameters from file.
229			"""
230			if not os.path.exists(path): return;
231			logging.info("loading parameters from %s" % path)
232			# Decide which parameters to load
233			if exclude_free_params:
234			params_to_load = self.parameters
235			else:
236			params_to_load = self.all_parameters
237			# Load parameters
238			if path.endswith(".gz"):
239			opener = gzip.open if path.lower().endswith('.gz') else open
240			handle = opener(path, 'rb')
241			saved_params = pickle.load(handle)
242			handle.close()
243			# Write parameters
244			for target, source in zip(params_to_load, saved_params):
245			logging.info('%s: setting value %s', target.name, source.shape)
246			target.set_value(source)
247			elif path.endswith(".npz"):
248			arrs = np.load(path)
249			# Write parameters
250			for target, idx in zip(params_to_load, range(len(arrs.keys()))):
251			source = arrs['arr_%d' % idx]
252			logging.info('%s: setting value %s', target.name, source.shape)
253			target.set_value(source)
254			else:
255			raise Exception("File format of %s is not supported, use '.gz' or '.npz' or '.uncompressed.gz'" % path)
256
257			self.train_logger.load(path)
258
259			def report(self):
260			"""
261			Print network statistics.
262			"""
263			logging.info("network inputs: %s", " ".join(map(str, self.input_variables)))
264			logging.info("network targets: %s", " ".join(map(str, self.target_variables)))
265			logging.info("network parameters: %s", " ".join(map(str, self.all_parameters)))
266			logging.info("parameter count: %d", self.parameter_count)
267
268			def epoch_callback(self):
269			"""
270			Callback for each epoch.
271			"""
272			for cb in self.epoch_callbacks:
273			cb()
274
275			def training_callback(self):
276			"""
277			Callback for each training iteration.
278			"""
279			for cb in self.training_callbacks:
280			cb()
281
282			def testing_callback(self):
283			"""
284			Callback for each testing iteration.
285			"""
286			for cb in self.training_callbacks:
287			cb()
288

zomux / deepy

Push — master ( f73e69...91b7c0 )

NeuralNetwork B

Complexity

Size/Duplication

Importance

22 Methods

How to fix Complexity

Complex Class

Duplication Side-by-Side

Filter issues like