optimize_updates() - Code Metrics - zomux/deepy - Measure and Improve Code Quality continuously with Scrutinizer

optimize_updates() F
last analyzed 2017-01-17 00:28 UTC

↳ Parent: Project

Complexity

Conditions

Size

Total Lines

105

Duplication

Lines	0
Ratio	0 %

Importance

Changes	5
Bugs	0	Features	0

Metric	Value
cc	30
dl	0
loc	105
rs	2
c	5
b	0
f	0

How to fix Long Method Complexity

#!/usr/bin/env python
# -*- coding: utf-8 -*-


import logging as loggers

import numpy as np
import theano
import theano.tensor as T
from theano.ifelse import ifelse

from deepy.utils import dim_to_var
from deepy.core.env import FLOATX, EPSILON
from deepy.trainers.util import wrap_core, multiple_l2_norm
from deepy.conf import TrainerConfig

logging = loggers.getLogger(__name__)

def optimize_updates(params, gradients, config=None, shapes=None):
    """
    General optimization function for Theano.
    Parameters:
        params - parameters
        gradients - gradients
        config - training config
    Returns:
        Theano updates
    :type config: deepy.TrainerConfig or dict
    """
    if config and isinstance(config, dict):
        config = TrainerConfig(config)

    # Clipping
    if config:
        clip_value = config.get("gradient_clipping", None)

        if clip_value:
            clip_constant = T.constant(clip_value, dtype=FLOATX)

            if config.avoid_compute_embed_norm:
                grad_norm = multiple_l2_norm([t[1] for t in zip(params, gradients) if not t[0].name.startswith("W_embed")])
            else:
                grad_norm = multiple_l2_norm(gradients)
            isnan = T.or_(T.isnan(grad_norm), T.isinf(grad_norm))
            multiplier = ifelse(grad_norm < clip_constant,
                                T.constant(1., dtype=FLOATX), clip_constant / (grad_norm + EPSILON))

            # Clip
            clipped_gradients = []
            for param, g in zip(params, gradients):
                g = multiplier * g
                if config.avoid_nan:
                    g = T.switch(isnan, np.float32(0.1) * param, g)
                if config.gradient_tolerance:
                    g = ifelse(grad_norm > config.gradient_tolerance, T.zeros_like(g) + EPSILON, g)
                clipped_gradients.append(g)

            gradients = clipped_gradients
    # Regularization
    if config and config.weight_l2:
        regularized_gradients = []
        for param, grad in zip(params, gradients):
            grad = grad + (2 * config.weight_l2 * param)
            regularized_gradients.append(grad)
        gradients = regularized_gradients

    # Avoid nan but not computing the norm
    # This is not recommended
    if config and config.avoid_nan and not config.gradient_clipping:
        logging.info("avoid NaN gradients")
        new_gradients = []
        for grad in gradients:
            new_grad = ifelse(T.isnan(grad).any(), T.zeros_like(grad) + EPSILON, grad)
            new_gradients.append(new_grad)
        gradients = new_gradients


    # Find method
    method = "SGD"
    if config:
        method = config.get("method", method).upper()
    # Get Function
    func = None
    if method in ["SGD", "ADAGRAD", "ADADELTA", "FINETUNING_ADAGRAD"]:
        from cores.ada_family import ada_family_core
        func = ada_family_core
    elif method == "ADAM":
        from cores.adam import adam_core
        func = adam_core
    elif method == "RMSPROP":
        from cores.rmsprop import rmsprop_core
        func = rmsprop_core
    elif method == "MOMENTUM":
        from cores.momentum import momentum_core
        func = momentum_core

    if not func:
        raise NotImplementedError("method '%s' is not supported" % method)

    logging.info("optimize method=%s parameters=%s" % (method, str(params)))

    free_parameters = []
    return_vals = wrap_core(func, config, params, gradients)
    if type(return_vals) == list and type(return_vals[0]) == list:
        updates, free_parameters = return_vals
    else:
        updates = return_vals

    # No free param recording
    if config and not config.record_free_params:
        free_parameters = []

    # Weight bound
    if config.weight_bound:
        logging.info("apply weight bound of %.2f" % config.weight_bound)
        new_updates = []
        for param, update_value in updates:
            bounded_value = (update_value * (T.abs_(update_value) <= config.weight_bound) +
                             config.weight_bound * (update_value > config.weight_bound) +
                             -config.weight_bound * (update_value < -config.weight_bound))
            new_updates.append((param, bounded_value))
        updates = new_updates
    return updates, free_parameters

def optimize_function(params, config=None):
    """
    Create a optimizing function receives gradients.
    Parameters:
        params - parameters
        config - training configuration
    Returns:
        updating function receives gradients
    """
    gs = [dim_to_var(p.ndim) for p in params]
    updates, _ = optimize_updates(params, gs, config)
    return theano.function(gs, [], updates=updates)


1			#!/usr/bin/env python
2			# -- coding: utf-8 --
3
4
5			import logging as loggers
6
7			import numpy as np
8			import theano
9			import theano.tensor as T
10			from theano.ifelse import ifelse
11
12			from deepy.utils import dim_to_var
13			from deepy.core.env import FLOATX, EPSILON
14			from deepy.trainers.util import wrap_core, multiple_l2_norm
15			from deepy.conf import TrainerConfig
16
17			logging = loggers.getLogger(__name__)
18
19			def optimize_updates(params, gradients, config=None, shapes=None):
20			"""
21			General optimization function for Theano.
22			Parameters:
23			params - parameters
24			gradients - gradients
25			config - training config
26			Returns:
27			Theano updates
28			:type config: deepy.TrainerConfig or dict
29			"""
30			if config and isinstance(config, dict):
31			config = TrainerConfig(config)
32
33			# Clipping
34			if config:
35			clip_value = config.get("gradient_clipping", None)
36
37			if clip_value:
38			clip_constant = T.constant(clip_value, dtype=FLOATX)
39
40			if config.avoid_compute_embed_norm:
41			grad_norm = multiple_l2_norm([t[1] for t in zip(params, gradients) if not t[0].name.startswith("W_embed")])
42			else:
43			grad_norm = multiple_l2_norm(gradients)
44			isnan = T.or_(T.isnan(grad_norm), T.isinf(grad_norm))
45			multiplier = ifelse(grad_norm < clip_constant,
46			T.constant(1., dtype=FLOATX), clip_constant / (grad_norm + EPSILON))
47
48			# Clip
49			clipped_gradients = []
50			for param, g in zip(params, gradients):
51			g = multiplier * g
52			if config.avoid_nan:
53			g = T.switch(isnan, np.float32(0.1) * param, g)
54			if config.gradient_tolerance:
55			g = ifelse(grad_norm > config.gradient_tolerance, T.zeros_like(g) + EPSILON, g)
56			clipped_gradients.append(g)
57
58			gradients = clipped_gradients
59			# Regularization
60			if config and config.weight_l2:
61			regularized_gradients = []
62			for param, grad in zip(params, gradients):
63			grad = grad + (2 * config.weight_l2 * param)
64			regularized_gradients.append(grad)
65			gradients = regularized_gradients
66
67			# Avoid nan but not computing the norm
68			# This is not recommended
69			if config and config.avoid_nan and not config.gradient_clipping:
70			logging.info("avoid NaN gradients")
71			new_gradients = []
72			for grad in gradients:
73			new_grad = ifelse(T.isnan(grad).any(), T.zeros_like(grad) + EPSILON, grad)
74			new_gradients.append(new_grad)
75			gradients = new_gradients
76
77
78			# Find method
79			method = "SGD"
80			if config:
81			method = config.get("method", method).upper()
82			# Get Function
83			func = None
84			if method in ["SGD", "ADAGRAD", "ADADELTA", "FINETUNING_ADAGRAD"]:
85			from cores.ada_family import ada_family_core
86			func = ada_family_core
87			elif method == "ADAM":
88			from cores.adam import adam_core
89			func = adam_core
90			elif method == "RMSPROP":
91			from cores.rmsprop import rmsprop_core
92			func = rmsprop_core
93			elif method == "MOMENTUM":
94			from cores.momentum import momentum_core
95			func = momentum_core
96
97			if not func:
98			raise NotImplementedError("method '%s' is not supported" % method)
99
100			logging.info("optimize method=%s parameters=%s" % (method, str(params)))
101
102			free_parameters = []
103			return_vals = wrap_core(func, config, params, gradients)
104			if type(return_vals) == list and type(return_vals[0]) == list:
105			updates, free_parameters = return_vals
106			else:
107			updates = return_vals
108
109			# No free param recording
110			if config and not config.record_free_params:
111			free_parameters = []
112
113			# Weight bound
114			if config.weight_bound:
115			logging.info("apply weight bound of %.2f" % config.weight_bound)
116			new_updates = []
117			for param, update_value in updates:
118			bounded_value = (update_value * (T.abs_(update_value) <= config.weight_bound) +
119			config.weight_bound * (update_value > config.weight_bound) +
120			-config.weight_bound * (update_value < -config.weight_bound))
121			new_updates.append((param, bounded_value))
122			updates = new_updates
123			return updates, free_parameters
124
125			def optimize_function(params, config=None):
126			"""
127			Create a optimizing function receives gradients.
128			Parameters:
129			params - parameters
130			config - training configuration
131			Returns:
132			updating function receives gradients
133			"""
134			gs = [dim_to_var(p.ndim) for p in params]
135			updates, _ = optimize_updates(params, gs, config)
136			return theano.function(gs, [], updates=updates)
137

zomux / deepy

optimize_updates() F last analyzed 2017-01-17 00:28 UTC

Complexity

Size

Duplication

Importance

How to fix Long Method Complexity

Long Method

Complexity

Duplication Side-by-Side

Filter issues like

optimize_updates() F
last analyzed 2017-01-17 00:28 UTC