ada_family_core() - Code Metrics - zomux/deepy - Measure and Improve Code Quality continuously with Scrutinizer

ada_family_core() F
last analyzed 2017-01-17 00:28 UTC

↳ Parent: Project

Complexity

Conditions

Size

Total Lines

Duplication

Lines	0
Ratio	0 %

Importance

Changes	3
Bugs	0	Features	0

Metric	Value
cc	15
c	3
b	0
f	0
dl	0
loc	49
rs	2.5785

How to fix Complexity

#!/usr/bin/env python
# -*- coding: utf-8 -*-

from collections import OrderedDict
import inspect
import numpy as np
import theano
from theano import tensor as T
from deepy.trainers.optimize import logging
from deepy.core.env import FLOATX


def ada_family_core(params, gparams, learning_rate = 0.01, eps= 1e-6, rho=0.95, method="ADADELTA",
                        beta=0.0, gsum_regularization = 0.0001):
    """
    Optimize by SGD, AdaGrad, or AdaDelta.
    """

    _, _, _, args = inspect.getargvalues(inspect.currentframe())
    logging.info("ada_family_core: %s" % str(args.items()))
    free_parameters = []

    if method == "FINETUNING_ADAGRAD":
        method = "ADAGRAD"
        gsum_regularization = 0

    oneMinusBeta = 1 - beta

    gsums   = [theano.shared(np.zeros_like(param.get_value(borrow=True), dtype=FLOATX), name="gsum_%s" % param.name) if (method == 'ADADELTA' or method == 'ADAGRAD') else None for param in params]
    xsums   = [theano.shared(np.zeros_like(param.get_value(borrow=True), dtype=FLOATX), name="xsum_%s" % param.name) if method == 'ADADELTA' else None for param in params]

    # Fix for AdaGrad, init gsum to 1
    if method == 'ADAGRAD':
        for gsum in gsums:
            gsum.set_value(gsum.get_value() ** 0)

    updates = OrderedDict()
    # Updates
    for gparam, param, gsum, xsum in zip(gparams, params, gsums, xsums):

        if method == 'ADADELTA':
            updates[gsum] = rho * gsum + (1. - rho) * (gparam **2)
            dparam = -T.sqrt((xsum + eps) / (updates[gsum] + eps)) * gparam
            updates[xsum] =rho * xsum + (1. - rho) * (dparam **2)
            updates[param] = param * oneMinusBeta + dparam
        elif method == 'ADAGRAD':
            updates[gsum] = gsum + (gparam **2) - gsum_regularization * gsum
            updates[param] =  param * oneMinusBeta - learning_rate * (gparam / (T.sqrt(updates[gsum] + eps)))

        else:
            updates[param] = param * oneMinusBeta - gparam * learning_rate
    # Add free parameters
    if method == 'ADADELTA':
        free_parameters.extend(gsums + xsums)
    elif method == 'ADAGRAD':
        free_parameters.extend(gsums)
    # Check dtype
    for k in updates:
        if updates[k].dtype != FLOATX:
            updates[k] = updates[k].astype(FLOATX)
    return updates.items(), free_parameters


1			#!/usr/bin/env python
2			# -- coding: utf-8 --
3
4			from collections import OrderedDict
5			import inspect
6			import numpy as np
7			import theano
8			from theano import tensor as T
9			from deepy.trainers.optimize import logging
10			from deepy.core.env import FLOATX
11
12
13			def ada_family_core(params, gparams, learning_rate = 0.01, eps= 1e-6, rho=0.95, method="ADADELTA",
14			beta=0.0, gsum_regularization = 0.0001):
15			"""
16			Optimize by SGD, AdaGrad, or AdaDelta.
17			"""
18
19			_, _, _, args = inspect.getargvalues(inspect.currentframe())
20			logging.info("ada_family_core: %s" % str(args.items()))
21			free_parameters = []
22
23			if method == "FINETUNING_ADAGRAD":
24			method = "ADAGRAD"
25			gsum_regularization = 0
26
27			oneMinusBeta = 1 - beta
28
29			gsums = [theano.shared(np.zeros_like(param.get_value(borrow=True), dtype=FLOATX), name="gsum_%s" % param.name) if (method == 'ADADELTA' or method == 'ADAGRAD') else None for param in params]
30			xsums = [theano.shared(np.zeros_like(param.get_value(borrow=True), dtype=FLOATX), name="xsum_%s" % param.name) if method == 'ADADELTA' else None for param in params]
31
32			# Fix for AdaGrad, init gsum to 1
33			if method == 'ADAGRAD':
34			for gsum in gsums:
35			gsum.set_value(gsum.get_value() ** 0)
36
37			updates = OrderedDict()
38			# Updates
39			for gparam, param, gsum, xsum in zip(gparams, params, gsums, xsums):
40
41			if method == 'ADADELTA':
42			updates[gsum] = rho * gsum + (1. - rho) * (gparam **2)
43			dparam = -T.sqrt((xsum + eps) / (updates[gsum] + eps)) * gparam
44			updates[xsum] =rho * xsum + (1. - rho) * (dparam **2)
45			updates[param] = param * oneMinusBeta + dparam
46			elif method == 'ADAGRAD':
47			updates[gsum] = gsum + (gparam *2) - gsum_regularization gsum
48			updates[param] = param * oneMinusBeta - learning_rate * (gparam / (T.sqrt(updates[gsum] + eps)))
49
50			else:
51			updates[param] = param * oneMinusBeta - gparam * learning_rate
52			# Add free parameters
53			if method == 'ADADELTA':
54			free_parameters.extend(gsums + xsums)
55			elif method == 'ADAGRAD':
56			free_parameters.extend(gsums)
57			# Check dtype
58			for k in updates:
59			if updates[k].dtype != FLOATX:
60			updates[k] = updates[k].astype(FLOATX)
61			return updates.items(), free_parameters
62

zomux / deepy

ada_family_core() F last analyzed 2017-01-17 00:28 UTC

Complexity

Size

Duplication

Importance

How to fix Complexity

Complexity

Duplication Side-by-Side

Filter issues like

ada_family_core() F
last analyzed 2017-01-17 00:28 UTC