green_magic.som.som_proxy.SelfOrganizingMap.project() - Code Metrics - Inspection of "build(setup.py): indicate to pip which package nee..." - boromir674/so-magic - Measure and Improve Code Quality continuously with Scrutinizer

Passed

Push — dev ( 5b3715...a42717 )

by Konstantinos

created 2020-09-05 12:29 UTC

SelfOrganizingMap.project() A

↳ Parent: green_magic.som.som_proxy

Complexity

Conditions

Size

Total Lines	3
Code Lines	2

Duplication

Lines	0
Ratio	0 %

Importance

Changes

Metric	Value
eloc	2
dl	0
loc	3
rs	10
c	0
b	0
f	0
cc	1
nop	2

import attr
import numpy as np
import somoclu
from sklearn.cluster import KMeans

import logging
logger = logging.getLogger(__name__)


class SomTrainer:

    def infer_map(self, nb_cols, nb_rows, dataset, **kwargs):
        """Infer a self-organizing map from dataset.\n
        initialcodebook = None, kerneltype = 0, maptype = 'planar', gridtype = 'rectangular',
        compactsupport = False, neighborhood = 'gaussian', std_coeff = 0.5, initialization = None
        """
        if not hasattr(dataset, 'feature_vectors'):
            raise NoFeatureVectorsError("Attempted to train a Som model, but did not find feature vectors in the dataset.")
        som = somoclu.Somoclu(nb_cols, nb_rows, **kwargs)
        som.train(data=np.array(dataset.feature_vectors, dtype=np.float32))
        return som


@attr.s
class SomFactory:
    """Implementing from the BaseSomFactory allows other class to register/subscribe on (emulated) 'events'.
       So, when the factory creates a new Som object, other entities can be notified."""
    trainer = attr.ib(init=True, default=SomTrainer())
    observers = attr.ib(init=False, default=[])

    def register(self, observer):
        if observer not in self.observers:
            self.observers.append(observer)

    def unregister(self, observer):
        if observer in self.observers:
            self.observers.remove(observer)

    def unregister_all(self):
        if self.observers:
            del self.observers[:]

    def update_observers(self, *args, **kwargs):
        for observer in self.observers:
            observer.update(*args, **kwargs)

    def create_som(self, nb_cols, nb_rows, dataset, **kwargs):
        try:
            map_obj = self.trainer.infer_map(nb_cols, nb_rows, dataset, **kwargs)
            self.update_observers(nb_rows, nb_cols, map_object=map_obj)
            return map_obj
        except NoFeatureVectorsError as e:
            logger.info(f"{e}. Fire up an 'encode' command.")
            raise e


class NoFeatureVectorsError(Exception): pass


@attr.s
class SelfOrganizingMapFactory:
    som_factory = attr.ib(init=True, default=SomFactory())

    def create(self, dataset, nb_cols, nb_rows, **kwargs):
        return SelfOrganizingMap(self.som_factory.create_som(nb_cols, nb_rows, dataset, **kwargs), dataset.name)


@attr.s
class SelfOrganizingMap:
    som = attr.ib(init=True)
    dataset_name = attr.ib(init=True)

    @property
    def height(self):
        return self.som._n_rows

    @property
    def width(self):
        return self.som._n_columns

    @property
    def type(self):
        return self.som._map_type

    @property
    def grid_type(self):
        return self.som._grid_type

    def __getattr__(self, item):
        if item in ('n_rows', 'n_columns', 'initialization', 'map_type', 'grid_type'):
            item = f'_{item}'
        return getattr(self.som, item)

    def get_map_id(self):
        _ = '_'.join(getattr(self, attribute) for attribute in ['dataset_name', 'n_rows', 'n_columns', 'initialization', 'map_type', 'grid_type'])
        if self.som.clusters:
            return f'{_}_cl{self.nb_clusters}'
        return _

    @property
    def nb_clusters(self):
        return np.max(self.som.clusters)

    def neurons_coordinates(self):
        """"""
        for i, arr in enumerate(self.som.bmus):  # iterate through the array of shape [nb_datapoints, 2]. Each row is the coordinates
            # of the neuron the datapoint gets attributed to (closest distance)
            attributed_cluster = self.som.clusters[arr[0], arr[1]]  # >= 0
            id2members[attributed_cluster].add(dataset[i].id)


    def datapoint_coordinates(self, index):
        """Call this method to get the best-matching unit (bmu) coordinates of the datapoint indexed byt the input pointer.\n
        Bmu is simply the neuron on the som grid that is closest to the datapoint after being projected to the 2D space."""
        return self.som.bmus[index][0], self.som.bmus[index][1]

    def project(self, datapoint):
        """Compute the coordinates of a (potentially unseen) datapoint. It is assumed that the codebook has been computed already."""
        pass

    def cluster(self, nb_clusters, random_state=None):
        som.cluster(algorithm=KMeans(n_clusters=nb_clusters, random_state=random_state))


    @property
    def visual_umatrix(self):
        b = ''
        max_len = len(str(np.max(self.som.clusters)))  # i.e. a clustering of 11 clusters with ids 0, 1, .., 10 has a max_len = 2
        for j in range(self.som.umatrix.shape[0]):
            b += ' '.join(' ' * (max_len - len(str(i))) + str(i) for i in self.som.clusters[j, :]) + '\n'
        return b




1			import attr
2			import numpy as np
3			import somoclu
4			from sklearn.cluster import KMeans
5
6			import logging
7			logger = logging.getLogger(__name__)
8
9
10			class SomTrainer:
11
12			def infer_map(self, nb_cols, nb_rows, dataset, **kwargs):
13			"""Infer a self-organizing map from dataset.\n
14			initialcodebook = None, kerneltype = 0, maptype = 'planar', gridtype = 'rectangular',
15			compactsupport = False, neighborhood = 'gaussian', std_coeff = 0.5, initialization = None
16			"""
17			if not hasattr(dataset, 'feature_vectors'):
18			raise NoFeatureVectorsError("Attempted to train a Som model, but did not find feature vectors in the dataset.")
19			som = somoclu.Somoclu(nb_cols, nb_rows, **kwargs)
20			som.train(data=np.array(dataset.feature_vectors, dtype=np.float32))
21			return som
22
23
24			@attr.s
25			class SomFactory:
26			"""Implementing from the BaseSomFactory allows other class to register/subscribe on (emulated) 'events'.
27			So, when the factory creates a new Som object, other entities can be notified."""
28			trainer = attr.ib(init=True, default=SomTrainer())
29			observers = attr.ib(init=False, default=[])
30
31			def register(self, observer):
32			if observer not in self.observers:
33			self.observers.append(observer)
34
35			def unregister(self, observer):
36			if observer in self.observers:
37			self.observers.remove(observer)
38
39			def unregister_all(self):
40			if self.observers:
41			del self.observers[:]
42
43			def update_observers(self, args, *kwargs):
44			for observer in self.observers:
45			observer.update(args, *kwargs)
46
47			def create_som(self, nb_cols, nb_rows, dataset, **kwargs):
48			try:
49			map_obj = self.trainer.infer_map(nb_cols, nb_rows, dataset, **kwargs)
50			self.update_observers(nb_rows, nb_cols, map_object=map_obj)
51			return map_obj
52			except NoFeatureVectorsError as e:
53			logger.info(f"{e}. Fire up an 'encode' command.")
54			raise e
55
56
57			class NoFeatureVectorsError(Exception): pass
58
59
60			@attr.s
61			class SelfOrganizingMapFactory:
62			som_factory = attr.ib(init=True, default=SomFactory())
63
64			def create(self, dataset, nb_cols, nb_rows, **kwargs):
65			return SelfOrganizingMap(self.som_factory.create_som(nb_cols, nb_rows, dataset, **kwargs), dataset.name)
66
67
68			@attr.s
69			class SelfOrganizingMap:
70			som = attr.ib(init=True)
71			dataset_name = attr.ib(init=True)
72
73			@property
74			def height(self):
75			return self.som._n_rows
76
77			@property
78			def width(self):
79			return self.som._n_columns
80
81			@property
82			def type(self):
83			return self.som._map_type
84
85			@property
86			def grid_type(self):
87			return self.som._grid_type
88
89			def __getattr__(self, item):
90			if item in ('n_rows', 'n_columns', 'initialization', 'map_type', 'grid_type'):
91			item = f'_{item}'
92			return getattr(self.som, item)
93
94			def get_map_id(self):
95			_ = '_'.join(getattr(self, attribute) for attribute in ['dataset_name', 'n_rows', 'n_columns', 'initialization', 'map_type', 'grid_type'])
96			if self.som.clusters:
97			return f'{_}_cl{self.nb_clusters}'
98			return _
99
100			@property
101			def nb_clusters(self):
102			return np.max(self.som.clusters)
103
104			def neurons_coordinates(self):
105			""""""
106			for i, arr in enumerate(self.som.bmus): # iterate through the array of shape [nb_datapoints, 2]. Each row is the coordinates
107			# of the neuron the datapoint gets attributed to (closest distance)
108			attributed_cluster = self.som.clusters[arr[0], arr[1]] # >= 0
109			id2members[attributed_cluster].add(dataset[i].id)
			0 ignored issues – show Comprehensibility Best Practice introduced 2020-07-31 20:00 UTC by Report Bug Copy Issue Report The variable `id2members` does not seem to be defined. Loading history... Comprehensibility Best Practice introduced 2020-07-31 20:00 UTC by Report Bug Copy Issue Report The variable `dataset` does not seem to be defined. Loading history...
110
111			def datapoint_coordinates(self, index):
112			"""Call this method to get the best-matching unit (bmu) coordinates of the datapoint indexed byt the input pointer.\n
113			Bmu is simply the neuron on the som grid that is closest to the datapoint after being projected to the 2D space."""
114			return self.som.bmus[index][0], self.som.bmus[index][1]
115
116			def project(self, datapoint):
117			"""Compute the coordinates of a (potentially unseen) datapoint. It is assumed that the codebook has been computed already."""
118			pass
119
120			def cluster(self, nb_clusters, random_state=None):
121			som.cluster(algorithm=KMeans(n_clusters=nb_clusters, random_state=random_state))
			0 ignored issues – show Comprehensibility Best Practice introduced 2020-07-31 20:00 UTC by Report Bug Copy Issue Report The variable `som` does not seem to be defined. Loading history...
122
123			@property
124			def visual_umatrix(self):
125			b = ''
126			max_len = len(str(np.max(self.som.clusters))) # i.e. a clustering of 11 clusters with ids 0, 1, .., 10 has a max_len = 2
127			for j in range(self.som.umatrix.shape[0]):
128			b += ' '.join(' ' * (max_len - len(str(i))) + str(i) for i in self.som.clusters[j, :]) + '\n'
129			return b
130
131
132

boromir674 / so-magic

Push — dev ( 5b3715...a42717 )

SelfOrganizingMap.project() A

Complexity

Size

Duplication

Importance

Duplication Side-by-Side

Filter issues like