annif.analyzer.simplemma - Code Metrics - Inspection of "Add simplemma analyzer" - NatLibFi/Annif - Measure and Improve Code Quality continuously with Scrutinizer

Passed

Pull Request — master (#591)

by Osma

created 2022-05-27 11:28 UTC

annif.analyzer.simplemma A

↳ Parent: Project

Complexity

Total Complexity

Size/Duplication

Total Lines	27
Duplicated Lines	70.37 %

Importance

Changes

Metric	Value
eloc	17
dl	19
loc	27
rs	10
c	0
b	0
f	0
wmc	4

3 Methods

Rating	Name	Duplication	Size	Complexity
A	SimplemmaAnalyzer.__init__()	4	4	1
A	SimplemmaAnalyzer._normalize_word()	5	5	2
A	SimplemmaAnalyzer.__getstate__()	5	5	1

How to fix Duplicated Code

"""Simplemma analyzer for Annif, based on simplemma lemmatizer."""

import functools
import simplemma
from . import analyzer


class SimplemmaAnalyzer(analyzer.Analyzer):

    name = "simplemma"

    def __init__(self, param, **kwargs):
        self.lang = param
        self.langdata = None
        super().__init__(**kwargs)

    def __getstate__(self):
        """Return the state of the object for pickling purposes. The langdata
        field is set to None as it's more efficient to use load_data."""

        return {'lang': self.lang, 'langdata': None}

    @functools.lru_cache(maxsize=500000)
    def _normalize_word(self, word):
        if self.langdata is None:
            self.langdata = simplemma.load_data(self.lang)
        return simplemma.lemmatize(word, self.langdata)


1		"""Simplemma analyzer for Annif, based on simplemma lemmatizer."""
2
3		import functools
4		import simplemma
5		from . import analyzer
6
7
8	View Code Duplication	class SimplemmaAnalyzer(analyzer.Analyzer):
		0 ignored issues – show Duplication introduced 2022-05-27 10:04 UTC by Report Bug Copy Issue Report This code seems to be duplicated in your project. Loading history...
9		name = "simplemma"
10
11		def __init__(self, param, **kwargs):
12		self.lang = param
13		self.langdata = None
14		super().__init__(**kwargs)
15
16		def __getstate__(self):
17		"""Return the state of the object for pickling purposes. The langdata
18		field is set to None as it's more efficient to use load_data."""
19
20		return {'lang': self.lang, 'langdata': None}
21
22		@functools.lru_cache(maxsize=500000)
23		def _normalize_word(self, word):
24		if self.langdata is None:
25		self.langdata = simplemma.load_data(self.lang)
26		return simplemma.lemmatize(word, self.langdata)
27

NatLibFi / Annif

Pull Request — master (#591)

annif.analyzer.simplemma A

Complexity

Size/Duplication

Importance

3 Methods

How to fix Duplicated Code

Duplicated Code

Duplication Side-by-Side

Filter issues like