annif.backend.mixins - Code Metrics - Inspection of "Merge pull request #270 from NatLibFi/issue267-cli..." - NatLibFi/Annif - Measure and Improve Code Quality continuously with Scrutinizer

Passed

Push — master ( c8c370...dee89b )

by Osma

created 2019-04-17 09:24 UTC

annif.backend.mixins A

↳ Parent: Project

Complexity

Total Complexity

Size/Duplication

Total Lines	33
Duplicated Lines	0 %

Importance

Changes

Metric	Value
wmc	4
eloc	22
dl	0
loc	33
rs	10
c	0
b	0
f	0

2 Methods

Rating	Name	Duplication	Size	Complexity
A	ChunkingBackend._suggest()	0	15	3
A	ChunkingBackend._suggest_chunks()	0	6	1

"""Annif backend mixins that can be used to implement features"""


import abc
from annif.suggestion import ListSuggestionResult


class ChunkingBackend(metaclass=abc.ABCMeta):
    """Annif backend mixin that implements chunking of input"""

    @abc.abstractmethod
    def _suggest_chunks(self, chunktexts, project):
        """Suggest subjects for the chunked text; should be implemented by
        the subclass inheriting this mixin"""

        pass  # pragma: no cover

    def _suggest(self, text, project, params):
        self.initialize()
        self.debug('Suggesting subjects for text "{}..." (len={})'.format(
            text[:20], len(text)))
        sentences = project.analyzer.tokenize_sentences(text)
        self.debug('Found {} sentences'.format(len(sentences)))
        chunksize = int(params['chunksize'])
        chunktexts = []
        for i in range(0, len(sentences), chunksize):
            chunktexts.append(' '.join(sentences[i:i + chunksize]))
        self.debug('Split sentences into {} chunks'.format(len(chunktexts)))
        if len(chunktexts) == 0:  # no input, empty result
            return ListSuggestionResult(
                hits=[], subject_index=project.subjects)
        return self._suggest_chunks(chunktexts, project)


1			"""Annif backend mixins that can be used to implement features"""
2
3
4			import abc
5			from annif.suggestion import ListSuggestionResult
6
7
8			class ChunkingBackend(metaclass=abc.ABCMeta):
9			"""Annif backend mixin that implements chunking of input"""
10
11			@abc.abstractmethod
12			def _suggest_chunks(self, chunktexts, project):
13			"""Suggest subjects for the chunked text; should be implemented by
14			the subclass inheriting this mixin"""
15
16			pass # pragma: no cover
17
18			def _suggest(self, text, project, params):
19			self.initialize()
20			self.debug('Suggesting subjects for text "{}..." (len={})'.format(
21			text[:20], len(text)))
22			sentences = project.analyzer.tokenize_sentences(text)
23			self.debug('Found {} sentences'.format(len(sentences)))
24			chunksize = int(params['chunksize'])
25			chunktexts = []
26			for i in range(0, len(sentences), chunksize):
27			chunktexts.append(' '.join(sentences[i:i + chunksize]))
28			self.debug('Split sentences into {} chunks'.format(len(chunktexts)))
29			if len(chunktexts) == 0: # no input, empty result
30			return ListSuggestionResult(
31			hits=[], subject_index=project.subjects)
32			return self._suggest_chunks(chunktexts, project)
33

NatLibFi / Annif

Push — master ( c8c370...dee89b )

annif.backend.mixins A

Complexity

Size/Duplication

Importance

2 Methods

Duplication Side-by-Side

Filter issues like