SGMLCompressContext.feed() - Code Metrics - Inspection of "drop globre custom implementation" - ergoithz/browsepy - Measure and Improve Code Quality continuously with Scrutinizer

Completed

Push — 0.5.3 ( a7ccc1...2a1862 )

by Felipe A.

created 2017-04-01 13:21 UTC

SGMLCompressContext.feed() C

↳ Parent: Project

Complexity

Conditions

Size

Total Lines

Duplication

Lines	0
Ratio	0 %

Importance

Changes	1
Bugs	0	Features	0

Metric	Value
cc	7
c	1
b	0
f	0
dl	0
loc	22
rs	5.7894

import re

import jinja2
import jinja2.ext
import jinja2.lexer

from browsepy.transform import StreamStateMachine


class SGMLCompressContext(StreamStateMachine):
    re_whitespace = re.compile('[ \\t\\r\\n]+')
    block_tags = {}  # block content will be treated as literal text
    jumps = {  # state machine jumps
        'text': {
            '<': 'tag',
            '<!--': 'comment',
            '<![CDATA[': 'cdata',
            },
        'lit1': {'"': 'tag'},
        'lit2': ("'", 'tag'),
        'tag': {
            '>': 'text',
            '"': 'lit1',
            "'": 'lit2'
            },
        'comment': {'-->': 'text'},
        'cdata': {']]>': 'text'}
        }
    lineno = 0  # current token lineno
    skip_until_token = None  # inside token until this is met
    skip_until_text = None  # inside text until this is met
    current = 'text'

    def look(self, value, current, start):
        offset = len(start)
        if self.skip_until_text and current == 'text':
            mark = self.skip_until_text
            index = value.find(mark, offset)
            if -1 != index:
                yield index, mark, current
        else:
            super_look = super(SGMLCompressContext, self).look
            for result in super_look(value, current, start):
                yield result
        yield len(value), '', None

    def transform_tag(self, data, mark, next):
        tagstart = self.start == '<'
        data = self.re_whitespace.sub(' ', data[1:] if tagstart else data)
        if tagstart:
            data = data.lstrip() if next is self.end else data.strip()
            tagname = data.split(' ', 1)[0]
            self.skip_until_text = self.block_tags.get(tagname)
            return '<' + data
        elif next is self.end:
            return data.rstrip()
        return self.start if data.strip() == self.start else data

    def transform_text(self, data, mark, next):
        if not self.skip_until_text:
            return self.start if data.strip() == self.start else data
        elif next is not self.end:
            self.skip_until_text = None
        return data


class HTMLCompressContext(SGMLCompressContext):
    block_tags = {
        'textarea': '</textarea>',
        'pre': '</pre>',
        'script': '</script>',
        'style': '</style>',
        }


class HTMLCompress(jinja2.ext.Extension):
    context_class = HTMLCompressContext
    token_class = jinja2.lexer.Token
    block_tokens = {
        'variable_begin': 'variable_end',
        'block_begin': 'block_end'
        }

    def filter_stream(self, stream):
        transform = self.context_class()
        lineno = 0
        skip_until_token = None
        for token in stream:
            if skip_until_token:
                yield token
                if token.type == skip_until_token:
                    skip_until_token = None
                continue

            if token.type != 'data':
                for data in transform.finish():
                    yield self.token_class(lineno, 'data', data)
                yield token
                skip_until_token = self.block_tokens.get(token.type)
                continue

            if not transform.pending:
                lineno = token.lineno

            for data in transform.feed(token.value):
                yield self.token_class(lineno, 'data', data)
                lineno = token.lineno

        for data in transform.finish():
            yield self.token_class(lineno, 'data', data)


1			import re
2
3			import jinja2
4			import jinja2.ext
5			import jinja2.lexer
6
7			from browsepy.transform import StreamStateMachine
8
9
10			class SGMLCompressContext(StreamStateMachine):
11			re_whitespace = re.compile('[ \\t\\r\\n]+')
12			block_tags = {} # block content will be treated as literal text
13			jumps = { # state machine jumps
14			'text': {
15			'<': 'tag',
16			'<!--': 'comment',
17			'<![CDATA[': 'cdata',
18			},
19			'lit1': {'"': 'tag'},
20			'lit2': ("'", 'tag'),
21			'tag': {
22			'>': 'text',
23			'"': 'lit1',
24			"'": 'lit2'
25			},
26			'comment': {'-->': 'text'},
27			'cdata': {']]>': 'text'}
28			}
29			lineno = 0 # current token lineno
30			skip_until_token = None # inside token until this is met
31			skip_until_text = None # inside text until this is met
32			current = 'text'
33
34			def look(self, value, current, start):
35			offset = len(start)
36			if self.skip_until_text and current == 'text':
37			mark = self.skip_until_text
38			index = value.find(mark, offset)
39			if -1 != index:
40			yield index, mark, current
41			else:
42			super_look = super(SGMLCompressContext, self).look
43			for result in super_look(value, current, start):
44			yield result
45			yield len(value), '', None
46
47			def transform_tag(self, data, mark, next):
48			tagstart = self.start == '<'
49			data = self.re_whitespace.sub(' ', data[1:] if tagstart else data)
50			if tagstart:
51			data = data.lstrip() if next is self.end else data.strip()
52			tagname = data.split(' ', 1)[0]
53			self.skip_until_text = self.block_tags.get(tagname)
54			return '<' + data
55			elif next is self.end:
56			return data.rstrip()
57			return self.start if data.strip() == self.start else data
58
59			def transform_text(self, data, mark, next):
60			if not self.skip_until_text:
61			return self.start if data.strip() == self.start else data
62			elif next is not self.end:
63			self.skip_until_text = None
64			return data
65
66
67			class HTMLCompressContext(SGMLCompressContext):
68			block_tags = {
69			'textarea': '</textarea>',
70			'pre': '</pre>',
71			'script': '</script>',
72			'style': '</style>',
73			}
74
75
76			class HTMLCompress(jinja2.ext.Extension):
77			context_class = HTMLCompressContext
78			token_class = jinja2.lexer.Token
79			block_tokens = {
80			'variable_begin': 'variable_end',
81			'block_begin': 'block_end'
82			}
83
84			def filter_stream(self, stream):
85			transform = self.context_class()
86			lineno = 0
87			skip_until_token = None
88			for token in stream:
89			if skip_until_token:
90			yield token
91			if token.type == skip_until_token:
92			skip_until_token = None
93			continue
94
95			if token.type != 'data':
96			for data in transform.finish():
97			yield self.token_class(lineno, 'data', data)
98			yield token
99			skip_until_token = self.block_tokens.get(token.type)
100			continue
101
102			if not transform.pending:
103			lineno = token.lineno
104
105			for data in transform.feed(token.value):
106			yield self.token_class(lineno, 'data', data)
107			lineno = token.lineno
108
109			for data in transform.finish():
110			yield self.token_class(lineno, 'data', data)
111

ergoithz / browsepy

Push — 0.5.3 ( a7ccc1...2a1862 )

SGMLCompressContext.feed() C

Complexity

Size

Duplication

Importance

Duplication Side-by-Side

Filter issues like