Code Duplication - MikeCoder/markdown-preview.vim - Measure and Improve Code Quality continuously with Scrutinizer

Code Duplication Length = 268-268 lines in 2 locations

pythonx/markdown_parser.py 1 location


            r'<!--[\s\S]*?-->',
            r'<(%s)((?:%s)*?)>([\s\S]*?)<\/\1>' % (_block_tag, _valid_attr),
            r'<%s(?:%s)*?\s*\/?>' % (_block_tag, _valid_attr),
        )
    )
    table = re.compile(
        r'^ *\|(.+)\n *\|( *[-:]+[-| :]*)\n((?: *\|.*(?:\n|$))*)\n*'
    )
    nptable = re.compile(
        r'^ *(\S.*\|.*)\n *([-:]+ *\|[-| :]*)\n((?:.*\|.*(?:\n|$))*)\n*'
    )
    text = re.compile(r'^[^\n]+')


class BlockLexer(object):
    """Block level lexer for block grammars."""
    grammar_class = BlockGrammar

    default_rules = [
        'newline', 'hrule', 'block_code', 'fences', 'heading',
        'nptable', 'lheading', 'block_quote',
        'list_block', 'block_html', 'def_links',
        'def_footnotes', 'table', 'paragraph', 'text'
    ]

    list_rules = (
        'newline', 'block_code', 'fences', 'lheading', 'hrule',
        'block_quote', 'list_block', 'block_html', 'text',
    )

    footnote_rules = (
        'newline', 'block_code', 'fences', 'heading',
        'nptable', 'lheading', 'hrule', 'block_quote',
        'list_block', 'block_html', 'table', 'paragraph', 'text'
    )

    def __init__(self, rules=None, **kwargs):
        self.tokens = []
        self.def_links = {}
        self.def_footnotes = {}

        if not rules:
            rules = self.grammar_class()

        self.rules = rules

    def __call__(self, text, rules=None):
        return self.parse(text, rules)

    def parse(self, text, rules=None):
        text = text.rstrip('\n')

        if not rules:
            rules = self.default_rules

        def manipulate(text):
            for key in rules:
                rule = getattr(self.rules, key)
                m = rule.match(text)
                if not m:
                    continue
                getattr(self, 'parse_%s' % key)(m)
                return m
            return False  # pragma: no cover

        while text:
            m = manipulate(text)
            if m is not False:
                text = text[len(m.group(0)):]
                continue
            if text:  # pragma: no cover
                raise RuntimeError('Infinite loop at: %s' % text)
        return self.tokens

    def parse_newline(self, m):
        length = len(m.group(0))
        if length > 1:
            self.tokens.append({'type': 'newline'})

    def parse_block_code(self, m):
        # clean leading whitespace
        code = _block_code_leading_pattern.sub('', m.group(0))
        self.tokens.append({
            'type': 'code',
            'lang': None,
            'text': code,
        })

    def parse_fences(self, m):
        self.tokens.append({
            'type': 'code',
            'lang': m.group(2),
            'text': m.group(3),
        })

    def parse_heading(self, m):
        self.tokens.append({
            'type': 'heading',
            'level': len(m.group(1)),
            'text': m.group(2),
        })

    def parse_lheading(self, m):
        """Parse setext heading."""
        self.tokens.append({
            'type': 'heading',
            'level': 1 if m.group(2) == '=' else 2,
            'text': m.group(1),
        })

    def parse_hrule(self, m):
        self.tokens.append({'type': 'hrule'})

    def parse_list_block(self, m):
        bull = m.group(2)
        self.tokens.append({
            'type': 'list_start',
            'ordered': '.' in bull,
        })
        cap = m.group(0)
        self._process_list_item(cap, bull)
        self.tokens.append({'type': 'list_end'})

    def _process_list_item(self, cap, bull):
        cap = self.rules.list_item.findall(cap)

        _next = False
        length = len(cap)

        for i in range(length):
            item = cap[i][0]

            # remove the bullet
            space = len(item)
            item = self.rules.list_bullet.sub('', item)

            # outdent
            if '\n ' in item:
                space = space - len(item)
                pattern = re.compile(r'^ {1,%d}' % space, flags=re.M)
                item = pattern.sub('', item)

            # determine whether item is loose or not
            loose = _next
            if not loose and re.search(r'\n\n(?!\s*$)', item):
                loose = True

            rest = len(item)
            if i != length - 1 and rest:
                _next = item[rest-1] == '\n'
                if not loose:
                    loose = _next

            if loose:
                t = 'loose_item_start'
            else:
                t = 'list_item_start'

            self.tokens.append({'type': t})
            # recurse
            self.parse(item, self.list_rules)
            self.tokens.append({'type': 'list_item_end'})

    def parse_block_quote(self, m):
        self.tokens.append({'type': 'block_quote_start'})
        # clean leading >
        cap = _block_quote_leading_pattern.sub('', m.group(0))
        self.parse(cap)
        self.tokens.append({'type': 'block_quote_end'})

    def parse_def_links(self, m):
        key = _keyify(m.group(1))
        self.def_links[key] = {
            'link': m.group(2),
            'title': m.group(3),
        }

    def parse_def_footnotes(self, m):
        key = _keyify(m.group(1))
        if key in self.def_footnotes:
            # footnote is already defined
            return

        self.def_footnotes[key] = 0

        self.tokens.append({
            'type': 'footnote_start',
            'key': key,
        })

        text = m.group(2)

        if '\n' in text:
            lines = text.split('\n')
            whitespace = None
            for line in lines[1:]:
                space = len(line) - len(line.lstrip())
                if space and (not whitespace or space < whitespace):
                    whitespace = space
            newlines = [lines[0]]
            for line in lines[1:]:
                newlines.append(line[whitespace:])
            text = '\n'.join(newlines)

        self.parse(text, self.footnote_rules)

        self.tokens.append({
            'type': 'footnote_end',
            'key': key,
        })

    def parse_table(self, m):
        item = self._process_table(m)

        cells = re.sub(r'(?: *\| *)?\n$', '', m.group(3))
        cells = cells.split('\n')
        for i, v in enumerate(cells):
            v = re.sub(r'^ *\| *| *\| *$', '', v)
            cells[i] = re.split(r' *\| *', v)

        item['cells'] = cells
        self.tokens.append(item)

    def parse_nptable(self, m):
        item = self._process_table(m)

        cells = re.sub(r'\n$', '', m.group(3))
        cells = cells.split('\n')
        for i, v in enumerate(cells):
            cells[i] = re.split(r' *\| *', v)

        item['cells'] = cells
        self.tokens.append(item)

    def _process_table(self, m):
        header = re.sub(r'^ *| *\| *$', '', m.group(1))
        header = re.split(r' *\| *', header)
        align = re.sub(r' *|\| *$', '', m.group(2))
        align = re.split(r' *\| *', align)

        for i, v in enumerate(align):
            if re.search(r'^ *-+: *$', v):
                align[i] = 'right'
            elif re.search(r'^ *:-+: *$', v):
                align[i] = 'center'
            elif re.search(r'^ *:-+ *$', v):
                align[i] = 'left'
            else:
                align[i] = None

        item = {
            'type': 'table',
            'header': header,
            'align': align,
        }
        return item

    def parse_block_html(self, m):
        tag = m.group(1)
        if not tag:
            text = m.group(0)
            self.tokens.append({
                'type': 'close_html',
                'text': text
            })
        else:
            attr = m.group(2)
            text = m.group(3)
            self.tokens.append({
                'type': 'open_html',
                'tag': tag,
                'extra': attr,
                'text': text
            })

pythonx/tests/markdown_parser.py 1 location


    text = re.compile(r'^[^\n]+')


class BlockLexer(object):
    """Block level lexer for block grammars."""
    grammar_class = BlockGrammar

    default_rules = [
        'newline', 'hrule', 'block_code', 'fences', 'heading',
        'nptable', 'lheading', 'block_quote',
        'list_block', 'block_html', 'def_links',
        'def_footnotes', 'table', 'paragraph', 'text'
    ]

    list_rules = (
        'newline', 'block_code', 'fences', 'lheading', 'hrule',
        'block_quote', 'list_block', 'block_html', 'text',
    )

    footnote_rules = (
        'newline', 'block_code', 'fences', 'heading',
        'nptable', 'lheading', 'hrule', 'block_quote',
        'list_block', 'block_html', 'table', 'paragraph', 'text'
    )

    def __init__(self, rules=None, **kwargs):
        self.tokens = []
        self.def_links = {}
        self.def_footnotes = {}

        if not rules:
            rules = self.grammar_class()

        self.rules = rules

    def __call__(self, text, rules=None):
        return self.parse(text, rules)

    def parse(self, text, rules=None):
        text = text.rstrip('\n')

        if not rules:
            rules = self.default_rules

        def manipulate(text):
            for key in rules:
                rule = getattr(self.rules, key)
                m = rule.match(text)
                if not m:
                    continue
                getattr(self, 'parse_%s' % key)(m)
                return m
            return False  # pragma: no cover

        while text:
            m = manipulate(text)
            if m is not False:
                text = text[len(m.group(0)):]
                continue
            if text:  # pragma: no cover
                raise RuntimeError('Infinite loop at: %s' % text)
        return self.tokens

    def parse_newline(self, m):
        length = len(m.group(0))
        if length > 1:
            self.tokens.append({'type': 'newline'})

    def parse_block_code(self, m):
        # clean leading whitespace
        code = _block_code_leadning_pattern.sub('', m.group(0))
        self.tokens.append({
            'type': 'code',
            'lang': None,
            'text': code,
        })

    def parse_fences(self, m):
        self.tokens.append({
            'type': 'code',
            'lang': m.group(2),
            'text': m.group(3),
        })

    def parse_heading(self, m):
        self.tokens.append({
            'type': 'heading',
            'level': len(m.group(1)),
            'text': m.group(2),
        })

    def parse_lheading(self, m):
        """Parse setext heading."""
        self.tokens.append({
            'type': 'heading',
            'level': 1 if m.group(2) == '=' else 2,
            'text': m.group(1),
        })

    def parse_hrule(self, m):
        self.tokens.append({'type': 'hrule'})

    def parse_list_block(self, m):
        bull = m.group(2)
        self.tokens.append({
            'type': 'list_start',
            'ordered': '.' in bull,
        })
        cap = m.group(0)
        self._process_list_item(cap, bull)
        self.tokens.append({'type': 'list_end'})

    def _process_list_item(self, cap, bull):
        cap = self.rules.list_item.findall(cap)

        _next = False
        length = len(cap)

        for i in range(length):
            item = cap[i][0]

            # remove the bullet
            space = len(item)
            item = self.rules.list_bullet.sub('', item)

            # outdent
            if '\n ' in item:
                space = space - len(item)
                pattern = re.compile(r'^ {1,%d}' % space, flags=re.M)
                item = pattern.sub('', item)

            # determin whether item is loose or not
            loose = _next
            if not loose and re.search(r'\n\n(?!\s*$)', item):
                loose = True

            rest = len(item)
            if i != length - 1 and rest:
                _next = item[rest-1] == '\n'
                if not loose:
                    loose = _next

            if loose:
                t = 'loose_item_start'
            else:
                t = 'list_item_start'

            self.tokens.append({'type': t})
            # recurse
            self.parse(item, self.list_rules)
            self.tokens.append({'type': 'list_item_end'})

    def parse_block_quote(self, m):
        self.tokens.append({'type': 'block_quote_start'})
        # clean leading >
        cap = _block_quote_leading_pattern.sub('', m.group(0))
        self.parse(cap)
        self.tokens.append({'type': 'block_quote_end'})

    def parse_def_links(self, m):
        key = _keyify(m.group(1))
        self.def_links[key] = {
            'link': m.group(2),
            'title': m.group(3),
        }

    def parse_def_footnotes(self, m):
        key = _keyify(m.group(1))
        if key in self.def_footnotes:
            # footnote is already defined
            return

        self.def_footnotes[key] = 0

        self.tokens.append({
            'type': 'footnote_start',
            'key': key,
        })

        text = m.group(2)

        if '\n' in text:
            lines = text.split('\n')
            whitespace = None
            for line in lines[1:]:
                space = len(line) - len(line.lstrip())
                if space and (not whitespace or space < whitespace):
                    whitespace = space
            newlines = [lines[0]]
            for line in lines[1:]:
                newlines.append(line[whitespace:])
            text = '\n'.join(newlines)

        self.parse(text, self.footnote_rules)

        self.tokens.append({
            'type': 'footnote_end',
            'key': key,
        })

    def parse_table(self, m):
        item = self._process_table(m)

        cells = re.sub(r'(?: *\| *)?\n$', '', m.group(3))
        cells = cells.split('\n')
        for i, v in enumerate(cells):
            v = re.sub(r'^ *\| *| *\| *$', '', v)
            cells[i] = re.split(r' *\| *', v)

        item['cells'] = cells
        self.tokens.append(item)

    def parse_nptable(self, m):
        item = self._process_table(m)

        cells = re.sub(r'\n$', '', m.group(3))
        cells = cells.split('\n')
        for i, v in enumerate(cells):
            cells[i] = re.split(r' *\| *', v)

        item['cells'] = cells
        self.tokens.append(item)

    def _process_table(self, m):
        header = re.sub(r'^ *| *\| *$', '', m.group(1))
        header = re.split(r' *\| *', header)
        align = re.sub(r' *|\| *$', '', m.group(2))
        align = re.split(r' *\| *', align)

        for i, v in enumerate(align):
            if re.search(r'^ *-+: *$', v):
                align[i] = 'right'
            elif re.search(r'^ *:-+: *$', v):
                align[i] = 'center'
            elif re.search(r'^ *:-+ *$', v):
                align[i] = 'left'
            else:
                align[i] = None

        item = {
            'type': 'table',
            'header': header,
            'align': align,
        }
        return item

    def parse_block_html(self, m):
        tag = m.group(1)
        if not tag:
            text = m.group(0)
            self.tokens.append({
                'type': 'close_html',
                'text': text
            })
        else:
            attr = m.group(2)
            text = m.group(3)
            self.tokens.append({
                'type': 'open_html',
                'tag': tag,
                'extra': attr,
                'text': text
            })

    def parse_paragraph(self, m):
        text = m.group(1).rstrip('\n')
        self.tokens.append({'type': 'paragraph', 'text': text})

    def parse_text(self, m):
        text = m.group(0)
        self.tokens.append({'type': 'text', 'text': text})


class InlineGrammar(object):

		@@ 160-427 (lines=268) @@
157		r'<!--[\s\S]*?-->',
158		r'<(%s)((?:%s)?)>([\s\S]?)<\/\1>' % (_block_tag, _valid_attr),
159		r'<%s(?:%s)?\s\/?>' % (_block_tag, _valid_attr),
160		)
161		)
162		table = re.compile(
163		r'^ \\|(.+)\n \\|( [-:]+[-\| :])\n((?: \\|.(?:\n\|$)))\n'
164		)
165		nptable = re.compile(
166		r'^ (\S.\\|.)\n ([-:]+ \\|[-\| :])\n((?:.\\|.(?:\n\|$)))\n'
167		)
168		text = re.compile(r'^[^\n]+')
169
170
171		class BlockLexer(object):
172		"""Block level lexer for block grammars."""
173		grammar_class = BlockGrammar
174
175		default_rules = [
176		'newline', 'hrule', 'block_code', 'fences', 'heading',
177		'nptable', 'lheading', 'block_quote',
178		'list_block', 'block_html', 'def_links',
179		'def_footnotes', 'table', 'paragraph', 'text'
180		]
181
182		list_rules = (
183		'newline', 'block_code', 'fences', 'lheading', 'hrule',
184		'block_quote', 'list_block', 'block_html', 'text',
185		)
186
187		footnote_rules = (
188		'newline', 'block_code', 'fences', 'heading',
189		'nptable', 'lheading', 'hrule', 'block_quote',
190		'list_block', 'block_html', 'table', 'paragraph', 'text'
191		)
192
193		def __init__(self, rules=None, **kwargs):
194		self.tokens = []
195		self.def_links = {}
196		self.def_footnotes = {}
197
198		if not rules:
199		rules = self.grammar_class()
200
201		self.rules = rules
202
203		def __call__(self, text, rules=None):
204		return self.parse(text, rules)
205
206		def parse(self, text, rules=None):
207		text = text.rstrip('\n')
208
209		if not rules:
210		rules = self.default_rules
211
212		def manipulate(text):
213		for key in rules:
214		rule = getattr(self.rules, key)
215		m = rule.match(text)
216		if not m:
217		continue
218		getattr(self, 'parse_%s' % key)(m)
219		return m
220		return False # pragma: no cover
221
222		while text:
223		m = manipulate(text)
224		if m is not False:
225		text = text[len(m.group(0)):]
226		continue
227		if text: # pragma: no cover
228		raise RuntimeError('Infinite loop at: %s' % text)
229		return self.tokens
230
231		def parse_newline(self, m):
232		length = len(m.group(0))
233		if length > 1:
234		self.tokens.append({'type': 'newline'})
235
236		def parse_block_code(self, m):
237		# clean leading whitespace
238		code = _block_code_leading_pattern.sub('', m.group(0))
239		self.tokens.append({
240		'type': 'code',
241		'lang': None,
242		'text': code,
243		})
244
245		def parse_fences(self, m):
246		self.tokens.append({
247		'type': 'code',
248		'lang': m.group(2),
249		'text': m.group(3),
250		})
251
252		def parse_heading(self, m):
253		self.tokens.append({
254		'type': 'heading',
255		'level': len(m.group(1)),
256		'text': m.group(2),
257		})
258
259		def parse_lheading(self, m):
260		"""Parse setext heading."""
261		self.tokens.append({
262		'type': 'heading',
263		'level': 1 if m.group(2) == '=' else 2,
264		'text': m.group(1),
265		})
266
267		def parse_hrule(self, m):
268		self.tokens.append({'type': 'hrule'})
269
270		def parse_list_block(self, m):
271		bull = m.group(2)
272		self.tokens.append({
273		'type': 'list_start',
274		'ordered': '.' in bull,
275		})
276		cap = m.group(0)
277		self._process_list_item(cap, bull)
278		self.tokens.append({'type': 'list_end'})
279
280		def _process_list_item(self, cap, bull):
281		cap = self.rules.list_item.findall(cap)
282
283		_next = False
284		length = len(cap)
285
286		for i in range(length):
287		item = cap[i][0]
288
289		# remove the bullet
290		space = len(item)
291		item = self.rules.list_bullet.sub('', item)
292
293		# outdent
294		if '\n ' in item:
295		space = space - len(item)
296		pattern = re.compile(r'^ {1,%d}' % space, flags=re.M)
297		item = pattern.sub('', item)
298
299		# determine whether item is loose or not
300		loose = _next
301		if not loose and re.search(r'\n\n(?!\s*$)', item):
302		loose = True
303
304		rest = len(item)
305		if i != length - 1 and rest:
306		_next = item[rest-1] == '\n'
307		if not loose:
308		loose = _next
309
310		if loose:
311		t = 'loose_item_start'
312		else:
313		t = 'list_item_start'
314
315		self.tokens.append({'type': t})
316		# recurse
317		self.parse(item, self.list_rules)
318		self.tokens.append({'type': 'list_item_end'})
319
320		def parse_block_quote(self, m):
321		self.tokens.append({'type': 'block_quote_start'})
322		# clean leading >
323		cap = _block_quote_leading_pattern.sub('', m.group(0))
324		self.parse(cap)
325		self.tokens.append({'type': 'block_quote_end'})
326
327		def parse_def_links(self, m):
328		key = _keyify(m.group(1))
329		self.def_links[key] = {
330		'link': m.group(2),
331		'title': m.group(3),
332		}
333
334		def parse_def_footnotes(self, m):
335		key = _keyify(m.group(1))
336		if key in self.def_footnotes:
337		# footnote is already defined
338		return
339
340		self.def_footnotes[key] = 0
341
342		self.tokens.append({
343		'type': 'footnote_start',
344		'key': key,
345		})
346
347		text = m.group(2)
348
349		if '\n' in text:
350		lines = text.split('\n')
351		whitespace = None
352		for line in lines[1:]:
353		space = len(line) - len(line.lstrip())
354		if space and (not whitespace or space < whitespace):
355		whitespace = space
356		newlines = [lines[0]]
357		for line in lines[1:]:
358		newlines.append(line[whitespace:])
359		text = '\n'.join(newlines)
360
361		self.parse(text, self.footnote_rules)
362
363		self.tokens.append({
364		'type': 'footnote_end',
365		'key': key,
366		})
367
368		def parse_table(self, m):
369		item = self._process_table(m)
370
371		cells = re.sub(r'(?: \\| )?\n$', '', m.group(3))
372		cells = cells.split('\n')
373		for i, v in enumerate(cells):
374		v = re.sub(r'^ \\| \| \\| $', '', v)
375		cells[i] = re.split(r' \\| ', v)
376
377		item['cells'] = cells
378		self.tokens.append(item)
379
380		def parse_nptable(self, m):
381		item = self._process_table(m)
382
383		cells = re.sub(r'\n$', '', m.group(3))
384		cells = cells.split('\n')
385		for i, v in enumerate(cells):
386		cells[i] = re.split(r' \\| ', v)
387
388		item['cells'] = cells
389		self.tokens.append(item)
390
391		def _process_table(self, m):
392		header = re.sub(r'^ \| \\| *$', '', m.group(1))
393		header = re.split(r' \\| ', header)
394		align = re.sub(r' \|\\| $', '', m.group(2))
395		align = re.split(r' \\| ', align)
396
397		for i, v in enumerate(align):
398		if re.search(r'^ -+: $', v):
399		align[i] = 'right'
400		elif re.search(r'^ :-+: $', v):
401		align[i] = 'center'
402		elif re.search(r'^ :-+ $', v):
403		align[i] = 'left'
404		else:
405		align[i] = None
406
407		item = {
408		'type': 'table',
409		'header': header,
410		'align': align,
411		}
412		return item
413
414		def parse_block_html(self, m):
415		tag = m.group(1)
416		if not tag:
417		text = m.group(0)
418		self.tokens.append({
419		'type': 'close_html',
420		'text': text
421		})
422		else:
423		attr = m.group(2)
424		text = m.group(3)
425		self.tokens.append({
426		'type': 'open_html',
427		'tag': tag,
428		'extra': attr,
429		'text': text
430		})

MikeCoder / markdown-preview.vim

Code Duplication Length = 268-268 lines in 2 locations

pythonx/markdown_parser.py 1 location

pythonx/tests/markdown_parser.py 1 location