Code Duplication    Length = 2-2 lines in 4 locations

tests/data.py 4 locations

@@ 92-93 (lines=2) @@
89
    return {'parse': '(ROOT\n  (SBARQ\n    (WHNP (WP What))\n    (SQ (VBZ is)\n      (NP\n        (NP (DT the) (JJS highest) (NN mountain))\n        (PP (IN of)\n          (NP (NNP Tanzania)))))\n    (. ?)))', 'basicDependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'is', 'dependentGloss': 'What', 'dependent': 1}, {'governor': 5, 'dep': 'det', 'governorGloss': 'mountain', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 5, 'dep': 'amod', 'governorGloss': 'mountain', 'dependentGloss': 'highest', 'dependent': 4}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'mountain', 'dependent': 5}, {'governor': 7, 'dep': 'case', 'governorGloss': 'Tanzania', 'dependentGloss': 'of', 'dependent': 6}, {'governor': 5, 'dep': 'nmod', 'governorGloss': 'mountain', 'dependentGloss': 'Tanzania', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}], 'collapsed-ccprocessed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'is', 'dependentGloss': 'What', 'dependent': 1}, {'governor': 5, 'dep': 'det', 'governorGloss': 'mountain', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 5, 'dep': 'amod', 'governorGloss': 'mountain', 'dependentGloss': 'highest', 'dependent': 4}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'mountain', 'dependent': 5}, {'governor': 7, 'dep': 'case', 'governorGloss': 'Tanzania', 'dependentGloss': 'of', 'dependent': 6}, {'governor': 5, 'dep': 'nmod:of', 'governorGloss': 'mountain', 'dependentGloss': 'Tanzania', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}], 'tokens': [{'originalText': 'What', 'characterOffsetEnd': 4, 'pos': 'WP', 'characterOffsetBegin': 0, 'index': 1, 'after': ' ', 'before': '', 'lemma': 'what', 'word': 'What', 'ner': 'O'}, {'originalText': 'is', 'characterOffsetEnd': 7, 'pos': 'VBZ', 'characterOffsetBegin': 5, 'index': 2, 'after': ' ', 'before': ' ', 'lemma': 'be', 'word': 'is', 'ner': 'O'}, {'originalText': 'the', 'characterOffsetEnd': 11, 'pos': 'DT', 'characterOffsetBegin': 8, 'index': 3, 'after': ' ', 'before': ' ', 'lemma': 'the', 'word': 'the', 'ner': 'O'}, {'originalText': 'highest', 'characterOffsetEnd': 19, 'pos': 'JJS', 'characterOffsetBegin': 12, 'index': 4, 'after': ' ', 'before': ' ', 'lemma': 'highest', 'word': 'highest', 'ner': 'O'}, {'originalText': 'mountain', 'characterOffsetEnd': 28, 'pos': 'NN', 'characterOffsetBegin': 20, 'index': 5, 'after': ' ', 'before': ' ', 'lemma': 'mountain', 'word': 'mountain', 'ner': 'O'}, {'originalText': 'of', 'characterOffsetEnd': 31, 'pos': 'IN', 'characterOffsetBegin': 29, 'index': 6, 'after': ' ', 'before': ' ', 'lemma': 'of', 'word': 'of', 'ner': 'O'}, {'originalText': 'Tanzania', 'characterOffsetEnd': 40, 'pos': 'NNP', 'characterOffsetBegin': 32, 'index': 7, 'after': '', 'before': ' ', 'lemma': 'Tanzania', 'word': 'Tanzania', 'ner': 'LOCATION'}, {'originalText': '?', 'characterOffsetEnd': 41, 'pos': '.', 'characterOffsetBegin': 40, 'index': 8, 'after': '', 'before': '', 'lemma': '?', 'word': '?', 'ner': 'O'}], 'text': 'What is the highest mountain of Tanzania?', 'index': 0, 'collapsed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'is', 'dependentGloss': 'What', 'dependent': 1}, {'governor': 5, 'dep': 'det', 'governorGloss': 'mountain', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 5, 'dep': 'amod', 'governorGloss': 'mountain', 'dependentGloss': 'highest', 'dependent': 4}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'mountain', 'dependent': 5}, {'governor': 7, 'dep': 'case', 'governorGloss': 'Tanzania', 'dependentGloss': 'of', 'dependent': 6}, {'governor': 5, 'dep': 'nmod:of', 'governorGloss': 'mountain', 'dependentGloss': 'Tanzania', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}]}
90
91
# Parsing result of "When is the birthday of Mickey Mouse?"
92
def mickey():
93
    return {'parse': '(ROOT\n  (SBARQ\n    (WHADVP (WRB When))\n    (SQ (VBZ is)\n      (NP\n        (NP (DT the) (NN birthday))\n        (PP (IN of)\n          (NP (NNP Mickey) (NNP Mouse)))))\n    (. ?)))', 'basicDependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'advmod', 'governorGloss': 'is', 'dependentGloss': 'When', 'dependent': 1}, {'governor': 4, 'dep': 'det', 'governorGloss': 'birthday', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'birthday', 'dependent': 4}, {'governor': 7, 'dep': 'case', 'governorGloss': 'Mouse', 'dependentGloss': 'of', 'dependent': 5}, {'governor': 7, 'dep': 'compound', 'governorGloss': 'Mouse', 'dependentGloss': 'Mickey', 'dependent': 6}, {'governor': 4, 'dep': 'nmod', 'governorGloss': 'birthday', 'dependentGloss': 'Mouse', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}], 'collapsed-ccprocessed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'advmod', 'governorGloss': 'is', 'dependentGloss': 'When', 'dependent': 1}, {'governor': 4, 'dep': 'det', 'governorGloss': 'birthday', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'birthday', 'dependent': 4}, {'governor': 7, 'dep': 'case', 'governorGloss': 'Mouse', 'dependentGloss': 'of', 'dependent': 5}, {'governor': 7, 'dep': 'compound', 'governorGloss': 'Mouse', 'dependentGloss': 'Mickey', 'dependent': 6}, {'governor': 4, 'dep': 'nmod:of', 'governorGloss': 'birthday', 'dependentGloss': 'Mouse', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}], 'tokens': [{'originalText': 'When', 'characterOffsetEnd': 4, 'pos': 'WRB', 'characterOffsetBegin': 0, 'index': 1, 'after': ' ', 'before': '', 'lemma': 'when', 'word': 'When', 'ner': 'O'}, {'originalText': 'is', 'characterOffsetEnd': 7, 'pos': 'VBZ', 'characterOffsetBegin': 5, 'index': 2, 'after': ' ', 'before': ' ', 'lemma': 'be', 'word': 'is', 'ner': 'O'}, {'originalText': 'the', 'characterOffsetEnd': 11, 'pos': 'DT', 'characterOffsetBegin': 8, 'index': 3, 'after': ' ', 'before': ' ', 'lemma': 'the', 'word': 'the', 'ner': 'O'}, {'originalText': 'birthday', 'characterOffsetEnd': 20, 'pos': 'NN', 'characterOffsetBegin': 12, 'index': 4, 'after': ' ', 'before': ' ', 'lemma': 'birthday', 'word': 'birthday', 'ner': 'O'}, {'originalText': 'of', 'characterOffsetEnd': 23, 'pos': 'IN', 'characterOffsetBegin': 21, 'index': 5, 'after': ' ', 'before': ' ', 'lemma': 'of', 'word': 'of', 'ner': 'O'}, {'originalText': 'Mickey', 'characterOffsetEnd': 30, 'pos': 'NNP', 'characterOffsetBegin': 24, 'index': 6, 'after': ' ', 'before': ' ', 'lemma': 'Mickey', 'word': 'Mickey', 'ner': 'PERSON'}, {'originalText': 'Mouse', 'characterOffsetEnd': 36, 'pos': 'NNP', 'characterOffsetBegin': 31, 'index': 7, 'after': '', 'before': ' ', 'lemma': 'Mouse', 'word': 'Mouse', 'ner': 'PERSON'}, {'originalText': '?', 'characterOffsetEnd': 37, 'pos': '.', 'characterOffsetBegin': 36, 'index': 8, 'after': '', 'before': '', 'lemma': '?', 'word': '?', 'ner': 'O'}], 'text': 'When is the birthday of Mickey Mouse?', 'index': 0, 'collapsed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'advmod', 'governorGloss': 'is', 'dependentGloss': 'When', 'dependent': 1}, {'governor': 4, 'dep': 'det', 'governorGloss': 'birthday', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'birthday', 'dependent': 4}, {'governor': 7, 'dep': 'case', 'governorGloss': 'Mouse', 'dependentGloss': 'of', 'dependent': 5}, {'governor': 7, 'dep': 'compound', 'governorGloss': 'Mouse', 'dependentGloss': 'Mickey', 'dependent': 6}, {'governor': 4, 'dep': 'nmod:of', 'governorGloss': 'birthday', 'dependentGloss': 'Mouse', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}]}
94
95
# Parsing result of "What is black and white?"
96
def black():
@@ 88-89 (lines=2) @@
85
    return {'parse': '(ROOT\n  (SBARQ\n    (WHADVP (WRB Where))\n    (SQ (VBZ is)\n      (NP (DT the) (NN mistake)\n        (NP (DT the) (NN mistake))))\n    (. ?)))', 'basicDependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'advmod', 'governorGloss': 'is', 'dependentGloss': 'Where', 'dependent': 1}, {'governor': 4, 'dep': 'det', 'governorGloss': 'mistake', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'mistake', 'dependent': 4}, {'governor': 6, 'dep': 'det', 'governorGloss': 'mistake', 'dependentGloss': 'the', 'dependent': 5}, {'governor': 4, 'dep': 'dep', 'governorGloss': 'mistake', 'dependentGloss': 'mistake', 'dependent': 6}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 7}], 'collapsed-ccprocessed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'advmod', 'governorGloss': 'is', 'dependentGloss': 'Where', 'dependent': 1}, {'governor': 4, 'dep': 'det', 'governorGloss': 'mistake', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'mistake', 'dependent': 4}, {'governor': 6, 'dep': 'det', 'governorGloss': 'mistake', 'dependentGloss': 'the', 'dependent': 5}, {'governor': 4, 'dep': 'dep', 'governorGloss': 'mistake', 'dependentGloss': 'mistake', 'dependent': 6}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 7}], 'tokens': [{'originalText': 'Where', 'characterOffsetEnd': 5, 'pos': 'WRB', 'characterOffsetBegin': 0, 'index': 1, 'after': ' ', 'before': '', 'lemma': 'where', 'word': 'Where', 'ner': 'O'}, {'originalText': 'is', 'characterOffsetEnd': 8, 'pos': 'VBZ', 'characterOffsetBegin': 6, 'index': 2, 'after': ' ', 'before': ' ', 'lemma': 'be', 'word': 'is', 'ner': 'O'}, {'originalText': 'the', 'characterOffsetEnd': 12, 'pos': 'DT', 'characterOffsetBegin': 9, 'index': 3, 'after': ' ', 'before': ' ', 'lemma': 'the', 'word': 'the', 'ner': 'O'}, {'originalText': 'mistake', 'characterOffsetEnd': 20, 'pos': 'NN', 'characterOffsetBegin': 13, 'index': 4, 'after': ' ', 'before': ' ', 'lemma': 'mistake', 'word': 'mistake', 'ner': 'O'}, {'originalText': 'the', 'characterOffsetEnd': 24, 'pos': 'DT', 'characterOffsetBegin': 21, 'index': 5, 'after': ' ', 'before': ' ', 'lemma': 'the', 'word': 'the', 'ner': 'O'}, {'originalText': 'mistake', 'characterOffsetEnd': 32, 'pos': 'NN', 'characterOffsetBegin': 25, 'index': 6, 'after': '', 'before': ' ', 'lemma': 'mistake', 'word': 'mistake', 'ner': 'O'}, {'originalText': '?', 'characterOffsetEnd': 33, 'pos': '.', 'characterOffsetBegin': 32, 'index': 7, 'after': '', 'before': '', 'lemma': '?', 'word': '?', 'ner': 'O'}], 'text': 'Where is the mistake the mistake?', 'index': 0, 'collapsed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'advmod', 'governorGloss': 'is', 'dependentGloss': 'Where', 'dependent': 1}, {'governor': 4, 'dep': 'det', 'governorGloss': 'mistake', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'mistake', 'dependent': 4}, {'governor': 6, 'dep': 'det', 'governorGloss': 'mistake', 'dependentGloss': 'the', 'dependent': 5}, {'governor': 4, 'dep': 'dep', 'governorGloss': 'mistake', 'dependentGloss': 'mistake', 'dependent': 6}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 7}]}
86
87
# Parsing result of "What is the highest mountain of Tanzania?"
88
def tanzania():
89
    return {'parse': '(ROOT\n  (SBARQ\n    (WHNP (WP What))\n    (SQ (VBZ is)\n      (NP\n        (NP (DT the) (JJS highest) (NN mountain))\n        (PP (IN of)\n          (NP (NNP Tanzania)))))\n    (. ?)))', 'basicDependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'is', 'dependentGloss': 'What', 'dependent': 1}, {'governor': 5, 'dep': 'det', 'governorGloss': 'mountain', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 5, 'dep': 'amod', 'governorGloss': 'mountain', 'dependentGloss': 'highest', 'dependent': 4}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'mountain', 'dependent': 5}, {'governor': 7, 'dep': 'case', 'governorGloss': 'Tanzania', 'dependentGloss': 'of', 'dependent': 6}, {'governor': 5, 'dep': 'nmod', 'governorGloss': 'mountain', 'dependentGloss': 'Tanzania', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}], 'collapsed-ccprocessed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'is', 'dependentGloss': 'What', 'dependent': 1}, {'governor': 5, 'dep': 'det', 'governorGloss': 'mountain', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 5, 'dep': 'amod', 'governorGloss': 'mountain', 'dependentGloss': 'highest', 'dependent': 4}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'mountain', 'dependent': 5}, {'governor': 7, 'dep': 'case', 'governorGloss': 'Tanzania', 'dependentGloss': 'of', 'dependent': 6}, {'governor': 5, 'dep': 'nmod:of', 'governorGloss': 'mountain', 'dependentGloss': 'Tanzania', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}], 'tokens': [{'originalText': 'What', 'characterOffsetEnd': 4, 'pos': 'WP', 'characterOffsetBegin': 0, 'index': 1, 'after': ' ', 'before': '', 'lemma': 'what', 'word': 'What', 'ner': 'O'}, {'originalText': 'is', 'characterOffsetEnd': 7, 'pos': 'VBZ', 'characterOffsetBegin': 5, 'index': 2, 'after': ' ', 'before': ' ', 'lemma': 'be', 'word': 'is', 'ner': 'O'}, {'originalText': 'the', 'characterOffsetEnd': 11, 'pos': 'DT', 'characterOffsetBegin': 8, 'index': 3, 'after': ' ', 'before': ' ', 'lemma': 'the', 'word': 'the', 'ner': 'O'}, {'originalText': 'highest', 'characterOffsetEnd': 19, 'pos': 'JJS', 'characterOffsetBegin': 12, 'index': 4, 'after': ' ', 'before': ' ', 'lemma': 'highest', 'word': 'highest', 'ner': 'O'}, {'originalText': 'mountain', 'characterOffsetEnd': 28, 'pos': 'NN', 'characterOffsetBegin': 20, 'index': 5, 'after': ' ', 'before': ' ', 'lemma': 'mountain', 'word': 'mountain', 'ner': 'O'}, {'originalText': 'of', 'characterOffsetEnd': 31, 'pos': 'IN', 'characterOffsetBegin': 29, 'index': 6, 'after': ' ', 'before': ' ', 'lemma': 'of', 'word': 'of', 'ner': 'O'}, {'originalText': 'Tanzania', 'characterOffsetEnd': 40, 'pos': 'NNP', 'characterOffsetBegin': 32, 'index': 7, 'after': '', 'before': ' ', 'lemma': 'Tanzania', 'word': 'Tanzania', 'ner': 'LOCATION'}, {'originalText': '?', 'characterOffsetEnd': 41, 'pos': '.', 'characterOffsetBegin': 40, 'index': 8, 'after': '', 'before': '', 'lemma': '?', 'word': '?', 'ner': 'O'}], 'text': 'What is the highest mountain of Tanzania?', 'index': 0, 'collapsed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'is', 'dependentGloss': 'What', 'dependent': 1}, {'governor': 5, 'dep': 'det', 'governorGloss': 'mountain', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 5, 'dep': 'amod', 'governorGloss': 'mountain', 'dependentGloss': 'highest', 'dependent': 4}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'mountain', 'dependent': 5}, {'governor': 7, 'dep': 'case', 'governorGloss': 'Tanzania', 'dependentGloss': 'of', 'dependent': 6}, {'governor': 5, 'dep': 'nmod:of', 'governorGloss': 'mountain', 'dependentGloss': 'Tanzania', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}]}
90
91
# Parsing result of "When is the birthday of Mickey Mouse?"
92
def mickey():
@@ 68-69 (lines=2) @@
65
    return {'parse': '(ROOT\n  (SBARQ\n    (WHNP (WP What))\n    (SQ (VBD was)\n      (NP (DT the) (JJ first) (NNP Gilbert)\n        (CC and)\n        (NNP Sullivan) (NN opera)))\n    (. ?)))', 'basicDependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'was', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'was', 'dependentGloss': 'What', 'dependent': 1}, {'governor': 5, 'dep': 'det', 'governorGloss': 'Gilbert', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 5, 'dep': 'amod', 'governorGloss': 'Gilbert', 'dependentGloss': 'first', 'dependent': 4}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'was', 'dependentGloss': 'Gilbert', 'dependent': 5}, {'governor': 5, 'dep': 'cc', 'governorGloss': 'Gilbert', 'dependentGloss': 'and', 'dependent': 6}, {'governor': 8, 'dep': 'compound', 'governorGloss': 'opera', 'dependentGloss': 'Sullivan', 'dependent': 7}, {'governor': 5, 'dep': 'conj', 'governorGloss': 'Gilbert', 'dependentGloss': 'opera', 'dependent': 8}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'was', 'dependentGloss': '?', 'dependent': 9}], 'collapsed-ccprocessed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'was', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'was', 'dependentGloss': 'What', 'dependent': 1}, {'governor': 5, 'dep': 'det', 'governorGloss': 'Gilbert', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 5, 'dep': 'amod', 'governorGloss': 'Gilbert', 'dependentGloss': 'first', 'dependent': 4}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'was', 'dependentGloss': 'Gilbert', 'dependent': 5}, {'governor': 5, 'dep': 'cc', 'governorGloss': 'Gilbert', 'dependentGloss': 'and', 'dependent': 6}, {'governor': 8, 'dep': 'compound', 'governorGloss': 'opera', 'dependentGloss': 'Sullivan', 'dependent': 7}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'was', 'dependentGloss': 'opera', 'dependent': 8}, {'governor': 5, 'dep': 'conj:and', 'governorGloss': 'Gilbert', 'dependentGloss': 'opera', 'dependent': 8}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'was', 'dependentGloss': '?', 'dependent': 9}], 'tokens': [{'originalText': 'What', 'characterOffsetEnd': 4, 'pos': 'WP', 'characterOffsetBegin': 0, 'index': 1, 'after': ' ', 'before': '', 'lemma': 'what', 'word': 'What', 'ner': 'O'}, {'originalText': 'was', 'characterOffsetEnd': 8, 'pos': 'VBD', 'characterOffsetBegin': 5, 'index': 2, 'after': ' ', 'before': ' ', 'lemma': 'be', 'word': 'was', 'ner': 'O'}, {'originalText': 'the', 'characterOffsetEnd': 12, 'pos': 'DT', 'characterOffsetBegin': 9, 'index': 3, 'after': ' ', 'before': ' ', 'lemma': 'the', 'word': 'the', 'ner': 'O'}, {'originalText': 'first', 'characterOffsetEnd': 18, 'pos': 'JJ', 'characterOffsetBegin': 13, 'index': 4, 'normalizedNER': '1.0', 'before': ' ', 'after': ' ', 'lemma': 'first', 'word': 'first', 'ner': 'ORDINAL'}, {'originalText': 'Gilbert', 'characterOffsetEnd': 26, 'pos': 'NNP', 'characterOffsetBegin': 19, 'index': 5, 'after': ' ', 'before': ' ', 'lemma': 'Gilbert', 'word': 'Gilbert', 'ner': 'PERSON'}, {'originalText': 'and', 'characterOffsetEnd': 30, 'pos': 'CC', 'characterOffsetBegin': 27, 'index': 6, 'after': ' ', 'before': ' ', 'lemma': 'and', 'word': 'and', 'ner': 'O'}, {'originalText': 'Sullivan', 'characterOffsetEnd': 39, 'pos': 'NNP', 'characterOffsetBegin': 31, 'index': 7, 'after': ' ', 'before': ' ', 'lemma': 'Sullivan', 'word': 'Sullivan', 'ner': 'PERSON'}, {'originalText': 'opera', 'characterOffsetEnd': 45, 'pos': 'NN', 'characterOffsetBegin': 40, 'index': 8, 'after': '', 'before': ' ', 'lemma': 'opera', 'word': 'opera', 'ner': 'O'}, {'originalText': '?', 'characterOffsetEnd': 46, 'pos': '.', 'characterOffsetBegin': 45, 'index': 9, 'after': '', 'before': '', 'lemma': '?', 'word': '?', 'ner': 'O'}], 'text': 'What was the first Gilbert and Sullivan opera?', 'index': 0, 'collapsed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'was', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'was', 'dependentGloss': 'What', 'dependent': 1}, {'governor': 5, 'dep': 'det', 'governorGloss': 'Gilbert', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 5, 'dep': 'amod', 'governorGloss': 'Gilbert', 'dependentGloss': 'first', 'dependent': 4}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'was', 'dependentGloss': 'Gilbert', 'dependent': 5}, {'governor': 5, 'dep': 'cc', 'governorGloss': 'Gilbert', 'dependentGloss': 'and', 'dependent': 6}, {'governor': 8, 'dep': 'compound', 'governorGloss': 'opera', 'dependentGloss': 'Sullivan', 'dependent': 7}, {'governor': 5, 'dep': 'conj:and', 'governorGloss': 'Gilbert', 'dependentGloss': 'opera', 'dependent': 8}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'was', 'dependentGloss': '?', 'dependent': 9}]}
66
67
# Parsing result of "Who is the chief and prime minister?"
68
def give_chief():
69
    return {'parse': '(ROOT\n  (SBARQ\n    (WHNP (WP Who))\n    (SQ (VBZ is)\n      (NP\n        (NP (DT the) (NN chief))\n        (CC and)\n        (NP (JJ prime) (NN minister))))\n    (. ?)))', 'basicDependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'is', 'dependentGloss': 'Who', 'dependent': 1}, {'governor': 4, 'dep': 'det', 'governorGloss': 'chief', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'chief', 'dependent': 4}, {'governor': 4, 'dep': 'cc', 'governorGloss': 'chief', 'dependentGloss': 'and', 'dependent': 5}, {'governor': 7, 'dep': 'amod', 'governorGloss': 'minister', 'dependentGloss': 'prime', 'dependent': 6}, {'governor': 4, 'dep': 'conj', 'governorGloss': 'chief', 'dependentGloss': 'minister', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}], 'collapsed-ccprocessed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'is', 'dependentGloss': 'Who', 'dependent': 1}, {'governor': 4, 'dep': 'det', 'governorGloss': 'chief', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'chief', 'dependent': 4}, {'governor': 4, 'dep': 'cc', 'governorGloss': 'chief', 'dependentGloss': 'and', 'dependent': 5}, {'governor': 7, 'dep': 'amod', 'governorGloss': 'minister', 'dependentGloss': 'prime', 'dependent': 6}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'minister', 'dependent': 7}, {'governor': 4, 'dep': 'conj:and', 'governorGloss': 'chief', 'dependentGloss': 'minister', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}], 'tokens': [{'originalText': 'Who', 'characterOffsetEnd': 3, 'pos': 'WP', 'characterOffsetBegin': 0, 'index': 1, 'after': ' ', 'before': '', 'lemma': 'who', 'word': 'Who', 'ner': 'O'}, {'originalText': 'is', 'characterOffsetEnd': 6, 'pos': 'VBZ', 'characterOffsetBegin': 4, 'index': 2, 'after': ' ', 'before': ' ', 'lemma': 'be', 'word': 'is', 'ner': 'O'}, {'originalText': 'the', 'characterOffsetEnd': 10, 'pos': 'DT', 'characterOffsetBegin': 7, 'index': 3, 'after': ' ', 'before': ' ', 'lemma': 'the', 'word': 'the', 'ner': 'O'}, {'originalText': 'chief', 'characterOffsetEnd': 16, 'pos': 'NN', 'characterOffsetBegin': 11, 'index': 4, 'after': ' ', 'before': ' ', 'lemma': 'chief', 'word': 'chief', 'ner': 'O'}, {'originalText': 'and', 'characterOffsetEnd': 20, 'pos': 'CC', 'characterOffsetBegin': 17, 'index': 5, 'after': ' ', 'before': ' ', 'lemma': 'and', 'word': 'and', 'ner': 'O'}, {'originalText': 'prime', 'characterOffsetEnd': 26, 'pos': 'JJ', 'characterOffsetBegin': 21, 'index': 6, 'after': ' ', 'before': ' ', 'lemma': 'prime', 'word': 'prime', 'ner': 'O'}, {'originalText': 'minister', 'characterOffsetEnd': 35, 'pos': 'NN', 'characterOffsetBegin': 27, 'index': 7, 'after': '', 'before': ' ', 'lemma': 'minister', 'word': 'minister', 'ner': 'O'}, {'originalText': '?', 'characterOffsetEnd': 36, 'pos': '.', 'characterOffsetBegin': 35, 'index': 8, 'after': '', 'before': '', 'lemma': '?', 'word': '?', 'ner': 'O'}], 'text': 'Who is the chief and prime minister?', 'index': 0, 'collapsed-dependencies': [{'governor': 0, 'dep': 'ROOT', 'governorGloss': 'ROOT', 'dependentGloss': 'is', 'dependent': 2}, {'governor': 2, 'dep': 'dobj', 'governorGloss': 'is', 'dependentGloss': 'Who', 'dependent': 1}, {'governor': 4, 'dep': 'det', 'governorGloss': 'chief', 'dependentGloss': 'the', 'dependent': 3}, {'governor': 2, 'dep': 'nsubj', 'governorGloss': 'is', 'dependentGloss': 'chief', 'dependent': 4}, {'governor': 4, 'dep': 'cc', 'governorGloss': 'chief', 'dependentGloss': 'and', 'dependent': 5}, {'governor': 7, 'dep': 'amod', 'governorGloss': 'minister', 'dependentGloss': 'prime', 'dependent': 6}, {'governor': 4, 'dep': 'conj:and', 'governorGloss': 'chief', 'dependentGloss': 'minister', 'dependent': 7}, {'governor': 2, 'dep': 'punct', 'governorGloss': 'is', 'dependentGloss': '?', 'dependent': 8}]}
70
71
# Parsing result of "Is born in 1900"
72
def give_born():
@@ 4-5 (lines=2) @@
1
from ppp_questionparsing_grammatical import computeTree, simplify, DependenciesTree, normalFormProduction
2
3
# Parsing result of "John Smith lives in the United Kingdom."
4
def give_john_smith():
5
    return {'collapsed-dependencies': [{'dependent': 3, 'governor': 0, 'governorGloss': 'ROOT', 'dependentGloss': 'lives', 'dep': 'ROOT'}, {'dependent': 1, 'governor': 2, 'governorGloss': 'Smith', 'dependentGloss': 'John', 'dep': 'compound'}, {'dependent': 2, 'governor': 3, 'governorGloss': 'lives', 'dependentGloss': 'Smith', 'dep': 'nsubj'}, {'dependent': 4, 'governor': 7, 'governorGloss': 'Kingdom', 'dependentGloss': 'in', 'dep': 'case'}, {'dependent': 5, 'governor': 7, 'governorGloss': 'Kingdom', 'dependentGloss': 'the', 'dep': 'det'}, {'dependent': 6, 'governor': 7, 'governorGloss': 'Kingdom', 'dependentGloss': 'United', 'dep': 'compound'}, {'dependent': 7, 'governor': 3, 'governorGloss': 'lives', 'dependentGloss': 'Kingdom', 'dep': 'nmod:in'}, {'dependent': 8, 'governor': 3, 'governorGloss': 'lives', 'dependentGloss': '.', 'dep': 'punct'}], 'basicDependencies': [{'dependent': 3, 'governor': 0, 'governorGloss': 'ROOT', 'dependentGloss': 'lives', 'dep': 'ROOT'}, {'dependent': 1, 'governor': 2, 'governorGloss': 'Smith', 'dependentGloss': 'John', 'dep': 'compound'}, {'dependent': 2, 'governor': 3, 'governorGloss': 'lives', 'dependentGloss': 'Smith', 'dep': 'nsubj'}, {'dependent': 4, 'governor': 7, 'governorGloss': 'Kingdom', 'dependentGloss': 'in', 'dep': 'case'}, {'dependent': 5, 'governor': 7, 'governorGloss': 'Kingdom', 'dependentGloss': 'the', 'dep': 'det'}, {'dependent': 6, 'governor': 7, 'governorGloss': 'Kingdom', 'dependentGloss': 'United', 'dep': 'compound'}, {'dependent': 7, 'governor': 3, 'governorGloss': 'lives', 'dependentGloss': 'Kingdom', 'dep': 'nmod'}, {'dependent': 8, 'governor': 3, 'governorGloss': 'lives', 'dependentGloss': '.', 'dep': 'punct'}], 'collapsed-ccprocessed-dependencies': [{'dependent': 3, 'governor': 0, 'governorGloss': 'ROOT', 'dependentGloss': 'lives', 'dep': 'ROOT'}, {'dependent': 1, 'governor': 2, 'governorGloss': 'Smith', 'dependentGloss': 'John', 'dep': 'compound'}, {'dependent': 2, 'governor': 3, 'governorGloss': 'lives', 'dependentGloss': 'Smith', 'dep': 'nsubj'}, {'dependent': 4, 'governor': 7, 'governorGloss': 'Kingdom', 'dependentGloss': 'in', 'dep': 'case'}, {'dependent': 5, 'governor': 7, 'governorGloss': 'Kingdom', 'dependentGloss': 'the', 'dep': 'det'}, {'dependent': 6, 'governor': 7, 'governorGloss': 'Kingdom', 'dependentGloss': 'United', 'dep': 'compound'}, {'dependent': 7, 'governor': 3, 'governorGloss': 'lives', 'dependentGloss': 'Kingdom', 'dep': 'nmod:in'}, {'dependent': 8, 'governor': 3, 'governorGloss': 'lives', 'dependentGloss': '.', 'dep': 'punct'}], 'parse': '(ROOT\n  (S\n    (NP (NNP John) (NNP Smith))\n    (VP (VBZ lives)\n      (PP (IN in)\n        (NP (DT the) (NNP United) (NNP Kingdom))))\n    (. .)))', 'index': 0, 'text': 'John Smith lives in the United Kingdom.', 'tokens': [{'after': ' ', 'ner': 'PERSON', 'characterOffsetBegin': 0, 'lemma': 'John', 'word': 'John', 'before': '', 'characterOffsetEnd': 4, 'originalText': 'John', 'index': 1, 'pos': 'NNP'}, {'after': ' ', 'ner': 'PERSON', 'characterOffsetBegin': 5, 'lemma': 'Smith', 'word': 'Smith', 'before': ' ', 'characterOffsetEnd': 10, 'originalText': 'Smith', 'index': 2, 'pos': 'NNP'}, {'after': ' ', 'ner': 'O', 'characterOffsetBegin': 11, 'lemma': 'live', 'word': 'lives', 'before': ' ', 'characterOffsetEnd': 16, 'originalText': 'lives', 'index': 3, 'pos': 'VBZ'}, {'after': ' ', 'ner': 'O', 'characterOffsetBegin': 17, 'lemma': 'in', 'word': 'in', 'before': ' ', 'characterOffsetEnd': 19, 'originalText': 'in', 'index': 4, 'pos': 'IN'}, {'after': ' ', 'ner': 'O', 'characterOffsetBegin': 20, 'lemma': 'the', 'word': 'the', 'before': ' ', 'characterOffsetEnd': 23, 'originalText': 'the', 'index': 5, 'pos': 'DT'}, {'after': ' ', 'ner': 'LOCATION', 'characterOffsetBegin': 24, 'lemma': 'United', 'word': 'United', 'before': ' ', 'characterOffsetEnd': 30, 'originalText': 'United', 'index': 6, 'pos': 'NNP'}, {'after': '', 'ner': 'LOCATION', 'characterOffsetBegin': 31, 'lemma': 'Kingdom', 'word': 'Kingdom', 'before': ' ', 'characterOffsetEnd': 38, 'originalText': 'Kingdom', 'index': 7, 'pos': 'NNP'}, {'after': '', 'ner': 'O', 'characterOffsetBegin': 38, 'lemma': '.', 'word': '.', 'before': '', 'characterOffsetEnd': 39, 'originalText': '.', 'index': 8, 'pos': '.'}]}
6
7
# Dot representation of the tree for "John Smith lives in the United Kingdom."
8
def give_john_smith_string():