Code Duplication - chrislit/abydos - Measure and Improve Code Quality continuously with Scrutinizer

Code Duplication Length = 13-15 lines in 2 locations

tests/test_phonetic.py 2 locations


        # etc. (for code coverage)
        self.assertEqual(bmpm('van Damme', name_mode='sep'), 'dami mi dam m')

    def test_bmpm_nachnamen(self):
        """Test abydos.phonetic.bmpm (Nachnamen set)."""
        if not ALLOW_RANDOM:
            return
        with codecs.open(TESTDIR + '/corpora/nachnamen.bm.csv',
                         encoding='utf-8') as nachnamen_testset:
            next(nachnamen_testset)
            for nn_line in nachnamen_testset:
                nn_line = nn_line.strip().split(',')
                # This test set is very large (~10000 entries)
                # so let's just randomly select about 20 for testing
                if nn_line[0] != '#' and one_in(500):
                    self.assertEqual(bmpm(nn_line[0], language_arg='german'),
                                     nn_line[1])
                    self.assertEqual(bmpm(nn_line[0]), nn_line[2])

    def test_bmpm_nachnamen_cc(self):
        """Test abydos.phonetic.bmpm (Nachnamen set, corner cases)."""

                                     nn_line[1])
                    self.assertEqual(bmpm(nn_line[0]), nn_line[2])

    def test_bmpm_nachnamen_cc(self):
        """Test abydos.phonetic.bmpm (Nachnamen set, corner cases)."""
        with codecs.open(TESTDIR + '/corpora/nachnamen.bm.cc.csv',
                         encoding='utf-8') as nachnamen_testset:
            next(nachnamen_testset)
            for nn_line in nachnamen_testset:
                nn_line = nn_line.strip().split(',')
                # This test set is very large (~10000 entries)
                # so let's just randomly select about 20 for testing
                if nn_line[0] != '#':
                    self.assertEqual(bmpm(nn_line[0], language_arg='german'),
                                     nn_line[1])
                    self.assertEqual(bmpm(nn_line[0]), nn_line[2])

    def test_bmpm_uscensus2000(self):
        """Test abydos.phonetic.bmpm (US Census 2000 set)."""

		@@ 4802-4816 (lines=15) @@
4799		# etc. (for code coverage)
4800		self.assertEqual(bmpm('van Damme', name_mode='sep'), 'dami mi dam m')
4801
4802		def test_bmpm_nachnamen(self):
4803		"""Test abydos.phonetic.bmpm (Nachnamen set)."""
4804		if not ALLOW_RANDOM:
4805		return
4806		with codecs.open(TESTDIR + '/corpora/nachnamen.bm.csv',
4807		encoding='utf-8') as nachnamen_testset:
4808		next(nachnamen_testset)
4809		for nn_line in nachnamen_testset:
4810		nn_line = nn_line.strip().split(',')
4811		# This test set is very large (~10000 entries)
4812		# so let's just randomly select about 20 for testing
4813		if nn_line[0] != '#' and one_in(500):
4814		self.assertEqual(bmpm(nn_line[0], language_arg='german'),
4815		nn_line[1])
4816		self.assertEqual(bmpm(nn_line[0]), nn_line[2])
4817
4818		def test_bmpm_nachnamen_cc(self):
4819		"""Test abydos.phonetic.bmpm (Nachnamen set, corner cases)."""
		@@ 4818-4830 (lines=13) @@
4815		nn_line[1])
4816		self.assertEqual(bmpm(nn_line[0]), nn_line[2])
4817
4818		def test_bmpm_nachnamen_cc(self):
4819		"""Test abydos.phonetic.bmpm (Nachnamen set, corner cases)."""
4820		with codecs.open(TESTDIR + '/corpora/nachnamen.bm.cc.csv',
4821		encoding='utf-8') as nachnamen_testset:
4822		next(nachnamen_testset)
4823		for nn_line in nachnamen_testset:
4824		nn_line = nn_line.strip().split(',')
4825		# This test set is very large (~10000 entries)
4826		# so let's just randomly select about 20 for testing
4827		if nn_line[0] != '#':
4828		self.assertEqual(bmpm(nn_line[0], language_arg='german'),
4829		nn_line[1])
4830		self.assertEqual(bmpm(nn_line[0]), nn_line[2])
4831
4832		def test_bmpm_uscensus2000(self):
4833		"""Test abydos.phonetic.bmpm (US Census 2000 set)."""

chrislit / abydos

Code Duplication Length = 13-15 lines in 2 locations

tests/test_phonetic.py 2 locations