Code Duplication - chrislit/abydos - Measure and Improve Code Quality continuously with Scrutinizer

Code Duplication Length = 13-15 lines in 2 locations

tests/test_phonetic.py 2 locations


        # etc. (for code coverage)
        self.assertEqual(bmpm('van Damme', name_mode='sep'), 'dami mi dam m')

    def test_bmpm_nachnamen(self):
        """Test abydos.phonetic.bmpm (Nachnamen set)."""
        if not ALLOW_RANDOM:
            return
        with codecs.open(TESTDIR + '/corpora/nachnamen.bm.csv',
                         encoding='utf-8') as nachnamen_testset:
            next(nachnamen_testset)
            for nn_line in nachnamen_testset:
                nn_line = nn_line.strip().split(',')
                # This test set is very large (~10000 entries)
                # so let's just randomly select about 20 for testing
                if nn_line[0] != '#' and one_in(500):
                    self.assertEqual(bmpm(nn_line[0], language_arg='german'),
                                     nn_line[1])
                    self.assertEqual(bmpm(nn_line[0]), nn_line[2])

    def test_bmpm_nachnamen_cc(self):
        """Test abydos.phonetic.bmpm (Nachnamen set, corner cases)."""

                                     nn_line[1])
                    self.assertEqual(bmpm(nn_line[0]), nn_line[2])

    def test_bmpm_nachnamen_cc(self):
        """Test abydos.phonetic.bmpm (Nachnamen set, corner cases)."""
        with codecs.open(TESTDIR + '/corpora/nachnamen.bm.cc.csv',
                         encoding='utf-8') as nachnamen_testset:
            next(nachnamen_testset)
            for nn_line in nachnamen_testset:
                nn_line = nn_line.strip().split(',')
                # This test set is very large (~10000 entries)
                # so let's just randomly select about 20 for testing
                if nn_line[0] != '#':
                    self.assertEqual(bmpm(nn_line[0], language_arg='german'),
                                     nn_line[1])
                    self.assertEqual(bmpm(nn_line[0]), nn_line[2])

    def test_bmpm_uscensus2000(self):
        """Test abydos.phonetic.bmpm (US Census 2000 set)."""

		@@ 6775-6789 (lines=15) @@
6772		# etc. (for code coverage)
6773		self.assertEqual(bmpm('van Damme', name_mode='sep'), 'dami mi dam m')
6774
6775		def test_bmpm_nachnamen(self):
6776		"""Test abydos.phonetic.bmpm (Nachnamen set)."""
6777		if not ALLOW_RANDOM:
6778		return
6779		with codecs.open(TESTDIR + '/corpora/nachnamen.bm.csv',
6780		encoding='utf-8') as nachnamen_testset:
6781		next(nachnamen_testset)
6782		for nn_line in nachnamen_testset:
6783		nn_line = nn_line.strip().split(',')
6784		# This test set is very large (~10000 entries)
6785		# so let's just randomly select about 20 for testing
6786		if nn_line[0] != '#' and one_in(500):
6787		self.assertEqual(bmpm(nn_line[0], language_arg='german'),
6788		nn_line[1])
6789		self.assertEqual(bmpm(nn_line[0]), nn_line[2])
6790
6791		def test_bmpm_nachnamen_cc(self):
6792		"""Test abydos.phonetic.bmpm (Nachnamen set, corner cases)."""
		@@ 6791-6803 (lines=13) @@
6788		nn_line[1])
6789		self.assertEqual(bmpm(nn_line[0]), nn_line[2])
6790
6791		def test_bmpm_nachnamen_cc(self):
6792		"""Test abydos.phonetic.bmpm (Nachnamen set, corner cases)."""
6793		with codecs.open(TESTDIR + '/corpora/nachnamen.bm.cc.csv',
6794		encoding='utf-8') as nachnamen_testset:
6795		next(nachnamen_testset)
6796		for nn_line in nachnamen_testset:
6797		nn_line = nn_line.strip().split(',')
6798		# This test set is very large (~10000 entries)
6799		# so let's just randomly select about 20 for testing
6800		if nn_line[0] != '#':
6801		self.assertEqual(bmpm(nn_line[0], language_arg='german'),
6802		nn_line[1])
6803		self.assertEqual(bmpm(nn_line[0]), nn_line[2])
6804
6805		def test_bmpm_uscensus2000(self):
6806		"""Test abydos.phonetic.bmpm (US Census 2000 set)."""

chrislit / abydos

Code Duplication Length = 13-15 lines in 2 locations

tests/test_phonetic.py 2 locations