重複を確認したい（`pandas.DataFrame.duplicated`）

data.duplicated()
data.duplicated(subset=["カラム1", "カラム2"])
data.duplicated(subset=["カラム1", "カラム2"], keep="last")

pandas.DataFrame.duplicatedで重複している行を確認できます。デフォルトは、すべてのカラムの値が重複している行が対象です。またkeep="first"となっているため、2番目以降の重複データがTrue（=重複している）と判定されます。

subsetでカラム名（のリスト）を指定して、範囲を絞ることができます。

dupes = data.duplicated().sum()
if dupes == 0:
    logger.info("No dupes")

重複している行がTrueとなるため、その合計を計算して重複している数を確認できます。

重複したデータを削除したい（`pandas.DataFrame.drop_duplicates`）

data.drop_duplicates()
data.drop_duplicated(subset=["カラム1", "カラム2"])
data.drop_duplicated(subset=["カラム1", "カラム2"], keep="last")

pd.DataFrame.drop_duplicatesで重複したデータを削除できます。 pd.DataFrame.duplicateでTrueと判定されたデータが削除されます。オプションもほぼ同じです。