欠損値を確認したい(pandas.DataFrame.isna

1data.isna()        # 欠損値を含む行は True になる
2data.isna().sum()  # 欠損値の数を数える

データフレームに含まれるカラムごとの欠損値の数を判定できます。 データに欠損値があるとうまく集計できない場合があるため、前処理の段階で除外するか、補完するかの処理が必要です。

注釈

isnaisnullはまったく同じものです(isnull = isna)。

ただし、RuffのルールのPD003では、 メソッド名の汎用性の観点からisnullの代わりにisnaを使うことが推奨されています。

参考

isnaと反対のpandas.DataFrame.notnaもあります。 欠損値でない値(=有効な値)を判定できます。

1data.notna().sum()  # 有効値の数を数える

欠損値を補完したい(pd.DataFrame.fillna

1data.fillna(0)
2data.fillna(method="ffill")
3data.fillna(method="bfill")
4data.fillna(data.mean())

リファレンス