欠損値を確認したい(pandas.DataFrame.isna
)
1data.isna() # 欠損値を含む行は True になる
2data.isna().sum() # 欠損値の数を数える
データフレームに含まれるカラムごとの欠損値の数を判定できます。 データに欠損値があるとうまく集計できない場合があるため、前処理の段階で除外するか、補完するかの処理が必要です。
注釈
isnaと
isnullはまったく同じものです(isnull = isna
)。
ただし、RuffのルールのPD003では、
メソッド名の汎用性の観点からisnull
の代わりにisna
を使うことが推奨されています。
欠損値を補完したい(pd.DataFrame.fillna
)
1data.fillna(0)
2data.fillna(method="ffill")
3data.fillna(method="bfill")
4data.fillna(data.mean())