Pandasの使い方
1import pandas as pd
2import matplotlib.pyplot as plt
データフレームを作成したい
データを読み込みたい
データを保存したい
データを確認したい
- 先頭行を確認したい(
pandas.DataFrame.head
) - 末尾行を確認したい(
pandas.DataFrame.tail
) - データフレームを確認したい(
pandas.DataFrame.info
) - 統計情報を確認したい(
pandas.DataFrame.describe
) - 形を確認したい(
pandas.DataFrame.shape
) - カラム名を確認したい(
pandas.DataFrame.columns
) - データ型を確認したい(
pandas.DataFrame.dtypes
) - 欠損値を確認したい(
pandas.DataFrame.isna
) - 重複を確認したい(
pandas.DataFrame.duplicated
) - ユニーク値を確認したい(
pandas.DataFrame.unique
)
データを選択したい
データを整形したい
- 空白を削除したい(
pandas.Series.str.replace
) - データ型を変換したい(
pandas.DataFrame.astype
) - カテゴリー型に変換したい(
pandas.CategoricalDtype
) - 日付に変換したい(
pandas.to_datetime
) - カラム名を変更したい(
pandas.DataFrame.rename
) - データを削除したい(
pd.DataFrame.drop
) - 欠損値を削除したい(
pandas.DataFrame.dropna
) - 欠損値を補完したい(
pandas.DataFrame.fillna
) - 重複を削除したい(
pandas.DataFrame.drop_duplicates
)
データを変換したい
集計したい
度数分布したい
フィットしたい
可視化したい
データの可視化にはデフォルトでmatplotlibを使います。
pandas.DataFrame
と連携できる可視化ツールもいろいろあります。
これまで使ったことがあるツールは、
Matplotlibの使い方、
Altairの使い方、
Plotlyの使い方、
hvPlotの使い方
にそれぞれ整理しました。