Pandasの使い方
1import pandas as pd
2import matplotlib.pyplot as plt
データフレームを作成したい
データを読み込みたい
データを保存したい
データを確認したい
- 先頭行を確認したい(
pandas.DataFrame.head) - 末尾行を確認したい(
pandas.DataFrame.tail) - データフレームを確認したい(
pandas.DataFrame.info) - 統計情報を確認したい(
pandas.DataFrame.describe) - 形を確認したい(
pandas.DataFrame.shape) - カラム名を確認したい(
pandas.DataFrame.columns) - データ型を確認したい(
pandas.DataFrame.dtypes) - 欠損値を確認したい(
pandas.DataFrame.isna) - 重複を確認したい(
pandas.DataFrame.duplicated) - ユニーク値を確認したい(
pandas.DataFrame.unique)
データを選択したい
データを整形したい
- 空白を削除したい(
pandas.Series.str.replace) - データ型を変換したい(
pandas.DataFrame.astype) - カテゴリー型に変換したい(
pandas.CategoricalDtype) - 日付に変換したい(
pandas.to_datetime) - カラム名を変更したい(
pandas.DataFrame.rename) - データを削除したい(
pd.DataFrame.drop) - 欠損値を削除したい(
pandas.DataFrame.dropna) - 欠損値を補完したい(
pandas.DataFrame.fillna) - 重複を削除したい(
pandas.DataFrame.drop_duplicates)
データを変換したい
集計したい
度数分布したい
フィットしたい
可視化したい
データの可視化にはデフォルトでmatplotlibを使います。
pandas.DataFrameと連携できる可視化ツールもいろいろあります。
これまで使ったことがあるツールは、
Matplotlibの使い方、
Altairの使い方、
Plotlyの使い方、
hvPlotの使い方
にそれぞれ整理しました。