列方向に結合したい(np.column_stack
)
1# np.column_stack(tpl)
2
3a = np.array([1, 2, 3])
4b = np.array([10, 20, 30])
5
6np.column_stack(a, b)
7# ==> array([
8# [1, 10],
9# [2, 20],
10# [3, 30],
11# ])
np.column_stack
で、引数に指定したタプルを、
列方向に並べ直すことができます。
実験データの時刻と値をまとめたり、
複数の特徴量をまとめて1つのデータセットにするときなどに便利です。
データフレームに変換したい
1import numpy as np
2import pandas as pd
3
4# データ数
5n = 10
6
7# 時刻(のサンプル)
8time = np.arange(n)
9
10# (ダミーの)センサーデータ
11tmp = 20 + 5 * np.random.randn(n)
12hmd = 60 + 10 * np.random.randn(n)
13atm = 1013 + 5 * np.random.randn(n)
14
15# 列方向に結合
16data = np.column_stack((time, tmp, hmd, atm))
17
18# データフレームに変換
19names = ["time", "tmp", "hmd", "atm"]
20df = pd.DataFrame(data, columns=names)
np.column_stack
したNumPy配列は、
そのままpd.DataFrame
に渡すことができます。