Matplotlibを使ったヒストグラムの使い方を解説します。
ヒストグラムは目的変数に対し、相関のあるデータを探したいときに利用します。
matplotlib.pyplot.hist の概要
matplotlib.pyplot.hist の書き方と主要な引数はいかのとおりです。
matplotlib.pyplot.hist(x, bins=None, range=None, density=False, weights=None,
cumulative=False, bottom=None, histtype='bar', align='mid', orientation='vertical',
rwidth=None, log=False, color=None, label=None, stacked=False, *, data=None, **kwargs)
よくつかうパラメータ
x | ヒストグラムを生成する配列、または配列のシーケンス |
bins | 表示するヒストグラムの棒の数(デフォルト10) |
range | ヒストグラムの範囲(x.min(), x.max()) |
color | ヒストグラムの色 |
label | 凡例 |
alpha | 透明度 |
実際の使用例
import matplotlib.pyplot as plt
plt.hist(train.loc[train['Survived'] == 0, 'Age'].dropna(), bins=30, alpha=0.5, label='0')
plt.hist(train.loc[train['Survived'] == 1, 'Age'].dropna(), bins=30, alpha=0.5, label='1')
plt.xlabel('Age')
plt.ylabel('count')
plt.legend(title='Survived')
コメント