Matplotlib ヒストグラム の使い方

Matplotlibを使ったヒストグラムの使い方を解説します。
ヒストグラムは目的変数に対し、相関のあるデータを探したいときに利用します。

matplotlib.pyplot.hist の概要

matplotlib.pyplot.hist の書き方と主要な引数はいかのとおりです。

matplotlib.pyplot.hist(x, bins=None, range=None, density=False, weights=None,
 cumulative=False, bottom=None, histtype='bar', align='mid', orientation='vertical',
 rwidth=None, log=False, color=None, label=None, stacked=False, *, data=None, **kwargs)

よくつかうパラメータ

xヒストグラムを生成する配列、または配列のシーケンス
bins表示するヒストグラムの棒の数(デフォルト10)
rangeヒストグラムの範囲(x.min(), x.max())
colorヒストグラムの色
label凡例
alpha透明度

実際の使用例

import matplotlib.pyplot as plt

plt.hist(train.loc[train['Survived'] == 0, 'Age'].dropna(), bins=30, alpha=0.5, label='0')
plt.hist(train.loc[train['Survived'] == 1, 'Age'].dropna(), bins=30, alpha=0.5, label='1')
plt.xlabel('Age')
plt.ylabel('count')
plt.legend(title='Survived')

コメント