【Pythonデータ分析】度数分布表の作成【ビニング】

pythonLOGO

Pythonでデータ分析する時、例えば年齢のデータがずらーっとあって、
『それぞれ何人いるの?』
と、全体の傾向を掴むため、度数分布表を作ってヒストグラムを作る。

今回はPythonでデータを小分けにする方法を書きます。

ラベルのある『ビンに詰める、ビンに分ける』という事で『ビニング』と言うそうです。

もっと深く調べたい方は『Python ビニング』で検索すると良いと思います。

例えばこんなデータ

Pandasのcutオブジェクトを利用

左側を閉区間にする場合

labelsオプションを設定するとビンの名前を設定できる

データの最小値と最大値を基にして、等間隔で区切る場合

qcut サンプルの分位点を基準にビンを設定する

任意の分位点をビンの境界とする方法




 

あ、宜しければ・・・。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です