【Python前処理】欠損値の処理メソッドまとめ【元データをスッキリ】

pythonLOGO

csvデータを取り込んだ後、データの中身を整理する時(前処理)に使う便利なメソッドをまとめてます。

メソッド、メソッド引数まとめ

メソッド
  • dropna
  • 指定した軸について、その軸のラベルの値に欠損値が含まれる場合は、ラベルごと削除する。削除する欠損値ラベルについて、閾値で指定可能。

  • fillna
  • 欠損値を指定した値で穴埋めする。
    ffill、bfillなどの指定した方法で穴埋めする。

  • isnull
  • 各値が欠損値(NA)であるかどうかを示す、真偽値を戻す。

  • notisnull
  • isnullの反対の動作をする。

メソッドの引数
  • value
  • 欠損値の穴埋めに使われるスカラー値。

  • method
  • 穴埋め方法を指定する。デフォルトではffill。

  • axis
  • 穴埋めしたい軸、デフォルトではaxis=0(行方向)。

  • inplace
  • コピーを作るのではなく、呼び出し元のオブジェクトを直接変更。

  • limit
  • 前方(method=’ffill’)、後方(method=’bfill’)への穴埋め時に、
    連続した穴埋めを最大何回まで行うか指定する

欠損値の削除 dropna

Serieseの場合

DataFrameの場合

how=’all’を指定すると、全ての行が欠損値である行のみ削除される

列の削除を行う場合は、axis=1を指定する

一定数の行を除外する場合は、threshを使う

欠損値を穴埋めする fillna

fillnaメソッドで列ごとに値を指定する

既存のオブジェクトを直接変更する場合

最終行の数字で穴埋めする場合、ffillを使う

範囲を限定的にしたい時は、limitを使う




 

あ、宜しければ・・・。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です