【お仕事自動化】pythonでHPからcsvをDLして、データフレーム化する③完【DLしたデータをPandasでDFにする】

pythonLOGO

今回のこの記事については完結編です。

②まで完成し、自分のPCへ必要なCSVファイルのDLは完了しているかと思います。いよいよ分析等をするためのデータフレーム化です。

DLファイルを自動で選択するには

#ダウンロードフォルダの最新ファイルパスを取得
import glob
import os
list_of_files = glob.glob('C:\\Users\\ユーザーフォルダ名\\Downloads\\*')
latest_file = max(list_of_files, key=os.path.getctime)
print (latest_file)

というソースです。

何をしているかというと、DLしたばっかりの最新ファイルをダウンロードフォルダから探し出して、そのファイルパスを取得しています。

上記ソースの「ユーザーフォルダ名」は

ここを右クリックで「プロパティ」を開いてこの部分を入力してください。

次はいよいよDF化です。

# ダウンロードしたcsvの読み込み
import pandas as pd
import codecs

time.sleep(3) # PC処理速度に応じて加減する
df1 = pd.read_csv(latest_file,encoding='cp932') # エンコード方式によって変える
df1

こんな感じで中身が開いたら完成です!

おめでとうございます。

うまくいかない場合は恐らくエンコード方式ですので、色々試してみてください。



 

あ、宜しければ・・・。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です