今回のこの記事については完結編です。
②まで完成し、自分のPCへ必要なCSVファイルのDLは完了しているかと思います。いよいよ分析等をするためのデータフレーム化です。
DLファイルを自動で選択するには
#ダウンロードフォルダの最新ファイルパスを取得
import glob
import os
list_of_files = glob.glob('C:\\Users\\ユーザーフォルダ名\\Downloads\\*')
latest_file = max(list_of_files, key=os.path.getctime)
print (latest_file)
というソースです。
何をしているかというと、DLしたばっかりの最新ファイルをダウンロードフォルダから探し出して、そのファイルパスを取得しています。
上記ソースの「ユーザーフォルダ名」は
ここを右クリックで「プロパティ」を開いてこの部分を入力してください。
次はいよいよDF化です。
# ダウンロードしたcsvの読み込み
import pandas as pd
import codecs
time.sleep(3) # PC処理速度に応じて加減する
df1 = pd.read_csv(latest_file,encoding='cp932') # エンコード方式によって変える
df1
こんな感じで中身が開いたら完成です!
おめでとうございます。
うまくいかない場合は恐らくエンコード方式ですので、色々試してみてください。
|
---|
コメントを残す