株価データの集め方まで!「データを集める技術」書評・レビュー
「データを集める技術」という本を読んでみました。
本書はプログラミングとかエンジニアリング関連の書籍だと思うのですが、なぜ本ブログで紹介するかというと、この本の中で株価などの金融データを集める方法が解説されているからです。
また、この本の方法では大がかりなプログラムなどを書く必要もなく、初心者でも読めるほど簡単な方法が解説されていました。
「システムトレードをやってみたい」「Excelなどで株価を分析してみたい」という人にはオススメです。
どうやってデータを取得する?
データを集める技術 最速で作るスクレイピング&クローラー (Informatics&IDEA)
Amazonでチェックする楽天で購入Yahoo!ショッピング
この本では、Excel、Googleスプレッドシート、そしてimport.ioなどのサービスを用いて各種データを集めてくる方法を解説しています。
特にGoogleスプレッドシートを使う方法は詳しく解説されています。
ちなみに、Googleファイナンスでは、Googleファイナンス関数を使って、このように米国の株価を取得することはできるのですが日本の株価は取得できません。。。
株価 | =GoogleFinance(“GOOG") |
始値 | =GoogleFinance(“GOOG", “priceopen") |
高値 | =GoogleFinance(“GOOG", “high") |
安値 | =GoogleFinance(“GOOG", “low") |
取引量 | =GoogleFinance(“GOOG", “volume") |
時価総額 | =GoogleFinance(“GOOG", “marketcap") |
1日の平均取引量 | =GoogleFinance(“GOOG", “volumeavg") |
前取引日終値からの変動 | =GoogleFinance(“GOOG", “change") |
本書の方法では、日本の株価を取得したり、株価の取得を自動実行させて常に最新の株価を取得する方法などが説明されています。
Googleスプレッドシートの方法の例
例えば、Googleスプレッドシートのセルにこんな関数を書けば、9984 ソフトバンクの株価が取得できます。
=IMPORTXML(“http://stocks.finance.yahoo.co.jp/stocks/detail/?code=9984.T",“//*[@id=’detail’]/div[2]/div[1]/dl/dd/strong")
他にも!AppStoreのランキングなどを取得
AppleのAppStoreのランキングは、例えばこんな方法で取得できます。ランキングはxmlフィードから読み込むことができるので、非常に楽ですね。
=IMPORTFEED(“https://itunes.apple.com/jp/rss/topgrossingapplications/limit=25/genre=6015/xml")
AppStoreの売上げランキングから株価を予測する、なんて方法もあるらしいので、使える方法だと思います。
総じて、データを集めてみたいという入門者向けの本
この本では、株価データ、AppStoreなどスマホアプリのランキング、Amazonのレビューやほしいものリストなどのデータを取得する方法が解説されています。
総じて入門的な内容で、「今までデータなんて手作業で集めてたよ!」なんて人でも理解できる内容になっています。
他にも、IFTTTなどの自動化サービスを利用してWebの最新情報をスマホに通知したり、自動的にGoogleスプレッドシートに記録したりする方法なども丁寧に説明されています。
「今からデータ収集を始めてみたい方」にとても良い一冊だと思います。
ちなみに
本書ではYahoo!ファイナンスなどからデータを取る方法も解説されているのですが、Yahoo!ファイナンスの規約を見ると、、、
Yahoo!ファイナンスでは、Yahoo!ファイナンスに掲載している株価やその他のデータを、プログラム等を用いて機械的に取得する行為(スクレイピング等)について、システムに過度の負荷がかかり、安定したサービス提供に支障をきたす恐れがあることから禁止しています。
しかしながら本書ではこの規約はスルーして株価取得方法を解説しています。いいのかな、、
ご利用は自己責任にてお願いします!
データを集める技術 最速で作るスクレイピング&クローラー (Informatics&IDEA)
Amazonでチェックする楽天で購入Yahoo!ショッピング