Webスクレイピングについて
WebスクレイピングとはWebページ上から任意の情報を取得することができる技術のことです。
このWebスクレイピングにより、得た情報を活用してコンテンツを作製したりします。
ただ、スクレイピングが禁止されているようなサイトもあるため注意が必要です。Twitter等がそれにあたります。
Webスクレイピングは様々なソフトから実行することができますが、ここでは、エクセルからWebスクレイピングをする方法を紹介していきます。
エクセルからWebスクレイピング方法
エクセルからWebスクレイピングするためにはいくつか方法がありますが、主にWindowsであればIEを操作するか、GoogleChromeを操作するかの選択をします。
処理速度やプログラムコードのメリットからChromeを操作する方がおススメです。
エクセルからChromeを操作するためには、SeleniumBasicというツールをインストールする必要があります。
インストール方法は以下で説明しています。
SeleniumBasicインストール方法
以下よりダウンロードします。
https://github.com/florentbr/SeleniumBasic/releases/tag/v2.0.9.0
SeleniumBasic-2.0.9.0.exe
これをダウンロードしてインストールします。
画面指示に従って、そのままインストールします。
特に変更する必要はないのでそのままNextをクリック
インストールされる先のフォルダ名を覚えておいて Installクリック
finishをクリックして完了
Selenium Basicを最新版のChromeに対応させる
SelenumBasicに同梱されているChrome用の制御ドライバは残念ながら最新版のChromeに対応していません。
以下のページから最新版のChromeドライバをダウンロードしてきて、手動で上書きコピーする必要があります。
https://sites.google.com/a/chromium.org/chromedriver/
赤丸で囲ったリンクをクリックしていけばダウンロードできます。
Windows版が必要なので、chromedriver_win32.zip をダウンロードします。
zipを解答すると、 chromedriver.exe が1ファイルあると思います。
このファイルを、Selenium Basicをインストールしたフォルダにコピー&上書きします。
これでChrome driverが最新のものになり、SeleniumBasicを使ってChromeを操作する準備が整いました。
実際にエクセルでマクロ作成するときは、参照設定よりSelenium Type Libraryにチェックを入れる必要があります。
以上でエクセルからSeleniumBasicを使ったWebスクレイピングの段取りが完了となります。
このサイトよりスクレイピング機能があるマクロをダウンロードして使用する際は上記の設定が必要となりますのでご注意ください!
プログラムについて
プログラミングコードにつきましては、各種サイト等を活用してみてください。
ちなみに私は下記サイトを参考にプログラムを学びました
エクセルの神髄↓
https://excel-ubara.com/excelvba4/EXCEL_VBA_401.html
dsp74118の補完庫↓
http://dsp74118.blogspot.com/2016/02/seleniumbasic.html
その他にもいろいろなサイトがありますので、独学で勉強する方は自分に合ったサイトを探してみてください