働き方改革、していますか?
働き方改革カンファレンスというイベントを見ていても、労働の生産性、効率化といったところは重要視されているな!と感じています。
▼働き方改革カンファレンス 公式サイト
https://hatarakikata.site/expo/
最近、そんな中で脚光を浴びてきているのが、webスクレイピングです。要は、Webサイトからデータを収集して、データ化するプログラムなんですよね。
これがあると、わかりやすいところでいうと、食べログで、3.5星以上のイタリアンを東京で何個あるかを探せたりします(笑)。
そんな個人的な使い方以外にも、いろいろと用途のあるスクレイピング。今回は、そんなスクレイピングについて、解説していきます!
スクレイピングとは
スクレイピングは、ホームページから情報を自動的に取得して、その情報を保存し、活用できるプログラムです。
Webスクレイピングとも呼ばれますね。
このスクレイピングは、xサーバや、さくらインターネットなどの共有サーバの環境でも運用ができます。また、開発言語としては、Python(パイソン)やRuby(ルビー)などのプログラミング言語で開発ができます。そうなんです。2019年10月現在では、誰でもスキルさえあれば、webスクレイピングを作れるんです!
参考までに、Samurai Blogさんのコンテンツで、以下のようなwebスクレイピングの方法が解説されているので、ご紹介します。
【初心者向け】PythonでWebスクレイピングをしてみよう!手順まとめ
引用:Samurai Blog
https://www.sejuku.net/blog/51241
スクレイピングのメリット
スクレイピングをするメリットは、以下のことがあります。
- 自動でデータが取れる
- プログラムなのでデータ精度が高い
- 人間がやるよりも速い
webサイトから、データを取得してくるため、人間が、webブラウザからコピーペーストしてもできますが、時間がかかるわけです。
webスクレイピングなら、そんな無駄や、ミスがなくなるので、効率的です。
また、料金のデータなどを、スクレイピングすれば、いわゆる、他社の料金比較をサクッとできたりします。
たとえば、同じ商圏にあるホテルが、楽天トラベルにいくらの料金で掲載しているか、などの情報の把握もできます。
ほかにも、求人情報を出している企業の一覧を、ハローワークのページをスクレイピングしたりすると、CSVデータなどで取得が可能です。
スクレイピングのデメリット
webスクレイピングのデメリットは、
- 対象のwebサイトにアクセス負荷がかかる
- 利用規約上、使えないサイトがある
といったところでしょうか?
後者については、twitterやマッチングアプリ Pairsなどは、明確に利用規約で、スクレイピングNGを公言しています。
実際、スクレイピングでググると、
「スクレイピング 違法」なんて、検索キーワードがサジェストされます。
ただ、法律事務所でも以下のことを書いています。
スクレイピングは、それ自体は違法とされていないものの、そこから派生する法的な問題点は存在します。問題の所在や、その注意点などをきちんと理解しておかなければ、場合によっては、刑法上の責任を問われる可能性すらあります。
そのようなことにならないためにも、関連する法律や、どのような点に注意すべきかといったことに意識をもって、スクレイピングを行うことが重要です。
引用:Topcourt(トップコート国際法律事務所)
https://topcourt-law.com/internet_security/scraping-illegal
そのため、しっかりと、利用目的、対象、アクセス制限、利用規約のチェックをすれば、問題にはなりません。
スクレイピングシステムの開発ができる会社4選
スクレイピングシステムの開発ができる会社をまとめていきます!
株式会社ルーター
こんなニュースリリースを出しているくらいです!
AIクローラー
https://rooter.jp/service/ai-crawler/
AI搭載次世代クローラー「AIクローラー」サービス紹介動画
Octopus Data Inc.
こちらは無料でツールも提供しています。もちろんトライアル版ですが。
スクレイピング世界では有名ですね!
webコンシェルジュ 株式会社クロト
月間200時間の工数削減につながった事例なども紹介されています。
ウェブスクレイピングの説明もしています。
ビックデータとの連携などについても解説されていますね。
https://www.clo-tho.com/system-scraping.html
株式会社キーウォーカー
10年以上に及ぶWEB検索エンジンの開発経験が武器になっている会社さんです。
https://www.keywalker.co.jp/web-crawler/crawler.html
まとめ:自動でミスがないスクレイピングは仕事の生産性を高める
スクレイピングは、わかりやすいシステムですが、自動化を考えると、非常にアリな技術だと思います。
そして、効率的に自分の仕事をしていく上でも重要なのではないか?と思います。
また、webスクレイピングは、インターネット上でいろいろとサンプルや情報も多いので、勉強素材にもいいと思います。プログラミングの練習がてら、TRYされるのもありかもですね。
簡単チャットボット作成ツール BotEditor(ボットエディター)