2019年10月4日のGoogleの発表が大きかったですね。なんと、GoogleのChromeが、HTTP経由とHTTPS経由の各ファイルソースがページ内に混在している「混在コンテンツ」は、ブロックするという発表がありました。
これはびっくりですよね。実際、予定では、以下のように、2020年2月ごろから、この動きはされていくわけです。
「Chrome 81」では、混在画像の取得経路を自動的にhttps://へと置き換え、https://経由でのロードができない場合にはブロックするというのがデフォルトの動作になる。Chrome 81は2020年2月に初期リリースチャンネルにリリースされる。
引用:ZDNET JAPAN
https://japan.zdnet.com/article/35143523/
ブロックされたら、アクセス数が減少するとか、そういうレベルでは済まなくなります。
Googleの検索結果でも表示されなくなるでしょうから、SEO対策上も大きく影響を受けることは必須です。ホームページのメンテナンスがされていないとみなされるでしょうから、サイトパワーもダウンするのではないかと思われます。
ということで、今回は、2019年版 http https 混在コンテンツの調査方法をまとめていきたいと思います。もう、実装したよ!という会社さんのweb担当者の方も。まだ、これから、という会社さんのweb担当者の方も、ぜひ、考えてみてくださいね。
混在コンテンツとは
Webサイトの常時SSL化対応が、SEO対策のトレンドとなっている2019年。
SSL対応のメリットはコンテンツの安全性による影響で、結果的に、SEO対策上も、プラスになるとされています。
しかし、ここで問題なのは、力業で、SSL化をすることで、逆に、httpのファイルが混在してしまい、影響が出てしまうことが問題です。
そもそも、混在コンテンツとは、HTTPSのページのhtmlソースなどに含まれるHTTPで配信されるコンテンツのことを指します。
この混在コンテンツがあると、ブラウザ側がセキュリティの観点から、混在コンテンツの読み込みや実行をブロックするようになってきているわけです。
そして、上記のように、2020年2月ごろから、コンテンツブロック、すなわち、Google Chromeでは、ホームページの表示をブロックするという予告をしているのです。
ちなみに、2019年10月時点での例えばGoogle Chrome(グーグルクローム)では、ページの中で読み込まれている画像のパスが「http://」始まりで書かれているとアイコンやメッセージが表示されず、バツ印がついたアイコンが表示されます。
なお、通常だと、アドレスバーの先頭には鍵アイコンと「保護された通信」というメッセージが表示されます。
混在コンテンツのエラーをなくす方法
そもそも、これはサイト、サーバの調査が必要かと思っています。
そのうえで、基本となる混在コンテンツをなくすようにしないといけないかと思っております。
混在コンテンツのエラーを見つける方法としては、サイト全体のファイルを検索し、http://から始まる記述がないかを確認していくという方法があります。
では、実際に混在コンテンツをなくすための調査方法を解説していきます。
混在コンテンツの調査方法
最初に行うのはサイト環境の調査ですね。
httpとhttpのサーバやファイルの設置ディレクトリが同一かどうかの確認
一緒の場合は問題ないですが、もし、httpとhttpで異なる場合は、少々厄介です。
というのも、httpとhttps環境で、同じファイルが置かれているかどうかを確認する必要が出てきます。
その際、画像が異なる、プログラムファイルの内容が異なる、といったところがあります。そのときに、このファイルは、httpを基準にする、httpsにする、といった判断などもしていく必要があります。
方針の決定
httpを基準にして、httpsの環境に、httpのファイルを設置する、というなどの方針を決めていくことが必要かと思います。
https環境で、httpからの記述を探す方法
この混在コンテンツが生じるページの把握は単調な作業ですが、そこそこ大変なんですよね。数千ページ規模のサイトでは、結構な大ごとです。
- まず、grep機能のある「秀まる」などのテキストエディタをインストール
- grep機能で、「=”http://」を検索をしていく
- このあとで、出てくる対象のデータについては、「a href」のリンク記述があると思うので、そこから、「href」で検索をして、リンク系のフルパス記述を確認する
- そこから目視で、imgタグのものだけが残ったら、imgタグ記載のhttpパスをhttpsのパスに変更をしていってください。
ただ、圧倒的に、ページ量が多いと大変なんですよね。
例えば5,000ページのWebサイトを調査する場合、どのくらいの時間がかかるか。
1ページあたり、チェックに20秒くらいかかるとすると、10万秒。
つまり、休まずにやっても、まるまる1日以上の時間がかかってきます。
ひとりで、やって、まぁ、だいだい、10営業日くらいはかかるのではないかと。
ちなみに、テスト環境とSTG環境、本番環境で3回チェックした場合、
単純に3倍なので、相当な工数ですよね。
予算もあると思いますので、人間の担当者で実施するか、ロボット用のシステムを活用するのか、アウトソーシングするか、検討してみてくださいね。
気になる混在コンテンツについての3つのポイント
細かいことなんですが、3つのポイントを記載していきます。
混在コンテンツ 古いtwitterやFacebookのソーシャルプラグインは大丈夫
古いツイッターやfacebookのソーシャルプラグインも、httpでも、混在コンテンツとしては大丈夫です。
というのも、ソーシャルプラグインなら、httpsがあるためです。
独自でタグを書き直していた場合は、要調査ですね。
ただ、古いソーシャルプラグインのタグも、一掃しておく方が後々のことを考えると、効率的ですね。
混在コンテンツ jquaryについてもhttpsにファイルをおけば大丈夫
サイト内部にjquaryのファイルをおいている場合、JQUARYもhttps環境に対象のファイルをおいておくのであれば、混在コンテンツ対策としては、問題ありません。
ただ、これを機会に、Googleのソースを読みに行くようにするのも1つの選択肢です。
混在コンテンツ W3Cの宣言文もhttpのままでも大丈夫
html内部で先頭に記述のあるW3Cの宣言文についても、httpのままでも大丈夫です。
w3cのサイトなので、https版のサイトも存在するので、大丈夫です。
ちなみに、前回2019年10月にお知らせしたGoogleの発表内容についての記事はこちら!