インターネットアーカイブとは
インターネットアーカイブとは、インターネット上に公開されている数多くのWebページ情報を保存してアーカイブを行うサービスです。アーカイブとして保存された情報は無料で見られます。インターネットアーカイブの目的は、デジタル上で保存・公開された資料やデータを世界中の誰もが無料で見られるようにすることです。過去に削除されてしまったサイトを見たい方などにインターネットアーカイブはおすすめのツールと言えます。
インターネットアーカイブを使うタイミング5つ
ここでは、インターネットアーカイブを使うタイミングを5つまとめました。
- 競合サイトを分析するとき
- 検索順位の変動の理由を調査したいとき
- サイトのデータを削除してしまったとき
- 公開終了したサイトをもう一度見たいとき
- 過去に公開されていた映画や書籍を見たいとき
順番に解説します。
競合サイト分析をするとき
インターネットアーカイブでは、競合他社の過去のWebサイトについて確認できます。そのため、競合サイトの細かな分析をおこなう際に便利です。具体的には、以下のような場合の分析に役立ちます。
- 競合サイトの検索順位が上がった理由が知りたい
- 検索順位の変動前後でサイトの内容を比較したい
- コンテンツ数やサイトのリニューアル内容が知りたい
サイトの分析をすれば、Google等の検索エンジンがなにをもって競合サイトの検索順位を上げたのかが見えてくるでしょう。そのため、競合サイトの分析にはインターネットアーカイブの利用がおすすめです。
検索順位の変動の理由を調査したいとき
自社サイトの検索順位の変動理由を調査するときも、インターネットアーカイブを使うのがおすすめです。Googleなどの検索エンジンは定期的にアップデートを繰り返しており、それによって検索順位も変動しています。SEO対策においては、なぜ検索順位が変動したのかを考えるのも大切です。例えば、「他社のサイトが何を変えたことで検索順位が上がったのか」が分かれば、自社サイトの見直し改善に役立てられるでしょう。検索順位の変動理由を確かめたい場合は、インターネットアーカイブを活用してみてください。
サイトのデータを削除してしまったとき
サイトのデータを削除してしまった場合は、焦らずにインターネットアーカイブでデータを探してみましょう。Webサイトを運営していると、誤ってサイトデータを削除してしまったという経験がある方も多いです。削除してしまったデータを一から構築しようとすると、膨大な時間とコストがかかります。そんな場合にもインターネットアーカイブは有効です。インターネットアーカイブは世界中のWebサイトの過去データが保存されているため、自社が運営しているWebサイトのデータもインターネットアーカイブ上で探し出せる可能性があります。消してしまったデータの回復手段として、インターネットアーカイブがあることを覚えておくと良いでしょう。
公開終了したサイトをもう一度見たいとき
インターネットアーカイブは、公開終了したサイトをもう一度見たいときにも使えるツールです。Webサイト調査をするうえで、以下のように思ったことがある方は多いでしょう。
- 公開終了してしまったリニューアル前のサイトを見たい
- 削除されてしまったサイトをもう一度見たい
特に企業のWeb担当者であれば、自社サイトの運営においてサイトの調査は欠かせません。インターネットアーカイブは、サイトが見れなくなった場合でも再表示できるサービスです。また、アーカイブから表示した過去サイトであっても、リンク先へのページ遷移ができます。そのため、過去サイトの細かなところまでチェックが可能です。自社サイトの改善をおこなううえで公開終了したサイトを見たい場合は、インターネットアーカイブを利用しましょう。
過去に公開されていた映画や書籍を見たいとき
インターネットアーカイブは、Webサイトだけでなく過去に公開されていた映画や書籍に関してもアーカイブ保存されていることが多いです。さまざまなジャンルの映画や書籍がアーカイブされているので、もう見られないと思っていたものでも見られることがあります。バンドのライブ映像などもアーカイブされているので、音楽好きな方も必見です。
インターネットアーカイブの代表格「Wayback Machine」とは
インターネットアーカイブの代表格サービスとして有名なものに、「Wayback Machine」があります。Wayback Machineはマルチメディア資料やデジタルデータにおけるアーカイブサービスです。他にもインターネットアーカイブサービスは複数あります。しかし、「Wayback Machine」があまりに有名なため、Wayback Machine自体がインターネットアーカイブと呼ばれることは多いです。サービス自体も無料で、過去に閉鎖されたWebサイトも見られます。
インターネットアーカイブ(Wayback Machine)の使い方
ここでは、インターネットアーカイブの使い方を2つまとめました。
- URLで特定のサイトを検索
- キーワードで複数のサイトを検索
順番に解説します。
URLで特定のサイトを検索
サイトURLで検索してアーカイブを調査する方法は以下の4ステップです。
- Wayback Machineのサイトにアクセス
- 検索したいサイトのURLをWayback Machine画面上部のテキストボックスに入力して、「BROWSE HISTORY」をクリック。
- 日付を選択するためのカレンダーが表示されるので、検索したいサイトデータの日付を指定
- 指定したURLサイトの指定した日時に公開されていたページの保存データが表示される
サイトのURLで検索する場合は、特定のサイトのみを調査したい場合におすすめです。しかし、検索してデータを表示できるのは、検索したその時点で保存されていたデータのみになることを頭に入れておきましょう。
キーワードで複数のサイトを検索
キーワードでサイトを検索する方法は以下の4ステップです
- Wayback Machineのサイトにアクセス
- 検索したいキーワードをWayback Machineの検索窓に入力
- 検索したキーワードに関連するサイトが一覧で表示される
- 調査したいサイトURL or サイトのサムネイルを選択する
URLを入力する方法と比べ、キーワード検索では複数のサイトを同時に検索できます。なお、複数のキーワード(例:「洗剤 保存方法 粉」など)で検索することも可能です。
インターネットアーカイブへのサイト登録方法
ここでは、インターネットアーカイブへのサイト登録方法を、Wayback Machineを例に挙げて2つまとめました。
- アーカイブしたいサイトURLを手動で登録
- 自動でアーカイブしてくれる場合もある
順番に解説します。
アーカイブしたいサイトURLを手動で登録
Wayback Machineでは、ユーザーがWebサイトデータを手動で登録して保存できます。手動での登録方法は以下の通りです。
- Wayback Machineのサイトトップページ右下にある「Save Page Now」に、登録したいWebサイトのURLを入力して「SAVE PAGE」をクリック。
- Wayback Machineの読み込み完了後、「Page save as【URL】」と表示されれば登録完了。
なお、インターネット上に公開されたばかりのWebサイトや、パスワードがかかっているWebサイトは、Wayback Machineに登録されていないことがほとんどです。そのため、データが存在せずWebサイトが表示されません。
自動でアーカイブしてくれる場合もある
Wayback Machineでは、Webサイトを自動でアーカイブしてくれている場合があります。なぜなら、インターネット上の膨大なデータを定期的にクローリングしているからです。そのため、Webサイトデータの保存数は非常に多く、約4800億にも上ると言われています。どんなデータが自動アーカイブされているのか気になる方はチェックしてみてください。
その他のインターネットアーカイブツール6選
ここでは、Wayback Machine以外のインターネットアーカイブツールを6つまとめました。
- WARP
- UK Parliament Web Archive
- Library of Congress
- Stanford Web Archive Portal
- OpenWayback
- Web魚拓
次から順番に解説します。
WARP
WARPは、国立国会図書館が運営するインターネットアーカイブサービスです。おもに日本国内のWebサイトを集めています。WARPのWebサイト収集方法は、サイトごとのターゲット単位です。収集する頻度はターゲットに合わせて行っています。また、大規模災害の発生時などWebサイトが頻繁に更新されると、WARPでも頻度を上げてWebサイト収集をします。WARPは既に約1万以上のWebサイトを収集していて、データ量はついに800テラバイト以上を記録しました。WARPによって収集されたWebサイトは、国立国会図書館内やインターネット上で閲覧可能です。
UK Parliament Web Archive
UK Parliament Web Archiveは、英国図書館が運営しているインターネットアーカイブサービスです。おもにイギリス国内のWebサイトを、クローラーを使って自動収集しています。現在、Webサイトの収集累積数は約2万件を超えました。収集されたWebサイトは英国図書館、英国図書館分館、スコットランド国立図書館、ウェールズ国立図書館の4つにわけて保存されています。各図書館ごとにデータが保存されているため、1つの図書館のデータが削除されてしまったとしても、ほかの図書館のデータを利用して復元することが可能です。
Library of Congress
Library of Congressは、米国議会図書館が運営するインターネットアーカイブサービスです。デジタルコンテンツ管理専門のWebアーカイブチームも立ち上げられており、国内外の機関と連携して技術開発に取り組んでいます。以前はLibrary of Congress専用のインターフェースを使用しないとWebサイトを閲覧できませんでした。しかし現在では、アーカイブされたWebサイトを他の図書館資料と統合して確認できるインターフェースが開発されています。また、国政選挙などの特定のテーマに基づいて選択収集を行うのも、Library of Congressの特徴です。選択収集の対象は国内外の政府機関、政党、宗教団体など多岐にわたります。
Stanford Web Archive Portal
Stanford Web Archive Portalは、スタンフォード大学が運営しているインターネットアーカイブサービスです。インターフェース自体はWayback Machineに類似していることが特徴ですが、Webサイトの収集内容が異なります。まだ数は少ないものの、日本のWebサイトも収集されており、閲覧可能です。
OpenWayback
OpenWaybackは、Wayback Machineのシステムをベースとしたインターネットアーカイブサービスです。ベースとしているWayback Machineには保存されていないデータがあることが特徴でした。しかし、収集の更新は2007年で停止されています。
Web魚拓
Web魚拓は、Webサイトのスナップショットを保存できる日本発祥のインターネットアーカイブサービスをいいます。インターネットアーカイブサービスは世界中に数多くありますが、Web魚拓は日本国内専用のサービスです。魚拓系サイトとも呼ばれており、保存したその時点のWebサイトの状態をアーカイブしてくれるサービスです。そのため、誰かが保存したWebサイトが残っているケースも多くあります。言い方を変えれば、誰かがWeb魚拓でアーカイブしたWebサイトしか残っていないとも言えるでしょう。また、robots.txtによるキャッシュの拒否をおこなっているWebサイトの場合は保存できないため、注意してください。
インターネットアーカイブの使い方まとめ
インターネットアーカイブサービスは、多数Webサイトの変更履歴や公開終了ページなどが見られる便利なツールです。自社サイトの運営の際、インターネットアーカイブを使えば競合サイトの分析が行えます。過去のWebサイトを閲覧することで検索順位の変動理由について調査が可能です。検索順位の変動理由の調査はWebサイトでSEO対策をおこなううえでも重要なため、インターネットアーカイブを上手く活用してみてください。なお、インターネットアーカイブはWebサイトのデータ復元にも活用できます。企業におけるWeb担当者は、インターネットアーカイブの活用方法を身に付けておくと良いでしょう。