[web]消えない過去&切れないリンク:Prevent Linkrot with Wayback Machine


When I heard about Internet Archive, I didn't buy it. But then came in the news about Joan Miro's family asking Google to take down its logo that commemorated his birthday (04.20.1893). I definitely wanted to see the logo 'allegedly incorporated images from Miro's ``The Escape Ladder,'' 1940, ``Nocture,'' 1940, and ``The Beautiful Bird Revealing the Unknown to a Pair of Lovers,'' 1941.' (MercuryNews.com), so I tried its Wayback Machine.

It wasn't archived yet( bigger image here at ZDNet). But staying there for 10 min. was enough for me to realize its value. Look what I found.;

Yahoo!(1996.10.17)| eBay(1997.06.14)| Amazon.com(2000.02.29)| Google!-BETA (1998.12.02)| CNN.com(2001.09.11)

As I submitted Yahoo! URL to Google!-BETA 1998, a confirmation message came from Google 2006.

The best part with Internet Archive is that you don't have to worry about linkrot or dead links (zdnet). But this can create a lot of problem, if people use it for personal offense or retreaving illegal contents.

Healthcare Advocates Inc., for example, is suing Internet Archive, alleging it failed to protect the information after the company asked to restrict access to certain contents. Prof. Michael Shamos at Carnegie Mellon Univ. told Yahoo!News that archiving like that is 'the biggest copyright infringement in the world,' but said it is done in a way 'that almost nobody cares.

***

非営利団体「インターネット・アーカイブ(Internet Archive)」が無料で提供する「Wayback Machine」は、ネットにかつて存在した世界中のウェブページや音声、画像が呼び出せる便利なネットライブラリ。金門橋のふもとにあるプレジーディオのオフィスにテラ級のサーバを置き、1996年創立時から累計550億ページのウェブをせっせと貯めこんでいる。公開は9-11直後。

Wayback Machineに見たいドメインを入れて「Take Me Back(連れ戻して)」ボタンをクリック。過去ページが年代順に出てくるので日付けをクリックすると、あたかも今見ているかのように昔のページが見れてしまうのだ。試しにデビュー前のグーグルを探してみよう。
Google!-BETA (1998.12.02)
HELPには「Add a URL to Google(グーグルにURLを追加する)」もあって、どこかヤフー調。どれどれ試しにヤフーを登録してやるか。コメントは「rival search engine」…と、これで良し。ボタンをべこっ。;
'Thank you. Your URL has been successfully added.
Your site URL has been successfully added to our list of URLs to crawl.'
いきなり2006年に戻った。過去に遡って書き換えはできないってことね。
よし、次は9-11。
CNN.com(2001.09.11)


うわ…あの日見た通りのページがそのままである。
試しに画像を直接リンクしてみると...

おおっ。これはリンク切れに悩むブロガーは要ブックマークかも。

因みに今日見れたネット御三家の最古ページはこちら↓
Yahoo!(1996.10.17)
eBay(1997.06.14)
Amazon.com(2000.02.29)

このウェイバック・マシン。最初話を聞いたときはサーバの無駄遣いとしか思わなかったが、ちょうど昨日、ミロの誕生日にグーグルが出した特製ロゴに遺族からクレームがついて半日で取り下げる騒ぎがあって思い出した。 残念ながら本星は未格納だったが、「The Escape Ladder(1940)、Nocture(1940)、The Beautiful Bird Revealing the Unknown to a Pair of Lovers(1941)の3つをリミックスした」と怒られたキレイなデザインはMercuryNews.comのスクリーンショット(上)とZDNETでご覧いただける。

人力検索はてな【ウェイバック・マシン】では「違法コンテンツもキャッシュする?」という問いが出ている。答えはYES。個人の誹謗中傷に悪用する人もいるらしい。

アメリカでも12日、健康関連のヘルスケア・アドボケイツ社が’訴訟の相手方弁護士が会社のホームページの過去ログから証拠資料を探しているのでアクセス制限してくれと頼んだが対応が十分ではなかった。裁判には影響しなかったから良かったものの、勝手にコピーして公開するのは著作権侵害じゃないか’として、インターネット・アーカイブ起訴の構えを明らかにした(Yahoo!News)。

カーネギーメロン大マイケル・シャモス教授が言う通り「世界最大の無断コピー。だが、誰も気にしないようなかたちで行われている」ということか。せっかくのサービス。違法コンテンツのフィルタリングやオプトアウト対応をなんとか整備し、是非存続してもらいたいものである。

関連:
Do you think for the future?: ウェイバックマシンの威力は?
インターネットと情報財(4/4) - 法、納得!どっとこむ

Comments