Googleのキャッシュ削除申請

検索したら一番上に出てきてほしいという欲求とうらはらに、表示されないようにしてほしい、というリクエストもあります。一度ネット上に流れたものを完全に削除するのは、まず無理で、大手検索サイトで直接表示されないようにする、というくらいでしょうか。今回は、Google検索から削除をするという作業でした。

  1. 削除URLに該当するコンテンツをサーバ上から削除する = 「HTTP 404」表示がでるようする
  2. Googleのアカウントを取得する >> コチラ
  3. ウェブマスターツールで削除申請 >> コチラ

大まかには以上の手順で実行し、申請が認められればキャッシュから消えることになります。しかし、WPの場合、ちょっと困ります。
特定記事のみ「HTTP404」を返すことがしにくいのです。ヘッダ部分にそれに対応したコードを書き込むわけですが、WPのヘッダ部分は共通です。つまり、「特定記事のみ」という作業がソースを書き直し、条件式などを挿入しないと実現困難です。そこで、今回の横着を考えつきました。
pluginを探したら、Permalink Validatorというのがありました。このプラグイン、特定記事に「HTTP404」反応できるようになります。削除前であれば、記事の付加作業としてできます。すでに、削除したものであれば、キャッシュなどされているURLをコピーし、専用作業画面に貼り付け、「HTTP404」を表示するURLを指示すればよいことになります。
今回は、すでに記事が削除されているので、後者の方法となり、404表示用PHPファイルをUPしました。
以下のファイルがPHP記法に沿っているかどうかよくわからないのですが、とりあえずつくったものです。普段、こういうものを書くことが無いので、大変戸惑いました〜。

<?php header("HTTP/1.1 404 Not Found"); ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="ja">
<head profile="http://gmpg.org/xfn/11">
<meta http-equiv="Content-Type" 
content="text/html; charset=UTF-8" />
<title> xxx Error 404</title>
</head>
<body>
<h2>Error 404 - Page Not Found</h2>
<p>xxx</p>
</body>
</html>

上のソース、ひょっとしたら、2行目以降不要かも…。なにせ、素人です。すみません。自分の備忘録みたいなもです。詳しい方教えてくださいませ。
サイトのblogヘッダー部分には、削除申請者がサイトの管理者であることが証明できるよう、Googleから発行されるメタタグを貼り付ける必要もあります。手順がかなり長いので、最初は途中までやって、できたと思い、削除が拒否されるということの繰り返しでした。やっと一晩かかって、1件の削除に成功。なんとか糸口がつかめたのでした。しかし、他にも削除申請しないといけない記事もあり、他の検索エンジンはまた別のことを考えなければならず、道のりはさらに長いのでした。
当初、Permalink Validatorを使わず、ジャンプ先のファイルに404表示させないときは、削除したい記事は、「HTTP200」(正常)が表示されるのでした。つまり、WPが「該当が無い」と表示して、反応しているため、「無い」という状態となっていなかったようでした。ああ、ややこしい。
解決の糸口になったのは、WordPress でステータスコード 404(Not Found)を返却するエラーページを作るでした。これをヒントに、テーマ変更があっても対応できるよう、プラグインで対応できないか探し、Permalink Validatorを見つけ、404ファイルをつくって、なんとか、キャッシュを削除する条件を整え、Googleに申請し、実現した、という流れでした。つ・か・れ・たぁ〜