サイトマップとインデックス登録リクエスト

十郎の日本全国ソウルフードの旅というサイトをサルベージしてあげてそこのアクセスが増えるようにといろいろ努力してきた(クロール済みインデックス未登録sitemap.xmlSEOブログ村、アジトで不要不急の仕事等参照)。

まず、どういうわけかまずサイトマップが作られていなかった。wordpress のバージョンアップや仕様変更やSEOプラグインなどの競合のために、本来wordpressはサイトマップを勝手に作るものらしいと思っていたのだが、なにかの具合で作られていなかった。サイトマップを明示的に作る方法はいろいろあるんだが結局なんちゃらAll in One SEOとかいう定番のプラグインを入れたら作られるようになった。このうち post-sitemap.xml というやつだけを google search console というところへ教えてやるようにした。wordpress って投稿したページ以外にもカテゴリーとかrssとかいろんなページをごちゃごちゃ作るのだけど、検索に引っかかってほしいのはまず投稿ページであって投稿ページをインデックスに登録してくれてないのにrssやカテゴリーばかりインデクスされても困るわけじゃないですか。

で、サイトマップを提出しても投稿ページのすべてをインデクスしてくれるわけじゃない。どういう気まぐれかは知らないが、クロールしてもインデクス登録してくれないページというのがあって、その一覧が出るので、ちまちまインデクス登録リクエストする。だいたい1日あたり10ページまではリクエストできて、リクエストするとだいたいインデクスに載るらしいってことがわかったのでひたすらちまちまちまちまリクエストしていった。

ところが、そもそもクロールすらしてくれてないページというものがあるらしくて、サイトマップ提出したにも関わらずクロールすらしてくれないってこともあるらしいってことがわかった。

最終手段としては、search console の URL検査ってところにインデクス登録リクエストしたいページのURLを一つずつ入力していくしかないってことがわかったので毎日10ページずつ、まだインデクスされてないページを入力している。

そうするとなんとなくだがブログ村のランキングにも反映されてきたように思える。

私はこの「はかもなきこと」というサイトも含めて自分のサイトではSEOなんてことは一度もやったことがなかったんだが、だんだんとSEOの片鱗というものが見えてきた気がする。こうした SEO対策ネタというものは、知っている人は知ってるが知らない人は知らないだろうし、人に教えるのもめんどくさいし、みんなどうやって勉強するんだろうね。

ともかくもgoogleにインデクスされてないページはこの世に存在しないのも同じなので気を付けねばならんね。

クロール済みインデックス未登録

google search console 見てると、クロール済みだがインデックス未登録、つまり、google様におかせられては、認知はしているが検索対象から外しているページというのが大量にあるんだけど、ある程度までは仕方ないと思うんだ。wordpress の場合、カテゴリーのページとか rss のページなんかが大量にあるからそういうページは検索してもらわんでも良い。普通の記事のページだけ登録してもらえば良い。ところがgoogle 様がインデックスに登録しているページとしないページの判別がよくわからん。

なので、インデックスに登録してほしいページとそうでないページをこちらから明示できて、それが google様に伝わると良いのだけど、そんなごく当たり前の機能がいまだに世の中では実装されてないらしいのが不思議だ。

sitemap.xml

ここ (tanaka0903.net) とか natsumeshinsha.com のサイトの sitemap.xml がうまく生成されていないようだったので直した。

最近の wordpress は sitemap.xml を生成せず index.php で済ませる仕様になっているようなのだが、これもなぜかページ数が0件になっていてうまくいってない。理由はわからない。

sitemap.xml はあったほうが良いに決まっているのだろうがページがインデックスされるかどうかとは直接関係はないように思える。

インデックスされてほしいページとそうでないページをうまく検索エンジンに伝える方法はないのだろうか。

ここ (tanaka0903.net) はインデックスされてないページの割合が、全ページの半分くらいだが、natsumeshinsha.com はもっと低い。これまた理由はよくわからない。

SEO

今年の4月頃から、夏目書房新社のサイトを negishi.fun から natsumeshinsha.com に移す作業を手伝っていたのだが、google 検索は negishi.fun が完全に死んでるにもかかわらずいまだにこっちのサイトを検索上位に出してくる。見れば普通に、negishi.fun から natsumeshinsha.com にサイトが移転したのはわかると思うのだが、ずいぶんと意固地だ。bing 検索だとすぐに natsumeshinsha.com を検索上位に切り替えてくれたのに。

夏目書房新社を検索しても、natsumeshinsha.com そのものではなく、夏目書房新社にリンクしている、または間接的に引用しているサイトばかりが出てくる。

この理由についていろいろ考えてみたがどうにもわからない。

世の中にはSEO (search engine optimization)を専門にやってる会社もあるし、wordpress の plugin にも有料で SEO対策してくれるものがあるし、ウェブサイト構築やSEO対策をやってくれるコンサルタントもゴマンとあるわけだ。ただこの件に関してはそういうものに金を出せば解決する、というわけでもなさそうに思える。

私も何度か google には negishi.fun から natsumeshinsha.com に移ったということは伝えた。私だけでなく他の方法でも連絡は試みた。私の知る限り、サイトオーナーが直接連絡を取れば google はすぐ動いてくれるはずだ。

たぶん google はすでに状況をすべて把握ているのだろう。だが、サイト乗っ取りなどの場合を考慮して、一定期間、検索結果を変更しないようにしているのではなかろうか。実際ドメインを変更したのは、一種の事故で negishi.fun というドメインが失効し所有権を失ったからなので、こういうトラブルに対して google が慎重な、中立的態度を取るのはわからんでもない。

それでまあ、1年ぐらいようすをみて、それでも natsumeshinsha.com が出てこないようであればこれはもうシャドウバンのようなものをくらっていると考えざるを得ないのではなかろうか。いずれにしても私はサイトオーナーではないからこれ以上どうすることもできないし、すべきでもないと思う。

natsumeshinsha.com はもともとサイゾーが所有していたドメインだったはずだが、売られていたので買ったわけだが、所有者が変わったからまだ警戒されているのかもしれない。

natsumeshinsha.com と同時に tanaka0903.net も復活させたのだけど、こちらも似たような扱いを受けている。tanaka0903.net は 2009年3月からずっと私が持っていて、途中休止させてはいたが、移転などしたわけではない。

「はかもなきこと」で検索しても tanaka0903.net が直接出てくるわけではないが、「”はかもなきこと”」で検索すれば最初に出てくる。「はかもなきこと」は和泉式部日記の「はかもなき夢をだに見であかしては何をかのちの世語りにせむ」に由来しているので、これはこれで正しい検索結果であるともいえる。bingで検索しても結果は似たり寄ったりで、こちらはこれでしょうがないのだろう。

SEO その2

SEOの続編なのだが、私自身は SEO (Search Engine Optimization) とかまったく興味がなかったのだが、私の周りの人で、私が多少 web に詳しいからといろいろ質問されることが多く(1994年からやってりゃそりゃ少しは詳しくなる)、そういう人たちはともかくgoogleの検索上位に来てくれないことがまず不満なのらしい。それで調べたりするのだけど、技術的なことなら私にもわかりはするが、google が内部でどんなふうに検索してどんなふうにインデックス化してどういうふうに順位付けしてるかなんてこと、内部の事情を知らない限りわかりゃしないし、わかったとして一年後、半年後には変わってしまっているかもしれない。

今のところここのサイトは、「はかもなきこと」で検索するとまず、和泉式部日記を現代語したブログサイトが2つ来る。その次に wikisource の「和泉式部日記」が来る。

その次に、なんと「はてブ」の「はかもなきこと」(つまりこのサイト)が来る。はてブしてくれている人がいるのはありがたい。

その次は「ブログ村」の「はかもなきこと」が来る。「ブログ村」は登録削除したからそのうち消えてなくなってくれると思う。別に「ブログ村」に参加したかったわけではなく、「ブログ村」に参加している人のために「ブログ村」を調べていただけなので、もう無くてよい。

それで結局私のサイトがズバリ検索で出てくることはなかった。

ところが Microsoft bing で検索すると、ここのサイトのページがいくつか直接上位に上がってくる。私の感覚では昔は bing の検索結果が当たり前であったが、近年では、google の結果はかなりいろんな対策、あるいは、対策の対策、対策の対策の対策、なんらかの基準に基づく最適化をしている結果のように見えるのである。

確かに、世の中には古文を勉強する人が多い。そういう需要が高い。そうした人が見たいのは私のサイトではなく、古文の解説をしてくれるサイトなわけである。ある一つのキーワードについて知りたいのではなく、そのキーワードの周りのいろんなことを知り得たほうが、検索する人にとっては都合が良い。そういうふうに最適化されているのだろうと推測される。

実際、クオーテーションで囲って「”はかもなきこと”」で検索すれば私のサイトが一番に出てくるので、google はここのサイトを知らぬわけではないので、「キーワードそのもの」で検索すれば私のサイトを一番に出さざるを得ない。しかし世の中の人は「キーワード」そのものではなく、その言葉で表される何らかの情報を知りたいわけで、google の検索結果はしょうがないのかなとも思えてくる。

あと、いくら独自ドメインだからと言っても個人のサイトよりはハテナとかブログ村のような多くのユーザーが使っているサイトの方を google は優先している。要するに、顧客の利用頻度が高いサイトやページが優先されるようになっているのだ。

SEOとかアフィリエイトで儲けようなんてサイトを立ち上げて1年で1月100万円儲かるようになりました、なんていうサイトが多いんだが、要するにみんなが「SEOとかアフィリエイトで楽して儲ける」情報を知りたがっているからそういうサイトはそれなりにアクセスが稼げるのだろう。1サイトで月に1万円儲かるならそんなサイトを100サイト作れば100万円儲かるというような仕組みになっているに違いない。実に馬鹿げたことだ。

SEO

今時はグーグル検索も全部チートだし、大学入試もチートだし、なんちゃら対策とかなんちゃら最適化というものが進めば進むほどつまらなく、当てにならなくなっていく。昔はこのブログも「はかもなきこと」で検索すれば一番最初に出てきたものだが、今は何ページも後ろまでみていかないとでてこない。最初に出てくるのは和泉式部日記で、そりゃまあ「はかもなきゆめをだにみであかしては」という歌から取ったタイトルだから和泉式部日記がまず出てくるのは仕方ないとして、その後は全然関係サイトがずっと出てくる。ここのサイトはしばらく休止して、再開してまだ半年も経っておらず、あまり活動もしてないので仕方ないのだけど、google ではなく bingで検索すると結構上に上がってくるので、bing なんかは昔ながらの検索方法で順位を決めていて、google はなんだかよくわからないアルゴリズムでもって順位を決めているのだろう。そしてその順位の決め方だって来年になればまた変わっているかもしれない。とにかくみんな検索上位に出てくるために必死になっているから、不正とまでは言わないがチートとしかいいようがないことが世の中に蔓延しているってことはわかる。

追記。「はかもなきこと」で検索しても出てこないが「”はかもなきこと”」で検索すると一番目に出てくる。

トップページのタイトル

トップページだけ、タブに表示されるタイトル(つまり titleタグの中身)を「ページのタイトル – サイトのタイトル」ではなく「サイトのタイトル」になるようにしてほしいと言われ、いろいろやってみた結果、function.php に

add_filter( 'pre_get_document_title', 'change_document_title' );
function change_document_title( $title )
{
  if( is_home() )
  {
     $title = blog_info('name');
  }
  return $title;
}

と加えれば良いだけだった。あと、SEOプラグインがタイトル管理してる場合があるのでその時はそのプラグインを無効にしなくてはならない。

macosキーボード・マウス設定

マウスがヌルヌル動くのを防ぐ方法はよくわからないので、とりあえず、google chromeの拡張機能、SmoothScrollでしのぐことにした。

Step Size これはマウスポインタが一度に移動する距離(px)。マウスのヌルヌルとは直接関係ない。デフォルトの100くらいにする。

Animation time [ms] アニメーションなど必要ないので0にしたいところだが0だとバグる可能性があるので1にしておく。

Acceleration scale 加速なんかする必要ないというか一瞬で加速してほしいので999にする。

Acceleration delta [ms] 一瞬で加速してほしいので1にする。

Pulse scale よくわからんがどのくらい立ち上がりを急にするかって意味だと思う。99にしておいた。

Arrow key step size [px] これはつまり矢印キーで一度にどれくらい移動するかってことだろう。適当。

キーボードに関してはまず普通にJISを選択。

command キーと caps lock キーを入れ替える。

Karabiner-EventViewer と Karabiner-Elements をインストール。

(Japanese) PCキーボードの無変換キー → 英数キー

PCキーボードの変換キー → かなキー

macos には num lock という機能は無いらしい。つまり、テンキーは基本的に数字しか入力できない。だから特に設定する必要無し。むしろここは windows も見習えば良いと思う。テンキーを数値入力以外に使う人っているんか。ていうか、数値入力するのがデフォルトで、それ以外の用途にテンキーを使いたいやつが苦労すれば良いのにと思う。

この程度のことはネットで調べればすぐにわかるかと思ったら案外なくて困った。というか驚いた。おそらく macユーザー(というか、ふだんはwindowsを使っているがたまにmacも使うユーザー)のほとんどはデスクトップではなく macbook のユーザーか、さもなくばデスクトップでも apple 純正のキーボードを使っていて、その仕様に最初から慣れており、不満を感じてないのだろう。

私のように今回mac mini を買って、手持ちのキーボードはPC用しかなく、appleのあのペラペラなキーボードなど使う気まったく無い人間、というのはほとんどいないのだろうと思う。むしろわざわざ英語配列のキーボードを好き好んで使っているユーザーの方が多いのではなかろうか。英語配列のテンキー無しのHHKB使いたがるマニアがときどきいる。確かに私も大昔、まだSunのワークステーションなんか使ってた頃は英語配列のキーボードのキー入力をカスタマイズしてかな漢字変換などしてたが、今わざわざそんなことする必要ないだろ。それにblenderはテンキーを多用するから、テンキー付きのJISキーボード以外、使う気はおこらん。

一時期、パスワードには大文字小文字数字記号を混ぜたほうがいいってんで、@を含めたパスワードを使ってたことがあったんだが、パスワードが入力できなくて困ったことがあった。キー配置が違ってて@が打てなかったわけだった。英語配列だろうとJISだろうとwindowsだろうとmacだろうと安全にパスワード入力できるような文字種が良いと思って今はやめてる。