2009年2月16日月曜日

Googleと脳

こんにちは

Googleって便利ですよねー。
調べたいことがあったら、今や百科事典より先にGoogleです。
キーワードを打ち込めば、瞬時に関連するホームページを探してくれる。
便利、便利。
Googleで調べることを「ググる」なんて言うんだそうです。

昨日、医療放射線被曝について調べようとググってみたら、なんとぼくのブログが引っかかりました。
それもかなり上位で。
自分の書いた物をより詳しく調べようとしてググったんですが、自分のブログが検索されちゃうとは。。。
ぼくのブログは開設してまだ数ヶ月ですが、もうGoogleでも検索されるようになっているのでビックリでした。

西田圭介『Googleを支える技術』技術評論社¥2280-を読みました。
この本に、なぜGoogleはこんなに素早く検索ができるのか、その仕組みが書いてありました。
Googleの検索エンジンは、もちろんコンピュータで構成されています。
そのコンピュータは、三つの部分から構成されているのだそうです。

 ・検索サーバー
 ・データベース(インデックス)
 ・バックエンド(クローラー)

普段ぼくらがググるときは、検索サーバーに接続します。
検索サーバーの後ろには、既に必要十分なデータベースが存在しています。
検索サーバーは、既にあるデータベースから検索結果を引き出してくるだけなんです。
だからあんなに速く検索結果を表示できるわけです。

では、そのデータベースを作るのはどうやっているのか。
バックエンドというコンピュータが、世界中のホームページを自動的に見て回っては、ダウンロードしているのです。
意外と泥臭いやり方なんですね。
バックエンドは別名クローラーとも言います。
水泳のクロールと同じスペル、crawlです。
crawlは、バタバタはい回る、という意味もあります。
まさに、クローラーはインターネットの広大な海の中をバタバタはい回って、データーを集めてきているのです。

そして集めてきたホームページからキーワードを抜き出して、インデックスを作り、データベース化するわけです。
いったんデータベースができあがれば、それをコピーして世界中の検索サーバに配信します。
検索サーバーには、検索キーワードとデータベース化したインデックスを関連づけるソフトウェアが入っています。
つまり、ロジックが組み込まれているわけです。
検索サーバーはそのロジックとデータベースを使って、ユーザーに検索結果を即座に投げ返しているというわけなんです。

今はめったにありませんが、昔はググった結果のURLにつないでみると、既にそのホームページが存在しない、なんてことがありました。
それは、データベースが古くなっている、ということを示しています。
つまり、データベースを作成するには時間がかかっているということです。
クローラーがデーターを集め、データベース化するには、たとえコンピューターが自動的にやっているとは言え、ある程度の時間がかかるものなのです。

Googleの仕組みがここまで分かって、なんか脳と似ているなと思いました。
脳は「メモリーベイスドアーキテクチャ」です。
記憶に基づいて思考する構造、なんです。
脳の判断時間はたったの0.2秒、とても速いんです。
でも素早い判断をするためには、記憶というデータベースの蓄積があり、思考のやり方、すなわちロジックが備わっている必要がある。
脳はデータベースとロジックで思考しているのです。
まったく、Googleと同じです。
もしかしたら、Googleは脳に倣ってシステムを設計したのかも知れません。

人間もその記憶、データベースを作り上げるには時間と労力がかかります。
子どもの頃からコツコツと勉強し、経験を積み重ねる。
そして大人になってからも、常に学び続けデータベースを更新していく必要がある。
古くなったデータベースでは、正しい答えを導けません。
それをやり続けた人が、瞬時に正しい判断ができるようになるわけです。
つまり、crawlですね。
勉強なんて時間と苦労を伴うことを地道にやり続ける忍耐力。
そのための時間を確保し、体力、精神力にも余裕を持ち続けること。
crawlするためには苦労もするって、オヤジギャグ??

0 件のコメント: