よっちゃんの本棚: Googleと脳

こんにちは

Googleって便利ですよねー。

調べたいことがあったら、今や百科事典より先にGoogleです。

キーワードを打ち込めば、瞬時に関連するホームページを探してくれる。

便利、便利。

Googleで調べることを「ググる」なんて言うんだそうです。

昨日、医療放射線被曝について調べようとググってみたら、なんとぼくのブログが引っかかりました。

それもかなり上位で。

自分の書いた物をより詳しく調べようとしてググったんですが、自分のブログが検索されちゃうとは。。。

ぼくのブログは開設してまだ数ヶ月ですが、もうGoogleでも検索されるようになっているのでビックリでした。

西田圭介『Googleを支える技術』技術評論社￥2280-を読みました。

この本に、なぜGoogleはこんなに素早く検索ができるのか、その仕組みが書いてありました。

Googleの検索エンジンは、もちろんコンピュータで構成されています。

そのコンピュータは、三つの部分から構成されているのだそうです。

　・検索サーバー

　・データベース(インデックス）

　・バックエンド（クローラー）

普段ぼくらがググるときは、検索サーバーに接続します。

検索サーバーの後ろには、既に必要十分なデータベースが存在しています。

検索サーバーは、既にあるデータベースから検索結果を引き出してくるだけなんです。

だからあんなに速く検索結果を表示できるわけです。

では、そのデータベースを作るのはどうやっているのか。

バックエンドというコンピュータが、世界中のホームページを自動的に見て回っては、ダウンロードしているのです。

意外と泥臭いやり方なんですね。

バックエンドは別名クローラーとも言います。

水泳のクロールと同じスペル、crawlです。

crawlは、バタバタはい回る、という意味もあります。

まさに、クローラーはインターネットの広大な海の中をバタバタはい回って、データーを集めてきているのです。

そして集めてきたホームページからキーワードを抜き出して、インデックスを作り、データベース化するわけです。

いったんデータベースができあがれば、それをコピーして世界中の検索サーバに配信します。

検索サーバーには、検索キーワードとデータベース化したインデックスを関連づけるソフトウェアが入っています。

つまり、ロジックが組み込まれているわけです。

検索サーバーはそのロジックとデータベースを使って、ユーザーに検索結果を即座に投げ返しているというわけなんです。

今はめったにありませんが、昔はググった結果のURLにつないでみると、既にそのホームページが存在しない、なんてことがありました。

それは、データベースが古くなっている、ということを示しています。

つまり、データベースを作成するには時間がかかっているということです。

クローラーがデーターを集め、データベース化するには、たとえコンピューターが自動的にやっているとは言え、ある程度の時間がかかるものなのです。

Googleの仕組みがここまで分かって、なんか脳と似ているなと思いました。

脳は「メモリーベイスドアーキテクチャ」です。

記憶に基づいて思考する構造、なんです。

脳の判断時間はたったの0.2秒、とても速いんです。

でも素早い判断をするためには、記憶というデータベースの蓄積があり、思考のやり方、すなわちロジックが備わっている必要がある。

脳はデータベースとロジックで思考しているのです。

まったく、Googleと同じです。

もしかしたら、Googleは脳に倣ってシステムを設計したのかも知れません。

人間もその記憶、データベースを作り上げるには時間と労力がかかります。

子どもの頃からコツコツと勉強し、経験を積み重ねる。

そして大人になってからも、常に学び続けデータベースを更新していく必要がある。

古くなったデータベースでは、正しい答えを導けません。

それをやり続けた人が、瞬時に正しい判断ができるようになるわけです。

つまり、crawlですね。

勉強なんて時間と苦労を伴うことを地道にやり続ける忍耐力。

そのための時間を確保し、体力、精神力にも余裕を持ち続けること。

crawlするためには苦労もするって、オヤジギャグ？？

よっちゃんの本棚

2009年2月16日月曜日

Googleと脳

0 件のコメント:

ブログアーカイブ

自己紹介