2008年11月26日水曜日

[他]大規模データ処理の極意?

先日CodeZineに、はてな流大規模データ処理の極意という記事が載っていました。じっくり読んでしまいました。その中で私自身の考えも及んでいなかったこと・知らなかったこと(Linuxちょっと弱い)がいくつか書かれていることがありました。抜粋すると以下のような感じ。
  • メモリ(キャッシュ)で処理ができなくなりディスクI/Oが発生した時点で負け
  • Linuxではメモリが空いていれば秋メモリはすべてキャッシュにまわる(キャッシュの制限はない)
  • OSが起動したら、データベースのファイルを全部catして「/dev/null」に投げる→メモリにキャッシュが構築される
  • SQL文でJOINを使わない(複数のSQLに分離して実行→テーブル単位でDBサーバを分けたりできる)

できればこのセミナーに参加したかったです。しかし、CodeZineに限らず、このような記事をタダで読めるとは。いい時代になりました。

0 件のコメント: