空間インデックスの履歴

リレーショナルデータベース空間インデックスを使おうと思ってる。

というか、使わざるを得ないかも。

なぜゆえに空間インデックス

まず、インデックスとは何か確認してみよう!

MySQLの場合、インデックスは多くの場合B-Treeというものが使われている。(資料: MySQLにおけるインデックスの使用)

いきなりB-Treeと言われても意味がわからないかもしれないが、要は外見上は50音順に並んでいる、ということ。なので、たとえば、データを取得するときや、ソートをするときに使われている。

複合インデックス

たとえば、カラムAだけをキーに取得するような場合には、インデックスは一つのカラムに設定する。

が、複数のキーに設定する場合には、カラムAカラムBに対して複合インデックスを張るということをする。

ここでもし複合インデックスを張り忘れたりすると、データベースは「同じカラムAを持つレコードから順番に全部のレコードを調べる」ということをしてしまう。

正しく複合インデックスを張っている場合には、「同じカラムAを持つレコードを調べ、そのうちのカラムBで○○のレコードを持つレコード」のデータのみを調べることができるようになるのだ。

で、何で空間インデックス

ここで、緯度経度などの座標の場合には問題が出てくる。

緯度経度の座標は多くの場合、近くの点であったとしても違う座標になっているんだ。

お店の位置
______________________________________
      x
                             x
                           x
              x
             x
                                   x
______________________________________
↑ 近くにあるようなお店でも実は緯度も経度も違う。


インデックスを調べる際にB-Treeでは「Aの値がxxのときでかつBの値がyyの場合」には効率よく調べることができるのだけれども、Aの値もBの値もそれぞれ細かく異なる場合には効率よく調べることができないんだ。

なので、ここで空間インデックスを使う。使うとよいらしい。

(後で書く)