ファセット分類について勉強

ファセット分類を利用したシステム構築の論文を読んでたら、中途半端に理解していた「ファセット分類とは何か」ということがグチャグチャになってしまった。
いろいろググって見たが。。。。

例を使ってファセット分類について説明してみよう

具体例を使うと、イメージをしやすいがその概念が狭義になってしまう恐れがあるので参考程度に。または「違うんじゃね?」って人はぜひ突っ込みを。

レコード1つ1つは、ファセットというメタデータを持つ。

例えば、PCというレコードセットを考えると、メタデータは、

といった感じになる。
んで、ファセットと言うのは上記の例で言う「PCのタイプ」「搭載CPU」「ディスプレイ」等になる。各ファセットの値は「PCのタイプ」や「ディスプレイ」のように単体の値だけのときもあるし、「搭載CPU」の様に階層構造が広がるときもある。下に階層構造を持つ場合は、各値は「AMD/Athlon」「Intel/Core2Duo」のようになる。
ココでユーザは、「PCのタイプはラップトップ、搭載CPUはAMDAthlon64で、。。。」といった感じに条件をつけて、一度に閲覧するレコードの数を減らしていく。っつかこれって価格.comじゃないか?
これがファセット分類(?)おそらくこれは極一部の具体例でしかないと思う。

タグ分類とファセット分類の関係

Wikiウサギさんのところでは、近年流行のタグ分類もファセット分類の一部としている。
上記のPCの例のように書くと。。。

  • これはひどい
    • このタグを持つ
    • このタグを持たない
  • linux
    • このタグを持つ
    • このタグを持たない
  • まとめ
    • このタグを持つ
    • このタグを持たない
  • etc.....

ってかんじかな?
だとしたら、膨大な量のファセットですね。
しかもファセットを複数指定できるわけじゃないから、ファセット分類としてはその長所を生かせてない感じがする。

ファセットの値の相互排他性について

ファセット分類の本質は非MECE(mutually exclusive, collectively exhaustive、 互いに重ならず、すべてを網羅する )にあることに、やっと思い至りました。

情報大工のひとりごと - 情報設計の脱MECE化がファセット分類

と仰ってますが、現在僕が読んでる論文

A facet is simply a method of classification. It groups together results which have the same value for a particular category and provides a view of the result set classified according to each category. The categories defined are mutually exclusive and hence facets are orthogonal.

って。。。


ん?

あぁ、これ書いてるときにわかった。
つまり相互排他であるって言ってるのが、前者では「ファセットの値」、後者では「ファセット」ってこと?


っとココまでがファセット分類についてわかったこと。(とわかってないこと

ファセット分類を用いているっぽいシステム、アプリを参考までに挙げておく。

ここまで書いて、疑問。
ファセット分類って結構抽象的な概念だけど、ひょっとしてディレクトリ分類もファセット分類の仲間?


うーん、イマイチファセット分類が分かった気分じゃない。

追記 : これを読んで見たい。→How to Make a Faceted Classification and Put It On the Web(ファセット分類をウェブに応用するために)