IIDXで見る偏差値

今日どこかで「IIDXのエキスパの偏差値って何よ?」というような疑問を見たのでちょっと.
公式でもエキスパートのコース別ページを見ると,かぎかっこ[]で偏差値が表示されます.
試しにWikipediaで偏差値の項を見てみると次のようになっています.
普段はWikipediaにはあまり頼らないようにしていますが(笑)

>偏差値(へんさち、Standard score)とは、ある数値が母集団の中でどれくらいの位置にいるかを
表した無次元数。平均値が50、標準偏差が10となるように標本変数を規格化したものである。

ちょっと統計的な語句が出てきているので少し説明をします.

母集団というのは,サンプリングしたデータの対象となる要素の集まりを差します.
例えば,全IIDXプレイヤーから100人をランダムにサンプリングしてロケテストを行ってその出来についてアンケートをとったとします.このとき「全IIDXプレイヤー」が母集団となります.
通常全プレイヤーのアンケート結果を集めればいいわけですが,現実問題としてそのようなことは不可能なので,一部のサンプル集団から得られる結果をその母集団についてを予測するわけです.
100人中8割の人が「満足な出来である」と評価したので,全プレイヤーとしてもその8割程度は同様の結果が得られるだろう,というようなことです.(本当はこんなに簡単ではありませんが)

次に平均値標準偏差についてです.
平均値は言わずと知れた,全ての合計をその標本数で割ったものです.
標準偏差とは,値の散らばり具合を表した指標の一つで,分散という同様に散らばり具合を表す指標の平方根をとったものになります.
(分散には不偏分散と標本分散という2つがありますが,ここでは前者を用いて以下「分散」とします.)
さて今週の非公式WRさんの課題曲が『madrugada』なので,それを用いて例を挙げます.
私うさたん。が少しでもいいスコアを登録しようとmadrugadaを繰り返しプレイしたとします.
ここで仮に6回SPNをプレイし,得られたスコアを以下に順に示します.当然全て同じ条件(ハイスピードは固定,正規譜面など)で得たスコアとします.
 701, 698, 708, 713, 690, 696
それに対して同様に仮にSPHをプレイしたスコアをスコアを以下に順に示します.
 1898, 1201, 1960, 1926, 1940, 1947
この2つを見て直感的にどう感じるでしょうか?
SPNの方が安定している,SPHはやるたびにバラバラであると見えるのではないでしょうか.
しかしある程度簡単で総ノート数も少ないNORMALと,それに比べてノート数が多いHYPERについて直感的に判断するのはやや憚られます.
そこでこの散らばり具合を示す指標が分散や標準偏差といったものです.
試しにこの2つのスコアの集団について標準偏差を計算してみます.
標本数(データの数)はそれぞれ6こ,SPNの平均値は701,SPHの平均値は1812となります.
計算は上のWikipediaのものを参照してもらうと,SPNの方の標準偏差は8.34, SPHの方の標準偏差は300.08となります.(小数点第2位で丸めてあります)
SPHではかなり大きな値となっていることがわかります.
つまり出したスコアに大きなバラツキがあるといえるわけです.
スコアのバラツキが大きいと,ACでエキスパートをやるときに非常に苦労します(笑)

さてなんだか長くなってしまいましたがここから本題です.
単刀直入にいきますと,自分のあるエキスパートコースでのスコアをxとすると,その偏差値zは同コースにおける全体の平均をμ,標準偏差をσとすれば以下の式で求められます.
ss
IIDXのエキスパートコースにおけるものですから,当然全員がその対象となるわけで母平均や母標準偏差などは考える必要はなく,単に平均,標準偏差を考えて問題ありません.
少しアレな話になりますが,これはあくまでスコアの分布がN(μ,σ^2)に従うと仮定した場合です.分布がこれとは離れている場合,適切な判断指標としては扱えなくなってしまう場合があります.
分布がN(μ,σ^2)に従うと仮定すると,(x-μ)/σはN(0,1^2)に従いますので,正規分布の性質より定数α,βに対して,αx+β~N(αμ+β,α^2*σ^2)が言えることより,zはN(50,10^2)
に従うといえます.ぁー,弐寺プレイヤーのスコア分布ってどんなもんだろ・・・標本数は別としてもマイナスとかいますからね,正規分布とはけっこう遠い気がしますが(笑)

要するにですね,偏差値というものは,平均μ,標準偏差σの分布を,平均50,標準偏差10の分布へ変換する式によって規格化したものであり,(母)集団内での位置を示したものであると言えます.
スコア分布(≠スコア)の中心に対して,自分がどの程度の位置にあるのかという一種の指標ですね.
よくわからん!という人は,60を超えていれば上位16%くらいの位置かな,程度です.(これもあくまで標準正規分布というものを仮定した場合ですが)

というわけでこんなもんで.結構曖昧なところ,おかしなところもあると思いますが終わり~
ちなみにmadrugadaの捏造スコアの中に実際の自分のスコアが1つずつあったりします.


参考
[1]Wikipedia-偏差値(http://ja.wikipedia.org/wiki/%E5%81%8F%E5%B7%AE%E5%80%A4)
[2]正規分布と標準偏差(http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/normdist/hyojunhensa.html)
プロフィール

うさたん。

Author:うさたん。
しがないサラリーマン(製薬)

▽pop'n music, IIDX, SDVX, QMA
引退

ポップン譜面集はこちら
忍者TOOLSのPWがリセットされたため更新終了

カレンダー
12 | 2009/01 | 02
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
月別アーカイブ
最新記事
最新コメント
カテゴリ
FC2カウンター
コンテンツ
検索フォーム
RSSリンクの表示