比と割合と率

QMAの“全国正答”やIIDXの“CLEAR RATE”など,率や比,割合といった言葉は日常的に目にするし,また使う言葉の一つである.しかしながら率・比・割合という3つの言葉を区別して使っている人はそうそういないのではないかと思われ,そんなの全部一緒じゃないかという意見が大部分のような気さえする.

実際,何か辞書を引いてみればどれも区別できない書き方をされている.
だがこれらの概念は科学的には区別されているものである.
そしてその区別に基づくならば,冒頭に挙げた“全国正解率”や“CLEAR RATE”はおかしな表現となる.

まずである.
これは直観的には何対何といったようなものであり,英語では“ratio”にあたる.
一方に対して比較するもう一方がその何倍か,というもので双方はお互いを含まないもの同士である.
例えば,ある部屋にいる「男性女性」といえば男性は女性を含まないしその逆もまた然りである.男性に対して女性はその何倍か,書き換えれば「男性:女性」で表すことができるものが比である.
この場合は次元はないが,お互いを含まないという性質上,一般的には次元が存在する.

次に割合である.
英語では“proportion”にあたる概念である.
私たちが比とか率というときの多くは実はこの割合の意味であることが多いように感じられる.
これは全体に占めるうちの何割かというもので,直観的には何分の何というようなものである.
比とは異なり一方(分子)は全体(分母)に含まれ,次元は存在しない.
先ほどの例と対比させて考えると,「ある部屋にいる男性の割合」とすれば部屋にいる全体の人数のうち男性が何割を占めるか,ということになる.
これが割合であり,最初の例である“全国正答率”も率といいながら割合であるといえる.なぜならば全国である問題に出会った人全体のうち正解した人の人数の割合だからである.後に続く形となるが“CLEAR RATE”もRATE(=率)といいながら割合であることは容易に理解できると思う.

最後にである.りっちゃん隊員こと律ではないので人によっては十分注意が必要である,かもしれない.
個人的にはこれが一番捉えずらい概念である.それは私が律派ではないからという理由とは一切関係がない.
先にも少し触れたが率は英語では“rate”にあたる.
これは佐藤俊哉先生の著書『宇宙怪人しまりす医療統計を学ぶ』(岩波科学ライブラリー)によれば,単位時間あたりに現象が起こる速さということで説明されている.一つ例を引用すると,化学変化の反応速度が挙げられている.これは一瞬当りの変化率であり,(瞬間的な)率である.次元の観点からみると,(一概に時間に限ったことではないが)次元は時間の単位の逆数となる.1年あたりの死亡率なども(平均的な)率である.


といったような具合に化学的には上で挙げた3つの言葉は区別されるものである.
しかしながら日常では殆ど区別されておらず,かといって今さら区別しようとしても混乱をきたすだけだろう.
学問的な分野では気を払い,日常的には「律派じゃねぇ!あずにゃん派だ!」「率じゃねぇ!割合だ!」と思っているくらいで十分なのではないかと思います.


宇宙怪人しまりす医療統計を学ぶ (岩波科学ライブラリー (114))宇宙怪人しまりす医療統計を学ぶ (岩波科学ライブラリー (114))
(2005/12)
佐藤 俊哉

商品詳細を見る

テーマ : 科学・医療・心理
ジャンル : 学問・文化・芸術

平均値の誤用

スポーツのトータル正解率が45%です.詰んでいる.

それはそうと全国大会をやっていて最近思うところが「平均値」です.
予選前半戦終了時に上位3人の得点と平均点が表示されますよね.
全国大会では組の概念がなく無差別マッチングのため,それこそ上から下までのプレイヤーが集います.当然,実力差が通常の組内マッチングに比べて大きくバラける傾向にあります.
すると必然的に次のような現象(?)が起きることがあります.

簡易的に小数点以下は考えないものとして,16人の点数を降順に並べます.

95,93,90,44,31,31,29,28,28,26,16,15,15,13,12,0

上位3人の得点:95,93,90
平均点:35.375

ここで注目してもらいたいのが平均点です.およそ35となっています.
このときあなたが上から5位の31点のプレイヤーならどう感じるでしょうか?
きっと『げ,平均点35点で自分の方が下回ってるじゃん・・・』と感じると思います.
平均というと経験的に“真ん中”という捉え方をしてしまうことがあるのと,また実際にそのようなニュアンスで使っている場合もあります.
本来ここで31点取れていれば上位5位ですし,予選後半にもよりますが現段階でそんなに心配することはないかと思います.しかし表示されるのは上位3人と平均点のみなので,あたかも自分が全体の半分以下であるかのような錯覚に陥ります.

これが平均値の落とし穴です.
平均値(通常,算術平均を指し,ここでも算術平均を平均といって扱っています)の算出方法は義務教育をそれなりに受けてきた人ならほぼ全員が知っていると言っていいかと思いますが,観測値の相和をその観測値の数で割ったもの,すなわち均したものです.全員が30点前後ならば当然平均値はそのへんの値に落ち着きます.
しかしこのような計算方法のため,この例でいう90点を超えるような一部の飛び離れた値によって,平均値は中心から上の方向へ引っ張られてしまいます.
ここでいう“一部の飛び離れた値”のことを「外れ値」と呼びます.
要するに,平均値は少数の外れ値によって強い影響を受けてしまう,というわけです.
私たちはその値を一つの目安としたいのに,目安になるどころか誤った判断をしてしまいます.
従って,外れ値を含むような場合を要約したい場合には,平均値は相応しくないと言えます.

ではそれに代わる指標はあるのかと思う人もいるかと思いますが,そのような場合に力を発揮するものが「median(メジアン,メディアン)」です.(以下,メジアン)理系学問文字パネルで出題されるので言葉だけは知っているという人もいるかと思います.
メジアンとは日本語では「中央値」と訳され,その名の通り,全てのデータの真ん中の値を指す指標となります.データが奇数個の場合は一つに定まり,偶数個の場合は中心に位置する2つの値の平均がメジアンとなります.
よって16個のデータがある今回の例では,中央に位置する点数は28と28ですから,メジアンはその平均をとって「28」となります.つまり,この予選前半戦での各プレイヤーの得点のうち中央の値は28点である,ということです.
このように考えれば,さきほどの31点の人は『なんとか半分より上にはいるぞ』ということになりますね.

なんとなく書きなぐってきましたが,要するに,「外れ値を含むデータを要約する場合は,平均値ではなくメジアンがよりよい」ということです.統計的に分布の話などに突入すると大変なのであくまで直感的な議論だけでおしまいです.
一部の魔力4000超えとかいう人が混ざっているとこのような事態を引き起こす恐れがあります.周りの正誤状況にも目を配りながら,平均値に惑わされないようにしましょう.

テーマ : 勉強
ジャンル : 学問・文化・芸術

プロフィール

うさたん。

Author:うさたん。
しがないサラリーマン(製薬)

▽pop'n music, IIDX, SDVX, QMA
引退

ポップン譜面集はこちら
忍者TOOLSのPWがリセットされたため更新終了

カレンダー
09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -
月別アーカイブ
最新記事
最新コメント
カテゴリ
FC2カウンター
コンテンツ
検索フォーム
RSSリンクの表示