2013年3月31日日曜日

ホテリングの立地競争モデル(1)

今回は、以前の記事で登場した統計学、数理経済学の大家であるホテリング(Harold Hotelling:1895 –1973)についてとりあげます。今回取り上げるのは、ホテリングの立地競争モデルと呼ばれるものです。

■ 設例

下記の図のようなA点とB点を端点とする一直線の道(又は隣接する鉄道の駅)を考えます。この道(線路)沿いに、X社とY社がそれぞれ出店を計画しているとします。X社とY社はA-B間のどこに店を出店することになるでしょうか。但し、以下のような条件が付されているとします。


① 道(線路)沿いには同じ人口密度で住民が住んでいる。
② X社とY社以外に出店する可能性はない。
③ X社,Y社の商品は汎用品(あるいはまったく同一の商品)で、差別化されていない。
④ 住民は自宅から近い方の店に行く。
⑤ 店が自宅から等距離の場合、無作為に(確率50%で)どちらに行くかを決める。
⑥ X社とY社はお客をなるべく多く集めたい(利益の最大化をしたい)と考えている。
⑦ X社とY社はお互いの店の存在や目的(利益最大化目的)を知っている。


■ 海水浴場のアイスクリーム店

上記のように①~⑦まで色々な条件を付けたので少し混乱するかもしれませんが、例えば、A点,B点を両端とした海水浴場に店を出そうとしている2つのアイスクリーム屋を考えれば良いと思います。売っている品物も値段も同じ(条件③)とすると、お客さんはどちらか近い方の店に行き(条件④)、仮に等距離の場合にはランダムに(50%の確率で)どちらに行くか決めるでしょう(条件⑤。)また、2つのアイスクリーム店は、それぞれ同じ目的(=利益最大化)を目指して行動し(条件⑥)、お互いに相手の目的や立地場所を知っている(条件⑦)と考えられます。
  ①、②の条件はやや非現実的ですが、それ以外の条件(③~⑦)については、必ずしも非現実的とまでは言えないと考えられます。



■ 最適な出店場所

さて、X社とY社の例に戻ります。それぞれの最適な出店場所を考えるにあたって、まず、X社が先に出店するケースを考えます。下の図のようにX社がややA地点寄り(中心から左寄り)に出店した場合、Y社はどこに出店すればよいでしょうか。


 ここで、話を整理して考えるために、Y社はX社よりも常に右側(B地点側)に出店するとします。そうすると、X社の左側からA地点まで(←の矢印)については、X社がシェアをとります。一方、Y社の右側からB地点まで(→の矢印)については、Y社がシェアをとります。X社とY社の間は、ちょうど中間点を境に、X社とY社がシェアを分け合います。したがって、Y社はX社のすぐ右隣に出店するのが最適な戦略となります。



■ X社とY社の最適な立地場所

先にY社が出店した場合も同様です。結局、X社、Y社は隣接して出店することになります。また、X社、Y社は利益を最大化(シェア最大化)をしたいと考えていますから、それぞれA地点とB地点のちょうど中間地点に出店することになります。仮に、上の例のようにX社がA地点寄りに出店すれば、Y社がX社のすぐ右隣に出店することで、Y社の方より大きなシェアを獲得できるからです。結局、X社とY社は(A地点とB地点の)中間地点に隣接して出店することになるわけです。



そして、いったんこの均衡状態に達すると、X社,Y社ともに、これ以上出店場所を変更しようという動機が起こりません。なぜなら、仮にY社がA地点とB地点の中間に立地するX社から離れて出店しようすると、Y社のシェア(売上)はX社よりも少なくなってしまうからです。

上記の均衡は安定的であり、ゲーム理論でいうところの「ナッシュ均衡」に該当します。


■ 立地競争モデルの理論で説明できる事例

ホテリングのモデルで説明できるのは立地状況だけでなく、以下のような事例が考えられます。

① 2大政党のマニフェストが似通ってくること。(中道的な政党がより多くの支持を得ること。)
② 製品の性能や価格が似かよったものになっていくこと。

今回は以上です。次回も引き続き、立地競争モデル扱います。


清水公認会計士事務所(Shimizu CPA Office

2013年3月24日日曜日

 「ステューデント」のt検定(閑話休題)

統計学の理論的な(堅苦しい)話が続いているので、今回は少し柔らかい話をしたいと思います。統計学を勉強した人なら誰もが知っていると思われるステューデントのt検定に関連する話題です。話は約100年前に遡ります。

■ ゴセットとギネスビール

オックスフォード大学で数学と化学の学位を得たウィリアム・シーリー・ゴセット(William Sealy Gosset:1876~1937)は、アイルランドの老舗ビール会社であるギネスビール醸造所へ入社しました。ちなみに、ギネス社は「ギネスビール」の他、ギネスブックの出版元としても有名です。

ビール会社と統計学に何の関係があるのでしょうか?

実は、ビールの製造過程では麦芽汁を発酵させる必要があり、発酵に必要な酵母の数を出来るだけ精緻に計算する必要があるのです。酵母が少なければ充分に発酵しませんし、多すぎると逆に苦くなってしまうのです。

酵母は生き物なので(酵母)細胞は絶えず増殖・分裂します。また、発酵に使う酵母細胞のすべてを検査するわけにもいきませんから、一部分をサンプル(標本)として抜き取って数えることになります。この少数のサンプルから全体を推定することがゴセットの課題でした。 


■ その名は「ステューデント」

ゴセットは自宅で小さなサンプルを繰り返し抽出し、何度も数値計算を行い、その結果を記録していきました。コンピュータなどない時代ですからすべて手計算です。このような作業には、相当の忍耐力が必要だったことは想像に難くありません。ゴセットの研究は当時バイオメトリカ誌の編集者であったカール・ピアソン(K. Pearson)の目に留まり、1年間の研究休暇をとってピアソンの下で研究を行いました。ゴセットが酵母に関する研究成果をまとめたとき、ピアソンは自分が編集しているバイオメトリカ誌に論文として公表したいと考えました。
ところが、ゴセットは会社に内緒で研究していました。また、研究発表の内容は(ゴセットの貢献が大きいとはいえ)ギネス社の企業秘密に関するものです。そこで、論文発表の際には「ステューデント」というペンネームを使って発表することにしたのです。これが「ステューデント」の由来です。その後約30年間にわたって、「ステューデント」は、数々の重要な論文を書き、その大半がバイオメトリカ誌に掲載されたそうです。中でも特に重要な研究成果の一つが、ステューデントのt検定と呼ばれるものです。この考え方は、The Probable Error of a Mean(1908)という論文で初めて公表され、以後、統計学の発展において極めて重要な役割を果たしました。


■ すべては秘密裏に


生前、ゴセットの研究活動は(少なくともギネス社のオーナーである)ギネス家には気づかれなかったようです。これを裏付けるかのように、アメリカ人の統計学者であるハロルド・ホテリング(H. Hotelling)が、当時「ステューデント」ことゴセットに会おうとした時、『すべて秘密裏に準備が整えられ、さながらスパイ・ミステリーのようだった』と述懐しています(ホテリングについては、後日とりあげる予定です。)

ゴセットはギネス社にとって重要な人材だったようで、ロンドン醸造所所長というポストを得ています。ゴセットが61歳で亡くなった後、彼の友人がゴセットの論文集を一冊の本にまとめるため、ギネス家に印刷費の援助を求めました。その時なって初めて、ギネス家はゴセットの活動を知ったということです。


参考文献:『統計学を拓いた異才たち』 David S. Salsburg (原著) 日本経済新聞社 2006年


清水公認会計士事務所(Shimizu CPA Office

2013年3月17日日曜日

統計的サンプリング:25件のサンプル(7)

■ 離散型確率分布と連続型確率分布

前回までの説明に用いた2項分布(Binomial Distribution)は、「離散型確率分布(Discrete Probability Distribution)」と呼ばれる確率分布です。「離散型」とは文字通り、「離れ離れ点在する」という意味です。先の部長承認の統制では、逸脱(承認漏れ)件数は、0,1,2,3,4,5,6・・・となり、こうした点在する値に対応して確率が計算されることになります。

下のグラフは、サンプル数25件、逸脱率9%の二項分布のグラフです。表示上は滑らかな曲線に見えますが、実際は、逸脱件数(自然数)に対応した確率が点在するグラフです。逸脱件数が2件(≒25件×9%)の時の確率が最大で、逸脱が0件の時の確率が10%を少し下回っているのが分かります(危険率が10%未満ということなので、信頼度90%以上を意味します)。




一方、例えば、日本人男性全員の身長を集めたデータは、下記の図のようなツリガネ型の正規分布(Normal Distribution)に従っていると考えられます。正規分布は連続型確率分布(Continuous Probability Distribution )となります。連続型分布の場合、(データが切れ目無く存在しますので)滑らかな曲線となります。



■ 二項分布から正規分布へ

上記の2つのグラフを比べると、グラフの形がかなり違います。しかし、二項分布でサンプル数を50件、100件、200件と増やしていくと、正規分布に徐々に近づいていくことが分かります。






なお、2項分布について、サンプル数:n→∞とすることで、正規分布になることは、数学的にも証明できます。

■ 許容逸脱率、信頼度、サンプル件数の関係

ここまでの議論で、以下の2つのことが言えることがお分かりかと思います。

① 許容逸脱率が低くなると、サンプル件数は増加する。
② 信頼度が高くなるほど、サンプル件数は増加する。


許容逸脱率は監査人が設定するハードルであり、このハードルを高めれば(許容逸脱率を低くすれば)、サンプル数は増加します。

一方、信頼度を高めることは、危険率(100%-信頼度)を低くすることになりますので、サンプル件数は増加します。

信頼度、許容逸脱率、(必要)サンプル件数の関係を示すと以下のようになります。   

信頼度:90%信頼度:95%
許容逸脱率:9%
25
32
許容逸脱率:6%
38
49
許容逸脱率:3%
76
99


■ 予想逸脱率、許容逸脱率、サンプル件数の関係

25件のサンプルの例や上記の①、②の説明においては、監査人の(母集団に対する事前)予想は考慮していませんでした。すなわち、監査人が事前に設定するのは「許容逸脱率」だけであり、(サンプル件数の決定時には)サンプル中には逸脱がないという暗黙の想定をしています。

ところが、過去の監査の実績等により、監査人が会社の統制の逸脱率を知っている場合があります。この逸脱率を予想逸脱率(Expected Population Deviation Rate)などといいます。

この点、先の部長決裁の統制について、(過去に何度か行った監査の実績で)「サンプル25件中に1件も逸脱がなかった」いう程度の情報では、「母集団の逸脱率は判明していない」ということを申し添えます。言い換えると、この場合は、「逸脱率は恐らく9%未満だろう」ということ位しか分かっていないのです。「逸脱率を知っている」という意味は、(部長決裁の統制の例で考えると)過去の監査の結果から、予想逸脱率(期待値 又は 平均値)が6%であることが分かっているような場合を意味します。

このように、母集団の予想逸脱率が分かっているケースでは、監査人が予想逸脱率を考慮して(サンプル中に一定割合の逸脱が存在することを見越して)、サンプル件数を決めることになります。

予想逸脱率が6%と分かっている場合、25件のサンプルには平均1.5件(25件×6%)の逸脱が含まれていると予想されますので、(許容逸脱率を9%とすると)25件のサンプルでは不足します。また、42件のサンプル(1件だけの逸脱ならOK)を選んでも、平均2.5件の逸脱(42件×6%)が含まれていることが予想されますから、42件ではサンプル数不足です。

このように、サンプル数を増やすと(予想逸脱率に)比例して予想逸脱件数も増えていくので、(必要)サンプル数はどんどん増加していきます。結局この場合は、182件のサンプル(予想逸脱件数は11件)が必要となります。予想逸脱件数の11件は、「182件(サンプル数)×6%≒11件」に対応しています。

許容逸脱率:9%、信頼度:90%の前提で、予想逸脱率と必要サンプル件数の関係を示すと以下のようになります。なお、( )内は逸脱数です。

予想逸脱率:0%予想逸脱率:4%予想逸脱率:6%予想逸脱率:8%
25(0)
73(3)
182(11)
1,437(115)


【Excel関数による計算】


● 予想逸脱率が6%(逸脱件数:11件)のケース
 =BINOM.DIST(逸脱件数(=11), サンプル数(=182), 逸脱率(=0.09), TRUE)=0.09836

● 予想逸脱率が8%(逸脱件数:115件)のケース
 =BINOM.DIST(逸脱件数(=115), サンプル数(=1,437), 逸脱率(=0.09), TRUE)=0.099675


 したがって、予想逸脱率に関して以下のことが言えます。


③ 予想逸脱率が高いほど、サンプル件数は増加する。
④ 予想逸脱率が許容逸脱率に近づくほど、サンプル件数は増加する


25件のサンプルの話題を題材に、7回にわたり統計的サンプリングをとりあげましたが、今回で終了です。


清水公認会計士事務所(Shimizu CPA Office

2013年3月10日日曜日

統計的サンプリング:25件のサンプル(6)

前回までは、25件のサンプルで1件も逸脱(承認漏れ)がなかったケースを取り扱いました。今回は承認漏れが見つかったケースについて考えたいと思います。


■ 25件中、1件逸脱(承認漏れ)があった場合

前回説明したように、ある事象が起きる確率をPBとした場合、試行を回行って、ある事象がx回起こる確率をPB(x)とすると、確率PB(x)は以下のように表すことができました。

  
 PB(x)=nxx(1-p)n-x  

2項分布の確率計算で、1件の逸脱(承認漏れ)が出る確率PB(1)は、以下のように計算されます。
 PB(1)=251 ×(0.09)1×(1-0.09)25-1 =251 ×(0.09)1×(0.91)24≒23.40%

(許容)逸脱率9%の場合、25件中1件の逸脱(承認漏れ)が生じる可能性は約23%となるので、1件でも承認漏れがあったら、「90%以上の信頼度で逸脱率が9%以下である。」とは、残念ながら言えないことになります

この場合、2つの対応が考えられます。1つは、サンプル数を増やしてもう1回検討する方法、もう1つは、逸脱率が9%を超える統制(=弱い統制)という前提で監査を進める方法です。後者は簡単にいえば、内部統制にあまり頼らずに、(試査範囲を広げて)監査を行うということです。後者は監査実務固有の話になるので、今回は前者の(サンプル数を増やす方法)を取り上げます。


■ 1件承認漏れがある場合の必要サンプル数

1件承認漏れがある場合、以下のようなサンプル数(n)を求めればよいことになります。

二項分布を前提として承認漏れが1件見つかった場合、90%の信頼度を得るには、少なくとも 件のサンプルが必要になる。


ここでは仮にサンプル数を40件とします。すると、1件の承認漏れがある確率は、n=40として上の式を使って計算すると、約9.10%となります。そうすると、あと、15件(40件-25件)追加サンプルを選んで、15件中1件も逸脱がなければ、一見良さそうな気がします。しかしこれは間違いです。

というのも、この9.10%というのは、「40件中ちょうど1件の逸脱が発生する確率」であって、「40件中1件以下の逸脱が発生する確率」ではないからです。すなわち、計算においては40件中1件も逸脱が発生しない確率も考慮しなければならないのです。

ここで、n件中1件も逸脱が生じない確率をPB(0),1件逸脱が発生する確率をPB(1)とすると
PB(0)+PB(1)<10% となるように、サンプル数を決定する必要があるのです(ちなみに符号は、≦,<のどちらでも構いません。)

この場合の最小サンプル数を計算すると42件となります。したがって、追加で17件(42件-25件)サンプルを選び、追加サンプルに1件も逸脱(承認漏れ)がなければ、90%以上の確率で(母集団の)逸脱率は9%以下であると判断できることになります。

■ 逸脱(承認漏れ)が2件以上の場合 ☛ 計算は複雑化

逸脱が1件程度なら何とかなりますが、2件、3件と増えて行った場合(監査上どう取り扱うかは別にして)、その分沢山のサンプルが必要となります。仮に、逸脱が3件まで許容できるとした場合、PB(0)+PB(1)+PB(2)+PB(3)<10%となるように、サンプル数を決定しなければなりませんから、手計算では煩雑になります。

上記の(累積)確率をExcel関数を使って計算する場合、計算式は以下のようになります。

=BINOM.DIST(逸脱件数, サンプル数, 逸脱率(0.09), TRUE)

ただ、上記のExcel関数を使ったとしても、試行錯誤を行って10%の危険率(90%の信頼度)を満たすようなサンプル数を見つける必要がありますので、計算はやや煩雑となります。

今回はここまでとします。

次回は、「二項分布」と「正規分布」との関係の説明と今まで(1回〜6回)のまとめをしたいと思います。


清水公認会計士事務所(Shimizu CPA Office


2013年3月3日日曜日

統計的サンプリング:25件のサンプル(5)

前回の続きです。

■ (再び)許容逸脱率は監査人の判断

母集団全体の本当の逸脱率(部長決裁が必要な全取引のうち、部長決裁を受けていない割合)は誰にも分かりませんもちろん、理屈上は誰かが取引全部を調べれば、本当の逸脱率は判明するのですが・・・。

極端にいえば、監査人は母集団の真の逸脱率自体を知りたいわけではありません。監査人が本当に知りたいのは、母集団の逸脱率が、(監査上許容できると考えている)一定の逸脱率より高いか低いかというこです。すなわち、(許容)逸脱率は、(事実としての逸脱率ではなく)監査人の価値判断によって決まってくる数値ということになります。逆にいえば、(監査人の判断である)許容逸脱率を決めないと、サンプル数も決まらないことになります。

なお、(実施基準の)25件のサンプルの例では許容逸脱率を9%と設定していますが、「何故9%なのか」については、私自身もよく分かりません。しかし一般的には重要な統制ほど許容逸脱率は低く設定され、サンプル数は多くなります。


■ もう少し理解を深めるために

ここで、もう少し理解を深めるために別の視点で考えてみます。「信頼度を90%とした場合、母集団全体の逸脱率は何%になるか?」ということを考えます。ここからの話は、監査人の判断(許容逸脱率)と母集団の推定逸脱率(上限逸脱率)との比較となります。

言い換えると、

許容逸脱率を9%として、25件のサンプル中1件も逸脱がない確率は9.46%(信頼度が90.54%)
                       ↓↓↓
信頼度がちょうど90%になるような、母集団の上限逸脱率(q)は何%か?


ということです。前回も少し説明したとおり、直感的に、「母集団全体の上限逸脱率は、9%より低いのではないか」と思われるでしょう。その直感が正しいことは、計算によって確かめられます。正確には、母集団の上限逸脱率は約8.8%になります(この計算の詳細は、末尾の数学的補足の(2)を参照ください。)

すなわち、上限逸脱率(8.8%)<許容逸脱率(9%)ですから、(90%の信頼度で)統制は有効であると判断できるわけです。

結局、25件のサンプルと逸脱ゼロは、以下のように解釈できます。

① 2項分布を前提に
② 許容逸脱率を9%と設定し
③ 25件のサンプルを選び
④ (サンプル中に)1件も逸脱(承認漏れ)がなければ
⑤ 90%以上の確率で
⑥ 母集団の上限逸脱率は8.8%となり、許容逸脱率(9%)を下回るから
⑦ 統制は有効であると判断できる。


蛇足ながら、許容逸脱率(9%)と信頼度(90)%は全く関係ありません。例えば、信頼度が90%の場合の危険率は10%(100%-90%)となりますが、ここで、許容逸脱率を仮に10%とすると、危険率も許容逸脱率も同じ10%になるので、混乱が生じるようです。許容逸脱率というのは(統制を評価する)監査人が設定する数値であり、信頼度や危険率とは無関係です。