構造と識別~構造推定と計量経済学に関するトピックを紹介する

踏み込んだ構造推定の日本語の文献がネットに転がっておらず、「構造推定」という響きのかっこよさに夢を抱いたりする人や、響きのうさんくささに勘違いしている人も多いので、土地勘のある自分が日本語でまとめます。気が向いたら。全ての記事はベータ版でござい。

反実仮想のアイデア:Suzuki, J. (2013). Land use regulation as a barrier to entry evidence from the Texas lodging industry. International Economic Review, 54(2), 495-523.

描きたい反実仮想を具体的にイメージしよう。

 

Suzuki, J. (2013). Land use regulation as a barrier to entry evidence from the Texas lodging industry. International Economic Review, 54(2), 495-523.

 

Abstractにまとめられた反実仮想の結果は以下。

My estimates indicate that imposing stringent regulation increases costs considerably. Hotel chains nonetheless enter highly regulatedmarkets even if entry probabilities are lower, anticipating fewer rivals and hence greater market power.
Consumers incur the costs of regulation indirectly in the form of higher prices.

 

この答えを得るためにバックワードで順に組み立てていく。

1. 答えたい問い:how do land regulation affect dynamic firm's entry decisions

2.答えたい反実仮想政策:参入企業数+PS+revenue

(1) Land regulation levelを3段階(lenient(-1SD), observed, stringent(+1SD))を「推定した動学コストパラメタ(operating and entry costs)をずらすことで表現して」MPEを再計算

3. 最終的に示したい図: 「サブマーケットごとの参入企業数+PS+revenue」

 

f:id:ohtanilson:20210629062412p:plain

4. 問いに答えるためにモデルに入れたい要素(anecdotal evidenceとfeasibilityから考える):

(1) land regulationの地域ごとのバリエーション

(2) 店舗ごとのrevenueに相当するデータ(金銭換算に必須)、需要推定の要素はない

(3)競争圏内の定義と需要に相当する外生共変量(人口とか)

 

 

構造推定をしたい匿名学生の実地体験ルポ (1) データを探す時点で試合は始まっている。第一章~データを得るまで(制度知識+経済理論パート)

下記の

第一章~データを得るまで(制度知識+経済理論パート)

に関する手記が届いたので公開する。

 

ohtanilson.hatenablog.com

 

構造推定を最終目標としたとき、データをどのように探すか、という前前前前処理(制度知識+経済理論パート)をできるだけ構造的に書いてみる。

 

第一章~データを得るまで(制度知識+経済理論パート)

 

まず

難所1. そもそも見たい現象と問いが経済学「理論」的に興味深いかどうか。その問いに応えるのに「追随した形で」、手法や理論面で貢献や新規性はあるのかどうか(あるとよりいいね!!)

難所7.除外制約や外生性などの推定に関する批判を乗り越えるアイデアと制度情報が「データを集める前から」すでに「複数」あるか

 

をどうやって達成するか。

 

先人の答え

 

 

  

 

 

 

 

 

まずデータを探すといっても、だいたい「関心がある事象を探そう」とアドバイスされるが、その関心を探すのはどうすればよいのか。

 

第一の案は、とりあえずなんでもよいので超絶リッチなデータセットを触れる環境を得る、というもの。

 

ここでいう超絶リッチとは、「先行研究と制度的知識から、複数の経済学理論モデルでそれぞれ違った切り口をみれそうな確信はあるけど、問い自体が決まってない」ようなデータの質をイメージしたい。RCTできる環境だったり、共同研究できる環境だったり、そのあたりは任意である。

それぐらいリッチだと、重要な先行研究の構造推定手法がほぼすべて検証できるはずで、データと手法の扱い方を学ぶ、先行研究の穴と手を付けていない点を緻密に突く、ことが平行して可能である。この案の推しポイントは、これをこなすだけでとりあえず最先端の後追いが自動でできること、先行研究という暫定の模範解答が存在するので(先行研究が正しければ)構造推定にまつわる不確実性がかなり減らせること、やってる中で拡張余地がみつかること、である。一方で、短所は、後追いにしかならない危険性があること(日本のデータでやってみました、が貢献点ならばそれでも十分である)。

 

以下は、有名なデータソースを探すとても良いきっかけになる。

 

sites.google.com

 

 

第二の案は、手法や理論を軸に、それを使える対象の中で最もインパクトがでかそうなものを探す、というもの。

手法や理論自体に面白みを感じているならば、現実のデータで応用できそうなものを探す、というのは、「やみくもになんか面白そうなものないかなー」とネットサーフィンしたり、「流れてきたネタに対してこんなの面白そう」と呟いてみるよりは、たぶん生産的になる。

また、手法や理論で迷子になることがないので、データが見つかりさえすれば、スルッとうまくいくかも。

以下はデータがリッチ、現象がインパクト大という、同一問題に対して、使いたい手法が異なる良い例。

 

 

 

 第三の案は、事前に自分がオタクレベルで知っている業界を軸に探す、というもの。その業界と心中する意気があればよし、という感じ。例えば、実証IOだと国交省で務めてた人が公共調達データ使ったり、通産省で務めてた人が店舗立地データを使ったり、アナリストをやっていた人がハイテク産業データを使ってたり、製鉄企業で務めてた人が鉄鋼産業を使ってたりする。業界経験歴というのは最強なのである。

 

 

 第四の案は、アンテナとコネを広げまくって、よいデータを釣り上げること。これは運命、データと問いにめぐり合い、宇宙ってこと。構造推定Laborの一番の大御所曰く、AEJ Appliedが構造推定(Labor?)の人にとってはよさげなデータと問いを見つける穴場らしい。

 

次に

難所2. 理論的に興味深いことを制度情報などからもサポートできるかどうか

 

をどうやって達成するか。もちろん達成するためには、この制度情報をよく知っていることが「前提」となっている。前提なので、ここが固まらないとよっぽどのテクニカルな貢献がない限りはレプリケーションの域をでない(レプリケーションは価値がとてもあるが、それ自体が目的だと構造推定はコスパが悪すぎる。)。逆に、ここが固ければ、既存の(実用に耐えうるのか不確実な)手法の応用が素晴らしい知見をもたらすことになる。

 

制度的な情報をよく知ることが、(少なくとも実証IOでは)一番大変で一番大事である。

 

先人の答えはここです。

 

 

 

 

まず、理論や実証は自分でモデルを閉じることが可能であるが、制度的な情報(メカデザで内部に潜れる場合を除き)は完全に外生的なものである。

また、どこまで調べ上げて研究に取り込むのかも際限がない。しかも、研究の問いによって何をどこまで調べるのかが事前に決まってしまう。

例えば、とある国の産業の一年間の事象に関して研究の問いを立てた場合は、最低その一年間の動きが調べられていればよい(もちろんその一年が歴史上、前後N年のなかでどういう位置づけであったかなどざっくり知って必要はあるものの、そんなのキリがない、そこも程度問題である)。数年の現象を定常的な状態とみるならば、静学モデルで捉えるのは理にかなっているだろう。

Igami, M. (2011). Does big drive out small. Review of Industrial Organization, 38(1), 1-21.

Igami, M. (2015). Market Power in I nternational Commodity Trade: The Case of C offee. The Journal of Industrial Economics, 63(2), 225-248.

 

一方で、国際取引がメインの産業の一年間の事象に関して問いを立ててしまった場合は、国際レベルでどういう動きがあったかをある程度サポートしないといけない。

 

 

ある一国の産業の二十年間の事象に関して問いを立ててしまった場合は、二十年分の制度情報の推移なんかも抑えていないといけない。一年ごとの分析?十年ごとの分析?

 

Igami, M., & Sugaya, T. (2017). Measuring the Incentive to Collude The Vitamin Cartels, 1990-1999.

 

国際レベルの二十年間の産業に関して問いを立ててしまった場合は、二十年分の国際情勢の推移なんかも抑えていないといけない。

Igami, M. (2017). Estimating the innovator’s dilemma Structural analysis of creative destruction in the hard disk drive industry, 1981–1998. Journal of Political Economy, 125(3), 798-847.

Igami, M., & Uetake, K. (2019). Mergers, Innovation, and Entry-Exit Dynamics Consolidation of the Hard Disk Drive Industry, 1996–2016. The Review of Economic Studies, forthcoming.

Igami, M. (2018). Industry Dynamics of Offshoring The Case of Hard Disk Drives. American Economic Journal Microeconomics, 10(1), 67-101.

 

残りの難所は、トピックコースを受けて分野内で何ができるのか、自分には何ができるのかを知るなり、実装試して失敗する経験がないとわからないので、保留。計量理論や経済学理論の貢献できる場合は、濃淡が変わって翻が追加されるというイメージ。

 

 

 

構造推定をしたい匿名学生の実地体験ルポ(続報1)

やあ (´・ω・`)
ようこそ、バーボンハウスへ。
このテキーラサービスだから、まず飲んで落ち着いて欲しい。

うん、「また」なんだ。済まない。
の顔もって言うしね、謝って許してもらおうとも思っていない。

でも、このスレタイを見たとき、君は、きっと言葉では言い表せない
ときめき」みたいなものを感じてくれたと思う。
殺伐とした世の中で、そういう気持ちを忘れないで欲しい
そう思って、このスレを立てたんだ。

じゃあ、注文を聞こうか

 

以前の報から、半年以上たったが、続報が届いたのでシェアしたい。


指導教官にぶっ叩かれた鉄は熱いうちに打て。

どうやら彼は一つ目の個人プロジェクトは愚直に以下の難所を後ろ向きに解いてみているらしい。

 

ohtanilson.hatenablog.com


我々日本人IOの研究者はバックワードで動学の数値計算解いて反実仮想しないとねー、というノリ。医学者が自分で治験する感じで、経済学者が治験しないとねえ。

 

 

 

自己採点結果は以下。構想から1年後をバックワードでいってみよう!
とりあえずそれなりのバッドエンドからスタートしとくのがシミュレーションゲームの鉄則。人生にハッピーエンドはない。城之内は結局死ぬし、海馬は散るし、本田は男の花道だけど玉砕する。進撃の巨人も最終回でエレンが多分死ぬ(来月が最終回)。

 

-----------------------------------
第七章~そして伝説へ

バッドエンド1. これだけの難所を厳密に検討してもうまくいかなかったら、改善点か方向修正点は無数にあるはず!前向きに!時間はかかっても、別の良い仕事や別の大発見に繋がりそうな予感!

-> 実際今これ。ある意味99%の不確実なチャレンジはこれでしょ。

-----------------------------------
第六章~推定したパラメタで反実仮想モデルを解くまで(世界であなたしかできないコイン取り放題お楽しみボーナスステージ)

難所1. 第一章で想定した反実仮想のアイデアを、第三章で使った均衡モデルの拡張で実装できるか

->関心のあるサブサンプルでは動くことが確認された。というかモンテカルロシミュレーションでこれができるように作った。強烈な描画もOK。ただ推定値が正しくないのでただの動作確認。【きれいにいけばドラ2翻】

難所2.上の拡張モデルを解いた結果が、「理論的に」解釈できるか

->理論の結果で解釈可能なモデル作ってるから、できる。変な値がでるけど、それは理論的解釈ができるから「変」と気づけるのである。【きれいにいけば1翻】


難所3. 異世界の創造神としてその結果に納得できるか

->変な推定値だからまだ変な結果だけど、まあいけそう。


-----------------------------------
第五章~データを使ってパラメタを推定するまで(博打推定パート)
難所1. 第四章で作ったモデルに、第二章で集めたデータを対応させるコード実装ができるか(前処理)

->できた。変数のスケールは直すかもしれない。Rでやった、Juliaはデータフレームの扱いがまだ微妙。【役には貢献しない】

難所2. 複数の初期値を試して、(真値は当然分からないが)reasonableなパラメタが推定できるか。【指導教官がOKだせるクオリティなら難所123合わせて3翻】

->初期値10000回試したプロットを見ると、推定値は集合識別しかできなさげ。下限は識別きれいだけど、上限はunboundedでだめ。なのでConfidence Intervalは計算したけど識別力なし。
2タイプにサンプルを分けると推定値が識別できるが、エコノメ理論的にはYでconditioningしてるからダメな実験デザインってことらしい。確かに。お手厳しい。
ここは特定化の単純化とか不等式評価をいい感じに修正するべき、ということらしい。確かに、1パラメタからじわじわやらないとダメよね。
上限が識別できないってのは部分識別の文脈でも新しい結果らしい。sharp identification探せっつうわけ。

難所3. 使う推定量に応じたStandard Errorを解析的にかブートストラップなりで計算して実装できるか、現実的な時間でそれが済むか

サブサンプリングでやったけど、上限が識別できないっぽいので、統計的には意味なし。一応やったけど、やっぱりうんこな結果を再確認した。うんこの確認は健康状態の把握に大切です。【指導教官がOKだせるクオリティなら難所123合わせて3翻】

------------------------------------------------------------------------
第四章~モデルが数値計算を通してパラメタを推定できるようになるまで(計量理論パート)

難所1.第三章で作った均衡モデルの数値計算コードに真のパラメタを与えて仮想データを色んなrandom seedで生成して、ばらつきがあるがおおざっぱな挙動は同じかどうか【役には貢献しない】

->下限は識別できるけど、上限は無理ってのが分かった。モデルの性質上、均衡解くDGPがヘビーなので、小サンプルのモンテカルロシミュレーションしかできない。
サイズが小さいからやっぱりパラメタ一つから始めるべし。確かに。
うまく不等式評価に効かせたい要素を重視するとsharpに行くんじゃないのって話。確かに。【指導教官がOKだせるクオリティなら難所123合わせて2翻】


難所2.作った仮想データから求めたいパラメタを推定するためにGMMなりSimulated Maximum LikelihoodなりベイズMLEなり部分識別なりの望ましい推定式や解法や言語を選んで実装できるか

->セミパラのスコア推定一択なので、仮定が緩い分、計量理論上いろいろ変数入れるのは厳しい感じ。先行研究見てなんとなくわかってたよ。【指導教官がOKだせるクオリティなら難所123合わせて2翻】

難所3.仮想データを使って上で作った推定式は、真のパラメタを推定できているか。どんな条件(操作変数の強さやモーメント式の数や外生的ばらつき)で真のパラメタを上手く推定できるのか、把握できるか

->下限はわかるよ。特定化はいくつか試したけど、だいたい一緒の結果となったよ。Appendixに放り込んだ。【指導教官がOKだせるクオリティなら難所123合わせて2翻】

 

難所4.第五章以降に備えて追加的な特定化や変数をある程度試せる設定やコードになっているか

->想定してたので、一人でうにゃうにゃやる分には大丈夫。全部の処理も1日あれば終わる。【役には貢献しない】


--------------------------------------------------------------------------
第三章~モデルが数値計算を通して正しく動くまで(経済学理論+数値計算パート)

難所1. 自分の作った均衡モデルがバグなくプログラミング実装できるか、経済学理論で特徴づけされた通りの均衡数や性質が得られるか

->計算結果チェックしながらやったけど、細かいバグはまだあるかも。でも多分モデル上の問題。均衡結果のシミュレーション結果はAppendixに放り込む(予定)。【役には貢献しない】

難所2. 数値計算の解を探すアルゴリズムは適当か、縮小写像なり凸性なりで数学的に現実的なオーダーで(局所)解に収束することが示されているか。

->OK.先行研究に沿ってるし、先行研究も重要なのはレプリケートできてる。【役には貢献しない】

難所3. 既存のパッケージやORや応用数学の観点から正しく定式化できて、正しくソルバー等を使えているか。初期値に依存するかどうか

->OK. というかDifferential Evolution使ってるだけで、数値計算上はそんな難しくない。初期値は1000回サクサクやれる。【役には貢献しない】

難所4. 実装した均衡モデルは固定した真のパラメタと第二章で想定したエラーを入れたもとで正しく解けているのか

->エラーの分布にロバストなのでOK.【役には貢献しない】

難所5. 真のパラメタを変更した時の挙動は、「事前の」理論的な解釈と(都合解釈でなく)一致しているか

->あるパラメタだと微妙。均衡が変わっちゃうからなあ。でもいろいろ試せるコードだし悪くない。【役には貢献しない】

難所6. 現実的な速度で解き切れているか、並列化高速化できるのか

->並列化はOK.そもそも計算速度が軽いのが利点の手法だし。【役には貢献しない】

----------------------------------------------------------
第二章~データを集めるまで(前前前処理パート)

難所1. データセットはどういう形でどういう範囲でどういう観察単位で集められるか、スクレイピングなりアナログなりどんな手法で集めるか(前処理の前処理の前処理)

->ほぼアナログ、面倒だけど写本しないと得られないデータの方が参入障壁高いっしょ。パブしたらに公開予定。【役には貢献しない】

難所2.上で作ったraw dataをどういうtidydataに処理するか(前処理の前処理)

->Rでいろいろタイプのきれいなプロットを書きました。【印象アップになれば1翻】

難所3.誘導形や基本統計量からデータの傾向をみて、第一章で立てた理論モデルとそれなりに予想通りかどうか。操作変数等はそれなりに機能していそうか。

->OK。回帰はした。本筋からすると別にそれほど意味はないけど、やっとくと役が一つ乗るっぽい。【きもちの1翻】

難所4.カリブレーションするパラメタと推定(識別)する予定のパラメタを想定したデータセット(行動変数、状態変数、説明変数、被説明変数)になっているかどうか

->そういう風に作れるように、モンテカルロシミュレーションのコードに当てはめるイメージでデータセット作った。【役には貢献しない】

難所5.エラーが入るのはどのレベル(複数階層、相関有無、分布指定有無)と想定しているのか

->今回はエラーの数は重要じゃない。分布にロバストセミパラだから。【役には貢献しない】

--------------------------------------------------------
第一章~データを得るまで(制度知識+経済理論パート)

難所1. そもそも見たい現象と問いが経済学「理論」的に興味深いかどうか。その問いに応えるのに「追随した形で」、手法や理論面で貢献や新規性はあるのかどうか(あるとよりいいね!!)

->問いのアイデアの着想は先輩研究者のパブ済みの研究から拝借してる。手法もデータも違うから、本人にすらわからないだろうけど。でもある意味、安全策でいった。【第6章まできれいにいけば難所1と2でこみこみ2翻】

難所2. 理論的に興味深いことを制度情報などからもサポートできるかどうか

->これが意外としんどいというか一番時間がかかる。制度情報がまとまってないし、digる範囲も自分で設定しないといけないし。後追い研究の産業ならそれを追えばいいってのはあるけどね。
先行者優位をえるのはそれなりにしんどい。【第6章まできれいにいけば難所1と2でこみこみ2翻】

難所3. 見たい現象が経済学「理論」の閉じたモデルに落とし込めて均衡存在や一意性などを特徴づけできるか。閉じるために必要な仮定とパラメタが全て網羅されているかどうか。見えてる現象はそこの均衡をどうやってデータとしてサンプリングしたものか把握しているか

->OK.一意存在が保障されて計算アルゴリズムも存在するモデルを、自分用に拡張して使った。これもテクいので十分貢献。一意じゃない奴は意図的に避けた。【あくまで先行研究の拡張なので1翻】

難所4.上のモデルを動かすための変数に対応するデータは現実世界に存在するのか。上で得られた仮定をそれなりに満たしてそうか

->一つを除き悪くない。変数はOKだけど、現実にそれがあったかどうかは制度的情報でサポートってかんじ。ひとつだけ理論的に究極に重要な要素があるが、これをどう表現するかができを左右するというか、役がふたつ乗るかどうかのcontroversial pointってかんじ。【うまくいかないとマイナス2翻、つらい】

 

難所5.その変数はそのデータで「理論的に」(都合解釈を排して)代理変数として近似できているか

->OK。そもそも代理変数としての正解がないし。先行研究はランダムパラメタみたいな処理してるし、データ独特の特定化しないといけない。【うまくいかないとマイナス2翻、つらい】

難所6.上のモデルを動かすためのパラメタは、モデルとデータから計量理論的に(部分)識別できるのか、識別できる範囲内でどんな特定化ができそうか。わざわざ新しい要素をモデルに入れたところで、データからは観察的同値な別の標準的なモデルが存在しなさそうかどうか、新要素が行動変化をどれだけ「経済学理論的に」説明しそうか。

->見たいパラメタが効きそうな感じでモデルを改良する必要あり。現状、下限しか識別できなかったけど、それはニューな発見なのでOK。【うまくいけば1翻】

難所7.除外制約や外生性などの推定に関する批判を乗り越えるアイデアと制度情報が「データを集める前から」すでに「複数」あるか

->これを考える必要が(幸運にも)そんなにないモデル(ある種の自然実験にちかい設定)をあえて選んでるので、ここはセーフ。IVが効く効かないとかサンクコストでかすぎるのでつらいし。【1翻】

難所8.経済学「理論」的にも政策的にも興味深い反実仮想アイデアが「複数」あって、モデルに外生的あるいは内生的に組み込めるか、その反実仮想アイデア自体が解いた後に識別できるのか

->ここはOK.バチバチに面白いはずなのを固めた。というかそういう風に作ってる。これが論文の面白さの上限ですし、それ以上の要素はモデルに組み込めないですし。【裏ドラ0-2翻】

難所9.解きたいアイデアと既存の推定手法は、どのレベル(N,T,S,B?)の漸近論を用いてどのサンプルサイズだと正当性が保証されているか、使おうと思っているデータがその漸近論がそもそも機能するサンプルサイズであるか「データを集める前に」把握できているか

->サンプルサイズは不安だったけど、信頼できる先行研究より多いのでいけるってことで踏み出して、結果なんとかなりそう。あぶねえ。【役には貢献しない】

難所10.第二章以下の難所を想定したtractableな方向性、challengingな方向性が事前に描けて、自分自身の能力、時間資源等制約付き、不確実性ありの動学投資最適化問題をイメージできているか、イメージできるだけの失敗経験とそれに基づく直観と文献理解がある程度あるか

->ここはOK。そういう風に作ってる。あと指導教官の学生しか、このタイプのコード書けない気がする。というか、モデル自体、指導教官の学生以外には全然自明じゃない。【役には貢献しない】

 

1(+ドラ2)+3+2+0+2+5(-4+裏ドラ2)=13翻前後がベースライン、全部完結するまでは当然あがれませんが。

 

結果、想定したバッドエンドのパスに落ちている(「パラメタの下限しか識別できないじゃん」と分かった)ので、ある意味予定通り。これがバックワードでやってみた治験結果。イメージとしては数え役満を目指して、13翻以上を取る予定だった。引用してるジャーナルの論文たちが自分の中では最低15翻って感じ。マーケティングとか書き方とかいろいろあるにしろ。

遺言書としてほにゃイヤーペーパとして全部結果まとめてるし、結果をLatexに自動生成するコードも書いてるし、reproduceableにはしてきたし、どこまで翻が変わるでしょうかねえ。

 

構造推定をしたい匿名学生の実地体験ルポ

*本誌への匿名投稿を許可を得たうえで掲載しています。

 

・構造推定、興味あります!お芝居も興味あります!

・構造推定をしたいんだよね~。だって~カッコよさげじゃん。

 

経済学理論的に意味があるものをデータから推定して、経済学理論的に意味がある現象を近似して、経済学理論屋も計量理論屋も実証屋も産業実務家もおじいちゃんおばあちゃんお隣さんもそれなりに理解できる形の分析をしたい

 

以下は、そんな志をもつ匿名学生の実地体験ルポである。

 

第一章~データを得るまで(制度知識+経済理論パート)

難所1. そもそも見たい現象と問いが経済学「理論」的に興味深いかどうか。その問いに応えるのに「追随した形で」、手法や理論面で貢献や新規性はあるのかどうか(あるとよりいいね!!)

難所2. 理論的に興味深いことを制度情報などからもサポートできるかどうか

難所3. 見たい現象が経済学「理論」の閉じたモデルに落とし込めて均衡存在や一意性などを特徴づけできるか。閉じるために必要な仮定とパラメタが全て網羅されているかどうか。見えてる現象はそこの均衡をどうやってデータとしてサンプリングしたものか把握しているか

難所4.上のモデルを動かすための変数に対応するデータは現実世界に存在するのか。上で得られた仮定をそれなりに満たしてそうか

難所5.その変数はそのデータで「理論的に」(都合解釈を排して)代理変数として近似できているか

難所6.上のモデルを動かすためのパラメタは、モデルとデータから計量理論的に(部分)識別できるのか、識別できる範囲内でどんな特定化ができそうか。わざわざ新しい要素をモデルに入れたところで、データからは観察的同値な別の標準的なモデルが存在しなさそうかどうか、新要素が行動変化をどれだけ「経済学理論的に」説明しそうか。

難所7.除外制約や外生性などの推定に関する批判を乗り越えるアイデアと制度情報が「データを集める前から」すでに「複数」あるか

難所8.経済学「理論」的にも政策的にも興味深い反実仮想アイデアが「複数」あって、モデルに外生的あるいは内生的に組み込めるか、その反実仮想アイデア自体が解いた後に識別できるのか

難所9.解きたいアイデアと既存の推定手法は、どのレベル(N,T,S,B?)の漸近論を用いてどのサンプルサイズだと正当性が保証されているか、使おうと思っているデータがその漸近論がそもそも機能するサンプルサイズであるか「データを集める前に」把握できているか

難所10.第二章以下の難所を想定したtractableな方向性、challengingな方向性が事前に描けて、自分自身の能力、時間資源等制約付き、不確実性ありの動学投資最適化問題をイメージできているか、イメージできるだけの失敗経験とそれに基づく直観と文献理解がある程度あるか

 

第二章~データを集めるまで(前前前処理パート)

難所1. データセットはどういう形でどういう範囲でどういう観察単位で集められるか、スクレイピングなりアナログなりどんな手法で集めるか(前処理の前処理の前処理)

難所2.上で作ったraw dataをどういうtidydataに処理するか(前処理の前処理)

難所3.誘導形や基本統計量からデータの傾向をみて、第一章で立てた理論モデルとそれなりに予想通りかどうか。操作変数等はそれなりに機能していそうか。

難所4.カリブレーションするパラメタと推定(識別)する予定のパラメタを想定したデータセット(行動変数、状態変数、説明変数、被説明変数)になっているかどうか

難所5.エラーが入るのはどのレベル(複数階層、相関有無、分布指定有無)と想定しているのか

 

第三章~モデルが数値計算を通して正しく動くまで(経済学理論+数値計算パート)

難所1. 自分の作った均衡モデルがバグなくプログラミング実装できるか、経済学理論で特徴づけされた通りの均衡数や性質が得られるか

難所2. 数値計算の解を探すアルゴリズムは適当か、縮小写像なり凸性なりで数学的に現実的なオーダーで(局所)解に収束することが示されているか。

難所3. 既存のパッケージやORや応用数学の観点から正しく定式化できて、正しくソルバー等を使えているか。初期値に依存するかどうか

難所4. 実装した均衡モデルは固定した真のパラメタと第二章で想定したエラーを入れたもとで正しく解けているのか

難所5. 真のパラメタを変更した時の挙動は、「事前の」理論的な解釈と(都合解釈でなく)一致しているか

難所6. 現実的な速度で解き切れているか、並列化高速化できるのか

 

第四章~モデルが数値計算を通してパラメタを推定できるようになるまで(計量理論パート)

難所1.第三章で作った均衡モデルの数値計算コードに真のパラメタを与えて仮想データを色んなrandom seedで生成して、ばらつきがあるがおおざっぱな挙動は同じかどうか

難所2.作った仮想データから求めたいパラメタを推定するためにGMMなりSimulated Maximum LikelihoodなりベイズMLEなり部分識別なりの望ましい推定式や解法や言語を選んで実装できるか

難所3.仮想データを使って上で作った推定式は、真のパラメタを推定できているか。どんな条件(操作変数の強さやモーメント式の数や外生的ばらつき)で真のパラメタを上手く推定できるのか、把握できるか

難所4.第五章以降に備えて追加的な特定化や変数をある程度試せる設定やコードになっているか

 

第五章~データを使ってパラメタを推定するまで(博打推定パート)

難所1. 第四章で作ったモデルに、第二章で集めたデータを対応させるコード実装ができるか(前処理)

難所2. 複数の初期値を試して、(真値は当然分からないが)reasonableなパラメタが推定できるか。

難所3. 使う推定量に応じたStandard Errorを解析的にかブートストラップなりで計算して実装できるか、現実的な時間でそれが済むか

 

第六章~推定したパラメタで反実仮想モデルを解くまで(世界であなたしかできないコイン取り放題お楽しみボーナスステージ)

難所1. 推定に使ったベンチマークの均衡モデルを「推定したパラメタ、ドローしたランダム項、データ」を与えて解きなおすと、データの特徴を再現できるかどうか(例えば、1000回シミュレーションして平均値)

難所2. 第一章で想定した反実仮想のアイデアを、第三章で使った均衡モデルの拡張で実装できるか

難所3.上の拡張モデルを解いた結果が、「理論的に」解釈できるか 

難所4. 異世界の創造神としてその結果に納得できるか

 

第七章~そして伝説へ

ハッピーエンド1. 全部うまく一気通貫で通った。凄い!!あなたはプロフェッショナルな仕事をしました!後世に残ります!

バッドエンド1. これだけの難所を厳密に検討してもうまくいかなかったら、改善点か方向修正点は無数にあるはず!前向きに!時間はかかっても、別の良い仕事や別の大発見に繋がりそうな予感!

ハッピーエンド2. 複数の難所を緩くやりすごしてたり、解けてるか不安だけど大丈夫そうな結果が出たからこの箇所はオッケー、ってポイント。自分より強い歴戦のプロにとっては理論とコードから弱点丸見え!足元がお留守だぜ!再戦するのもよし!あるいは、別の競技かフィールドで戦おう!お給料はそっちの方が断然いいかも!

バッドエンド2. 非難(批判)轟轟死屍累々。とりあえず生きて!!!!あんたが今ここで倒れたら、舞さんや遊戯との約束はどうなっちゃうの? ライフはまだ残ってる。ここを耐えれば、マリクに勝てるんだから! 次回、「城之内死す」。デュエルスタンバイ!

 

総合格闘技か? 

否、地下闘技場トーナメントであった

 

作者 不詳

*本誌への匿名投稿を許可を得たうえで掲載しています。

 

 

2024/04/24 追記

同じようなことが日本語で書かれている

 

chap4. SCPvsRBVおよび競争の型.世界標準の経営理論を構造推定の観点からメモ書き

chap4. SCPvsRBVおよび競争の型.世界標準の経営理論を構造推定の観点からメモ書き

 

p85.「結局のところ、SCPとRBVのどちらが重要な問いなのか」という議論は、実務家ポエム的な発想。インプットもアウトプットもどちらも考慮したいならすればいいじゃない、としかいえない。個人のディスカッションならいいけども。次の段落で同じことを著者もいっている。

p86.産業属性固定効果と企業固定効果を入れたパネル分析かつ財務データでばらつきの説明を実証しているのだろうか。疎いのでできるのか不明。

p87.競争の型として(1)IO型競争、(2)チェンバレン独占的競争型、(3)シュンペーター型、とBarney(1986AMR)は定義している。

p88.シリアルやコーラ大手が広告費出して転倒棚スペースを占有、デュポンの過剰投資、が参入障壁の引き上げの具体例として挙げられているが、前者は例として不適切。参入障壁の定義が参入時のみにかかる固定費用FCならば、広告費AがFCを引き上げるのっておかしい。店頭スペースが制約でそのシェアを広告費Aが外生的に奪えるモデルがあれば、正当化できるのかもしれない。広告スペースのモデルはそれで面白いかもしれない。

p89.チェンバレン型の差別化された前提の個別市場で「勝つ差別化」をしないといけない=RBV大事、という流れは分からんでもないが、「勝つ差別化」と「負ける差別化」が定義されていない。事業環境がどのような競争の型かを決める、ってのは産業がベルトランかクールノーかを研究者が決めるのと近いことを言ってるのか?

p90.日本企業はポーター定義の戦略はないが、バーニー定義の戦略はうまくいってたんでは、というミンツバーグの話は巧いね。

p91.シュンペーター型競争は「不確実性の高さとそれによる予測のしにくさ」が大事。同値のことを言ってる。不確実性の程度とは、IO的には産業全体への供給ショック、需要ショック、製品へのショックとか、添え字ごとに入れられるショック、それの分散の大きさ、とモデル化されているはず。ここでは「事業環境や自社の長期的な強みにある程度予測が立つなら」と明言されているが、事業環境はゲーム等の均衡結果のひとつとして解釈できるが、一方で「長期的な強み」ってポエムワードはなんだ?「強み」がモデル化しづらい、そもそも。

p92.Maasで既存の自動車製造ビジネスの競争はチェンバレン型の競争をマッチしているから、高い競争力をもつらしい。ここに「競争力」の定義が隠れてる気がするが、ちゃんと考えた方がいいかも。マッチしているしていないが反証できるのか?ただし、ここのマトリックスは個人的には、ill definedと感じるものの示唆がある。

p94.「鷹の目」を持て、ってのはビジネスパーソンポエムとして効き目がありそうだ。業界ごとの不確実性の濃淡、ってのは個人的には見過ごしてた。例えば、インフラ関係だと不確実性は薄そうだし、ハイテクは濃そうだし、それをモデルのショックで同モデル化するかってのは繋がってなかった。「より現実に近い仮定に基づき、複雑な組織の心理を解き明かす理論が組織の経済学」の「より現実に近い仮定」は不適切。分析するエージェントが企業から個人になって、情報不完備ゲームになっただけでは?

 

 

 

 

chap3. RBV.世界標準の経営理論を構造推定の観点からメモ書き

chap3. RBV.世界標準の経営理論を構造推定の観点からメモ書き

 

p66. 1次元の生産関数グラフのインプットX軸に着目するのがRBVで、アウトプットY軸に着目するのがSCPってのは、なるほど。1次元なのは経済学的には気になる。IOでは、アウトプット側を市場と定義して需要と供給分析するので、RBV的なインプットに相当するものは限界費用関数に入る共変量やコストシフターに相当する。企業間のやりとりや上流下流企業を定義してマッチングやバーゲニングで分析するものはまだまだ新しい分野だとおもう。

p68. ペンローズって女性なんだ。

p70.リソースの独占化、ってIOでは聞いたことない観点。「模倣しにくいもの」ってどう定義するのかあいまいかつ、ディエリックス=クール(1989)は「模倣しにくさはリソースの組み合わせにある」と考えるらしい。組み合わせで模倣しにくさをどう定義するつもりなのか不明。一応は、組み合わせの尺度は1蓄積経路の独自性、2因果あいまい性、3社会的複雑性という3条件が満たされるとき、模倣困難である、と定義される。正直、定義になってない。

p72. バーニー(1991)が提示した前提は、(1)企業リソースの異質性、(2)企業リソースの不完全移動性。これらが前提で、アウトプット側の議論であるSCPが成り立つかも議論される、らしい。

p73.仮定を基に、競争優位=「他社にはできない価値創造戦略を起こす力」と定義している。また「持続的な(競争優位)」=「長い間?ライバルよりも高い業績を出せる」と定義している。競争優位を実現するリソースの条件はvaluable&rarity、またそれが持続的であるための条件はinimitable&non-substitutableだと。まず競争優位の条件はトートロジー、かつ持続的の条件もトートロジーなので、命題自体がill-defined. 

 

p74. footnoteの競争優位=「他社が奪おうとする努力が消えているある種の均衡状態」という説明の方が納得できる。均衡を覆す方法を考えようの方が、生産的じゃない?

p77.財務パフォーマンスをデータにした雑な回帰分析をいくら積み上げても不毛。ほぼ信用できない。

p78.やっぱり、トートロジーについてはここで触れられてる。RBVは部分均衡、っていうのは、アウトプットとインプットを同時に雑に考えようとしたから一般均衡ぽくなってしまっただけなので、それ自体は問題ではない。産業を定義すれば、部分均衡でもモデルは閉じれる。

p79.ブラックボックスなのは定義なしでポエムで理論を綴るから。実務で使える、ってどういう定義か、実務家の視点は不明。

p82.アクティビティシステムが米国LCCのビジネスアクティビティの「つながり」を意味しているグラフらしい。nodeとtieの定義がまず一貫性がなく恣意的で意味不明。なので「絡み合うつながりの複雑さ」というものが定義できず、ビジュアルで「複雑そうに」見せかけてるハッタリ。

p83. 「複雑で」かつ「一貫性のある」システム、の一貫性の定義がない。意味不明。p84. footnote15の「一貫したアクティビティシステムのある企業は、価値を創造しやすい」とは、一貫性の指標が価値創造の指標に対してポジティブかつ有意、といいたいのか?経済学的にはすべてがnot well-defined.

 

 

 

 

 

chap2.SCPベースのフレームワーク:世界標準の経営理論を構造推定の観点からメモ書き

 

chap2.世界標準の経営理論を構造推定の観点からメモ書き

 

p50. SCPは経営学的にはもっとも綺麗にフレームワークに落とし込まれた理論。ファイブフォース+戦略グループ+ジェネリック戦略(cost leadership or differentiation)。フォース1potential entrantsは参入固定費次第で動学では入ってくる。,フォース2rivalryはゲーム理論が絶対必要。フォース3force of buyerは需要サイドの話だが交渉力という表現は微妙、そういうモデル化ももしかしたらできるのかもしれない。フォース4force of supplierはvertical relationshipがいきなり入ってきた。このふたつは市場をB2Bの上流&下流下流&顧客関係を同時に考えようとしていて経営学ポイね。フォース5substitutesは需要サイドの話で、IO的にはフォース3と「同値」といえる。

p52. 自動車が飛行機を代替する手段、ってのは産業を飛び越えてるので例として不適切。どちらかの産業に固定して、もう片方をアウトサイドオプション(変動を許す)で分析するしかない気がする。フレームワークを図示するとビジネスマンには売れるというのは皮肉な話、

p53.第一の将来予測に有用、というのは、モデル化されていると適用しやすいという話か?第二の複数階層でファイブフォース分析を行う重要性、というIOにおける「地理、時間的産業区分t\in T」をデータにおいてどう定義するか、という個人的に最重要な設定と重なる。リサーチとデータのデザイン次第であるが。

p54. 製品セグメント構造などを基に戦略グループを分ける、というのは雑すぎる。IO的には産業と製品セグメント設定はgivenなので、恣意性はそこにしか入り込まない。せいぜい需要推定と価格弾力性&シェアによる代替関係で分けることはできそうだが、もしかしたら文献はあるかもしれない。

p55. 幅広い顧客対象&ニッチ狙い、という軸も追加、っていうのは、理論IOでも比率αで需要サイドのWTPを分けて分析するのがあったはず。戦略論の教科書にはジェネリック戦略に紙面を割くが、一般の教科書はそんなに割かない、ってのは知らなかった。

p57. ウォルマートの地方部には大手ライバル企業が少ないので、低価格戦略によって独占的ポジションがとれる、というのは参入+地理的市場+チェーンストア、さらに価格戦略設定も入れるモデルといえるが、Igami&Yang(2016QE)などしかないかも。自明でないし面白いかも。大規模な流通システムも、distribution center IVを使う文脈として解釈できる。

p58.両取り戦略は、multiproduct firmでそれぞれのproductの戦略を分けれるのであればwell-definedだが、ベルトラン価格設定FOCで両戦略を分けるのは自明でない。理論的にも面白いのか?

p59.収益性は産業固有か、企業固有か、という実証は、当時は斬新だが、今同じような回帰分析やるのは新鮮味がない。COVでばらつき分析、などもIOというよりマクロな実証という感じ。

p61.戦略グループの実証はnot well-definedなので、全部怪しい。心理的な戦略グループは、行動経済学理論のモデルに組み込まないと同様にnot well-define.直感的には、反応関数内のrivalのaction&beliefをどう外生的or内生的にモデル化するか、という話になるはず。自明ではないし、モデルが閉じるかも不明。実験はあるかも。

p.62.一時的な/持続的な競争優位という概念は動学。同額で競争優位をどうモデル化するのか自体が自明でないし、model specific。基礎付けできるならば面白いかもしれない。

p.63 以前より競争が外生的な理由で厳しくなることを、ハイパーコンペティション経営学ではいうが、経済学だとおそらく産業衰退&退出のモデル(Takahashi2015AER)あるいは外生的なoutside option valueの変動で産業が相対的に魅力なくなるモデルだろうか。説明できないものをハイパーと定義するのは、なんでもありで個人的にはムムム。

 

p65. SCPの前提条件をやるなら、経済学やればいいじゃない、という気もする。