構造と識別~構造推定と計量経済学に関するトピックを紹介する

踏み込んだ構造推定の日本語の文献がネットに転がっておらず、「構造推定」という響きのかっこよさに夢を抱いたりする人や、響きのうさんくささに勘違いしている人も多いので、土地勘のある自分が日本語でまとめます。気が向いたら。全ての記事はベータ版でござい。

構造推定をしたい匿名学生の実地体験ルポ

*本誌への匿名投稿を許可を得たうえで掲載しています。

 

・構造推定、興味あります!お芝居も興味あります!

・構造推定をしたいんだよね~。だって~カッコよさげじゃん。

 

経済学理論的に意味があるものをデータから推定して、経済学理論的に意味がある現象を近似して、経済学理論屋も計量理論屋も実証屋も産業実務家もおじいちゃんおばあちゃんお隣さんもそれなりに理解できる形の分析をしたい

 

以下は、そんな志をもつ匿名学生の実地体験ルポである。

 

第一章~データを得るまで(制度知識+経済理論パート)

難所1. そもそも見たい現象と問いが経済学「理論」的に興味深いかどうか。その問いに応えるのに「追随した形で」、手法や理論面で貢献や新規性はあるのかどうか(あるとよりいいね!!)

難所2. 理論的に興味深いことを制度情報などからもサポートできるかどうか

難所3. 見たい現象が経済学「理論」の閉じたモデルに落とし込めて均衡存在や一意性などを特徴づけできるか。閉じるために必要な仮定とパラメタが全て網羅されているかどうか。見えてる現象はそこの均衡をどうやってデータとしてサンプリングしたものか把握しているか

難所4.上のモデルを動かすための変数に対応するデータは現実世界に存在するのか。上で得られた仮定をそれなりに満たしてそうか

難所5.その変数はそのデータで「理論的に」(都合解釈を排して)代理変数として近似できているか

難所6.上のモデルを動かすためのパラメタは、モデルとデータから計量理論的に(部分)識別できるのか、識別できる範囲内でどんな特定化ができそうか。わざわざ新しい要素をモデルに入れたところで、データからは観察的同値な別の標準的なモデルが存在しなさそうかどうか、新要素が行動変化をどれだけ「経済学理論的に」説明しそうか。

難所7.除外制約や外生性などの推定に関する批判を乗り越えるアイデアと制度情報が「データを集める前から」すでに「複数」あるか

難所8.経済学「理論」的にも政策的にも興味深い反実仮想アイデアが「複数」あって、モデルに外生的あるいは内生的に組み込めるか、その反実仮想アイデア自体が解いた後に識別できるのか

難所9.解きたいアイデアと既存の推定手法は、どのレベル(N,T,S,B?)の漸近論を用いてどのサンプルサイズだと正当性が保証されているか、使おうと思っているデータがその漸近論がそもそも機能するサンプルサイズであるか「データを集める前に」把握できているか

難所10.第二章以下の難所を想定したtractableな方向性、challengingな方向性が事前に描けて、自分自身の能力、時間資源等制約付き、不確実性ありの動学投資最適化問題をイメージできているか、イメージできるだけの失敗経験とそれに基づく直観と文献理解がある程度あるか

 

第二章~データを集めるまで(前前前処理パート)

難所1. データセットはどういう形でどういう範囲でどういう観察単位で集められるか、スクレイピングなりアナログなりどんな手法で集めるか(前処理の前処理の前処理)

難所2.上で作ったraw dataをどういうtidydataに処理するか(前処理の前処理)

難所3.誘導形や基本統計量からデータの傾向をみて、第一章で立てた理論モデルとそれなりに予想通りかどうか。操作変数等はそれなりに機能していそうか。

難所4.カリブレーションするパラメタと推定(識別)する予定のパラメタを想定したデータセット(行動変数、状態変数、説明変数、被説明変数)になっているかどうか

難所5.エラーが入るのはどのレベル(複数階層、相関有無、分布指定有無)と想定しているのか

 

第三章~モデルが数値計算を通して正しく動くまで(経済学理論+数値計算パート)

難所1. 自分の作った均衡モデルがバグなくプログラミング実装できるか、経済学理論で特徴づけされた通りの均衡数や性質が得られるか

難所2. 数値計算の解を探すアルゴリズムは適当か、縮小写像なり凸性なりで数学的に現実的なオーダーで(局所)解に収束することが示されているか。

難所3. 既存のパッケージやORや応用数学の観点から正しく定式化できて、正しくソルバー等を使えているか。初期値に依存するかどうか

難所4. 実装した均衡モデルは固定した真のパラメタと第二章で想定したエラーを入れたもとで正しく解けているのか

難所5. 真のパラメタを変更した時の挙動は、「事前の」理論的な解釈と(都合解釈でなく)一致しているか

難所6. 現実的な速度で解き切れているか、並列化高速化できるのか

 

第四章~モデルが数値計算を通してパラメタを推定できるようになるまで(計量理論パート)

難所1.第三章で作った均衡モデルの数値計算コードに真のパラメタを与えて仮想データを色んなrandom seedで生成して、ばらつきがあるがおおざっぱな挙動は同じかどうか

難所2.作った仮想データから求めたいパラメタを推定するためにGMMなりSimulated Maximum LikelihoodなりベイズMLEなり部分識別なりの望ましい推定式や解法や言語を選んで実装できるか

難所3.仮想データを使って上で作った推定式は、真のパラメタを推定できているか。どんな条件(操作変数の強さやモーメント式の数や外生的ばらつき)で真のパラメタを上手く推定できるのか、把握できるか

難所4.第五章以降に備えて追加的な特定化や変数をある程度試せる設定やコードになっているか

 

第五章~データを使ってパラメタを推定するまで(博打推定パート)

難所1. 第四章で作ったモデルに、第二章で集めたデータを対応させるコード実装ができるか(前処理)

難所2. 複数の初期値を試して、(真値は当然分からないが)reasonableなパラメタが推定できるか。

難所3. 使う推定量に応じたStandard Errorを解析的にかブートストラップなりで計算して実装できるか、現実的な時間でそれが済むか

 

第六章~推定したパラメタで反実仮想モデルを解くまで(世界であなたしかできないコイン取り放題お楽しみボーナスステージ)

難所1. 推定に使ったベンチマークの均衡モデルを「推定したパラメタ、ドローしたランダム項、データ」を与えて解きなおすと、データの特徴を再現できるかどうか(例えば、1000回シミュレーションして平均値)

難所2. 第一章で想定した反実仮想のアイデアを、第三章で使った均衡モデルの拡張で実装できるか

難所3.上の拡張モデルを解いた結果が、「理論的に」解釈できるか 

難所4. 異世界の創造神としてその結果に納得できるか

 

第七章~そして伝説へ

ハッピーエンド1. 全部うまく一気通貫で通った。凄い!!あなたはプロフェッショナルな仕事をしました!後世に残ります!

バッドエンド1. これだけの難所を厳密に検討してもうまくいかなかったら、改善点か方向修正点は無数にあるはず!前向きに!時間はかかっても、別の良い仕事や別の大発見に繋がりそうな予感!

ハッピーエンド2. 複数の難所を緩くやりすごしてたり、解けてるか不安だけど大丈夫そうな結果が出たからこの箇所はオッケー、ってポイント。自分より強い歴戦のプロにとっては理論とコードから弱点丸見え!足元がお留守だぜ!再戦するのもよし!あるいは、別の競技かフィールドで戦おう!お給料はそっちの方が断然いいかも!

バッドエンド2. 非難(批判)轟轟死屍累々。とりあえず生きて!!!!あんたが今ここで倒れたら、舞さんや遊戯との約束はどうなっちゃうの? ライフはまだ残ってる。ここを耐えれば、マリクに勝てるんだから! 次回、「城之内死す」。デュエルスタンバイ!

 

総合格闘技か? 

否、地下闘技場トーナメントであった

 

作者 不詳

*本誌への匿名投稿を許可を得たうえで掲載しています。

 

 

2024/04/24 追記

同じようなことが日本語で書かれている