趣味で構造推定をチャチャっと習いにきたら、こんな教室でした。
第四章~モデルが数値計算を通してパラメタを推定できるようになるまで(計量理論パート)
難所1.第三章で作った均衡モデルの数値計算コードに真のパラメタを与えて仮想データを色んなrandom seedで生成して、ばらつきがあるがおおざっぱな挙動は同じかどうか
これは理論ペーパーの比較静学(+ランダム項)のことである。これは理論的な解釈と生成する均衡の挙動が同じかどうか確かめるためにも、大事なステップである。例えば、一番シンプルな需要曲線と供給曲線の交点(+ランダム項)から均衡価格Pと均衡量Qを計算した時に、X軸QーY軸Pのグラフに各均衡点をプロットしたら価格は右下がりになりますか?少し拡張したモデルでも解釈可能な挙動をしていますか?ここをやっておかないと反実仮想以前のベンチマークモデルと現実のフィッティングでおかしくなる。DGPがそもそもおかしいんなら、どんなモンテカルロシミュレーションもgarbage in, garbage out。どんなパラメタの時に意味わからない挙動なのかも簡単にチェックできるようになる。
難所2.作った仮想データから求めたいパラメタを推定するためにGMMなりSimulated Maximum LikelihoodなりベイズMLEなり部分識別なりの望ましい推定式や解法や言語を選んで実装できるか
これは実際に扱うデータの性質に依存するので省略。
難所3.仮想データを使って上で作った推定式は、真のパラメタを推定できているか。どんな条件(操作変数の強さやモーメント式の数や外生的ばらつき)で真のパラメタを上手く推定できるのか、把握できるか
これは計量理論ペーパーでやるモンテカルロシミュレーションのことである。構造推定だと、データから作る有益そうなモーメントやなんやらが雨後の筍のように現れる(レフェリーが足すように要求してるのか、著者が足してるのかは定かではない)が、いったんはシンプルな設定でうまくいくか確かめる必要がある。操作変数の強さは理論上は大事だが、どのレベルだと強いのかみたいなコンセンサスは応用上はなさそう(モンテカルロシミュレーションではStock and Yogo (2002)みたいなのがあるし、自分も一本書いてる。)。なので、どのぐらい強くないといけないかは実験してみるとペーパーになるかもしれない(自分は一本書けた)。モーメント式の数は多ければ理論上は望ましいので、応用上いいかんじのやつを頑張って見つけてください。
難所4.第五章以降に備えて追加的な特定化や変数をある程度試せる設定やコードになっているか
これは「実際のデータと特定化でやったら、なんか挙動がおかしかった」というのに気づくためにあると便利な設定で、研究者というより「プログラマーとしての能力」である。徹底してhard cordingしない、とかに相当する。トップジャーナルのレプリケーションコードとか見ると、プログラマーが見たら卒倒するコードが沢山あるのでご覧あれ。よいこのみんなはくれぐれも真似してはいけない。