構造と識別~構造推定と計量経済学に関するトピックを紹介する

踏み込んだ構造推定の日本語の文献がネットに転がっておらず、「構造推定」という響きのかっこよさに夢を抱いたりする人や、響きのうさんくささに勘違いしている人も多いので、土地勘のある自分が日本語でまとめます。気が向いたら。全ての記事はベータ版でござい。

構造推定をしたい匿名学生の実地体験ルポ (1) データを探す時点で試合は始まっている。第一章~データを得るまで(制度知識+経済理論パート)

下記の

第一章~データを得るまで(制度知識+経済理論パート)

に関する手記が届いたので公開する。

 

ohtanilson.hatenablog.com

 

構造推定を最終目標としたとき、データをどのように探すか、という前前前前処理(制度知識+経済理論パート)をできるだけ構造的に書いてみる。

 

第一章~データを得るまで(制度知識+経済理論パート)

 

まず

難所1. そもそも見たい現象と問いが経済学「理論」的に興味深いかどうか。その問いに応えるのに「追随した形で」、手法や理論面で貢献や新規性はあるのかどうか(あるとよりいいね!!)

難所7.除外制約や外生性などの推定に関する批判を乗り越えるアイデアと制度情報が「データを集める前から」すでに「複数」あるか

 

をどうやって達成するか。

 

先人の答え

 

 

  

 

 

 

 

 

まずデータを探すといっても、だいたい「関心がある事象を探そう」とアドバイスされるが、その関心を探すのはどうすればよいのか。

 

第一の案は、とりあえずなんでもよいので超絶リッチなデータセットを触れる環境を得る、というもの。

 

ここでいう超絶リッチとは、「先行研究と制度的知識から、複数の経済学理論モデルでそれぞれ違った切り口をみれそうな確信はあるけど、問い自体が決まってない」ようなデータの質をイメージしたい。RCTできる環境だったり、共同研究できる環境だったり、そのあたりは任意である。

それぐらいリッチだと、重要な先行研究の構造推定手法がほぼすべて検証できるはずで、データと手法の扱い方を学ぶ、先行研究の穴と手を付けていない点を緻密に突く、ことが平行して可能である。この案の推しポイントは、これをこなすだけでとりあえず最先端の後追いが自動でできること、先行研究という暫定の模範解答が存在するので(先行研究が正しければ)構造推定にまつわる不確実性がかなり減らせること、やってる中で拡張余地がみつかること、である。一方で、短所は、後追いにしかならない危険性があること(日本のデータでやってみました、が貢献点ならばそれでも十分である)。

 

以下は、有名なデータソースを探すとても良いきっかけになる。

 

sites.google.com

 

 

第二の案は、手法や理論を軸に、それを使える対象の中で最もインパクトがでかそうなものを探す、というもの。

手法や理論自体に面白みを感じているならば、現実のデータで応用できそうなものを探す、というのは、「やみくもになんか面白そうなものないかなー」とネットサーフィンしたり、「流れてきたネタに対してこんなの面白そう」と呟いてみるよりは、たぶん生産的になる。

また、手法や理論で迷子になることがないので、データが見つかりさえすれば、スルッとうまくいくかも。

以下はデータがリッチ、現象がインパクト大という、同一問題に対して、使いたい手法が異なる良い例。

 

 

 

 第三の案は、事前に自分がオタクレベルで知っている業界を軸に探す、というもの。その業界と心中する意気があればよし、という感じ。例えば、実証IOだと国交省で務めてた人が公共調達データ使ったり、通産省で務めてた人が店舗立地データを使ったり、アナリストをやっていた人がハイテク産業データを使ってたり、製鉄企業で務めてた人が鉄鋼産業を使ってたりする。業界経験歴というのは最強なのである。

 

 

 第四の案は、アンテナとコネを広げまくって、よいデータを釣り上げること。これは運命、データと問いにめぐり合い、宇宙ってこと。構造推定Laborの一番の大御所曰く、AEJ Appliedが構造推定(Labor?)の人にとってはよさげなデータと問いを見つける穴場らしい。

 

次に

難所2. 理論的に興味深いことを制度情報などからもサポートできるかどうか

 

をどうやって達成するか。もちろん達成するためには、この制度情報をよく知っていることが「前提」となっている。前提なので、ここが固まらないとよっぽどのテクニカルな貢献がない限りはレプリケーションの域をでない(レプリケーションは価値がとてもあるが、それ自体が目的だと構造推定はコスパが悪すぎる。)。逆に、ここが固ければ、既存の(実用に耐えうるのか不確実な)手法の応用が素晴らしい知見をもたらすことになる。

 

制度的な情報をよく知ることが、(少なくとも実証IOでは)一番大変で一番大事である。

 

先人の答えはここです。

 

 

 

 

まず、理論や実証は自分でモデルを閉じることが可能であるが、制度的な情報(メカデザで内部に潜れる場合を除き)は完全に外生的なものである。

また、どこまで調べ上げて研究に取り込むのかも際限がない。しかも、研究の問いによって何をどこまで調べるのかが事前に決まってしまう。

例えば、とある国の産業の一年間の事象に関して研究の問いを立てた場合は、最低その一年間の動きが調べられていればよい(もちろんその一年が歴史上、前後N年のなかでどういう位置づけであったかなどざっくり知って必要はあるものの、そんなのキリがない、そこも程度問題である)。数年の現象を定常的な状態とみるならば、静学モデルで捉えるのは理にかなっているだろう。

Igami, M. (2011). Does big drive out small. Review of Industrial Organization, 38(1), 1-21.

Igami, M. (2015). Market Power in I nternational Commodity Trade: The Case of C offee. The Journal of Industrial Economics, 63(2), 225-248.

 

一方で、国際取引がメインの産業の一年間の事象に関して問いを立ててしまった場合は、国際レベルでどういう動きがあったかをある程度サポートしないといけない。

 

 

ある一国の産業の二十年間の事象に関して問いを立ててしまった場合は、二十年分の制度情報の推移なんかも抑えていないといけない。一年ごとの分析?十年ごとの分析?

 

Igami, M., & Sugaya, T. (2017). Measuring the Incentive to Collude The Vitamin Cartels, 1990-1999.

 

国際レベルの二十年間の産業に関して問いを立ててしまった場合は、二十年分の国際情勢の推移なんかも抑えていないといけない。

Igami, M. (2017). Estimating the innovator’s dilemma Structural analysis of creative destruction in the hard disk drive industry, 1981–1998. Journal of Political Economy, 125(3), 798-847.

Igami, M., & Uetake, K. (2019). Mergers, Innovation, and Entry-Exit Dynamics Consolidation of the Hard Disk Drive Industry, 1996–2016. The Review of Economic Studies, forthcoming.

Igami, M. (2018). Industry Dynamics of Offshoring The Case of Hard Disk Drives. American Economic Journal Microeconomics, 10(1), 67-101.

 

残りの難所は、トピックコースを受けて分野内で何ができるのか、自分には何ができるのかを知るなり、実装試して失敗する経験がないとわからないので、保留。計量理論や経済学理論の貢献できる場合は、濃淡が変わって翻が追加されるというイメージ。