This paper reviews a set of recent studies that have attempted to measure the causal effect of education on labor market earnings by using institutional features of the supply side of the education system as exogenous determinants of schooling outcomes. A simple theoretical model that highlights the role of comparative advantage in the optimal schooling decision is presented and used to motivate an extended discussion of econometric issues, including the properties of ordinary least squares and instrumental variables estimators. A review of studies that have used compulsory schooling laws, differences in the accessibility of schools, and similar features as instrumental variables for completed education, reveals that the resulting estimates of the return to schooling are typically as big or bigger than the corresponding ordinary least squares estimates. One interpretation of this finding is that marginal returns to education among the low-education subgroups typically affected by supply-side innovations tend to be relatively high, reflecting their high marginal costs of schooling, rather than low ability that limits their return to education.
Econometricaだけど教科書的な理論と実証サーベイで読みやすい。論文中でも
Griliches77に何度か触れて、この延長線上にあるような位置づけ。ただ冒頭部に
Griliches77を初め、70年代の研究は教育のサプライサイドの違いに全く注意を払っていなかったと、この論文のウリを出している。
前半の理論部は動学を積分使って効用現在価値を構造形で定式化して限界条件を出す。固定金利とか完全予見とか強い仮定を使っても、積分の形のまま解くことはできず(解いてもぐちゃぐちゃ)結局は、簡単化&特定化の誘導形で対数線形にする。(ちなみにこの論文自体では、シグナリングか人的資本を区別しない@脚注4。理論部でも実証部でも、学生&労働者が賃金が上がるということが認識できていれば問題ない。)推定係数の意味は定性的で、理論と実証には距離がある。
線形化して個々人の能力に異質性があり、元からできる奴(切片大)、学校に行ったときの効果が大の奴(傾き大)の単純な形で異質性を入れてみる。仮に切片だけに異質性があり、元からできる子が進学する場合でも、OLSは過大推定というバイアスを例示している。(直感的には当たり前ですな。)切片&傾きにの両方を加味するだけでも、式はけっこう複雑になる。でも多分upwardバイアスがかかっているだろうと一般人も経済学者も思う。
実証への橋渡しとして、操作変数法の典型例:進学や学歴の決定には影響があるが、元の能力や教育効果とは無相関の操作変数を探す。市場の需給と同じで供給側で変数で需要側の効果を識別するとしている。(通常ミクロの文脈で内生性や操作変数法を出してくる場合は、きれいに方程式かけないので同時方程式バイアスよりも観測できない説明変数の方と説明変数の相関の方が多い。しかしここでは同時方程式バイアス風の説明。まぁエラーと相関なく、説明変数と相関ある操作変数以上のネタではない)本当に操作変数要件が満たされるならば、(個人にヘテロ切片とヘテロ係数があっても)平均的な限界(収益)効果が一致性を持って推定される。IVが理想的な仮定を満たしても、操作変数によって影響され進学した人の加重平均効果であって、国民全体の効果ではない。また、教育年数の観測エラーが漸近的に無視できるって意味でもIVはOLSよりも良い。
操作変数例としては、修業年限や授業料、学校へのアクセス。「例えば、高校が3年間の州と4年間の州では、その差分が一年間の純粋な教育効果とか」「学校が近い方が同じ潜在能力でも、学校に行きやすいのでエラーと相関なく、進学への操作変数」というアイディア。前者の方は、外国でもさほどのバリエーションがなく、日本だとデータ的にも無理っぽい。後者の方は、これがエラーと無相関と言えるか?はよく分からない。能力の高い家族、金持ち家族が、教育の充実した地域に移り住む、引っ越しの際の重要度が高いかもしれない。東京と地方の子供を比べて、潜在的な能力は一緒か?って言われると、よく分からない。外生性が怪しい操作変数は本末転倒な気がする。また、この潜在的な能力の定義自体も不明瞭な気もする。生まれた時に固定なのか?家庭環境、小中学校に依存したり、変化するのか?兄弟や双子なら等しいと言えるか?
ランダム係数モデルも紹介している。ランダム係数モデルっていうと、個人や時期によって母係数が確率的に変化しうるベイズチックな話を思い浮かべるが、二段階推定で誘導形における操作変数よりも、不均一分散に対応でき、平均からの乖離部の効果も推定できる。見えない生産性との相関があるという点ではOlley Pakes風の見えない説明変数⇒単調関係⇒見えるものを推定式に入れ込むという発想と似ているかも。 教育の効果が逓減して、教育不効用などの費用が一定ならば、より低学歴ほど高い教育収入になるはず。(LangさんはDiscount Rate Biasと名付けたが、Cardは定義が狭い印象を与えるとしている)
後はCard自身の論文も含めて、実証のサーベイ、基本的にはOLSはIVよりも低い学歴効果で直感とは異なるというのはCard95同じで、前のバージョンアップの形。 Angrisit Kruger生まれた四半期:日本で言う早生まれは損。アメリカは9月学校なので前半に生まれると損という話。 操作変数が弱すぎ、生まれた時期と能力、効果の相関あるかも、という批判がStaigerStock97(弱い操作変数の問題)からあり。この辺りの分かりやすい説明は、 Wooldridgeの初歩計量の操作変数の章にある。
あとは学資ローン、大学の近さ(低学歴の親、女性に関しては、大学の近さはそこそこ説明力ある)軍隊スコア、戦時コーホート(ドイツ、オーストリア、イギリスは効果大、アメリカはあんまり効果大きくない)軍隊経験が高率の英語カナダ人と、低率のフランス語カナダ人の比較、開発の文脈で、フィリピンやインドネシアの学校の近さをIVとした分析もある。そのほとんどでIV推定>OLS推定になっている。Cardの提示した4つの解釈は 1.Griliches77では、教育水準の観測エラーがattenuation biasでdownwardバイアスがある。操作変数では漸近的にこの影響がなくなるが、Card自身もこれのみでの説明には懐疑的。 2.操作変数による、グルーピングがさらなるバイアス引き起こす。 3.面白い結果、t値が大きい設定や回帰を公表しやすい、出版バイアス 4.低学歴の選択は低いリターンではなく、高いコストのため選んだ(IVでもOLSでもバイアス)。
できない子ほど(できるようになったリターン大きいので)進学傾向が強いというロジックはあり得るが、直感的には考えにくい。(進学することがもとの能力の悪いシグナルにもなる)実感としてには考えにくいし、Cardも挙げていない。
数多くの実証論文を挙げているがAngrisit KrugerとStaigerStock97がQJEとエコノメトリカ、この二つは教育効果そのものよりも弱いIVの使用論争として有名。 その他はDP出して5年以上経っているのにDPのまま。やはりOLSを超えるIV推定値が出ると「そんなの変でしょ、他のエラー拾っているのじゃないの?そんな変な推定値を前提に解釈考えて良いの?」という意見がでるのだろうか?そういうパズルが推定やデータによらずに一般的であることを示した論文でもある。(操作変数のパズルはDDの文脈で考える余地がある。)学歴は操作変数法の教科書的な例だが、直感に合う教科書的な推定値を出してくれる論文は最近あんまりない。