データ探しの旅 (2001年12月24日)

 後期に入ってから、ほとんどこのホームページを更新していませんでした。そもそも、このホームページは時間が余ったときに気分転換に更新するいい加減なものでした。しかし95%基礎計量経済のせいで、気分転換をする暇があまり与えられず、課題提出後は放心状態であったので、更新していませんでした。しかしこの二ヶ月忙しかったけど、今振り返ってみると、授業や課題から来ている忙しさなのでネタにしにくいのです。『僕とGMM』とか『おいしい完全ベイジアン均衡の作り方』とかで文章書けたら、ネタに困ることもありません。でも予習したり、復習したりというルーティンワークって忙しさの割に、あまり書くことがありません。というわけで時間もネタもないのですが、さすがにそろそろ更新しないといけません。

 ここ数ヶ月の忙しさは、ほぼ基礎計量経済によるものなのですが、マーフィの法則(死語?)というか、忙しいときには集中的に忙しくなるもので、2週間ほど前には計量の中間試験+課題、公共経済、ミクロの課題、財政理論、ミクロ経済政策の発表が重なりました。お陰で今年12月8日と9日のインゼミもゆっくり見ることができませんでした。メインの計量をやっつけるために他の細かい仕事を片づける心持ちだったのですが、予想以上に時間をとられてしまいました。
 公共経済は学部上級科目と合併で半分以上が学部生なので、授業は理論的にやさしいし、先生も「課題はそんなに難しくないですから」と言われたので、数時間あれば出来るだろうと思っていました。最初の論述、2問目の計算問題は楽でしたが、3か4問目に端点解+内点解の労働供給と人口分布から税収を考える難問が出て、当初3時間で書き上げるはずだった問題に丸2日かかってしまいました。後に作問ミスだということが分かりました。
 財政理論の発表も僕がM1で初発表で、それまでの博士課程の方がTeXを使って作成していました。その空気に負けてWordや手書きで書けば1時間で作れる資料をTeXで作ったりして余計に時間がかかってしまいました。
 一番時間を費やしたのがミクロ経済政策演習の発表です。もともと阪大懸賞論文で書いた日本版の世代別賃金格差モデルをアメリカにも適用可能かを大まかにチェックするというミッションでした。データをとるという頭は使わないで足で稼ぐだけのはずでしたが、足で稼ぎすぎてしまいました。世代別賃金格差モデルは、かなり古いデータが必要となるため、5歳区分で少なくとも5世代(25年分)はさかのぼってデータを収集する必要がありました。

 とりあえずアメリカでの統計総覧みたいな『Statistical abstract of the United States』を調べてみました。abstractなので、あまりにマニアックな学歴別5歳区分賃金データは当然載っていません。しかし調べたい関連資料が『Current Population Survey』に載っていることが分かり、それをインターネットで調べてみました、ここ94年〜2000年の資料はネット上のPDFがありました。しかし1980年代以降のデータはネット上に存在せず現物を探す必要があり、東大OPACで探してみました。Current Population Surveyの発見対応表
 まずこの資料名を入力すると、東大社研のマイクロフィッシュが1971年から1984年までずらーっと出てました。マイクロフィッシュは投影するのが面倒なので、出来るなら紙媒体の方が良いと思いました。しかし主要な大学図書館での横断型OPACのWebcatで調べてみても、1970年代はこの社研のマイクロフィッシュが日本に存在する唯一のデータのようです。それにこのデータ自体が日本には数少ないことも分かりました。この資料を部分的にでも持っている大学図書館は日本全体に数カ所です。現物を10年以上の時系列で持っている図書館は日本には存在しませんでした。
 その時の発見は右図のようになります。下の青いところがネットにPDFであった分、上の黄色の所が社研にマイクロフィッシュでおいてある分です。縦でビンゴをとりたいわけのですが、中途半端に古いデータの1985-1993の失われた9年間を埋めるのが今回のミッションでした。PDFは全て集めましたが、失われた9年間の収集に不確実性があるのでマイクロフィッシュは後回しで、先に失われた9年間の収集を考えました。


その1: 失われた9年を求める旅

 このデータを現物で比較的多く(散発的に8年分程度)持っている一橋大学経済研究所資料室へ行くことにしました。中央線に揺られて「山田さCurrent Population Surveyの発見対応表2んは通学大変だなぁ」とか思いながら、一橋大学へ到着しました。数ヶ月ぶりに森谷君に会って、経済学や授業の雑談をしながら一緒に昼飯を食べた後に一橋大学経済研究所へと行きました。しかし12時から1時までは役所現象の昼休みだったので、森谷氏とともに院生室でさらに雑談をしました。1時になって資料室が開いたので、ようやく調査開始となりました。
 一橋大学の院生でない僕は、係の人に紙に書いて注文して持ってきてもらう方式でした。開架方式なら本棚の前に居座って調べられるけど、この資料が題名をころころ変えていることもあり、なかなか上手に調べられません。係りの人に3,4回往復してもらって<(_ _)> ようやく1980年、1982年、1987年、1990年、1991年、1992年のデータを見ることができました。東大社研のマイクロフィッシュの状況が分からないので1980年のコピーもとっておきました。1989年が見つかれば、その時点で6世代ビンゴ予定でしたが、1989年は日本には存在しないことが判明しました。また1990年はあっても、1985年も日本に存在せず、『04-09ライン』『05-10ライン』で組むことは、ほぼ不可能であることが分かりました。 しかしマイクロフィッシュを使えば、とりあえず『02-07ライン』で6世代ビンゴとなります。

その2: マイクロフィッシュリーダーを求める旅

 数日後に東大社研にで1972年、1977年、1982年のマイクロフィッシュを借りました。マイクロフィッシュは借りれても、社研職員じゃないと社研のマイクロフィッシュリーダーを使えないようです。経済学部資料室にてマイクロフィッシュを映し出すと、経済学研究科においてある最高倍率の20倍では、倍率が小さく画面に対してフィッシュが半分の大きさでしか映りません。仕方がないので総合図書館に行って投影をしましたが、東京大学総合図書館が誇る最高倍率24倍では経済学部が持っている20倍と大差がありませんでした。マイクロフィッシュリーダーが悪いと言うよりも、このマイクロフィッシュが特殊みたいです。
 社研に戻って相談してみると、社研の最大倍率も24倍なので、仮に社研のリーダーを使わせてもらったしても総合図書館と倍率が変わらないことが判明しました。職員の方と話すと、法学部の資料室へ行けば高倍率のものがあるかもしれないという情報をいただきました。お使い系RPGをやっているような気分がしつつ、日を改めて法学部の資料室に向かいました。
 法学部資料室の事務室の隅ににあるリーダーの倍率は総合図書館の約2倍の50倍です。法学部の教官&院生専用ということでしたが、事情を話して特別に使わせてもらうことができました<(_ _)>。しかし1972年のマイクロフィッシュは、倍率50倍でも文字がかすんだり、潰れたりしてメディアELEMENTARY SCHOOLと書いてある。側の問題で読めないということが分かりました。『01-06ライン』の可能性も考えて1971年のフィッシュも調べてみましたが、同じようにも読めませんでした。 1976年や1977年は一応読めます。このフィッシュが小さすぎるという問題や保存状態にも依存すると思いますが、マイクロフィッシュの使用期限は25年〜30年のようです。仕方がないので1977年から1997年の5世代でデータを作成することにしました。

 ミクロ経済政策の発表のある水曜日は院生総会、計量の中間試験と重なって2週とばしでした。よって年末の1回の発表のために、かなり時間を割いてしまったことになります。しかも労力の割には、単にデータを出して加重をとって世代区分に直しただけのExcelでの作業のみです。さらには、その年末最後のミクロ経済政策の発表では、先生の都合で発表しなくても良くなってしまいました。結果論としてはこの数十時間かけたデータ収集は、別に計量の中間テスト前に急いでやる必要もなかったことになります。こうしたことに時間をとられたので、計量の勉強も宿題も中間試験もかなりいい加減になってしまいました。そういうわけで、もうすぐ返ってくる計量の中間テストに恐怖しつつ、23歳を迎えました。