はじめに
- 主に自分の修士の学生向け用にマニュアルが必要だと思ったのですが、他の学生の方にも参考になるかもなので、公開しておきます。
- 想定している読者: これから経済学の実証論文、特にミクロ計量経済学を使って実証論文を書くよ、という人向け。博士の人も最初の部分は参考になるかもしれません。僕の指導を受けたい(といってもまだ僕は正式に指導学生は持てませんが)人はmust readです。学部生だと全てをこなすのは難しいと思いますが、意識をするだけでもいいかと思います。
- 何かコメントあったらtwitterででもここのコメント欄にでもどうぞ。
- 常にベータ版: 有益なリンクなどを追加して更新していこうと思います。
- ざっくりいうと以下の順番に並んでいます
研究アイディアの練り方
あくまで一例ですが、こんな感じで僕は考えることが多いです。この3つが揃うとすごく良い論文だと思いますが、最初から(特に学部の段階で)それを揃えるのは難しいとは思うので、どれかを切り口にして考えてみると良いと思います。因果推論の基礎的知識を前提した説明もありますが、それに限らずヒントにはなると思います。
- データdrivenのケース
- こんな見慣れないデータがあるぞ
- 他の似た研究では使われていないぞ
- このデータで新しく言えることはなんだろう
- それが経済学的(もしくは社会一般にとって)になぜ重要なのだろう?
- コンテクストdrivenのケース
- こんなことが起きた(ている)ぞ (例: 幕末の開国
- その結果何が起きるだろうか? (閉鎖経済からの移行、価格の変動
- それは経済学的(もしくは社会一般にとって)に重要なのだろうか? (貿易理論のテストに使える
- もしくはそれは何かを綺麗に識別するのに使えるだろうか?(DID, IV, RDなどの検討)
- セオリーdrivenのケース
- こんな理論があるぞ
- 経済学的(もしくは社会一般にとって)に重要そうだぞ
- この理論は本当だろうか?あまり今まではテストされていないぞ
- もしくは特定のXという状況だと違う予測になるぞ
- もしくはそれを使って何か予測をしよう
- それをテストできるデータ/コンテクストを探そう
- (僕はあまりこういうタイプの研究をしてないですし、経験や知識の蓄積がある程度必要だとは思いますがこういうのもあるぞということで)リテラチャーdrivenのケース
- 既存の実証論文たちはこんなことを言ってるぞ
- でもなんか疑問に思うぞ、本当は今まで分析されてない別のチャネルが重要じゃないだろうか/こういう視点で見れば論文によって一見違う結果をうまく説明できるぞ
- そのポイントを分析可能なデータや状況はないだろうか。もしくはどういう実験(RCT)をすれば良いのか。それに比べて手元の状況はどういう欠点があるのか。
ちなみに色々思考を広げすぎると論文が書けなくなるので、因果関係の特定を前提とするならば、例えばDifference-in-Differencesができるコンテクストを探す、という一歩目をまずは踏み出すというのが修論だとfeasibleかもと思います。
それと、重要性の訴え方ですが、「〇〇の市場はXXX円だ」のように現実との関連で訴えかける時もありますし、「〇〇は経済学で基本的なコンセプトでそれを使った予測は多いが、実証論文は少ない」みたいにあくまで学術的に訴えかける時もあります。色々な論文を読むことでその辺り吸収できると思います。
これらを考えてくることに慣れると、最初に論文のアブストラクト(とできればリテラチャーサーベイ)を考えて、「もし計画が100%うまく行ったらこんな論文になる」というのを書いて見ます。これで面白くなさそうだったら多分そのプロジェクトはやめた方がいいです。実際は計画通りにデータが取れなかったりするので、ここで微妙だったらさらに微妙になる確率が高いと思います。もちろんやっているうちに色々アイディアが出ることもありますが、時間は有限なので最初の一歩を間違えないことも大事だと思います。
それとできればですが、結果次第で「論文になるかどうか」が変わらないようにするのが理想です。例えばAがBに与える影響を調べるときに、理論的チャネルによってはその正負どちらかわからないので調べる、といったスタンスで望めば「あれ?正のはずなのにおかしいな」と書けなくなることも減るでしょうし、有意性がなくても本当に効果がほぼゼロならそれから学べることはあります(参考論文)。避けるべきはサンプルサイズが小さくてStandard Errorがおおきく何もpreciseに推定できずに有意にならないといった状況で、効果がゼロになることではないように思います。もちろん例えば効果が正に出た方が論文のインパクトが大きいことはあり得ますが、それは結果論なので始めるときにはそれほど気にすることはなくて、「これは問う価値があるリサーチクエッションだ」とドンと構えておけばいいんじゃないか、と僕は思ってます。卒論修論だと論文を書く技術の習得が目的の一つだと思うので、特に当てはまると思います。
おすすめできないアイディア
どうしてもデータや背景知識の面から日本のことを取り上げることが多いとは思いますが、「Aは日本では検証されていない」というモチベーションの仕方のは経済学の論文を書く以上、よくないやり方です。なぜなら日本人以外誰も興味を持たないでしょうし、日本人ですら興味を持つかも謎です。ただ、なぜそれを日本で検証することに学問的意義があるのかを考えれば、自ずとヒントが出てきて差別化できることが多いと思います。(例えばデータが日本にしかない、何か綺麗な外生的ショックがある、他とは違うコンテクストなので違う効果が予測される、そもそも日本でしか起きていない大きな出来事である、など)
開発だと日本のデータはあまり使わないかもしれませんが、同じ話です。日本に限らず特定の地域に愛着があるケースもありますし、その愛着が研究のモチベーションを高めてくれることも多々ありますが、経済学を研究している他人が興味を持ってくれるか、をベースに考えた方がいいと思います。逆に言えば歴史系や地域研究系など、違う価値体系を持っている分野であれば、このセクションですでに書いたことはあまり関係ないと思われます。
それとYの要因は何なのかを調べる、といってYをいろんな変数に回帰するタイプの研究もあまりおすすめしません。通常1つの要因の因果関係を知るだけでも大変なので、複数の要因の因果関係を調べるのはさらに難しいです。Yの要因としてとある1つのXを調べよう、というモチベーションで始めるならば自然とXの効果を識別できるような研究デザインを考える方向に向かい分析の質は向上するはずです。
文献収集術
- とりあえずJournal of Economic Perspectives, Journal of Economic Literature, Handbook of XXXX Economics、Annual Review of Economicsあたりのサーベイが載ってるジャーナルでサーベイ論文を探す
- なければ有名論文をなんとか探して、そこのリテラチャーレビューを参考にする
- 有名な学部-修士向けの教科書の関連する部分の内容とリテラチャーレビューを確認する(特に欧米の大学はシラバスが公開されていることが多いので便利
- 一旦その分野で重要そうな文献を見つけたら、それをgoogle scholarで検索し、「その論文を引用している論文」をひたすら(アブストだけでも良いので)見る。
- 最新の動向に関しては以上では引っかからないこともあるので、気になる研究者のサイトを見て未発表草稿がないか、また有力学会のページなどを見て新しい研究がないか確認する
文献管理術
- Zotero
- 論文pdfなどを書誌情報付きで管理できる。書誌情報はオートマティックに収集してくれる(多少手作業で直す必要がたまにあるが)。
- 実際に論文に参考文献を出すときには、引用した選んでエクスポートすればすぐ参考文献リストが作れるし、latexで書くのであればbibtexファイルがすぐ出せるので超便利。
- 同様のソフトウェアでMendeleyなどがある。大して変わらないと思うが、僕はzoteroで始めたのでzoteroを使っている。これらは無料。endnoteなどの有料サービスの方がいいかは知らない。
- とあるトピックについて集中的に読んだときには、各論文をまとめたメモをtxtファイルやword、evernoteなどで作ると良い。
- リサーチクエッション、データの構造、メインとなる推定式とその識別戦略、結果や解釈の概略と気になったことのメモぐらいでちょうど良いかと
データの探し方
- 開発関係のデータカタログ/データベースだとdevecondataや世銀のmicrodata library、IPUMS(各国センサス)、DHS(健康関連)、Uppsala大のconflict data、World Values Survey、Afrobarometer(アフリカ諸国の意識調査等)、あとは農業関係でFAO-GAEZ(
途中からリンク貼るの面倒になった)あたりが役に立つ/よく見ると思います。その辺を足がかりにいろいろ探すと良いかと思います。 - ここんところずっと流行り気味?の衛星画像に関するサーベイはDonaldson and Storeygard (2016) JEP参照
- 日本のデータだと国のセンサスや調査系データ、国土数値情報などが基礎的なデータになるかと。他にも研究所等がデータベースを持っていることもあるので中身や利用法を要チェック(例えば東京大学空間情報科学研究センター、東京大学社会科学研究所、などなど)。神戸大ならKUMiCから国のミクロデータが利用可能かも(ただ学部や修士の学生が使えるかは僕はちょっとわかりません)。
- あとは、関連研究が使っているデータを確認する、ひたすらgoogle (scholarと普通のgoogle両方)で興味があるワードをひたすら探す、などがあるかと思います。
データ分析ツール(特にミクロ計量経済学を使う人向け)
- R: 統計プログラミング言語。無料なので、大学を離れても使える。経済系以外の社会科学研究者もよく使ってる。RStudioを追加インストールすると使いやすい。特にこれを読め!というのは多分あるのだろうけど僕は独学したのでよく知らない。
- Stata: ミクロ計量経済系研究者(特に僕みたいな複雑な推計をしないタイプの人)御用達の統計ソフトウェア。有料だが、研究者たちは使っている人が多い。学生の間は永久ライセンスが安く買える。Rよりプログラミング初心者にはとっつきやすいかも。入門書としてよく出るのはこれ。
- Python: 無料。Rよりもさらに一般のプログラミング言語。anacondaを入れてjupyter labで分析すると、実験ノートみたいにコードと結果が記録されるので指導教官とのミーティングには便利。入門書はたくさんあるが、僕はみんなのpythonを読んでわかりやすかった記憶がある。
- ArcGIS: 地理データを使う際に便利。データを目視しながら確認できる。フリーソフトではQGISもほぼ同様のことができる。単に地理データを分析するならRのsfパッケージなどがあるが、データを目視しながらクリックしてココどこだろう?みたいなことはできない。これもKudamatsu氏のwebsiteか、経済・政策分析のためのGIS入門や応用が役に立つ。
- Excel: csvを開くとき、csvを手で入力してつくるときだけ使う。それ以外はほとんど使わない。決してこれで統計分析をしようと思わないこと。
データ管理
- クラウドストレージ: 何かクラウドにおいてはいけないデータがない限り、基本的にDropboxなどのクラウドストレージにデータや論文は全て保存する。
- 異なるpc間での同期をするためとバックアップのための二つの意味がある
- dropboxにはかなり遡ってバックアップを復元できるオプションがあるので、買っても良いかも
- GitHub
- いわゆるプログラマーはみんな使ってるようだが、経済学の研究者業界ではまだあまり浸透していない。dropboxと違って、コードのバージョン管理をするのがメインの目的。
- (2022年8月追記)だんだん浸透してきていると思われる。経済セミナーにも連載があった。
コードを書くとき
- コメントを駆使して自分が何をしようとしているか細かく書く
- 後で見返したときに分かるように。2週間後の自分は他人と思う。
- 生データとコードの組み合わせだけにする
- 生データを例えばエクセルでいきなり加工して保存すると、その作業は再現不可能になる
- 後で修正を加えたいとき、作業内容を確認したいときにすごい困る
- 生データから最終成果物までのコードで全て再現できることを目指す
- コードは適切な単位で分ける。コードが増えてきたら、readme.txtなどを作って、それぞれのコードの実行の順番などを記述しておくなど、全体像の把握に気を使うと良い。
stataやR, latexなどでテクニカルな問題にぶち当たったら
- 僕はこの順番でやってました
- ひたすらググる
- helpファイルをよく読む
- 友人や先輩に聞く
- twitterで聞く
- stackoverflowで聞く
執筆ツール
- Grammarly(文法チェッカー)
受動態に親でも殺されたか、というぐらい受動態を嫌ってくるが英語で書く場合の基礎的な文法ミスは減る。ブラウザ対応しているのでgmailなどでメールを書くときにも使える。
- Word vs LaTeX
- もはや宗教戦争じみているが、僕はLaTeX教徒であるので多少以下の記述にはバイアスがかかってます
- wordの良いところ:
- 卒業して研究とは違う仕事をするようになっても使う。
- 研究者でも事務仕事はwordが多い。
- ただそもそも普通に仕事をしているだけだと高度な機能を使うことはあまりなさそうなので、習熟するメリットがどこまであるかはよく知りません。
- latexと違ってインストールに苦労したりはまずしない(ただ最近はcloudlatexやoverleafなどオンラインですぐにlatexが使えるサービスがあるので、このメリットは小さくなってきた。)
- 英文で書く場合、文法チェッカが最初から入っている。
- トラックチェンジをオンにすれば変更点がすぐわかる。複数人で原稿を確認し修正するときに便利。latexでもできなくはないがかなり面倒。latexのコードをwordにコピーしてtrackchangeする人もいる。
- 卒業して研究とは違う仕事をするようになっても使う。
- latexの良いところ
- 一般には数式が綺麗というのが挙げられる
- が、むしろbibtexと組み合わせて「文献引用と文献表の作成(citationをする->reference listに加わる)を自動的に行える」「表や図などを追加したときに自動的に番号を振ってくれ、かつ文章中での参照も自動的にアップデートしてくれるので番号振り分けミスが起きない」「以上の機能をガシガシ使っても立ち上げ時に重くならない」が強力
- 自動的に行えることで、締め切り直前に確認すべきことが減るのはストレスレス。
- とりあえず使ってみるには「LaTeX2ε美文書作成入門」が鉄板の入門書
- 個人的におすすめのテキストエディターはsublime text 3(大抵のプログラミング言語のコーディングにも対応してます)
- (2022年8月追記)最近はVS Codeが使いやすくなっているので、そちらに一部移行中。。
- 好み次第かもしれないところ
- latexは元の文章をコンパイルすることでpdfに初めてなるので、文章を入力している間は完成形が見えない。これをデメリットに感じる人もいるが、むしろ執筆中はレイアウトなどを気にしなくて内容に集中できるという利点でもある。
- 論文を書いているときにデザインと格闘するのは僕は嫌いです
- (おまけ)markdown
- 簡単な文章ならmarkdownで書くと早い。latexのように文献管理とかはできないが、wordより軽い。このブログもmarkdownで書いてる。
書き方、スタイル
- harvardのサイトに分野別の論文の書き方指南書がupされています。ここで経済学のものをDLしてもらえればかなりのことが網羅されているのでmust readです。(データsourceなども書いてあります)。
- 英文もっと基本的なことはこれが良いと言う情報を聞きつけました。中身を見たらまた追記するかも。
- 私は和文で学術論文を書いたことがないのですが、和文で書く際も上のharvardのリンクは参考になると思います。普段皆さんが読んでいるような雑誌やwebの記事などと学術論文は求められている厳密性が違うせいか、かなり文体が違いますし、学術論文でも分野によりけりなので、和文で参考にするなら和文の研究書や雑誌に載っている経済学の実証論文にしましょう。
図表のデザイン
- アカデミアに限らず書類/スライドにおける図のデザインは非常に重要です。
- 「データ視覚化のデザイン」が読んだ感じ入門として良かったように思います。
- 僕の雑感はこちら
https://twitter.com/J_YAMASAKI/status/1274261578699792384 - 論文では白黒印刷することが多いので、グレイスケール(白黒)を基本とするのがいいでしょう。もしくはカラーにしたいのであれば、Sim Daltonism (mac専用、winは自分でcolorblined checker appとかで調べてみてください)などのアプリなどを使ってグレイスケール/あらゆる色覚の方にも判別できるかを確認するといいと思います。
- 表に無駄な罫線をつけないこと。少し論文を眺めてみればわかりますが、ほとんどのケースで縦線を使うことはないと思います。