NTT研究所のインターンシップ行ってきた
毎週書こうと思ってたのに土日は疲れてボケーッとしていて結局書かなかった。
行ってよかったです。統計的因果推論チョットデキルって感じになりました。ボクがやったのはサーバのログから故障原因を特定しよう!ってやつで、CPU のロードアベレージとか、単位時間当たりの DB の遅延クエリの数とかが何が原因で大きい値になってしまったのかを統計的因果推論を使って分析してみました。
研究所のインターン行ったって言うとなにか特別なことやるような気がするけど、普通に論文読んで実装しての繰り返しなので、目新しいことは無かった。ボクは 3 日おきくらいに進捗報告だったので、1 日目は論文読んで頭ひねって、2 日目は理解が足らない所を適当な本読んでカリカリ勉強しつつ論文読み込んで、3日目にガガガと実装して午後に進捗見せるみたいな感じだった。
論文読みながら結構基礎的なところを復習してた…。推測統計学とか…。「基礎が大事」という高校時代の古典の先生の口癖を思い出して、こういうことかあとしみじみ思ってた。学部時代の講義を話半分に聞いたボクを説教したいけど、ボクの場合、座学ってその必要性が理解できてからじゃないと手がつかないんだよな、なのでこうなってしまったのは仕方ないです。話半分でも聞いたことがあるぞという感覚が必要なんだと思う。全く聞いたことも見たことも無い単語が並ぶのと、ボケーッとしていても解説を聞いた経験があるのでは、いざ取り組むときのハードルの高さが違う。なのでその時真剣にやらなくても大学の講義をなんとなく聞くというのも重要なことかな、とおもいました。
社員の人はやっぱり博士号を持っている人が多くて漠然といいなーボクも欲しいなーとは思ったんだけど、博士号取った後にリサーチャーとして生きる将来はあんまり想像できなかった。なんでかなあと思って考えたけど、多分自分の能力で金を稼いで生きているという実感が欲しいのだと思う。それと、何かを作ったときの感覚が、自身のアイデンティティに貢献したようなよう気持ちがしていて、それでエンジニアになりいと思っている気がする。
今回のインターンは、リサーチャーの仕事というよりはエンジニア的な仕事だったと思う。既にアイデアはあってボクはそれを検証しただけで、実装のために自身の工夫はあったんだけど、アイデア自体にボクのアイデアを含まれていないのでした。自身のアイデアを含めるには物事を知らな過ぎだった…。突き詰めて勉強すればリサーチャーとして生きる覚悟もできるかもしれない。
だから統計的因果推論続けて勉強してみようと思っている。いくつか因果関係を検出する手法があるんだけど今回のインターンで検証できたのは 2 つだけで、簡単な手法だけ理解した別の手法がもう 2 つあるので、その当たりから論文読んでこうかなあ。あとはどこに応用するかを考えたいですな、故障原因検出とか医療統計とかの他にここで使ったらめっちゃ面白いみたいなの、見つけたい。
統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)
- 作者: 宮川雅巳
- 出版社/メーカー: 朝倉書店
- 発売日: 2004/04
- メディア: 単行本
- 購入: 6人 クリック: 67回
- この商品を含むブログ (23件) を見る
調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)
- 作者: 星野崇宏
- 出版社/メーカー: 岩波書店
- 発売日: 2009/07/29
- メディア: 単行本
- 購入: 29人 クリック: 285回
- この商品を含むブログ (24件) を見る
- 作者: Judea Pearl,黒木学
- 出版社/メーカー: 共立出版
- 発売日: 2009/02/24
- メディア: 単行本
- 購入: 6人 クリック: 231回
- この商品を含むブログ (25件) を見る