働きながら博士号の取得を目指すとなると、一番ネックになるのが時間です。
最小限の時間で効率よく、実験・評価・論文執筆を行わなければなりませんので、
・従来手法がわからない
・実装方法がわからない
・何が新しいかがわからない
という時間を減らすことが必要です。
本記事は、私が博士過程に入学する前に読んでおいてよかった参考書を紹介します。
紹介するジャンルは以下の4つです。
・社会人博士関連
・信号処理関連
・深層学習、機械学習関連
・Python実装関連
学術領域に踏み出すモチベーション
・働きながらでも博士号は取れる
実際に働きながら博士号を取得した方の本です。博士過程はかなり専門性が高く、狭い領域になリますので、ドンピシャで同じ分野の方の体験談を知れるということはないですが、モチベーションを上げるには適しているかと思います。
|
・博士号のとり方
こちらは、海外の方が書かれた本です。日本の大学とは異なる部分もあるかと思いますが、先ほどの本よりも網羅的に書かれています。
文量も多いですが、興味のある方はこちらも読んでみてはいかがでしょうか。
|
信号処理関連
・よくわかる信号処理 フーリエ変換からウェーブレット変換まで
何冊か読んだ中で、これが一番わかりやすかったです。
特に、デジタルフィルタでは基本中の基本である、FIRフィルタとIIRフィルタの違いなど、数式の追い方も非常に分かりやすかったです。
・フーリエ解析 ラプラス変換 z変換
この本もわかりやすかったですが、上の本とは範囲がやや異なります。
純粋な信号処理というよりかは、ラプラス変換やz変換も扱われていますので、制御工学にも興味のある方におすすめかと思います。
・統計的信号処信号・ノイズ・推定を理解する
この本もわかりやすかったです。実測データのように、ノイズを含む信号の扱い方について説明されています。
正規分布や最小二乗法など、基本的な内容から、EMアルゴリズムやベイズ推定までが説明されています。
|
・ディジタルフーリエ解析
音響学会から出版されている本で、フーリエ解析に特化しています。
特に2巻がおすすめで、信号の畳み込みや相互相関関数、クロススペクトルなど、他の参考書には書かれていない内容まで書かれていて、非常に重宝しました。
私自身が大学生の頃は、畳み込みが全然理解できていませんでしたが、信号の伝達特性を理解する上で必須の内容です。
|
|
・音のアレイ信号処理 〜音源の定位・追跡と分離〜
マイクアレイで得られるマルチチャンネル信号の処理(アレイ信号処理)に特化した本です。アレイ信号処理を扱う必要のある方は、かなり限られるかと思いますが、日本でほぼ唯一の参考書です。
なかなか難解でしたが、研究にも関係のある内容だったので、ボロボロになるまで読みました。
|
深層学習関連
・入門パターン認識と機械学習
深層学習ではないですが、サポートベクターマシンやランダムフォレストなど、機械学習手法を網羅的に学ぶことができます。
データさえあれば、深層学習の方が性能が良いことが多いかと思いますが、アプリケーションに応じて使い分けられるよう、前提知識として知っておいたほうが良いかと思い、一通り読みました。
ニューラルネットワークについても書かれていますが、あまり詳しくは述べられていません。
|
・ゼロから作るDeep Learning
メジャー中のメジャーですが、数式を極力用いずに、わかりやすく丁寧に説明されています。KerasやPytorchといったフレームワークを使わずに、0から実装していくスタイルなので、丁寧に追っていけば、理解が深まります。
また、研究を始めると、特徴マップのチャンネルってなんだっけ?
畳み込みってチャンネルごとに掛け算するんだっけ?
と言ったような素朴な疑問がわきますが、ゼロから実装しているということもあり、そういった細かな疑問も解決することができました。
|
・画像処理 機械学習プロフェッショナルシリーズ
従来の画像処理手法から深層学習まで、網羅的に説明されています。
私の場合、研究対象が音声データだったのですが、画像との共通点と差分がどこにあるのかを知るために読みました。
なので、前半の従来手法の部分は読み飛ばしてしまいましたが、畳込みニューラルネットワークや、当時の先端技術であるセマンティックセグメンテーションについて理解することができました。
|
・メカ屋のための 脳科学入門 脳をリバースエンジニアリングする
勉強というよりは、息抜き本でもあるかもしれませんが、脳をメカ屋の視点から学ぶことができます。
難しい生化学の内容はほとんどなく、ニューラルネットワークとの違いを想像しながら読むことができ、非常に面白かったです。
ニューラルネットワークの進化の方向性を考える上でも、人間の脳についても少し知っておくとよいかもしれません。
・音と人間
人間の耳の構造や特徴、心理音響などを学ぶことができます。
音声認識分野でも人間の耳の構造がヒントになっていたりもするので、時間があれば読んでおくとよいかもしれません。
人間の耳=マイク
と勝手に思い込んでいましたが、人間の耳には人間の耳の特徴があることをはじめて知りました。
Python実装関連
・つくりながら学ぶPytorchによる発展ディープラーニング
Pytorchを使った深層学習に特化した本です。非常に分厚い本ですが、クラス分類からセマンティックセグメンテーション、動画認識まで幅広くカバーしていますので、ご自身で実装される際のベースとしても使うことができるかと思います。
・Pythonで学ぶ音源分離
音源分離について、ここまで解説している本はこれ1冊だと思います。
特定の音源だけを取り出すと言っても、前提としているマイクの条件や前処理によって多数の手法が提案されています。
それを広範囲に、しかも実装付きで解説されている本は他にはありません。
また、必須となる短時間フーリエ変換についても、基礎的なところからわかりやすく説明されています。