社会人博士の深層学習ブログ

深層学習を使った環境音認識研究で、働きながら博士号を取得しました

【深層学習】環境音認識に関する国際学会DCASE2019参加レポート 〜ディープラーニングを用いた環境音認識(音響イベント検出)の最新技術動向〜

社会人博士初めてになりますが、DCASE(Workshop on Detection and Classification of Acoustic Scenes and Events)という国際学会に参加してきました。 この学会は、今はやりのAIやディープラーニングといった技術を使って、音のデータから周囲の環境を理…

Githubとタブレットで論文管理

皆さんは論文の管理はどのように行っているでしょうか? 私は、先行文献調査や勉強のために論文を読むことがそれなりにあるのですが、いつも管理に困っていました。 今までの論文管理の問題点 ・印刷してメモしながら読みたいのですが、なくしたり破れたり、…

【深層学習】CNNを用いた画像分類手法まとめ(VGG, ResNet, Inceptionなど)

社会人博士を始めるにあたり、CNNの様々なモデルやテクニックについて勉強したので、忘れないようまとめておきます。 体験談も書いていますので、よければそちらもご覧ください。 ys0510.hatenablog.com 参考文献は以下のサーベイ論文です。図もこちらから引…

【社会人博士】体験談②〜1年目の3月でようやく国際学会へ投稿、まさかの採択〜

ほぼほぼ初心者の状態から、社会人博士課程に入学し、1年ちょっとがたったので、今までをまとめてみます。 入学を決めるまでの2年間や入学直後の感想も書いてありますので、よかったら読んでみてください。 (ただの日記になってしまっていますが) ys0510.h…

【深層学習】ディープラーニングで音楽を認識する手法 〜CNNでミスチルらしさが識別できるか!?〜

今までイベント検出やセマンティックセグメンテーションについての記事を書いてきましたので、今さらですがシンプルにCNNでクラス分類をやってみようと思います。 とは言っても、さすがに犬猫や数字の認識をやってもしょうがないので、 今回は、CD音源を聴い…

【深層学習】GAN(pix2pix)でモノクロ画像のカラー変換や欠けた画像の修復

pix2pixとは pix2pixとは、対応する画像から所望の画像を生成する手法で、Image translationとも言われます。 具体例として、以下のような変換を行うことができます。 ・グレースケールからカラー画像への変換 ・一部のかけた画像の補完 ・レンダリング画像…

【社会人博士】体験談① 〜入学からの約半年、深層学習の勉強からスタート〜

ほぼほぼ初心者の状態から、社会人博士課程に入学し、半年ちょっとがたったので、今までをまとめてみる。 入学を決めるまでの2年間も書いてありますので、よかったら読んでみてください。 (ただの日記になってしまっていますが) ys0510.hatenablog.com 4月…

【セマンティックセグメンテーション手法】Segnetのネットワーク構造や性能をU-Netと比較

今回はSegnetを使って、自動運転にも使われているセマンティックセグメンテーションを試してみました。 Segnetとは 前回紹介したU-Netと同様、セマンティックセグメンテーション手法の一つで、以下の図のようなEncoder-Decoder構造を持ちます。 簡単に言うと…

【深層学習】VGG16でfine tuningしたFCNでセマンティックセグメンテーション 〜ネットワークの解説とCityscapesデータセットで実験〜

今回は、VGG16をFine tuningしたFCNを試してみました。 そもそもセマンティックセグメンテーションは何か?他の手法との比較に関しては、以下の記事をご覧ください。 本記事では、FCNに関連する事項について書いていきます。 ys0510.hatenablog.com VGG16と…

【深層学習】U-Netでセマンティックセグメンテーション 〜ネットワーク解説とCityscapesデータセットで実験〜

今日はU-Netでセグメンテーションをやってみた結果を載せてみます。 セグメンテーションとは、以下の例のように、画像のピクセル単位で車や歩行者などを認識するAIの技術で、自動運転などに使われていたりします。 ys0510.hatenablog.com 学習に使ったデータ…

【機械学習】ディープラーニング以外の機械学習は古い?

今回は、ディープラーニング以外の機械学習手法などについて。 ディープラーニングを用いれば、人間が特徴量抽出を行わなくて済むため、大変便利なのですが、その分デ ータ数が必要になったり、パラメータチューニングが大変になってしまうのというのが、私…

【信号処理】コヒーレンス関数から何が言えるか

先日の記事で、伝達関数測定の際、どのようにコヒーレンス関数を見ればよいのかを考えました。 伝達関数測定とコヒーレンス関数とは - メーカー社員が0から人工知能分野の博士号を目指す 某サイトによると、コヒーレンス関数が低くなっていまう理由としては…

【信号処理】伝達関数測定とコヒーレンス関数とは

会社で振動制御に取り組んでいる先輩から、伝達関数やFRF、コヒーレンスについて質問をもらい、答えていくうちに、少し本質が見えたような気がしたので、記録に残しておく。 正しくない部分があれば、ご指摘いただけると助かります。 まずは、問題の整理。 …

【体験談】働きながら人工知能分野で社会人博士を目指してみる

あるきっかけで、人工知能や音の信号処理を勉強し始め、「もっと本格的に勉強したい!」という思いから、社会人博士課程に入学しました。 ・ディープラーニング、信号処理の数学的なところが難しすぎて理解不能 ・博士は勉強するところではない(研究すると…

【社会人博士】入学を決めるまでの2年間〜進学を決めたきっかけ、研究室選び、入試までの準備、必要な英語力〜

私は今、社会人博士の学生として、働きながら大学院に通っていますが、そもそもなぜそんなことをしようと思ったのか、入学前の手続きや学費について書いていこうと思います。(直接関係なさそうな過去から振り返っていますが、ご了承ください) 入学2年前の…

【死ぬ前に後悔すること】社会人博士に踏み切ったきっかけと後悔しないための自己分析

社会人の方で、以下のような悩みや不安がある人って多いのではないでしょうか。 ・このままの自分でいいのか不安 ・自己啓発をしようと思っているが、何をやればいいか迷っている ・やったところで意味あるのか? まさに私もその一人でした。今でもその不安…