JuliaTokyo #3 Speech Signal Processing in Julia

JuliaTokyo #3でLT発表してきました。前回のJuliaTokyo #2でも発表したので、二回目でした。

スライド

コード

https://github.com/r9y9/JuliaTokyo3

三行まとめ

発表の内容を三行でまとめると、

という感じです。

応用例として、歌声を分離する話(デモコード)、統計的声質変換(統計的声質変換クッソムズすぎワロタ(チュートリアル編) - LESS IS MORE)、画像をスペクトログラムに足しこむ話とか、さっと紹介しました。

補足

僕が使う/作ったパッケージを、あとで見返せるように最後のスライドにまとめておいたのですが、改めてここで整理しておきます。

上から順に、汎用的かなーと思います1。僕が書いたパッケージの中では、WORLDのみ公式パッケージにしています。理由は単純で、その他のパッケージはあまりユーザがいないだろうなーと思ったからです。かなりマニアックであったり、今後の方針が決まってなかったり(ごめんなさい)、応用的過ぎて全然汎用的でなかったり。WORLDは自信を持ってオススメできますので、Juliaで音声信号処理をやってみようかなと思った方は、ぜひお試しください。

ざっくり感想

最後に

@soramiさんを筆頭とする運営の方々、本当にありがとうございました!楽しかったです。


  1. とスライドに書いたけど、考えなおすと、僕が思う品質の高さ順、の方が正確です、失礼しました。MelGeneneralizedCepstrumsは一番気合入れて書いたけど、ユーザーがいるかといったらいないし、RobustPCAはさっと書いただけだけど、アルゴリズムとしては汎用的だし。またRobustPCAだけ毛色が違いますが、応用例で紹介したのでリストに入れておきました。 [return]