JuliaTokyo #3 Speech Signal Processing in Julia

JuliaTokyo #3でLT発表してきました。前回のJuliaTokyo #2でも発表したので、二回目でした。

スライド

コード

https://github.com/r9y9/JuliaTokyo3

三行まとめ

発表の内容を三行でまとめると、

  • 音声ファイルの読み込み(or 書き込み)は[WAV.jl]((https://github.com/dancasimiro/WAV.jl)を使おう
  • 基本的なデジタル信号処理は JuliaDSP/DSP.jl をチェック(※JuliaDSPにはウェーブレットとかもあるよ)
  • 音声に特化した信号処理は、r9y9/WORLD.jl がオススメです

という感じです。

応用例として、歌声を分離する話(デモコード)、統計的声質変換(統計的声質変換クッソムズすぎワロタ(チュートリアル編) - LESS IS MORE)、画像をスペクトログラムに足しこむ話とか、さっと紹介しました。

補足

僕が使う/作ったパッケージを、あとで見返せるように最後のスライドにまとめておいたのですが、改めてここで整理しておきます。

上から順に、汎用的かなーと思います1。僕が書いたパッケージの中では、WORLDのみ公式パッケージにしています。理由は単純で、その他のパッケージはあまりユーザがいないだろうなーと思ったからです。かなりマニアックであったり、今後の方針が決まってなかったり(ごめんなさい)、応用的過ぎて全然汎用的でなかったり。WORLDは自信を持ってオススメできますので、Juliaで音声信号処理をやってみようかなと思った方は、ぜひお試しください。

ざっくり感想

最後に

@soramiさんを筆頭とする運営の方々、本当にありがとうございました!楽しかったです。


  1. とスライドに書いたけど、考えなおすと、僕が思う品質の高さ順、の方が正確です、失礼しました。MelGeneneralizedCepstrumsは一番気合入れて書いたけど、ユーザーがいるかといったらいないし、RobustPCAはさっと書いただけだけど、アルゴリズムとしては汎用的だし。またRobustPCAだけ毛色が違いますが、応用例で紹介したのでリストに入れておきました。 ↩︎

Ryuichi Yamamoto
Ryuichi Yamamoto
Engineer/Researcher

I am a engineer/researcher passionate about speech synthesis. I love to write code and enjoy open-source collaboration on GitHub. Please feel free to reach out on Twitter and GitHub.

Related