shingoushori's dialy

音信号処理を専ら研究していた元博士後期課程の学生によるメモ

文献 / bibliography

memo : SilentVoice: Unnoticeable Voice Input by Ingressive Speech

2018年10月ごろの話題 のメモ SilentVoice: Unnoticeable Voice Input by Ingressive Speech〜 息を吸いながら発話 小さい音量での発話でも音声認識できる https://www.microsoft.com/en-us/research/uploads/prod/2018/10/UIST2018_SilentVoice_cameraready…

memo : DKA法

代数方程式の解を、"Aberthの初期値を用い,DK式を反復計算することで, 個の根を得る方法をDKA(Durand-Kerner-Aberth)法と呼ぶ.(引用 : DKA法 - PukiWiki for PBCG Lab)" 複素数を考慮するのがポイント DKA法 - PukiWiki for PBCG Lab qiita.com エクセル…

memo : JavaScript x Python ... iPython Notebook -> GitHub Gist

とりあえず、メモ Python のコードを JavaScript で実行したいんだが、という調べ物手軽にWebアプリ化できるといいのだが Brython ... Python のコマンドプロンプトを作っちゃう?その実行ファイルの大きさとアクセスの負荷が心配とりあえず Brython 本家の…

memo : Google、歌詞->旋律の機械学習を特許出願

機械学習するにあたり、「うわぁ」な記事がきました。 aidiary on Twitter: "グーグル、歌詞に合わせてメロディを自動作曲する機械学習システム--公開特許に https://t.co/Cl1oDVzNxT" [公開特許] 「公開特許公報」って何? - 発明plus 特許申請された内容が…

memo : Magenta.js

とりあえず、メモ Magentaで開発されてきた音楽生成のモデルや、音楽の潜在表現を得るMusicVAEのモデルが、オールインワンのJavaScriptライブラリとなって登場。このMagenta.jsを利用することで、簡単にブラウザ上で音楽を生成したりすることができるように…

最近Webブラウザのタブに居続けたナイスURL

gigazine.net www.codexa.net www.atmarkit.co.jp Dynamic Routing Between Capsules from Fujimoto Keisuke www.slideshare.net machine-learning.hatenablog.com qiita.com qiita.com <RNNによる音源分離、ノイズ除去のWeb Audio API を用いたデモ> js-mim.github.io RNNoise: Learning Noise Suppression www.dtmstati</rnnによる音源分離、ノイズ除去のweb>…

最近Webブラウザのタブに居続けたナイスURL

s0sem0y.hatenablog.com s0sem0y.hatenablog.com tech-blog.abeja.asia blog.brainpad.co.jp qiita.com qiita.com dsas.blog.klab.org www.speechandhearing.net 音源分離における音響モデリング(Acoustic modeling in audio source separation) from Daic…

Pythonで音信号処理する環境づくり on Mac のメモ

<経緯>メインPCがMacです。Pythonで音信号処理する環境づくりをやりました。恥ずかしいことに、これまで何度も挑戦しては挫折してました。今回は今の所すんなり綺麗にできているので、メモをば。 <Python本体>まずバージョン。Python2, Python3 をそれぞれ入れて適宜切り</python本体>…

Web Audio API で、the sliding Goertzel DFT filter を試作 (1帯域)

Web Audio APIでのSTFTによる帯域分割がうまくいかないので,the sliding Goertzel DFT filterに抜け道を求めました. ↓the sliding Goertzel DFT filterの素敵な文献↓The Sliding DFTSLIDING IS SMOOTHER THAN JUMPING DFTの1帯域分に着目すれば,IIRフィルタ…

論文・文献徘徊メモ 160219-1 Pease FFT / Korn–Lambiotte FFT

FFTといえば, Cooley–Tukey FFTが一番有名で, Stockham FFTが二番であろうと思います. 工学書を覗いてみると, だいたいここ2つではないでしょうか. Cooley–Tukeyはわかりやすいとして, Stockhamはぎょっとします. Webサイトによっては, よくよく線を辿ってみ…

IEEE Xploreの検索結果を一気に表示

IEEE Xplore http://ieeexplore.ieee.org/Xplore/home.jsp の検索結果は,一見すると最大100件しか1ページに表示できない.Per Pageのプルダウンメニューが, 10, 25, 50, 75, 100 だけだからだ. ところが, URLを直接いじることで, 任意の件数を表示できる. Pe…

ハイレゾオーディオ技術読本

「ハイレゾオーディオ技術読本」を大学生協で購入しました. 安田彰,岡村喜博著,オーム社出版.購入の決め手は,2点. ΔΣ変調の解説が詳しい.信号処理のみならず,回路の切り口があるのが好印象. オーディオフォーマットの解説が詳しい.特にDSDの紹介が…

論文・文献徘徊メモ 140504-1 Split-Radix FFT / 基数分解FFT

FFT(fast fourier transform,高速フーリエ変換)といえば, FFT点数を2のべき乗とするのが,常套手段です. が,4のべき乗がさらに効率がよい. FFTルーチンの概略と使い方 大浦拓哉http://fe.math.kobe-u.ac.jp/Movies/cm/2006-03-sd-2-ooura.pdf FFT アル…

論文・文献徘徊メモ 131211-2 非整数次フーリエ変換 / Fractional Fourier transform (FRFT)

非整数次フーリエ変換による 光波伝搬の数値計算法の検討 岩手大学 橋本ら 計測自動学会東北支部 第 257 回研究集会( 2010 . 5 . 31 ) Fractional-Fourier-transform calculation through the fast-Fourier-transform algorithm Javier Garcı ́a, David Ma…

論文・文献徘徊メモ 131211-1 スペクトル距離/spectral distance

スペクトルパターンベクトルと距離尺度 →応用音響学 講義資料 2009 東大嵯峨山先生2009年の講義資料 音声処理における距離尺度 →音響信号処理特論2013(九州大学) NAIST猿渡先生の講義資料 音声音響信号処理(線形予測分析と自己回帰モデル) →音声音響信号処…

Web Audio API のステキなWebページ

Web Audio API の基礎 http://www.html5rocks.com/ja/tutorials/webaudio/intro/ Web Audio API Demos http://chromium.googlecode.com/svn/trunk/samples/audio/samples.html いまさらながら、WebAudio APIで遊ぶ http://qiita.com/umisama/items/fd31da94a…

VU/PPUメータ,ラウドネスメータのステキなWebページ

学問の小部屋音楽部・視聴覚室~メーター編 VUメータ http://kazima.pro.tok2.com/music/av/vu-meter.html 学問の小部屋音楽部・視聴覚室~メーター編 PPメータ http://kazima.pro.tok2.com/music/av/pp-meter.html 「音量(VU)計からラウドネスメータへ」 ht…

マスキングの応用 : NTTドコモ「音響 OFDM 技術仕様 Ver. 1.00」

NTTドコモ, 「音響 OFDM 技術仕様 Ver. 1.00」, 2009年 http://www.nttdocomo.co.jp/binary/pdf/corporate/technology/ofdm/OFDM_ver1_00.pdf 「オーディオ信号にOFDM(Orthogonal Frequency Division Multiplexing)を利用しデータを多重する音響OFDM(サービ…

voice bar に関する文献

"voice bar" について文献をWebで探した結果を,忘備録.研究室の後輩さんに輪講で紹介され,興味を持った. http://asadl.org/jasa/resource/1/jasman/v130/i4/p2521_s7 (2013/08/02 参照) It is usually also possible to observe an emphasized frequency…

音声学 / Phonetics

音声学は,英語で "Phonetics" というらしい. <参考文献> wikipedia「音声学」の英語版 : http://en.wikipedia.org/wiki/Phonetics日本音声学会 : http://www.psj.gr.jp/jpn/

聴覚情景分析 / Auditory Scene Analysis が詳しい国内のWebサイト

九州大学 聴覚心理学研究室 中島祥好教授 のWebサイト. http://www.design.kyushu-u.ac.jp/~ynhome/JPN/index.html 聴覚情景分析 / Auditory Scene Analysis が詳しい印象.wavファイルのデモが聴ける.

Auditory Scene Analysis の Demo

Auditory Scene Analysis の Albert S. Bregman氏のWebサイトに,デモ音源(mp3)を発見.MIT Press経由でPCMも手に入るそうな. "Al Bregman's Website - McGill University" http://webpages.mcgill.ca/staff/Group2/abregm1/web/ "ASA Demos"http://webpage…

Helmet Mounted Displays- Sensation, Perception and Cognitive Issues

the U.S. Army Aeromedical Research Laboratory (USAARL) の the design of helmet-mounted displays (HMDs) の文献を発見 http://www.usaarl.army.mil/publications/HMD_Book09/ 聴覚特性の文献を漁っていたところ遭遇.