> HOME > データ一覧 > 音声コーパス

音声コーパス

国立情報学研究所に設置された音声資源コンソーシアム(NII-SRC)がさまざまな機関やグループから受け入れて研究者に提供している音声のデータセットです。

2020/03/10 現在

データの概要

各音声コーパスの内容については音声資源コンソーシアムのページをご参照ください。

更新情報

利用目的・提供対象者

  • コーパスの利用目的は研究に限ります。
  • 提供対象者は主に大学および公的研究機関の研究者としますが,研究内容によっては民間企業等の研究者にも提供可能です。利用の可否をお知りになりたい場合は末尾の「問い合わせ窓口」までお問い合わせください。
  • 原則として,提供の単位は研究室(大学以外の場合は研究室に相当するグループ)としますので,利用申請は研究室を代表する方が行ってください。

データ提供方法

データはIDR事務局より,原則としてWebサーバからのダウンロードにより提供します。技術的な理由によりダウンロードができない場合は,従来通り音声資源コンソーシアムのページからメールにてCD/DVD版の利用申請をお願いします。

メーリングリストについて

音声コーパスに関する連絡や利用報告の依頼の他,利用統計や事務局からの各種ご案内を目的として,利用者のメーリングリストを作成しています。申請時に入力されたメールアドレスを登録しますのでご了承ください。登録済みアドレスの変更や追加登録をご希望の場合は,末尾の「問い合わせ窓口」までメールでご連絡ください。

利用報告について

利用誓約書に従い,毎年度,コーパスを使用した研究活動について報告書と発表文献のコピーの提出をお願いします。毎年3月頃に上記メーリングリストに提出方法等の案内を配信します。

この報告は,コーパスについて利用者の使用状況を把握するだけでなく,IDR/SRCの活動を継続するためのエビデンスとしても重要なものですので,提出にご協力ください。

利用申請

利用に際しては,コーパスごとに定められた利用誓約書の内容にご同意いただきます。下記よりご希望のコーパス名をクリックすると当該コーパスの利用申請ページに移りますので,そちらからお申し込みください。

<無償コーパス>

  1. 重点領域研究「音声言語」・試験研究「音声DB」 連続音声データベース (PASL-DSR)
  2. 筑波大 多言語音声コーパス (UT-ML)
  3. 東北大‐松下 単語音声データベース (TMW)
  4. 基盤研究(A)「日本語方言の地域差」方言音声コーパス (GSR-JD)
  5. RWCP 音声データベース
    1. 音声対話データベース-96年版 (RWCP-SP96)
    2. 音声対話データベース-97年版 (RWCP-SP97)
    3. 検索・要約用ニュース音声データベース (RWCP-SP99)
    4. 会議音声データベース (RWCP-SP01)
  6. RWCP 実環境音声・音響データベース (RWCP-SSD)
  7. 重点領域研究「音声対話」 対話音声コーパス (PASD)
  8. CIAIR 子供の声データベース (CIAIR-VCV)
  9. IPSJ SIG-SLP 雑音下音声認識評価環境 (CENSREC)
    1. 雑音重畳日本語連続数字 音声認識評価環境 (CENSREC-1/AURORA-2J)
    2. 雑音下日本語連続数字 音声区間検出評価環境 (CENSREC-1-C)
    3. マルチモーダル音声認識評価環境 (CENSREC-1-AV)
    4. 実環境車内 日本語連続数字 音声認識評価環境 (CENSREC-2)
    5. 実環境車内 日本語単語 音声認識評価環境 (CENSREC-3)
    6. 残響下日本語連続数字 音声認識評価環境 (CENSREC-4)
  10. 特定領域研究「メディア教育利用」音声データベース (UME)
    1. 日本人学生による読み上げ英語音声データベース (UME-ERJ)
    2. 留学生による読み上げ日本語音声データベース (UME-JRF)
  11. 理研ワープロ操作対話音声コーパス (RIKEN-DLG)
  12. 地図課題対話コーパス
    1. 千葉大 日本語地図課題対話コーパス (MapTask)
    2. 三重大 日本語地図課題対話コーパス (MapTask-Mie) -NEW!!
  13. 宇都宮大学 パラ言語情報研究向け音声対話データベース (UUDB)
  14. 電総研 単語音声データベース (ETL-WD)
  15. 鶴岡調査音声データベース91-92 (Tsuruoka91-92)
  16. 音声研究用X線フィルムデータベース (X-Ray)
  17. 特定領域研究「韻律と音声処理」日本語MULTEXT韻律コーパス (MULTEXT-J)
  18. 中国語MULTEXTコーパス (MULTEXT-C)
  19. 慶應義塾大学 研究用感情音声データベース (Keio-ESD)
  20. 身体情報付き男・女・子どもの母音音声データベース (JVPD)
  21. 東工大 多言語音声コーパス (TITML)
    1. インドネシア語 (TITML-IDN)
    2. アイスランド語 (TITML-ISL)
  22. AWA長期間収録音声コーパス (AWA-LTR)
  23. 南琉球新城方言音声データベース (Aragusuku)
  24. 宮古大神島方言音声データベース (Oogami)
  25. 感情評定値付きオンラインゲーム音声チャットコーパス (OGVC)
  26. 千葉大学 3人会話コーパス (Chiba3Party)
  27. 近畿大 児童の単語音声データベース (JWC)


※有償コーパスと取り次ぎのコーパスについては,DVD等のメディアで納品しますので,従来通り
 音声資源コンソーシアムのページからメールにて利用申請してください。

<有償コーパス>

  1. 日本音響学会 新聞記事読み上げ音声コーパス (JNAS)
  2. 新聞記事読み上げ高齢者音声コーパス (S-JNAS)
  3. 日本音響学会 研究用連続音声データベース (ASJ-JIPDEC)
  4. NTT・東北大 親密度別単語了解度試験用音声データセット (FW03)
  5. NTT・東北大 親密度別単語了解度試験用音声データセット2007 (FW07)
  6. NTT 乳幼児音声データベース (INFANT)

<取り次ぎ>

  1. 電子協 日本語共通音声データ (JEIDA-JCSD)
  2. 電子協 騒音データベース (JEIDA-NOISE)

問い合わせ窓口(IDR事務局)

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所 IDR事務局(音声コーパス担当)
電話: 03-4212-2009
電子メール:idr-speech [at] nii.ac.jp
※問い合わせ等はできるだけ電子メールでお願いします。