ニュース / News

NII情報

「日本語多話者オーディオブックコーパス(J-MAC)」提供開始

国立情報学研究所 音声資源コンソーシアム(NII-SRC)では,東京大学の高道慎之介先生を中心に構築された「日本語多話者オーディオブックコーパス(J-MAC)」の提供を開始しました。

本コーパスは,市販のオーディオブックのテキストに対し,文単位の時間情報を付与したものです。

大量の市販品の中から音声合成研究に適するものを選択した,小説24作品のオーディオブック延べ74点について,章や段落に構造化し振り仮名を付与したテキストに,文単位での時間情報を付与してあります。

(※本コーパスに音声データは含まれておらず,別途販売元より購入いただく必要があります。販売元の情報はコーパス内に含まれています)

情報学研究データリポジトリ(IDR)のサイトの「音声コーパス」よりオンライン申請にて入手可能です。提供は無償で,利用は研究目的に限ります。

コーパスの内容や利用条件等の詳細については以下をご覧ください。

オンライン申請については以下をご覧ください。


 IDRでは,「研究者等提供データセット受入要項」に基づき,大学等の研究者が 作成したデータセットの受入を行っています。本データセットはこの受入要項 に基づき受入・提供を行うものです。データセット受入の詳細に関しては下記 をご覧ください。

 また、その他提供中のデータセットについては次のウェブサイトをご覧ください。

国立情報学研究所 情報学研究データリポジトリ

5000

注目コンテンツ / SPECIAL