Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、「日本語・3話者ビジネステーマの対話音声・トランスクリプト」の提供を開始します。 本データセットは、WEB会議形式で収録された13組の日本語3話者ビジネス対話音声に、人手作成による高品質なトランスクリプトを付与したコーパスです。ASRドメイン適応・LLMのビジネス対話理解向上など、音声系AIモデルの開発・ファインチューニングに活用できます。 ■ ビジネステーマ対話音声データセットとは ビジネステーマ対話音声データセットとは、投資・保険・商談などの業務文脈で交わされる複数話者の自然な対話を収録した音声コーパスです。ASRモデルのドメイン適応、多話者音声認識・LLMのビジネス対話理解向上を目的とした機械学習データとして活用されます。 ■ 今回提供を開始する「日本語・3話者ビジネステーマの対話音声・トランスクリプト」の概要 本データセットは、性別・年齢の多様性を確保した日本人13組がWEB会議環境で行ったビジネス対話を、3話者構成で収録しています。ビジネス関連トピックを扱う自発的発話のため、専門用語・話者交代・フィラーを含む実務環境に近い音声特性を持ちます。トランスクリプトは自動書き起こしなどを使用せず人手で作成しており、専門用語の誤変換・フィラーの脱落・話者境界のずれを排除でき、WER・CER評価の信頼性と学習データの品質を担保しています。 データ種別 音声(3話者対話形式) 収録話者 性別・年齢の多様性を確保した日本人(13組) 収録時間 / 量 約25時間(63ファイル)/約55GB データ形式 mp3 サンプリング / ビットレート 48kHz / 192kbps、ステレオ収録 収録内容の特徴 WEB会議想定の3話者ビジネス対話(投資・保険など)、1セッションあたり約90分 利用用途 商用利用可能・研究利用可能・アカデミア無償提供対象 トランスクリプト 人手による書き起こし作業により高品質を担保 サンプルデータはこちら:https://qleandataset.visual-bank.co.jp/lineup/ds-050 ■よくある質問(FAQ) Q. 3話者構成は2話者データと何が違いますか? A. 発話交代パターンが複雑になり、実際のビジネス会議に近い環境を再現できます。2話者ベースのASRモデルの汎化性能検証にも有効です。 Q. 金融・保険分野のASRやLLM開発に使えますか? A. はい。人手作成トランスクリプトと音声のペアにより、誤認識なしの状態でWhisper LoRAなどのドメイン適応ファインチューニングや、金融特化LLMのSFT・評価データとして直接活用できます。 Q. 議事録生成・会議要約AIの開発に向いていますか? A. はい。約90分/セッションの長尺収録と人手作成トランスクリプトにより、要約・議事録生成・アクションアイテム抽出タスクのSFTデータとして高精度に利用できます。 Q. カスタム収録に対応していますか? A. はい。業種・役職・年齢層・対話シナリオを指定したカスタムデータ収集に対応しています。 ■ユースケースイメージ ビジネスドメインASRのファインチューニング 人手作成トランスクリプトと音声のペアで、WhisperやESPnetのLoRA・full fine-tuningに活用できます。自動書き起こし由来のノイズがなく、WER・CER評価を高い信頼性で実施できます。 多話者ASRの性能評価 話者交代・重複発話・フィラーを含む3話者音声により、2話者データでは再現できない複雑な発話パターンへのASRモデル対応力を検証できます。 LLMによるビジネス対話要約・議事録生成 人手作成トランスクリプトを用いた要約・議事録生成・アクションアイテム抽出タスクのSFTデータを構築できます。約90分/セッションの長文データにより、長文コンテキスト処理能力の検証・強化にも活用できます。 『Qlean Dataset(キュリンデータセット)』について Qlean Datasetは、Visual Bank傘下の株式会社アマナイメージズが提供するAI学習用データソリューションです。アマナイメージズは40年以上にわたり、写真・映像・音源などを権利者から正規に預かり流通させてきた実績を持ち、データの権利を守ることを事業の中心に置いてきました。その体制と知見がQlean Datasetの土台となっています。 データ一点ごとに取得ソースと権利処理を明確にし、そのまま学習に使える状態で提供することで、国内外の基