音声認識 | Dolphin Voice Blog

CosyVoice音声生成大模型：300M-Instructの先進機能を探求する

人工知能分野で、音声生成技術は研究と適用のホットスポットとなってきました。ModelScope.cnは最近、CosyVoice音声生成大模型をリリースしました。これは300Mのパラメーターを持ち、音声合成と理解タスクに特化した高度なモデルで...

2024-11-21

ニュース

人工知能技術の急速な発展の中で、リアルタイム音声認識技術は人と機械を結ぶ重要な架け橋となっています。ModelScope.cnがリリースしたWeNet-U2pp_Conformerモデルは、中国語音声認識タスクに特化し、16kHzの音声処理...

2024-11-21

ニュース

人工知能分野で、音声認識技術は常に研究と適用のホットスポットです。ModelScope.cnが最新にリリースしたConformer音声認識モデルは、中国語音声データセットaishell2を特に最適化し、16kHzの音声処理をサポートし、オフ...

2024-11-21

ニュース

デジタル時代において、音声認識技術は私たちの日常生活に欠かせない部分となっています。スマートアシスタントとしてのAlexaやSiri、車のハンズフリーナビゲーションシステムまで、AI駆動の音声認識は私たちの生活和工作の方法を変えています。こ...

2024-11-21

ニュース

医療健康分野で、人工知能（AI）の適用が急速に拡大し、特にclinical diagnosisと患者监护において大きな潜在力を見せています。今日は、「npj Digital Medicine」誌に掲載された論文「責任あるclinical v...

2024-11-21

ニュース

人工知能の音声認識分野で、预训练モデルは認識性能を向上させるための重要な技術となっています。今日は、ModelScope.cn上のData2vec構造に基づくParaformer中国語音声認識モデルを紹介します。AISHELL-2データセッ...

2024-11-20

ニュース

人工知能分野では、音声認識技術がますます重要になり、私たちが機械と対話する方法を次第に変えています。今日は、ModelScope.cn上の英語音声認識モデルParaformerについて探求し、16kHzのオーディオ用に設計され、オフライン処...

2024-11-20

ニュース

人工知能の急速な発展の中で、リアルタイム音声インタラクション技術はますます重要になっています。今日は、Ultravoxというオープンソースプロジェクトを紹介します。このプロジェクトは、迅速な音声応答能力とマルチモーダル処理能力でAI分野で注...

2024-11-20

ニュース

人工知能技術の進歩の中で、音声認識技術は人類と機械を結ぶ重要な架け橋となっています。今日は、ModelScope.cn上の日本語用のリアルタイム音声認識モデルであるUniASRについて探求し、それが日本語分野で音声認識技術に与える新ブレイク...

2024-11-20

ニュース

人工知能技術の波に乗って、ボイスインタラクション技術は次第に私たちの生活に欠かせない部分となっています。今日は、西湖心辰チームが開発したWestlake-Omniモデルについて紹介します。これは、オープンソースの中国語感情ボイスインタラクシ...

2024-11-20

ニュース