《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 通義千問發布新一代端到端多模態旗艦模型Qwen2.5-Omni并開源

通義千問發布新一代端到端多模態旗艦模型Qwen2.5-Omni并開源

2025-03-27
來源:IT之家
關鍵詞: 阿里云 通義千問 Qwen

3 月 27 日消息,今日凌晨,阿里云發布通義千問 Qwen 模型家族中新一代端到端多模態旗艦模型 ——Qwen2.5-Omni,并在 Hugging Face、ModelScope、DashScope 和 GitHub 上開源。

阿里云表示,該模型專為全方位多模態感知設計,能夠無縫處理文本、圖像、音頻和視頻等多種輸入形式,并通過實時流式響應同時生成文本與自然語音合成輸出。

匯總其主要特點如下:

全能創新架構:Qwen 團隊提出了一種全新的 Thinker-Talker 架構,這是一種端到端的多模態模型,旨在支持文本 / 圖像 / 音頻 / 視頻的跨模態理解,同時以流式方式生成文本和自然語音響應。Qwen 提出了一種新的位置編碼技術,稱為 TMRoPE(Time-aligned Multimodal RoPE),通過時間軸對齊實現視頻與音頻輸入的精準同步。

實時音視頻交互:架構旨在支持完全實時交互,支持分塊輸入和即時輸出。

自然流暢的語音生成:在語音生成的自然性和穩定性方面超越了許多現有的流式和非流式替代方案。

全模態性能優勢:在同等規模的單模態模型進行基準測試時,表現出卓越的性能。Qwen2.5-Omni 在音頻能力上優于類似大小的 Qwen2-Audio,并與 Qwen2.5-VL-7B 保持同等水平。

卓越的端到端語音指令跟隨能力:Qwen2.5-Omni 在端到端語音指令跟隨方面表現出與文本輸入處理相媲美的效果,在 MMLU 通用知識理解和 GSM8K 數學推理等基準測試中表現優異。

00.png

據官方介紹,Qwen2.5-Omni 采用 Thinker-Talker 雙核架構。Thinker 模塊如同大腦,負責處理文本、音頻、視頻等多模態輸入,生成高層語義表征及對應文本內容;Talker 模塊則類似發聲器官,以流式方式接收 Thinker 實時輸出的語義表征與文本,流暢合成離散語音單元。Thinker 基于 Transformer 解碼器架構,融合音頻 / 圖像編碼器進行特征提取;Talker 則采用雙軌自回歸 Transformer 解碼器設計,在訓練和推理過程中直接接收來自 Thinker 的高維表征,并共享全部歷史上下文信息,形成端到端的統一模型架構。

00.png

模型性能方面,Qwen2.5-Omni 在包括圖像,音頻,音視頻等各種模態下的表現都優于類似大小的單模態模型以及封閉源模型,例如 Qwen2.5-VL-7B、Qwen2-Audio 和 Gemini-1.5-pro。

在多模態任務 OmniBench,Qwen2.5-Omni 達到了 SOTA 的表現。此外,在單模態任務中,Qwen2.5-Omni 在多個領域中表現優異,包括語音識別(Common Voice)、翻譯(CoVoST2)、音頻理解(MMAU)、圖像推理(MMMU、MMStar)、視頻理解(MVBench)以及語音生成(Seed-tts-eval 和主觀自然聽感)。

00.png

▲ 模型性能圖

Qwen Chat:https://chat.qwenlm.ai

Hugging Face:https://huggingface.co/Qwen/Qwen2.5-Omni-7B

ModelScope:https://modelscope.cn/models/Qwen/Qwen2.5-Omni-7B

DashScope:https://help.aliyun.com/zh/model-studio/user-guide/qwen-omni

GitHub:https://github.com/QwenLM/Qwen2.5-Omni

Demo 體驗:https://modelscope.cn/ studios / Qwen / Qwen2.5-Omni-Demo


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 99久久精品国产免看国产一区 | 400部大量精品情侣网站 | www.xxxx欧美| 欧美极品video粗暴 | 精品一精品国产一级毛片 | 欧美亚洲国产日韩一区二区三区 | 欧美日韩一区二区三区免费不卡 | 91九色精品国产 | 国产精彩视频在线观看 | 欧美三级一区 | 中国一级做a爱片免费 | 国产精品夜色视频一级区 | 国产偷国产偷亚洲高清午夜 | 国产日韩久久久精品影院首页 | 欧美日韩亚洲国产 | 91寡妇天天综合久久影院 | 亚洲国产国产综合一区首页 | 日韩精品午夜视频一区二区三区 | 亚洲一级毛片免费看 | 国产欧美日韩另类 | 456主播喷水在线观看 | 亚洲综合99 | 欧美白人最猛性xxxxx | 国产亚洲精品资源一区 | 农村寡妇女人一级毛片 | 日韩性大片免费 | 亚洲精品一区二区三区网址 | 久久久免费视频观看 | 1024香蕉视频在线播放 | 亚洲欧美在线观看播放 | 日本无卡码免费一区二区三区 | 色综合久久88色综合天天 | 成人观看的视频三级 | 欧美日本道免费一区二区三区 | 成年人在线观看网站 | 国产精品所毛片视频 | 久草免费资源站 | 在线播放波多野结衣 | 日本aaa成人毛片 | 日本b站一卡二卡乱码入口 日本s色大片在线观看 | 国内美女福利视频在线观看网站 |