
DeepSeek-ai
DeepSeek-R1
DeepSeek-R1 是一款強(qiáng)化學(xué)習(xí)(RL)驅(qū)動(dòng)的推理模型,,解決了模型中的重復(fù)性和可讀性問(wèn)題,,引入了冷啟動(dòng)數(shù)據(jù),,進(jìn)一步優(yōu)化了推理性能。它在數(shù)學(xué),、代碼和推理任務(wù)中與 OpenAI-o1 表現(xiàn)相當(dāng),,并且通過(guò)精心設(shè)計(jì)的訓(xùn)練方法,提升了整體效果,。

DeepSeek-ai
DeepSeek-V3
DeepSeek-V3 是一款擁有 6710 億參數(shù)的混合專家(MoE)語(yǔ)言模型,,采用多頭潛在注意力(MLA)和 DeepSeekMoE 架構(gòu),,結(jié)合無(wú)輔助損失的負(fù)載平衡策略,優(yōu)化推理和訓(xùn)練效率,。
對(duì)話
FIM,、Tools、MoE,、671B,、64K 
DeepSeek-ai
DeepSeek-R1-Distill-Qwen-32B
DeepSeek-R1-Distill-Qwen-32B 是基于 Qwen2.5-32B 通過(guò)知識(shí)蒸餾得到的模型。該模型使用 DeepSeek-R1 生成的 80 萬(wàn)個(gè)精選樣本進(jìn)行微調(diào),,在數(shù)學(xué),、編程和推理等多個(gè)領(lǐng)域展現(xiàn)出卓越的性能。

FunAudioLLM
CosyVoice2-0.5B
CosyVoice 2 是基于大語(yǔ)言模型的流式語(yǔ)音合成模型,,通過(guò)有限標(biāo)量量化(FSQ)來(lái)提升語(yǔ)音 token 的編碼本利用率,,簡(jiǎn)化了文本到語(yǔ)音的語(yǔ)言模型架構(gòu),并開(kāi)發(fā)了支持不同合成場(chǎng)景的分塊感知因果流匹配模型,。

Fishaudio
Fish-speech-1.5
Fish Speech V1.5 是一款開(kāi)源文本轉(zhuǎn)語(yǔ)音(TTS)模型,,采用創(chuàng)新的 DualAR 架構(gòu),,包含雙自回歸變換器設(shè)計(jì),。它支持多種語(yǔ)言,在英文單詞錯(cuò)誤率(WER)和字符錯(cuò)誤率(CER)方面分別達(dá)到了 3.5% 和 1.2%,。

BAAI
Bge-large-zh-v1.5
BAAI/bge-large-zh-v1.5 是一個(gè)大型中文文本嵌入模型,,是 BGE (BAAI General Embedding) 系列的一部分,。它支持最大 512 個(gè) token 的輸入長(zhǎng)度,適用于各種中文自然語(yǔ)言處理任務(wù),,如文本檢索,、語(yǔ)義相似度計(jì)算等,。

THUDM
Glm-4-9b-chat
GLM-4-9B-Chat 是 GLM-4 系列預(yù)訓(xùn)練模型中的開(kāi)源版本。它在語(yǔ)義,、數(shù)學(xué),、推理,、代碼和知識(shí)等多個(gè)方面表現(xiàn)出色。除支持多輪對(duì)話外,,還具備網(wǎng)頁(yè)瀏覽,、代碼執(zhí)行、自定義工具調(diào)用(Function Call)和長(zhǎng)文本推理等功能,。

FunAudioLLM
SenseVoiceSmall
SenseVoice 是一個(gè)具有多種語(yǔ)音理解能力的語(yǔ)音基礎(chǔ)模型,,包括自動(dòng)語(yǔ)音識(shí)別(ASR)、口語(yǔ)語(yǔ)言識(shí)別(LID),、語(yǔ)音情感識(shí)別(SER)和音頻事件檢測(cè)(AED),。它采用非自回歸端到端框架,具有非常低的推理延遲,。