本文分類:news發(fā)布日期:2026/3/2 12:14:28
相關(guān)文章
NVIDIA OpenReasoning-Nemotron:數(shù)學(xué)代碼推理提速指南
NVIDIA OpenReasoning-Nemotron:數(shù)學(xué)代碼推理提速指南 【免費(fèi)下載鏈接】OpenReasoning-Nemotron-14B 項(xiàng)目地址: https://ai.gitcode.com/hf_mirrors/nvidia/OpenReasoning-Nemotron-14B
導(dǎo)語
NVIDIA推出OpenReasoning-Nemotron系列大語言模型,通…
建站知識(shí)
2026/3/2 10:44:17
Qwen3-0.6B-FP8:0.6B參數(shù)暢享智能雙模推理
Qwen3-0.6B-FP8:0.6B參數(shù)暢享智能雙模推理 【免費(fèi)下載鏈接】Qwen3-0.6B-FP8 Qwen3 是 Qwen 系列中最新一代大型語言模型,提供全面的密集模型和混合專家 (MoE) 模型。Qwen3 基于豐富的訓(xùn)練經(jīng)驗(yàn),在推理、指令遵循、代理能力和多語言支持方面取得…
建站知識(shí)
2026/3/2 11:51:24
ERNIE 4.5-A47B:300B參數(shù)大模型高效訓(xùn)練與推理秘籍
ERNIE 4.5-A47B:300B參數(shù)大模型高效訓(xùn)練與推理秘籍 【免費(fèi)下載鏈接】ERNIE-4.5-300B-A47B-PT 項(xiàng)目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-300B-A47B-PT
百度ERNIE團(tuán)隊(duì)推出最新300B參數(shù)大模型ERNIE-4.5-300B-A47B-PT,通過創(chuàng)新…
建站知識(shí)
2026/3/2 12:10:38
騰訊混元翻譯模型HY-MT1.5適合中小企業(yè)嗎?成本效益分析
騰訊混元翻譯模型HY-MT1.5適合中小企業(yè)嗎?成本效益分析
在AI大模型快速發(fā)展的背景下,高質(zhì)量、低成本的機(jī)器翻譯能力正成為企業(yè)出海、跨語言服務(wù)和內(nèi)容本地化的重要基礎(chǔ)設(shè)施。近期,騰訊開源了其混元翻譯大模型HY-MT1.5系列,包含兩…
建站知識(shí)
2026/3/2 12:11:20
VisionReward:AI視覺生成人類偏好評(píng)分新突破
VisionReward:AI視覺生成人類偏好評(píng)分新突破 【免費(fèi)下載鏈接】VisionReward-Image-bf16 項(xiàng)目地址: https://ai.gitcode.com/zai-org/VisionReward-Image-bf16
導(dǎo)語:THUDM團(tuán)隊(duì)推出VisionReward-Image-bf16模型,通過多維度人類偏好分解…
建站知識(shí)
2026/3/2 12:10:13
HY-MT1.5-7B術(shù)語庫管理:企業(yè)級(jí)翻譯解決方案
HY-MT1.5-7B術(shù)語庫管理:企業(yè)級(jí)翻譯解決方案
隨著全球化進(jìn)程的加速,高質(zhì)量、可定制的機(jī)器翻譯系統(tǒng)成為企業(yè)出海、跨語言協(xié)作的核心基礎(chǔ)設(shè)施。傳統(tǒng)通用翻譯模型雖能處理基礎(chǔ)語義轉(zhuǎn)換,但在專業(yè)術(shù)語一致性、上下文連貫性以及多語言混合表達(dá)等復(fù)雜…
建站知識(shí)
2026/3/2 12:08:45
騰訊Hunyuan-A13B開源:130億參數(shù)高效AI推理神器
騰訊Hunyuan-A13B開源:130億參數(shù)高效AI推理神器 【免費(fèi)下載鏈接】Hunyuan-A13B-Pretrain 騰訊開源Hunyuan-A13B大語言模型,采用細(xì)粒度MoE架構(gòu),800億總參數(shù)僅激活130億,高效平衡性能與資源消耗。支持256K超長(zhǎng)上下文、混合推理模式及…
建站知識(shí)
2026/2/12 7:14:24
HY-MT1.5模型解釋工具:Attention可視化
HY-MT1.5模型解釋工具:Attention可視化
1. 引言
隨著大模型在機(jī)器翻譯領(lǐng)域的廣泛應(yīng)用,模型的可解釋性逐漸成為工程落地中的關(guān)鍵問題。特別是在專業(yè)翻譯、術(shù)語一致性要求高的場(chǎng)景中,開發(fā)者和語言學(xué)家需要深入理解模型“為何這樣翻譯”。騰訊…
建站知識(shí)
2026/2/12 6:44:10

