本文分類:news發(fā)布日期:2026/3/2 5:13:57
相關文章
CogVLM:10項SOTA!免費商用的視覺對話模型
CogVLM:10項SOTA!免費商用的視覺對話模型 【免費下載鏈接】cogvlm-chat-hf 項目地址: https://ai.gitcode.com/zai-org/cogvlm-chat-hf
導語:THUDM團隊發(fā)布開源視覺語言模型CogVLM,以170億參數(shù)量在10項跨模態(tài)基準測試中刷…
建站知識
2026/3/2 5:13:36
Hunyuan HY-MT1.5降本方案:邊緣設備部署,GPU費用省60%
Hunyuan HY-MT1.5降本方案:邊緣設備部署,GPU費用省60%
近年來,大模型在機器翻譯領域取得了顯著進展,但高昂的推理成本和對高性能計算資源的依賴,限制了其在實際場景中的廣泛應用。騰訊開源的混元翻譯大模型 HY-MT1.5 …
建站知識
2026/2/28 0:03:30
Qwen3-235B:一鍵切換雙模式,AI推理更高效
Qwen3-235B:一鍵切換雙模式,AI推理更高效 【免費下載鏈接】Qwen3-235B-A22B-MLX-8bit 項目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-235B-A22B-MLX-8bit
導語:Qwen3系列最新旗艦模型Qwen3-235B-A22B-MLX-8bit正式發(fā)布&am…
建站知識
2026/3/2 5:13:02
混元翻譯1.5上下文理解優(yōu)化:指代消解技術
混元翻譯1.5上下文理解優(yōu)化:指代消解技術
1. 引言:混元翻譯模型的技術演進與上下文挑戰(zhàn)
隨著全球化進程的加速,高質(zhì)量、多語言互譯能力已成為自然語言處理(NLP)領域的重要基礎設施。騰訊推出的混元翻譯模型 1.8B 和 …
建站知識
2026/3/2 5:11:10
Qwen3雙模式大模型:22B參數(shù)實現(xiàn)智能無縫切換
Qwen3雙模式大模型:22B參數(shù)實現(xiàn)智能無縫切換 【免費下載鏈接】Qwen3-235B-A22B-GGUF 項目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-235B-A22B-GGUF
導語:Qwen3系列最新發(fā)布的235B參數(shù)大模型(激活參數(shù)22B)帶來…
建站知識
2026/2/4 23:48:08
免費體驗32B大模型!Granite-4.0快速上手指南
免費體驗32B大模型!Granite-4.0快速上手指南 【免費下載鏈接】granite-4.0-h-small-unsloth-bnb-4bit 項目地址: https://ai.gitcode.com/hf_mirrors/unsloth/granite-4.0-h-small-unsloth-bnb-4bit
導語
IBM最新發(fā)布的320億參數(shù)大模型Granite-4.0-H-Small…
建站知識
2026/2/23 5:44:01
74.6%準確率!KAT-Dev-72B-Exp開源編程模型登場
74.6%準確率!KAT-Dev-72B-Exp開源編程模型登場 【免費下載鏈接】KAT-Dev-72B-Exp 項目地址: https://ai.gitcode.com/hf_mirrors/Kwaipilot/KAT-Dev-72B-Exp
導語:編程大模型領域再添強將,KAT-Dev-72B-Exp以74.6%的SWE-Bench Verifie…
建站知識
2026/2/23 1:45:47
混元1.5翻譯模型:邊緣計算部署問題排查
混元1.5翻譯模型:邊緣計算部署問題排查
1. 引言:混元翻譯模型的演進與邊緣部署挑戰(zhàn)
隨著多語言交流需求的快速增長,高質(zhì)量、低延遲的翻譯服務已成為智能設備、跨境通信和本地化應用的核心能力。騰訊開源的混元翻譯模型 1.5(HY-M…
建站知識
2026/2/1 8:03:48

