本文分類:news發(fā)布日期:2026/2/27 5:25:46
相關(guān)文章
導(dǎo)出模型用于vLLM加速:量化后推理性能實(shí)測(cè)
導(dǎo)出模型用于vLLM加速:量化后推理性能實(shí)測(cè)
在單張A10 GPU上部署一個(gè)70億參數(shù)的大語(yǔ)言模型,還能支持上百用戶并發(fā)訪問(wèn)——這在過(guò)去幾乎是不可想象的。但今天,借助模型量化與高效推理引擎的結(jié)合,這樣的場(chǎng)景正變得越來(lái)越常見(jiàn)。
我們?cè)?
建站知識(shí)
2026/2/27 5:25:14
HumanEval代碼生成評(píng)測(cè):衡量編程能力的標(biāo)準(zhǔn)工具
HumanEval代碼生成評(píng)測(cè)與ms-swift工程實(shí)踐:通往可靠AI編程的閉環(huán)路徑
在AI輔助編程日益普及的今天,一個(gè)尖銳的問(wèn)題擺在開(kāi)發(fā)者面前:我們?nèi)绾闻袛嘁粋€(gè)大模型真的“會(huì)寫(xiě)代碼”,而不是在堆砌看似合理的語(yǔ)法碎片?當(dāng)IDE彈出的…
建站知識(shí)
2026/2/24 4:13:43
為什么你的邊緣AI設(shè)備耗電快?C語(yǔ)言底層優(yōu)化的5個(gè)關(guān)鍵點(diǎn)
第一章:邊緣AI設(shè)備功耗問(wèn)題的根源剖析邊緣AI設(shè)備在部署過(guò)程中面臨嚴(yán)峻的功耗挑戰(zhàn),其根本原因涉及硬件架構(gòu)、算法復(fù)雜度與運(yùn)行環(huán)境的多重耦合。受限于嵌入式平臺(tái)的供電能力,設(shè)備必須在性能與能耗之間尋求平衡,而當(dāng)前多數(shù)AI模型并未…
建站知識(shí)
2026/2/4 3:09:49
Loss Scale調(diào)優(yōu)技巧:AMP混合精度訓(xùn)練穩(wěn)定秘籍
Loss Scale調(diào)優(yōu)技巧:AMP混合精度訓(xùn)練穩(wěn)定秘籍
在大模型時(shí)代,顯存墻和訓(xùn)練效率瓶頸已成為開(kāi)發(fā)者繞不開(kāi)的難題。一個(gè)130億參數(shù)的語(yǔ)言模型,僅用FP32訓(xùn)練就可能占用超過(guò)50GB顯存——這幾乎鎖死了單卡訓(xùn)練的可能性。而更現(xiàn)實(shí)的問(wèn)題是:即…
建站知識(shí)
2026/1/21 2:07:09
C17與舊C標(biāo)準(zhǔn)兼容性終極對(duì)比:5個(gè)真實(shí)案例揭示隱藏風(fēng)險(xiǎn)
第一章:C17 特性 兼容性測(cè)試C17 引入了一系列語(yǔ)言和庫(kù)層面的改進(jìn),提升開(kāi)發(fā)效率與運(yùn)行性能。在實(shí)際項(xiàng)目中使用 C17 新特性前,必須驗(yàn)證編譯器與目標(biāo)平臺(tái)的兼容性,避免因支持不完整導(dǎo)致構(gòu)建失敗或運(yùn)行時(shí)異常。主要 C17 新特性概覽
結(jié)…
建站知識(shí)
2026/2/24 9:39:14
【獨(dú)家深度】:C與Python混合開(kāi)發(fā)中熱點(diǎn)函數(shù)調(diào)用的性能極限突破
第一章:C與Python混合開(kāi)發(fā)的性能挑戰(zhàn)在高性能計(jì)算和系統(tǒng)級(jí)編程中,C語(yǔ)言以其接近硬件的執(zhí)行效率和低開(kāi)銷內(nèi)存管理著稱,而Python則因簡(jiǎn)潔語(yǔ)法和豐富生態(tài)廣泛應(yīng)用于快速開(kāi)發(fā)。當(dāng)二者結(jié)合進(jìn)行混合開(kāi)發(fā)時(shí),雖然能兼顧開(kāi)發(fā)效率與運(yùn)行性能…
建站知識(shí)
2026/2/21 9:13:22
嗶哩嗶哩自制內(nèi)容:UP主共創(chuàng)計(jì)劃激發(fā)社區(qū)活力
ms-swift:讓每位UP主都能訓(xùn)練自己的AI模型
在B站這樣的內(nèi)容社區(qū)里,一個(gè)有趣的現(xiàn)象正在發(fā)生:越來(lái)越多的UP主不再滿足于“使用”AI工具生成配音、字幕或封面圖,而是希望擁有真正屬于自己的個(gè)性化模型——比如能模仿自己聲音風(fēng)格的語(yǔ)…
建站知識(shí)
2026/2/24 1:44:30
揭秘TPU任務(wù)調(diào)度瓶頸:如何用C語(yǔ)言提升300%執(zhí)行效率
第一章:TPU C 語(yǔ)言 調(diào)度算法優(yōu)化在高性能計(jì)算場(chǎng)景中,張量處理單元(TPU)的調(diào)度效率直接影響模型推理的吞吐與延遲。通過(guò)C語(yǔ)言對(duì)TPU任務(wù)調(diào)度進(jìn)行底層優(yōu)化,可顯著提升資源利用率和執(zhí)行并行性。合理的調(diào)度策略需綜合考慮任…
建站知識(shí)
2026/1/13 16:04:10

