1.研發(fā)分布式訓練加速方案,優(yōu)化并行策略方案例如:DP/TP/PP/MP/CP,提升千億參數(shù)模型訓練吞吐量;
2.設(shè)計混合精度訓練與顯存優(yōu)化方案,開發(fā)自適應梯度壓縮、通信優(yōu)化模塊,實現(xiàn)單卡訓練模型規(guī)模提升和降低分布式訓練通信開銷;
3.開發(fā)量化壓縮工具鏈(支持GPTQ/AWQ等算法),實現(xiàn)模型8/4-bit無損量化部署;
4.設(shè)計多GPU推理調(diào)度策略,優(yōu)化顯存碎片管理與計算資源利用率;
5.跟進vLLM/TensorRT-LLM/SGLang等前沿框架,探索MoE架構(gòu)/稀疏化訓練等新型范式,將最新學術(shù)成果快速落地到工程實踐。
職位要求:
1.計算機相關(guān)專業(yè)碩士及以上學歷,3 年LLM系統(tǒng)優(yōu)化經(jīng)驗;
2.精通PyTorch/TensorFlow框架底層機制,具備CUDA/C 內(nèi)核開發(fā)能力;
3.掌握Megatron-LM/DeepSpeed/HuggingFace生態(tài)核心原理;
4.有千億參數(shù)模型訓練優(yōu)化或百萬QPS推理服務(wù)落地經(jīng)驗者優(yōu)先;
5.熟悉NVIDIA GPU架構(gòu)與性能分析工具;
6.熟悉大模型推理服務(wù)架構(gòu)設(shè)計與微服務(wù)化部署。
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務(wù)必提高警惕。
-
IT服務(wù)·系統(tǒng)集成
-
500-999人
-
股份制企業(yè)
-
越城區(qū)曲屯路398號聯(lián)合大廈16層
-
吾悅商管西南區(qū)域精睿 15000-20000元應屆畢業(yè)生 本科新城控股集團股份有限公司
-
電鍍制程工程師(J14327) 面議應屆畢業(yè)生 不限深南電路股份有限公司
-
行政專員 面議應屆畢業(yè)生 不限四川衛(wèi)寧軟件有限公司
-
助理人力資源專員-成都金堂 (MJ038953) 8000-12000元應屆畢業(yè)生 本科寧德時代新能源科技股份有限公司
-
平安內(nèi)催(五險一金 月入7000) 面議應屆畢業(yè)生 不限深圳平安綜合金融服務(wù)有限公司合肥分公司
-
8000 有宿舍 須大專 面議應屆畢業(yè)生 大專四川泰盈科技有限公司

應屆畢業(yè)生
學歷不限
2026-04-28 12:42:45
1918人關(guān)注
注:聯(lián)系我時,請說是在四川人才網(wǎng)上看到的。
