高級(jí)算法研發(fā)工程師
3.5-4.5萬元/月崗位職責(zé):
1、高性能推理引擎研發(fā),打造低延遲的模型推理解決方案。
2、負(fù)責(zé)千億參數(shù)基座模型的深度調(diào)優(yōu)與架構(gòu)升級(jí),優(yōu)化注意力結(jié)構(gòu)與位置編碼設(shè)計(jì),增強(qiáng)對(duì)復(fù)雜語義關(guān)系的建模能力;
3、構(gòu)建面向特定領(lǐng)域的自適應(yīng)訓(xùn)練體系,實(shí)現(xiàn)專業(yè)知識(shí)的高效融合與模型快速迭代;
4、研發(fā)動(dòng)態(tài)計(jì)算路徑機(jī)制,針對(duì)高并發(fā)請(qǐng)求與深度分析場(chǎng)景進(jìn)行資源精準(zhǔn)調(diào)度;
5、攻堅(jiān)大模型分布式訓(xùn)練技術(shù),基于Megatron-LM、DeepSpeed等框架搭建集群架構(gòu),突破顯存與通信瓶頸;
6、設(shè)計(jì)混合精度計(jì)算模塊(FP8/FP16),有效應(yīng)對(duì)梯度異常問題;
7、搭建自動(dòng)化監(jiān)控平臺(tái),實(shí)時(shí)追蹤萬億Token級(jí)訓(xùn)練任務(wù)運(yùn)行狀態(tài);
8、為NVIDIA H20/Ascend 910B芯片定制CUDA/Triton算子,加速計(jì)算密集型操作;
9、研究MoE動(dòng)態(tài)路由策略在復(fù)雜任務(wù)中的負(fù)載均衡優(yōu)化方法。
任職要求:
1、計(jì)算機(jī)科學(xué)、人工智能或應(yīng)用數(shù)學(xué)等相關(guān)專業(yè)碩士及以上學(xué)位;
2、具備2年以上大模型開發(fā)實(shí)踐經(jīng)驗(yàn);
3、熟練掌握矩陣分析、概率圖模型及優(yōu)化理論,深刻理解計(jì)算復(fù)雜性原理與分布式系統(tǒng)CAP原則;
4、主導(dǎo)完成過200B以上參數(shù)規(guī)模模型的大規(guī)模集群訓(xùn)練項(xiàng)目;
5、能夠設(shè)計(jì)顯存優(yōu)化方案,重構(gòu)模型通信邏輯,顯著降低通信開銷;
6、擁有高性能推理引擎落地經(jīng)驗(yàn),成功交付萬級(jí)QPS高并發(fā)服務(wù)(P99延遲低于200ms);
7、具備模型結(jié)構(gòu)深度改造能力,改進(jìn)RoPE/ALiBi位置編碼以支持超長(zhǎng)上下文(>128K),設(shè)計(jì)動(dòng)態(tài)稀疏Attention機(jī)制,開發(fā)領(lǐng)域適配模塊;
8、具有昇騰910B或H20平臺(tái)算子開發(fā)背景,可設(shè)計(jì)HBM分層KV緩存策略,提升緩存利用率;
9、在NeurIPS/ICLR/ICML/ACL等頂會(huì)發(fā)表過模型優(yōu)化相關(guān)論文,或持有分布式訓(xùn)練、推理加速方向的有效發(fā)明專利者優(yōu)先。