您當(dāng)前的位置：首頁 > 職位列表 > 職位詳情

高級(jí)算法研發(fā)工程師

3.5-4.5萬元/月

投遞簡(jiǎn)歷

廣東-廣州-海珠區(qū)

3-5年機(jī)器學(xué)習(xí) · 深度學(xué)習(xí) · 多模態(tài)算法

2026-03-02 13:00:09 更新被瀏覽：242 次

廣州趣元?jiǎng)?chuàng)數(shù)字科技有限公司

最近在線時(shí)間：2026-03-02 13:00:09

電話：181********

地址：廣州市海珠區(qū)敦和路171號(hào)A4-301房(僅限辦公)

職位描述

崗位職責(zé)：
1、高性能推理引擎研發(fā)，打造低延遲的模型推理解決方案。
2、負(fù)責(zé)千億參數(shù)基座模型的深度調(diào)優(yōu)與架構(gòu)升級(jí)，優(yōu)化注意力結(jié)構(gòu)與位置編碼設(shè)計(jì)，增強(qiáng)對(duì)復(fù)雜語義關(guān)系的建模能力；
3、構(gòu)建面向特定領(lǐng)域的自適應(yīng)訓(xùn)練體系，實(shí)現(xiàn)專業(yè)知識(shí)的高效融合與模型快速迭代；
4、研發(fā)動(dòng)態(tài)計(jì)算路徑機(jī)制，針對(duì)高并發(fā)請(qǐng)求與深度分析場(chǎng)景進(jìn)行資源精準(zhǔn)調(diào)度；
5、攻堅(jiān)大模型分布式訓(xùn)練技術(shù)，基于Megatron-LM、DeepSpeed等框架搭建集群架構(gòu)，突破顯存與通信瓶頸；
6、設(shè)計(jì)混合精度計(jì)算模塊（FP8/FP16），有效應(yīng)對(duì)梯度異常問題；
7、搭建自動(dòng)化監(jiān)控平臺(tái)，實(shí)時(shí)追蹤萬億Token級(jí)訓(xùn)練任務(wù)運(yùn)行狀態(tài)；
8、為NVIDIA H20/Ascend 910B芯片定制CUDA/Triton算子，加速計(jì)算密集型操作；
9、研究MoE動(dòng)態(tài)路由策略在復(fù)雜任務(wù)中的負(fù)載均衡優(yōu)化方法。

任職要求：
1、計(jì)算機(jī)科學(xué)、人工智能或應(yīng)用數(shù)學(xué)等相關(guān)專業(yè)碩士及以上學(xué)位；
2、具備2年以上大模型開發(fā)實(shí)踐經(jīng)驗(yàn)；
3、熟練掌握矩陣分析、概率圖模型及優(yōu)化理論，深刻理解計(jì)算復(fù)雜性原理與分布式系統(tǒng)CAP原則；
4、主導(dǎo)完成過200B以上參數(shù)規(guī)模模型的大規(guī)模集群訓(xùn)練項(xiàng)目；
5、能夠設(shè)計(jì)顯存優(yōu)化方案，重構(gòu)模型通信邏輯，顯著降低通信開銷；
6、擁有高性能推理引擎落地經(jīng)驗(yàn)，成功交付萬級(jí)QPS高并發(fā)服務(wù)（P99延遲低于200ms）；
7、具備模型結(jié)構(gòu)深度改造能力，改進(jìn)RoPE/ALiBi位置編碼以支持超長(zhǎng)上下文（>128K），設(shè)計(jì)動(dòng)態(tài)稀疏Attention機(jī)制，開發(fā)領(lǐng)域適配模塊；
8、具有昇騰910B或H20平臺(tái)算子開發(fā)背景，可設(shè)計(jì)HBM分層KV緩存策略，提升緩存利用率；
9、在NeurIPS/ICLR/ICML/ACL等頂會(huì)發(fā)表過模型優(yōu)化相關(guān)論文，或持有分布式訓(xùn)練、推理加速方向的有效發(fā)明專利者優(yōu)先。