多模態(tài)算法工程師
5-7.5萬元/月職位描述
1.負(fù)責(zé)智能眼鏡端多模態(tài)交互核心算法研發(fā)與落地,重點攻克實時音視頻問答、視覺記憶相關(guān)技術(shù)難題,保障設(shè)備端算法高效穩(wěn)。
2.主導(dǎo)音視頻、文本、圖像等多模態(tài)數(shù)據(jù)融合處理,設(shè)計優(yōu)化多模態(tài)語義理解、跨模態(tài)檢索等核心模塊,提升交互精準(zhǔn)度與流暢。
3.針對視覺記憶場景,研發(fā)圖像/視頻內(nèi)容特征提取、匹配及高效存儲算法,實現(xiàn)場景快速記憶、精準(zhǔn)召回與智能問答交互。
4.負(fù)責(zé)多模態(tài)算法的云端部署方案設(shè)計與實現(xiàn),完成算法性能調(diào)優(yōu),保障實時性要求(如控制音視頻問答響應(yīng)延遲)。
5.跨團(tuán)隊協(xié)作產(chǎn)品、軟件研發(fā)團(tuán)隊,明確技術(shù)需求,推動算法方案落地驗證與迭代,解決項目技術(shù)瓶頸。
職位要求
1.計算機(jī)科學(xué)與技術(shù)、電子信息、人工智能等相關(guān)專業(yè),碩士及以上學(xué)歷;博士學(xué)歷或有相關(guān)領(lǐng)域突出成果者優(yōu)先。
2.精通多模態(tài)數(shù)據(jù)融合、語義理解、跨模態(tài)檢索技術(shù),熟練堂握圖像,視頻特征提取、匹配及存儲算法,深耕視覺記憶、實時音視運用PyTorch/TensorFlow,具備扎實調(diào)優(yōu)能力。
3.具備算法工程化經(jīng)驗,熟悉多模態(tài)算法云端部署;了解記憶系統(tǒng)者優(yōu)先;能解決音視頻問答延遲等實時性問題,精通性能調(diào)優(yōu)3穩(wěn)定運行;有大規(guī)模數(shù)據(jù)處理及迭代經(jīng)驗者優(yōu)先。
4.具備較強(qiáng)的問題解決能力、團(tuán)隊協(xié)作意識,對新技術(shù)敏感,能快速跟進(jìn)行業(yè)前沿并落地實踐。