AI測(cè)試工程師/外派至聯(lián)想
1.5-1.8萬(wàn)元/月崗位職責(zé):
1. 將大模型作為“產(chǎn)品”進(jìn)行測(cè)試:覆蓋從問(wèn)答到Agent的全流程,設(shè)計(jì)測(cè)試用例、執(zhí)行評(píng)測(cè)、追蹤核心指標(biāo),輸出分析結(jié)論與報(bào)告。
2. 構(gòu)建完整評(píng)測(cè)體系:搭建數(shù)據(jù)集、定義評(píng)估標(biāo)準(zhǔn)、開發(fā)配套工具,實(shí)現(xiàn)評(píng)測(cè)流程自動(dòng)化、結(jié)果可視化?!局攸c(diǎn)】
3. 通過(guò)代碼提升效率:使用Python編寫腳本或平臺(tái),自動(dòng)化重復(fù)性評(píng)測(cè)任務(wù),降低團(tuán)隊(duì)人工投入。
4. 以用戶視角發(fā)現(xiàn)痛點(diǎn):深入體驗(yàn)產(chǎn)品流程,復(fù)盤典型問(wèn)題案例,協(xié)同算法與產(chǎn)品團(tuán)隊(duì)推進(jìn)問(wèn)題閉環(huán)。
5. 關(guān)注前沿評(píng)測(cè)技術(shù):持續(xù)跟進(jìn)LLM-as-a-Judge、多模態(tài)基準(zhǔn)測(cè)試、自動(dòng)評(píng)測(cè)等新方法,具備快速落地能力。
6. 推動(dòng)AI賦能測(cè)試:探索“AI測(cè)試AI”的新模式,研發(fā)智能測(cè)試輔助工具,提升測(cè)試工作的智能化水平。
崗位要求:
1. 學(xué)歷&年限:計(jì)算機(jī)、人工智能、數(shù)學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷;具備3年以上測(cè)試領(lǐng)域工作經(jīng)驗(yàn)。
2. 專業(yè)能力:
(1)具有大模型(LLM)、NLP、圖像識(shí)別/CV、多模態(tài)或強(qiáng)化學(xué)習(xí)中至少一項(xiàng)方向的算法評(píng)測(cè)實(shí)戰(zhàn)經(jīng)驗(yàn);
(2)熟練掌握標(biāo)注質(zhì)量相關(guān)指標(biāo)(如準(zhǔn)確率、召回率、F1、置信度校準(zhǔn))的計(jì)算邏輯與分析方法;
(3)熟悉NLP/CV/多模態(tài)常用性能指標(biāo)(如Accuracy、Recall、F1、CIDEr、CLIP-Score等)。
3. 工程實(shí)踐能力:精通Python,能獨(dú)立完成測(cè)試工具和自動(dòng)化框架的開發(fā)(有Pytest/Unittest/Playwright經(jīng)驗(yàn)者優(yōu)先)。
4. 綜合素養(yǎng):
(1)學(xué)習(xí)能力強(qiáng),善于鉆研,具備良好的溝通協(xié)作能力;對(duì)質(zhì)量保障與用戶體驗(yàn)高度敏感,能主動(dòng)發(fā)現(xiàn)問(wèn)題并推動(dòng)解決;
(2)具備強(qiáng)自驅(qū)力與進(jìn)取心,積極主動(dòng),擅長(zhǎng)獨(dú)立思考與階段性復(fù)盤總結(jié);
(3)關(guān)注AI大模型技術(shù)發(fā)展趨勢(shì),具備持續(xù)學(xué)習(xí)與創(chuàng)新探索的熱情。