您當(dāng)前的位置：首頁(yè) > 職位列表 > 職位詳情

AI測(cè)試工程師/外派至聯(lián)想

1.5-1.8萬(wàn)元/月

投遞簡(jiǎn)歷

北京-海淀區(qū)

5-10年 AI · 大模型 · Python

2026-03-03 09:44:29 更新被瀏覽：723 次

北京聯(lián)和利泰科技股份有限公司

最近在線時(shí)間：2026-03-03 09:44:29

電話：136********

地址：北京市海淀區(qū)上地信息產(chǎn)業(yè)基地創(chuàng)業(yè)路6號(hào)4層4007

職位描述

崗位職責(zé)：
1. 將大模型作為“產(chǎn)品”進(jìn)行測(cè)試：覆蓋從問(wèn)答到Agent的全流程，設(shè)計(jì)測(cè)試用例、執(zhí)行評(píng)測(cè)、追蹤核心指標(biāo)，輸出分析結(jié)論與報(bào)告。
2. 構(gòu)建完整評(píng)測(cè)體系：搭建數(shù)據(jù)集、定義評(píng)估標(biāo)準(zhǔn)、開發(fā)配套工具，實(shí)現(xiàn)評(píng)測(cè)流程自動(dòng)化、結(jié)果可視化?！局攸c(diǎn)】
3. 通過(guò)代碼提升效率：使用Python編寫腳本或平臺(tái)，自動(dòng)化重復(fù)性評(píng)測(cè)任務(wù)，降低團(tuán)隊(duì)人工投入。
4. 以用戶視角發(fā)現(xiàn)痛點(diǎn)：深入體驗(yàn)產(chǎn)品流程，復(fù)盤典型問(wèn)題案例，協(xié)同算法與產(chǎn)品團(tuán)隊(duì)推進(jìn)問(wèn)題閉環(huán)。
5. 關(guān)注前沿評(píng)測(cè)技術(shù)：持續(xù)跟進(jìn)LLM-as-a-Judge、多模態(tài)基準(zhǔn)測(cè)試、自動(dòng)評(píng)測(cè)等新方法，具備快速落地能力。
6. 推動(dòng)AI賦能測(cè)試：探索“AI測(cè)試AI”的新模式，研發(fā)智能測(cè)試輔助工具，提升測(cè)試工作的智能化水平。

崗位要求：
1. 學(xué)歷&年限：計(jì)算機(jī)、人工智能、數(shù)學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷；具備3年以上測(cè)試領(lǐng)域工作經(jīng)驗(yàn)。
2. 專業(yè)能力：
（1）具有大模型（LLM）、NLP、圖像識(shí)別/CV、多模態(tài)或強(qiáng)化學(xué)習(xí)中至少一項(xiàng)方向的算法評(píng)測(cè)實(shí)戰(zhàn)經(jīng)驗(yàn)；
（2）熟練掌握標(biāo)注質(zhì)量相關(guān)指標(biāo)（如準(zhǔn)確率、召回率、F1、置信度校準(zhǔn)）的計(jì)算邏輯與分析方法；
（3）熟悉NLP/CV/多模態(tài)常用性能指標(biāo)（如Accuracy、Recall、F1、CIDEr、CLIP-Score等）。
3. 工程實(shí)踐能力：精通Python，能獨(dú)立完成測(cè)試工具和自動(dòng)化框架的開發(fā)（有Pytest/Unittest/Playwright經(jīng)驗(yàn)者優(yōu)先）。
4. 綜合素養(yǎng)：
（1）學(xué)習(xí)能力強(qiáng)，善于鉆研，具備良好的溝通協(xié)作能力；對(duì)質(zhì)量保障與用戶體驗(yàn)高度敏感，能主動(dòng)發(fā)現(xiàn)問(wèn)題并推動(dòng)解決；
（2）具備強(qiáng)自驅(qū)力與進(jìn)取心，積極主動(dòng)，擅長(zhǎng)獨(dú)立思考與階段性復(fù)盤總結(jié)；
（3）關(guān)注AI大模型技術(shù)發(fā)展趨勢(shì)，具備持續(xù)學(xué)習(xí)與創(chuàng)新探索的熱情。