數(shù)據(jù)標注
7000-12000元/月北京、成都模型標注
【崗位職責】
● 承擔大語言模型(LLM)通用能力的日常評測任務(wù),涵蓋文本生成、邏輯推理、知識問答、多輪對話、代碼生成等關(guān)鍵場景的效果評估。
● 依據(jù)既定標準與流程,對模型輸出進行準確評分與標注,記錄評測中發(fā)現(xiàn)的異常表現(xiàn)及模型短板,形成完整詳實的評測記錄。
● 參與自動化評估數(shù)據(jù)集建設(shè),完成題目設(shè)計、考查點說明、評分規(guī)則制定等相關(guān)工作。
● 協(xié)助開展評測數(shù)據(jù)集的整理、清洗與標注,提升樣本覆蓋廣度與代表性,保障評測數(shù)據(jù)質(zhì)量。
● 配合團隊推進評測任務(wù)執(zhí)行,及時反饋實施過程中遇到的問題(如標準不明確、樣本異常等),助力優(yōu)化評測策略與流程。
【崗位要求】
● 本科及以上學歷,專業(yè)不限。
● 具備扎實的文字理解與表達能力,思維條理清晰,具備同理心和用戶導向意識。
● 工作態(tài)度嚴謹,責任心強,執(zhí)行力高,具有良好的協(xié)作能力,能嚴格遵循評測規(guī)范與操作流程。
● 掌握基礎(chǔ)計算機操作,熟練使用辦公軟件(如Excel、Word),有數(shù)據(jù)標注或模型評測經(jīng)驗者優(yōu)先考慮。
● 對人工智能及大語言模型領(lǐng)域有興趣,長期使用主流AI產(chǎn)品并有獨立思考,了解智能客服系統(tǒng)知識庫維護及模型測試迭代流程。
工作地址:北京騰訊大廈 (北京當?shù)睾蜻x人優(yōu)先)
工作地址:成都騰訊(成都當?shù)睾蜻x人優(yōu)先)
工作時間:朝十晚七,雙休、五險一金
薪酬范圍:北京8-13k,成都7-12k,12薪
面試流程:線下集體筆試 → 線上初試 → 線上復試 → 錄用通知