RAG技術(shù)研究實(shí)習(xí)生
400-600元/天工作職責(zé):
1、參與構(gòu)建面向大規(guī)模非結(jié)構(gòu)化數(shù)據(jù)的檢索增強(qiáng)生成(RAG)系統(tǒng)整體架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)。
2、研發(fā)高效檢索方法,涵蓋向量檢索、混合檢索及語義搜索等技術(shù),提升信息召回的準(zhǔn)確率與相關(guān)性。
3、探索知識(shí)圖譜在RAG流程中的融合應(yīng)用,包括實(shí)體識(shí)別、關(guān)系抽取,并利用圖結(jié)構(gòu)優(yōu)化檢索與生成效果。
4、參與大語言模型在特定領(lǐng)域非結(jié)構(gòu)化數(shù)據(jù)上的微調(diào)任務(wù),提升模型對(duì)專業(yè)內(nèi)容的理解與輸出能力。
5、對(duì)RAG各模塊進(jìn)行性能測(cè)試與分析,基于實(shí)驗(yàn)反饋持續(xù)優(yōu)化系統(tǒng)表現(xiàn)。
6、關(guān)注RAG及相關(guān)前沿技術(shù)動(dòng)態(tài),積極參與團(tuán)隊(duì)內(nèi)部技術(shù)交流與分享。
任職資格:
學(xué)歷背景: 計(jì)算機(jī)科學(xué)、人工智能、自然語言處理或相關(guān)專業(yè)在讀碩士研究生。
***專業(yè)技能***
1、掌握檢索增強(qiáng)生成(RAG)的核心機(jī)制與典型流程。
2、具備扎實(shí)的自然語言處理理論基礎(chǔ),熟悉Transformer、BERT等主流深度學(xué)習(xí)模型。
3、有信息檢索相關(guān)項(xiàng)目或研究經(jīng)歷,了解向量數(shù)據(jù)庫(kù)(如FAISS, Milvus)和檢索引擎(如Elasticsearch)者優(yōu)先。
4、具有知識(shí)圖譜實(shí)踐經(jīng)驗(yàn),熟悉圖譜構(gòu)建過程、圖查詢語言(如SPARQL, Cypher)及圖數(shù)據(jù)庫(kù)(如Neo4j)。
5、具備大語言模型微調(diào)的實(shí)際經(jīng)驗(yàn),熟練使用Hugging Face Transformers、PyTorch等主流框架。
編程能力: 熟練掌握Python編程,熟悉常用數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)工具庫(kù)。
***綜合素質(zhì)***
1、具備出色的邏輯分析與問題解決能力。
2、具備良好的溝通協(xié)作意識(shí),能夠高效融入團(tuán)隊(duì)合作。
3、對(duì)人工智能前沿技術(shù)有強(qiáng)烈興趣,具備快速掌握新知識(shí)的能力。
***加分項(xiàng)***
在高水平學(xué)術(shù)會(huì)議或期刊發(fā)表過相關(guān)研究成果。
有處理大規(guī)模非結(jié)構(gòu)化數(shù)據(jù)(如文本、圖像、音視頻)的實(shí)際經(jīng)驗(yàn)。
熟悉多模態(tài)信息的檢索與生成技術(shù)并有過實(shí)踐經(jīng)歷。
有開源社區(qū)貢獻(xiàn)經(jīng)歷者優(yōu)先。