職位描述
該職位信息待核驗,請仔細了解后再進行投遞!
團隊介紹:
高德語音技術部,是負責高德全棧語音技術的綜合性團隊。團隊核心技術能力包括:自研TTS基座大模型、端側模型、多語種、RTC流式語音、語音內容生成、語音識別、多模態(tài)模型、模型服務與推理。業(yè)務支撐面向高德全部核心場景,包括語音導航、AI導航員、IP語音定制、國際化、AI語音助手、智能外呼、內容生成等。
團隊定位是通過前沿語音技術的研究和落地,賦能下一代AI產(chǎn)品創(chuàng)新。近期部分技術(https://arxiv.org/abs/2507.12197)
具體職責:
圍繞voice agent/speech language model的研究工作,包括但不限于如下事項:
1. 文本對話大模型/多模態(tài)對話大模型的研發(fā)、語音對話pipeline方案以及端到端方案的交互能力搭建、全雙工交互能力搭建,落地到高德agent應用場景;
2. 跟進前沿的對話模型/語音交互技術,包括但不限于提出新的技術框架、改進現(xiàn)有的算法、持續(xù)提升相關技術及業(yè)務指標,鼓勵撰寫論文及申請專利;
3. 探索前沿方向,如更加高效且合理的模型架構、跨模態(tài)(文字/語音/視覺)混合訓練實踐、基于speech language model的后訓練技術、COT Reasoning in streaming full-duplex、proactive interaction,等等。結合全鏈路各個agent,持續(xù)提升voice agent的交互體驗;
4. 海量的語音數(shù)據(jù),尤其是對話數(shù)據(jù)的處理構建:定性分析、定量評估、參與設計自動評估框架,研發(fā) scalable 的改進方案,持續(xù)提升數(shù)據(jù)質量。
職位描述
1. 985/211高校研究生及以上學歷或優(yōu)秀本科生,計算機、人工智能、軟件、數(shù)學等相關專業(yè);
2. 較強的代碼能力,在文本大模型或多模態(tài)大模型某一領域(語音大模型、Voice Agent、生成模型等)有過深入的研究經(jīng)歷或者應用經(jīng)驗;
3. 熟練掌握C/C ,Python,Shell編程語言,對數(shù)據(jù)結構和算法設計有較好的理解;
4. 精通 Pytorch / megatron等深度學習框架,熟悉 Transformer 架構以及大語言模型基礎知識。
加分項:
1. 有豐富的對話大模型(包括文本對話或者語音對話)的研發(fā)、應用經(jīng)驗;
2. 具有較強的工程能力,有開發(fā)音視頻實時交互系統(tǒng)的經(jīng)驗;
3. 在國際權威會議或期刊(ICASSP,Interspeech,ICML,NIPS,TASLP等)上發(fā)表論文者優(yōu)先;
4. 編程能力強,在ACM/ICPC、NOI/IOI、TopCoder、Kaggle等比賽獲獎者優(yōu)先;
5. 良好的溝通能力、團隊合作精神、自我驅動能力,對技術充滿熱情,主動解決問題者優(yōu)先;
6. 有數(shù)據(jù)感知、對數(shù)據(jù)有充分的認識和研究興趣者,優(yōu)先;
工作地點
地址:北京朝陽區(qū)北京-朝陽區(qū)阿里中心·望京B座
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
楊曦HR
北京高德云圖科技有限公司
-
互聯(lián)網(wǎng)·電子商務
-
1000人以上
-
私營·民營企業(yè)
-
北苑小街8號5號樓龍湖藍海引擎產(chǎn)業(yè)園B館
相似職位
-
裝修產(chǎn)品運營 10000-16000元應屆畢業(yè)生 本科貝殼找房(北京)科技有限公司
-
商務數(shù)據(jù)分析經(jīng)理 (MJ008626) 10000-15000元應屆畢業(yè)生 本科百威投資(中國)有限公司
-
軟件測試工程師 11000-18000元應屆畢業(yè)生 碩士四川泛華航空儀表電器有限公司
-
IDC數(shù)據(jù)中心數(shù)據(jù)中心基礎設施運維崗(川大眉山校區(qū)) 面議應屆畢業(yè)生 不限四川通發(fā)電信股份有限公司
-
新媒體運營(拍攝剪輯) 面議1年以上 大專四川鴻信建筑裝飾工程有限公司
-
新媒體運營 面議應屆畢業(yè)生 不限川越教育

應屆畢業(yè)生
本科
最近更新
94人關注
注:聯(lián)系我時,請說是在四川人才網(wǎng)上看到的。
