大模型LLM实习生

当面告知
更新:2025-09-12
北京市
硕士

职位详情

团队致力于打造核心LLM算法能力和应用技术,为了更好服务淘宝电商场景业务。如果你对LLM技术有思考和热情,欢迎投简历。你会接触和探索最前沿的LLM技术,有丰富资源和开放的研究环境。 职位描述: 1、探索模型结构、数据和pretrain/continue pretrain训练方式,对LLM基座电商领域注入知识,提升基座能力; 2、跟进和探索最新的sft/RL技术,提升垂直场景效果,减少幻觉,增强推理能力; 3、探索新框架、数据构造和训练方式,包括但不限RAG/agent框架,提升复杂问题解决能力; 职位要求: 1、985、211计算机相关专业,本科及以上学历; 2、有pretrain/sft/RL之一相关经验;了解RAG/Agent常见应用框架和算法原理; 2、基于Deepspeed,FSDP,Megatron等框架,跟进最新算法效果和探究实验; 3、优先项:发表过高水平会议或期刊论文;高star开源项目重要贡献者

公司介绍

公司信息:


公司名称:阿里巴巴(中国)有限公司


公司类型:互联网/电子商务


公司性质:5000以上


公司地点:


公司规模:--


涉及领域:--


公司网址:


*以上信息来自媒体新闻、公众号或、官方网站或公司HR,如涉及侵权,请联系我们删除或修改。
公司基本信息

阿里巴巴(中国)有限公司

民营/私企
相似岗位推荐