团队致力于打造核心LLM算法能力和应用技术,为了更好服务淘宝电商场景业务。如果你对LLM技术有思考和热情,欢迎投简历。你会接触和探索最前沿的LLM技术,有丰富资源和开放的研究环境。
职位描述:
1、探索模型结构、数据和pretrain/continue pretrain训练方式,对LLM基座电商领域注入知识,提升基座能力;
2、跟进和探索最新的sft/RL技术,提升垂直场景效果,减少幻觉,增强推理能力;
3、探索新框架、数据构造和训练方式,包括但不限RAG/agent框架,提升复杂问题解决能力;
职位要求:
1、985、211计算机相关专业,本科及以上学历;
2、有pretrain/sft/RL之一相关经验;了解RAG/Agent常见应用框架和算法原理;
2、基于Deepspeed,FSDP,Megatron等框架,跟进最新算法效果和探究实验;
3、优先项:发表过高水平会议或期刊论文;高star开源项目重要贡献者