网站首页 > 岗位 > 详情

招聘提示:收取培训费、贷款培训,或在录用过程中需支付体检、服装、押金等费用、鼓吹出国出境务工短期内可获得丰厚报酬等都属违法行为,请求职者提高警惕,谨防上当受骗,如遇类似情况,请立即举报。校园招聘违规举报

深圳虾皮信息科技有限公司

算法工程师-AI方向

20K-40K/月 全国 本科及以上

发布时间:2026年2月27日

点击人次:283

职位描述

岗位职责:

职位描述

1. 预训练方向 (Pre-training & Architecture):探索大模型能力的边界,负责基座模型的训练与优化。探索超越Transformer的下一代架构(如SSM、MoE、Linear Attention等),优化长上下文(Long Context)与推理效率。 参与万亿级Token的高质量数据清洗、配比与合成数据(Synthetic Data)研究,探索Data-Centric AI的极限。优化Megatron-LM、DeepSpeed等训练框架,解决千卡/万卡集群下的训练稳定性与通信瓶颈。

2. 后训练与对齐方向 (Post-training & Alignment):让模型更“懂”人类,并通过强化学习激发模型的高阶推理与泛化潜能。研发高效的SFT(监督微调)策略,探索参数高效微调(PEFT),优化多轮对话与指令遵循能力。深入研究 PPO、DPO、GRPO 等算法;探索 Online RL(在线强化学习) 机制,通过环境交互与大规模 Self-play(自我博弈),实现模型能力的自主进化。

3. 大模型评测方向 (Evaluation):做大模型的“考官”,建立科学、客观、自动化的能力评估体系。设计针对通用能力、垂类知识、安全性及幻觉(Hallucination)的评测Benchmark。训练LLM-as-a-Judge,利用大模型评估大模型,探索评测的一致性与偏差问题。

4. 大模型应用与Agent构建 (Application & Agents):将模型能力转化为实际生产力,构建能够解决复杂任务的智能体。研发检索增强生成技术,解决向量检索、重排序及上下文融合中的痛点。设计能够自主规划、调用工具(Tool Learning)、记忆与反思的智能体系统(如Multi-Agent协作)。

职位要求

熟练掌握Python/C++,具备优秀的代码风格和算法数据结构基础。

深入理解Transformer原理(Attention机制、位置编码、归一化等),熟悉PyTorch/TensorFlow等主流框架。

对新技术(如OpenAI最新Paper)保持极度敏感,具备快速复现前沿算法的能力。

加分项:

顶会发表: 在ICML, NeurIPS, ICLR, CVPR, ACL, EMNLP等顶级会议以一作发表过高质量论文。

开源贡献: 曾参与HuggingFace, vLLM, DeepSpeed等知名开源项目,或拥有高Star的个人Github项目。

竞赛获奖: 在ACM-ICPC, Kaggle或大模型相关挑战赛中获得Top名次。

实战经验: 曾实际参与过百亿参数(10B+)以上模型的训练、RLHF全流程或大规模RAG系统的落地。

为什么选择我们?

算力自由: 充足的GPU资源,不再因为没有显卡而限制你的想象力。

大牛导师: 业内顶尖科学家作为Mentor,一对一指导你的职业成长。

宽容的创新环境: 我们鼓励Failed Attempts,因为伟大的算法往往诞生于无数次失败之后。

岗位要求:

职位描述

1. 预训练方向 (Pre-training & Architecture):探索大模型能力的边界,负责基座模型的训练与优化。探索超越Transformer的下一代架构(如SSM、MoE、Linear Attention等),优化长上下文(Long Context)与推理效率。 参与万亿级Token的高质量数据清洗、配比与合成数据(Synthetic Data)研究,探索Data-Centric AI的极限。优化Megatron-LM、DeepSpeed等训练框架,解决千卡/万卡集群下的训练稳定性与通信瓶颈。

2. 后训练与对齐方向 (Post-training & Alignment):让模型更“懂”人类,并通过强化学习激发模型的高阶推理与泛化潜能。研发高效的SFT(监督微调)策略,探索参数高效微调(PEFT),优化多轮对话与指令遵循能力。深入研究 PPO、DPO、GRPO 等算法;探索 Online RL(在线强化学习) 机制,通过环境交互与大规模 Self-play(自我博弈),实现模型能力的自主进化。

3. 大模型评测方向 (Evaluation):做大模型的“考官”,建立科学、客观、自动化的能力评估体系。设计针对通用能力、垂类知识、安全性及幻觉(Hallucination)的评测Benchmark。训练LLM-as-a-Judge,利用大模型评估大模型,探索评测的一致性与偏差问题。

4. 大模型应用与Agent构建 (Application & Agents):将模型能力转化为实际生产力,构建能够解决复杂任务的智能体。研发检索增强生成技术,解决向量检索、重排序及上下文融合中的痛点。设计能够自主规划、调用工具(Tool Learning)、记忆与反思的智能体系统(如Multi-Agent协作)。

职位要求

熟练掌握Python/C++,具备优秀的代码风格和算法数据结构基础。

深入理解Transformer原理(Attention机制、位置编码、归一化等),熟悉PyTorch/TensorFlow等主流框架。

对新技术(如OpenAI最新Paper)保持极度敏感,具备快速复现前沿算法的能力。

加分项:

顶会发表: 在ICML, NeurIPS, ICLR, CVPR, ACL, EMNLP等顶级会议以一作发表过高质量论文。

开源贡献: 曾参与HuggingFace, vLLM, DeepSpeed等知名开源项目,或拥有高Star的个人Github项目。

竞赛获奖: 在ACM-ICPC, Kaggle或大模型相关挑战赛中获得Top名次。

实战经验: 曾实际参与过百亿参数(10B+)以上模型的训练、RLHF全流程或大规模RAG系统的落地。

为什么选择我们?

算力自由: 充足的GPU资源,不再因为没有显卡而限制你的想象力。

大牛导师: 业内顶尖科学家作为Mentor,一对一指导你的职业成长。

宽容的创新环境: 我们鼓励Failed Attempts,因为伟大的算法往往诞生于无数次失败之后。

投递说明:

网申/内推 > 笔试(部分岗位不设笔试) > 2-3轮专业面试 > HR沟通 > Offer

单位简介
Shopee是东南亚领航电商平台,覆盖新加坡、马来西亚、菲律宾、印度尼西亚、泰国及越南等市场,同时在中国深圳、上海和香港设立跨境业务办公室。2019 年 Shopee总订单量高达12亿,同比增长100.5%。根据权威移动数据分析平台 App Annie,2019年Shopee强势跻身全球购物类App下载量前五,同时斩获东南亚及台湾市场购物类App年度总下载量、平均月活数、安卓使用总时长三项冠军,并领跑东南亚两大头部市场,拿下印尼及越南年度购物类App下载量与月活量双冠王。
提示:在微信扫描关注,可以直接投递简历哟

深圳虾皮信息科技有限公司

领域:信息传输、软件和信息技术服务业

规模:1000-5000人

地址:深圳市南山区粤海街道高新区社区科技南一路28号达实大厦3302