岗位职责:1.负责大模型基础模块开发及应用;2.与业务部门沟通合作,将大模型相关能力应用到实际业务;3.基于业务场景,定制训练语料,进行垂直领域大模型微调训练;4.负责大模型领域前沿技术的研究、竞品评估等。岗位要求:1.计算机相关专业,自然语言理解、机器学习相关方向的硕士研究生以上学历,要求3年以上工作经验;2.对主流大模型(例如GPT3/chatGPT/T5/PaLM/LLaMA/GLM等)的原理、性能、差异有深入理解;3.具备扎实的编程能力,熟悉python编程,熟悉TensorFlow/pytorch等深度学习框架,熟悉LLM大模型基本原理及应用、langchain框架及应用;4.良好的算法开发和工程实现能力。熟悉AI领域常见的开发语言、开发框架、通用平台和技术;深入了解大模型在产品化过程中的调优、量化、封装、部署、调度、并发、时延等常见软硬件问题,熟悉大模型常用训练框架、推理架构;熟悉大模型的训练、推理的各类硬件平台及不同平台之间的特点区别;5.具备较好的文档阅读(包括英文文档)能力,具备较好的文档编写能力,如在相关领域***会议发表过高水平论文者优先;6.良好的问题分析和解决能力,对解决具有挑战性的问题充满热情,具备良好的团队合作、沟通能力。工作地:成都/攀枝花年龄要求:35岁以下职能类别:算法工程师关键字:计算机编程文档编写ai封装机器学习部署开发语言调优深度学习
成都-金牛区 (成都-金牛区沙湾266号攀钢金贸大厦14楼) 查看地图