操作系统产品及应用
案例及解决方案
生态建设
服务支持
培训认证
关于统信

推理优化工程师

北京 | 开发类 | 本科 | 社会招聘

岗位职责:

1、跟进工业界/学术界最新的推理动态;

2、模型推理算法实现和优化;

3、推理优化,包括缓存优化、(CUDA、CPU 等)算子开发、模型量化、xPU推理优化,推测解码;

4、量化工具开发。


任职要求:

1、熟悉NLP 和 ML 的基础理论和常见算法;

2、熟练使用python,C++;

3、有pytorch 编程经验;

4、熟悉 CUDA编程,CPU SIMD并行算法等;

5、熟悉大模型推理优化技术,包括但不限于解码技术、layer fusion、kernel fusion和量化等技术;

6、熟悉llama.cpp或vLLM等框架。


请将个人简历及附加个人成果/作品等发送邮件至recruiting@uniontech.com 邮件主题:姓名-城市-投递岗位