职位描述


1、负责设计、开发、优化机器学习Inference Framework和Training Framework;

2、理解异构硬件(Intel CPU/GPU/FPGA/ARM/ASIC)的体系结构,在异构硬件上优化算法,达到加速效果;

3、参与设计深度学习训练数据中心的设计、选型和实际搭建;

4、参与产品硬件选型、算法优化、计算优化工作。


任职要求


1、不错的逻辑分析能力,愿意接受挑战;

2、有扎实的计算机体系结构、编译原理、操作系统、计算机网络知识,对高性能计算有浓厚兴趣;

3、对代码运行效率有极致追求;

4、了解深度学习算法及其计算过程,阅读过常见计算框架源码(如Caffe、TensorFlow等)优先;

5、扎实的C/C++能力,有OpenMP、TensorRT、汇编、MPI、RDMA开发经验者优先;

6、985/211本科及以上学历者优先。


工作地点

上海

投递简历

Top