职位描述:
1、 理解异构硬件(Intel CPU/GPU/FPGA/ARM/ASIC)的体系结构,在异构硬件上优化算法,达到加速效果;
2、 对产品进行代码适配和加速,获得更好的用户体验,降低成本;
3、 针对异构硬件,开发和优化深度学习推断库,将硬件性能发挥到极致;
4、 对分布式异构训练框架进行优化加速,达到加速训练速度效果;
5、 负责设计深度学习训练数据中心的设计、选型和实际搭建;
6、 负责产品硬件选型、算法优化、计算优化工作;


任职要求:
1、 岗位面向2019届及2020届毕业生,有优秀的逻辑分析能力,愿意接受挑战;
2、 有扎实的计算机体系结构、编译原理、操作系统知识;
3、 有扎实的C/C++开发能力;
4、 对代码运行效率有极致追求;
5、 有熟悉开源推断库的设计、原理、实现的同学优先;
6、 有阅读过Caffe/TensorFlow/MXNet等训练/推断框架源码,熟悉ARM、Intel、GPU SIMD指令开发者优先;


工作地点:

上海/北京


投递简历

Top