当前位置:

img

智算运维技术专家

五险一金;定期体检;带薪年假;节日福利;全勤奖

¥30000-¥60000 /月

  • check发布时间:2025-04-23
  • check职位类别:运维工程师
  • check发布公司:卓望数码技术(深圳)有限公司
  • check工作地点:深圳市-南山区
  • check联系人:余飞扬
  • check联系电话:6682066****
立即申请

公司信息:

联系人:余飞扬

联系电话:6682066****

公司地址:深圳市南山区粤海街道高新区社区高新南七道015号深港产学研基地W601

职位详情

quote
岗位职责: 1. 负责智算运维业务能力建设及新业务推广,保障业务目标达成; 2. 负责组织实施智算运维体系建设及运营(含一二线运作指导及优化),包括不限于业务连续性保障建设、运维架构建设、监控体系建设、运维风险管理等; 3. 负责运维过程标准化、运维经验及能力沉淀,打造运维工具提升效率降低成本; 4. 负责对团队运维质量进行分析及管控,负责对团队定期开展培训赋能,体系运营质 量达到行业专业水平; 5. 负责重大运维技术方案的制定,参与产品技术方案的评审,与重要客户开展常态技术交流; 6. 负责智算中心运维疑难问题解决,尤其是智算中心硬件计算、网络、存储运维前沿性技术预研; 7. 构建智算运维合理的技术交付体系梯队,明确各层级和角色的工作职责,并具备市场竞争力。 任职资格: 1. 精通中大型通算、智算数据中心运维管理,熟悉基于 RDMA 技术的 IB 或 ROCE 无损网络架构及相关网络设备运维技能; 2. 8年数据中心运维经验,3年以上智算中心运维经验,拥有网络、存储、云计算等技术认证; 3. 5年以上的中大型数据中心运维项目管理经验; 4. 熟悉智算中心运维工作,独立和指导团队进行日常工程交维、系统监控和维护、容量规划和管理、数据备份与恢复、安全防护、故障处理、设备巡检等工作; 5. 熟悉实时计算的智能运维体系建设与稳定性保障,熟悉分布式存储 NFS、CEPH、CIFS、HDFS、S3 等非结构化数据协议,具备相关分布 式文件、对象存储设备系统上数据迁移、复制、弹性扩展及数据优化的能力; 6. 具备良好的团队合作精神和沟通能力,能够承受一定的工作压力,熟悉IT管理方法论,如ITIL/DevOps/ITOM等; 7. 精通智算运维工具及相关运维流程,有成熟体系运营经验; 8. 责任心强,有 30 人以上团队管理经验优先。

猜你喜欢

1.95G 4G 4G 4G 4G 4G 4G 4G 4G 3.31G 2.62G 3.1G 3.05G 4.51G 4G 3.85G 2.56G 3.03G 3.72G 4G 2.3G 3.8G 3.7G 4.36G 2.71G 5.17G 6.34G 2.92G 4.05G 6.34G