联系人:黄景燕
联系电话:020-663****8
公司地址:广州市黄埔区瑞祥路188号
岗位职责:
1.与设备管理、运维等同事协同,依据设备故障分析需求,梳理明确数据采集范围,涵盖设备运行参数、环境监测数据、维修记录等多源数据;
2.借助数据清洗算法及规则,识别并纠正数据中的缺失值、异常值与重复值,完成数据标准化、归一化等预处理操作;
3.深入剖析设备故障机理,结合数据特性及业务目标,灵活选用决策树、随机森林、支持向量机、深度学习中的循环神经网络(RNN)及其变体(如 LSTM、GRU)等适配的分类、预测算法;
4.综合运用统计分析方法与数据可视化工具(如 Matplotlib、Seaborn、Tableau 等),深度挖掘模型输出结果与原始数据,精准提炼设备故障发生的规律、模式及关键影响因素;
5.与软件开发、运维团队密切协作,将训练成熟、性能稳定的设备故障模型,平稳部署至生产环境,确保模型与企业现有设备管理系统、运维平台无缝集成,实现数据实时接入与故障预测结果实时输出;
6.依据设备运行工况变化、新数据积累以及模型性能衰退情况,定期对模型开展重新训练、优化与更新工作;
7.针对设备频发故障、重大故障隐患等重点问题,开展专项深入分析研究,挖掘数据背后隐藏的设备设计缺陷、操作不当、维护短板等业务逻辑关联;
8.输出研究分析报告、技术文档并撰写相对应的算法专利;
9.严格遵守相关开发工具的编码规范,确保模型开发和应用过程符合相关法律法规和公司政策;
10.上级领导安排的其他事务以及配合其他部门的相关工作。
岗位要求:
1.重点本科(985,211)或硕士以上的学历,计算机科学/数学/统计学等相关专业,计算机技术三级及以上;
2.熟练掌握常用的数据处理、分析和机器学习库,不限制实现语言,但需至少掌握一种编程语言;
3.深入理解并熟练运用各种数据挖掘算法和模型;
4.熟悉数据预处理技术,包括数据清洗、数据集成、数据变换、特征工程等,了解大数据处理技术和分布式计算框架,如 Hadoop、Spark 等;
5.具备从多种数据源(如数据库、文件系统、API 等)收集数据的经验,熟练运用数据分析工具(如 SQL、Python 的 Pandas、NumPy 等)进行数据探索性分析;
6.掌握常见的机器学习算法和模型评估指标(如准确率、召回率、F1 值、均方误差等);
参与过完整的数据挖掘项目,从项目需求分析、数据准备、模型构建、模型评估到模型部署和上线;
7.有故障诊断算法等相关经验者优先;