(通讯员/宋登巍)近日,Mechanical System and Signal Processing(MSSP)在线发表刊登了北航PHM团队最新研究成果:基于大语言模型的轴承故障诊断框架(LLM-based Framework for Bearing Fault Diagnosis)。
论文原文链接:https://doi.org/10.1016/j.ymssp.2024.112127(MSSP期刊)
研究团队在健康管理大模型领域提出了基于大语言模型的故障诊断框架,有效提升了预训练大模型对振动数据的解析与泛化能力。以轴承为例,他们探索并打通了基于预训练大语言模型解决泛化故障诊断难题的技术路线,初步展现了对跨工况、小样本、跨对象等泛化诊断任务的综合解决能力。该成果为业界学者应对故障诊断领域泛化痛点问题提供了新思路,也是深入开展大模型与健康管理交叉研究并建立健康管理大模型的重要基础与参考。
北航国新院为第一完成单位,智能测试与健康管理技术联合实验室主任陶来发研究员为论文的第一作者,首席科学家吕琛教授为论文的通讯作者。
健康管理(Prognostics and Health Management,PHM)是避免设备故障导致人员安全和经济财产损失的重要技术手段,而算法模型泛化性不足等瓶颈问题严重制约着PHM技术的发展应用。作为健康管理的重要环节,传统故障诊断也面临着跨工况适应能力、小样本学习能力和跨对象泛化能力等诸多挑战。
大语言模型(LLM)通过千亿级参数化的先验知识与深层次的模式识别能力,为提升故障诊断模型的泛化性提供了新的可能性。因此,团队整合LLM与传统故障诊断技术优势,以轴承为例探索并打通基于预训练大语言模型解决泛化故障诊断难题的可能性和技术路线,初步展现了对跨工况、小样本、跨对象等泛化诊断任务的综合解决能力。
团队分别开展了单数据集跨工况实验和全量及少量样本的跨数据集迁移实验,验证所提出框架同时完成三种泛化故障诊断任务的能力,证明LLM对输入的模式和形式具有良好的适应性。
为解决泛化诊断难题,论文提出基于LLM的轴承故障诊断框架,创新点主要包括振动数据特征的文本化处理和预训练模型微调方法。
针对轴承故障诊断中振动数据难以挖掘语义信息的问题,基于传统故障诊断的统计学分析框架,提出了一种融合时域和频域特征提取的信号特征量化方法,将时序数据进行文本化处理,旨在通过精简的特征选择高效学习小样本和多工况下的共性特征。
针对LLM在解析振动数据特征时泛化能力不足的问题,该团队采用基于LoRA和QLoRA的振动数据微调方法,有效利用预训练模型的深层语义理解能力,提高故障诊断的精确度并增强模型的泛化性能。
针对创新点的实验验证。通过单数据集实验、单数据集跨工况实验以及全量、少量跨数据集实验,该团队证明了所提出框架同时具备跨工况、小样本、跨数据集故障诊断能力。
研究团队采用CWRU、MFPT、JNU、PU四个轴承故障诊断公开数据集,分别针对基于特征的LLM故障诊断和基于数据的LLM故障诊断方法进行验证。
案例实验验证了所提出框架在三种泛化任务上的适应性,且经过跨数据集学习的模型同比获得10%左右的精度提升。
1. 该框架更多地在特征提取和故障模式判别阶段将LLM与故障诊断相结合,未来可充分利用诊断领域知识和大模型架构知识,实现大模型与装备故障诊断的深度融合。
2. 论文以轴承为例,探索了预训练LLM解决泛化故障诊断难题新思路。未来可将其作为基础与参考,特异性设计模型结构,将框架拓展至其他领域对象,如动力、控制系统的电源、功能电路等。
3. 论文以故障诊断为例展示了LLM对传统健康管理手段的扩展能力,未来还可将技术延拓到预测、评估等典型健康管理领域,打通PHM开发方案生成、数据生成、能力生成、解决方案生成、验证评价、方案更新等技术流程,支撑装备PHM设计、诊断、评估、预测、决策、推荐、验证、更新等下游任务。
4. 论文利用LLM的文本处理能力及泛化性能,初步实现了基于预训练LLM的泛化故障诊断功能;未来将在此基础上,构建以健康管理领域多模态信息为基础、以PHM各种功能需求为主要业务、以生成涌现能力为目标的垂直领域健康管理大模型,实现以通用化、判别式、实战性为主要特点的健康管理领域新生态及根本性技术转变。
(参考 An Outline of Prognostics and Health Management Large Model: Concepts, Paradigms, and Challenges, https://arxiv.org/abs/2407.03374)
(审核:洪冠新 陈龙飞)
编辑:谢雨倩