摘要:失败通常是指特定系统或执行过程的一系列相关参数失去规定的性能,或者在特定场景中控制指标出现偏差。故障是不可避免的,故障影响电力系统的正常安全运行。为此,有必要迅速识别诊断错误。本文以数据驱动算法为基础,详细比较分析了基于机器的学习主流模型故障诊断方法,通过实例验证了模型的有效性和优越性,对模型的选择具有重要的参考意义。

关键词:错误识别;机器学习数据驱动器

0简介

当被起诉的系统处于异常操作状态时,如果能够使用某种技术实时检测错误,根据先进的定位技术确定故障点的确切位置,并尽可能地对故障发出警报,就可以减少故障造成的一系列伤害。这种技术是故障诊断技术,可以锁定故障发生的位置。(阿尔伯特爱因斯坦,Northern Exposure,“失败”)这些技术具有低延迟、低敏感性和低准确度,对系统的正常运行起着至关重要的作用。

目前有关故障诊断的方法主要是k-最近邻算法

(k-nearest neighbor,KNN),支持向量机(支持向量机)

机器、SVM)的循环迭代诊断方法和差分自回归移动平均模型(Auto Regressive Integrated Moving Average,

阿里马)方法。另外,由于样本数据集庞大,算法计算时间较长,对解决问题的及时性更加困难。为此,本文采用Kid树算法提高了效率。

本文结合上述三种主流算法和Kid树算法,解决了变压器数据集的问题。数据集分为三个场景:完整数据集、缺失数据集和粗糙数据集(未预先处理的数据集)。每一个场景都逐一比较了故障诊断的准确度,并详细分析了算法的适用性。

1故障排除框架

在高速发展的大数据时代背景下,电力采用数据也进入井喷增长阶段,其次是巨大的计算数据量和建模复杂性。迫切需要一种可应用于冗余数据的计算方法,目前,基于数据的自适应障碍识别预警方法受到了工程界和学术界的关注。其特点主要是对海量、异种、高维数据甚至非数字数据的采样数据(视频数据、图像数据等)进行挖掘计算和信息处理。PMU

高精度、高频、多维采样数据得到了广泛的应用,故障诊断可以对采样设备收集的各种类型的数据、各种源数据进行快速诊断和预警。数据包括图像数据、视频数据、数字数据和抽象数据。数据的采样频率、属性、源和维不同。如果数据维不匹配,则必须使用相关的降维数据将异构源数据规范化为结构属性匹配的数据。在数据一致性的基础上,利用相关挖掘算法挖掘能够表示系统运行属性特征的数据。这些数据信息可以判断系统是否正常,从而实现系统检测和诊断功能。本文提出的故障诊断的逻辑结构框架如图1所示。

1669349119681598.png

图1基于数据的故障排除框架

如图1所示,基于数据驱动问题解决的机制框架可以使用时间序列分析、经验分解的基本算法来处理原始数据,并进一步分析数据处理结果。分析过程包括基于数据特性的手动设计和数据预处理(选择要素、缩小数据维等)。最后,根据构建的模型对数据进行培训,并根据训练的模型输出故障诊断结果。

2算法理论模型

基于2.1k-最近邻(kNN)数据恢复理论

k-最近邻(kNN)算法通过计算相邻点的距离来判断异常点。该算法主要用于查找相似、数据接近的特定类型的相邻样本,根据样本计算的距离判断是否异常。同样的故障一般由于相关特征指标接近,可以使用kNN。

用于恢复缺少的数据或异常数据。KNN算法的理论模型如下:根据收集的样品的初始数据集,通过数据预处理标识缺少的样品数据集。确定要恢复的测试样本,历史数据集通过kNN方法查找最接近数据的K个计算样本数据,并调整计算出的K个样本数。

估计是关于已知的缺失数据集。本文提出了相关计算指标的负指数作为特定的权重类型,然后以曼哈顿-D作为样本间距离指标,以强调出错时发生该错误的不同数据相关指标之间的相关性。

假设样本数据已经有N组样本历史数据,则每组样本历史数据可以表示如下:

1669349258375636.png

1669349290684109.png

对需要使用相关系数法计算的相关特征指标进行空间距离计算。此距离可以反映两种类型的数据集数据和数据之间的空间相关性。与缺少数据的计算相关性越大,数据指标权重越小。表示测试的样品。这是强相关特征指标和更容易接近的计算训练样本。

选择最接近测试样品的k个培训样品,计算该特性指标的平均值作为缺失数据的估计值。

1669349350883813.png

与一般方法(如线性方法、预测方法等)相比,kNN主要通过数据修补方法,按类型逐个修补丢失的数据。即使是结构属性不同的数据,也可以规格化异构数据,然后进一步修补。该方法可以挖掘对不同数据进行分类的特征属性,这种算法打破了对时间序列原始数据的高度依赖,在适合数据快速变化的方案(如故障特征)中提供缺失的数据恢复和异常数据识别。

基于2.2 k-d树的样本快速搜索策略

随着PMU、RTU等多种高精度采样设备在配电网、传输网中的广泛应用,电力数据也呈指数级增长。以某省电网为实力分析,高精度采样设备一个月的采样数据达到GB水平。如果仍然使用传统方法,在庞大的历史数据库中查找与培训样本数据最接近的N个培训数据,那么现有的各种指标性能将无法满足实时错误检测的要求。通过在曼哈顿距离计算这些相关系数,可以使用基于k-d树的样本检索技术快速恢复缺失的数据,快速识别缺失的数据。

每个样本数据都设置了多个特性指标,因此从现有样本数据中获取的样本数据往往是高维数据空间。K-d树是一种通过划分数据空间将空间划分为K子空间的运算方法,通常应用于高维空间,在重要数据的全局范围内进行快速搜索。图2以K为3的三维空间的数据集为例,简要说明了k-d树的结构原理。

1669349472760191.png

K-d树生成过程分为图3所示的三个阶段。

1669349505514832.png

首先计算样本数据的维数方法,根据维数计算方差数值大小,确定距离的距离和距离是否为异常数据,方差越大,表面数据分布越好。其次,示例Split对数据维进行分割和排序,以中间数据点为中心轴,并基于子空间分割数据点轴心点。最后,确定子树大小是否达到预定值K,如果达到,是否结束,否则循环的第一阶段。

K-d树中每个树叉网络的节点是K维点的二叉树。所有子节点都可以被视为分区子空间的超平面,可以对分区空间进行分层分区,从而建立可以快速有效地检索的索引结构。该方法包含k个特征指标,并使用存储在k-d树所有节点上的样本数据,可应用于结构化存储。

通过图4,可以得出以下结论:通过测试方法,可以获得精度性能比较。在提到的方法中,基于k-d树的快速搜索方法可以快速搜索整个邻近地区的样本值。计算所需的时间表示以下趋势:数据容量越大,需要的时间越长,但增幅并不明显。也就是说,在大规模样本的场景中,这种相邻搜索策略具有相当大的优势。

image.png

图4不同搜索策略的性能比较

基于2.3 k-最近邻和SVM的循环迭代诊断方法

支持向量机(SVM)算法的基本思想是通过核函数将无法线性分离的样本数据映射到高维特征空间,从而产生潜在的线性可分离问题。单个SVM只能解决一个二分类问题。本文设计了包含多个SVM的多分类器,可以准确诊断6种类型的变压器故障。多分类SVM分类器的结构如图5所示。

image.png

图5采用多分类器的SVM模型机制结构

在数据丢失、异常数据情况下,使用kNN方法首先填充和更正丢失的数据。多分类SVM分类器的诊断数据必须是恢复的数据。缩小采样空间的范围,然后在缩小的区域中重复使用kNN以估计缺少的数据。反复重复,直到相邻样品的错误类型与测试样品的故障排除结果相匹配。如图7所示,故障排除过程包括如图6所示的多个步骤。

1669349811950077.png

图6采用多分类器的SVM模型机制结构

如图6所示,首先通过原始数据输入获得样本数据集。第二,基于多分类SVM算法的故障诊断;然后,检查诊断结果是否与K相邻的训练样本集的残疾特性相匹配,如果匹配,则转至步骤4,反之,转至步骤5。最后,根据诊断结果恢复的数据将存储在历史数据集中,包括诊断结果。

2.4 AIRMA算法

差分自回归移动平均模型(自回归集成)

Moving average,ARIMA)算法主要用于时间系列预测分析。时间序列的获得可以通过实验分析或相关部门提供的数据获得。对于获得的数据,首先调查数据是否异常,分析这些点的存在是人为的还是其他原因。确保获得的数据的质量,以便可以用于构建适当的模型。

时间序列的数据预处理数据包数据异常识别、数据缺失填充和恢复、数据降噪和降维、重复数据过滤等AIRMA算法可以在数据质量得到保证的条件下准确预测,并以此为分析依据及时掌握准确的故障预警信息,从而确保故障预警。

image.png

图7数据丢失方案的诊断程序过程

3硬件平台

本文设计了自适应诊断系统的硬件执行环境,该系统由信号源设备、故障指示器、诊断服务器三部分组成,如下所示:

3.1信号源设备

信号源装置连接到变压器结构的高压功率输出端,在接地电阻元件组的作用下,可以对温度控制设备进行综合调整,从而更好地满足自适应诊断系统的实际应用要求。在单位传输时间内,两个不同的接地电阻元件分别连接到控制开关和信号源频带上。电子可以检测变压器内部的温度变化,同时集中消耗剩余的自适应电流。后者主要负责准确调试输出的电信号源,使系统内部的电子传输环境瞬间保持相对稳定的应用状态。信号源设备右侧集中分布着多个输出频带结构,随着变压器设备承担的电压水平的提高,这些物理频带的振动行为也逐渐突出,直到变压器设备的内部温度达到额定标准值为止。

3.2错误指示器

自适应诊断系统中的故障指示器由直流型、交流型、交感变化型三种形式组成。其中,DC故障指示器的连接适应性相对较弱,只能加载DC型变压器应用装置,当元件内物理性能稳定持续提高时,这种类型的装置容易发生熔体变化状态,从而提高热故障行为的性能强度。交流故障指示器的连接适应性有一定程度的变化,但只能加载交流型变压器应用设备。组件内物理性能稳定值不断提高,可以长期保持相对稳定的连接状态。因此,对热故障行为的性能强度有一定的抑制作用,可以为自适应诊断系统提供更多的参考信息条件。

3.3诊断服务器

在变压器内部过热故障自适应诊断系统中,诊断服务器始终作为主机集群存在,准确确定变压器设备内部表面温度值,并使用信号源设备识别和处理诊断执行准则。一般来说,客户端主机根据诊断服务器模式的顶层执行结构记录的变压器内部温度值水平设置自适应诊断权重,然后通过输入网络通道维护整个网络内的信息诊断环境。系统内待定的数据信息可以提高实用价值。基本服务器连接必须完全符合自适应诊断网络的实际规划要求,包括记录客户端内的数据传输要求,同时将未完全消耗的温度值信息反馈给其他系统诊断因素。

4算例分析

本文对常见的故障类型进行分类,并根据故障特征对故障类型进行预分类。在本文中,T1、T1、

T2、T3三种类型的温度数据分别代表低温、中温、高温数据异常。通过插入局部放电、低能放电和高能放电三种常见故障和稳态Normal(N)来补偿缺失的数据。相关各方案的正确故障排除率结果见表1。本文进一步采用分层过滤方法对采样数据进行分级过滤。第一层用于过滤周期性窄带干扰信号,第二层用于消除白噪声,第三层用于防止脉动干扰。过滤连续性、周期性高的数据,尽可能频繁地收集数据。如图8所示,分层过滤抗干扰模型结构图。

image.png 1669353461404716.png

图8分层干涉过滤模型原理图

表1深入分析表明,第一种方法使用完整采样完整数据集,通过SVM算法实现了83.17%的错误精度,与预期相似。但是,如果直接采用原始数据集,没有SVM的辅助,错误精度将降低到68.25%,与预期相符。另外,如果使用原始数据集,并且原始数据集缺少数据,则分类准确度只有59.09%。原因分析:如果原始数据集没有重要数据,即缺失的数据没有主要指标,准确性也将得到保证,但如果缺失。

对于重要数据,故障诊断精度急剧下降,包含主要特征属性的数据缺失严重影响故障诊断的准确性。

使用使用的kNN方法,在数据丢失的情况下实时诊断系统错误,并提供错误预警信息。此时,解决问题的准确度达到78.64%,如果数据不丢失,则可达到83.17%。这表明该方法适用于缺少数据的数据集场景。也就是说,数据丢失对解决问题没有太大影响,可以通过第1类方法获得。表2

图6通过一个例子详细说明了两种方法的差异。

image.png

(*,12.85,3.65,2.6,0)是原始样例数据集,每个数据集对应于五个不同属性的特性指标。其中*表示缺少

a指标。使用本文提出的方法,从记录数据库中检索最终数据样本(如表2所示),并使用最近样本中A2含量平均值作为缺失数据的估计和相对误差。利用修复的样品数据解决问题的结果是低温过热,与实际情况相符。使用ARIMA方法拟合变压器A含量的历史数据,预测缺失值。结果,如图7所示,估计值为68.02,根据该估计值进行故障排除,导致中温过热、诊断错误。

算例分析结果表明,本文提出的故障诊断方法可以在缺失的数据场景中实现样本数据的实时故障诊断,适用于大数据时代数据缺失正常化的场景,实际场景经常因通信中断、采样设备故障等原因而出现数据丢失。本文提出的方法与传统的过度拟合预测等方法相比,本文在数据丢失方案中的方法具有明显的优势。另外,本文提出的方法的诊断速度也可以满足要求。最后,本文提出的方法仅适用于丢失数据的恢复,但也存在无法识别异常数据的场景的局限性。变压器内部过热故障自适应诊断系统在信号源装置、故障指示器、诊断服务器三类硬件设备结构的作用下,准确分析变压器内部过热的原因,然后通过变压器负荷计算方法实现诊断信息存储数据库的平衡和稳定性。实验结果表明,变压器直接电阻平均量和电流上升量数值的下降可以抑制变压器设备内部的温升变化,实现对电力消耗资源的合理保护。

第五结束语

本文根据基于数据的故障诊断机制,针对经常发生数据丢失或数据异常的场景中的原始样本数据,提出了实时故障诊断方法。在此链接中,样本数据质量是最重要的因素。为了提高数据样本的质量,本文采用相关的数据恢复方法,使数据质量保持稳定。为了在线监测数据丢失问题,提出了基于丢失数据恢复的在线故障诊断方法,并在数据丢失方案中提出了高精度的在线故障诊断方法,可以适应当今大数据背景下数据异常频繁发生的情况。本文提出的方法与传统方法相比,在主要指标缺失、故障快速增加的情况下,仍能提供较高的诊断精度。

本文在信号源设备、故障指示器等多个硬件设备结构的支持下,准确分析了设备过热的原因,并提出了一种新的变压器内部发热故障自适应诊断系统,该系统从联合变压器负荷数值实现了诊断信息存储数据库软件的实时连接。自适应诊断系统的应用可以很好地抑制电流上升量数值上升趋势,保持变压器设备内部的平衡温度变化状态。

参考文献:

[1]beard r v . failure accommodation in linear systems

Through self-re organization [r]。report MVT-71-1、man vehicle

说唱,1971年。

[2] Ali a m,Zhang q . an innovations approach to fault diagnosis

in linear time-varying descriptor systems[c]。control conference。

IEEE,2014年。

[3]杨秋玉、阮康军、黄道春。改进希尔伯特-赫宁变换和支持向量机的高压断路器接触超距状态识别[J]。电力自动化设备

,2019,39(1):198-204。

[4]刘琳。基于改进粒子群优化算法的微电网经济调度研究[J]。上海电气技术,2020,13(2):5-9。

[5]孙冰英、杨秀丽、刘宗智等。国内外兆瓦级储能示范应用现状分析及启示[J]。电力系统自动化,2017,41(11):8-16。

[6]魏承志、陈静、陶春明等。基于储能装置和静止无功功率联合控制策略的微电网电压波动抑制方法[J]。网格技术,2012,36(11):18-24。

[7]张兴科、魏济阳、李正等。预测总线负载区间,包括高渗透率分布式电源[J]。电网和清洁能源,2020,36(12):101-106。

[8]黄和平、韩景宽、王玉生等。我国能源安全战略与对策探讨[J]。中国工程科学,2021(2):1-6。

(注:本文转载于《电子产品世界》杂志2022年11月刊)

_基于数据的多模型故障诊断

推荐文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注