找回密码
立即注册
发新帖

64

积分

0

好友

10

主题
发表于 2023-9-4 07:00:54 | 查看: 521| 回复: 0
摘 要:通過对大型电力变压器(电抗器)声纹信号采集、处理与特征分析,提出了一种基于声纹识别技术的变压器工况检测方法及验证系统,实现对变压器工作状态的判断检测。首先,通过声纹采集传感器实地采集获取73组变压器音频,共约1800 min;其次,分别运用分段、分帧、加窗音频预处理方法对所采集的变压器声纹进行去噪处理;再次,综合运用能量特征、频率特征、梅尔频率倒谱系数、频率压缩方法提取变压器声纹特征并进行有效融合;最后,针对变压器工况声音由稳定工作状况发出的声音与不稳定的瞬时杂音加性叠加问题,提出一种基于余弦相似度算法实现声纹叠加的分离检测,同时建立一套变压器工况检测与验证分析系统。

关键词:声纹识别;变压器;工况检测;验证系统

中图分类号:TM933      文献标识码:A

Detection Algorithm and Verification System of Transformer

Working Condition Based on Voiceprint Recognition

ZHANG Ke1,YANG Kejun1,HUANG Wenli1 , WANG Chenglong1,

JI Kun2, ZHU Taiyun3, DING Guocheng3, ZHEN Chao3

(1.Anhui NARI Jiyuan Power Grid Technology Co., Ltd., Hefei,Anhui 230088, China;

2.State Grid Anhui Electric Power Co., Ltd., Hefei,Anhui 230061, China;

3.Electric Power Research Institute of State Grid Anhui Electric Power Co., Ltd., Hefei,Anhui 230088, China)

Abstract:Through the acquisition, processing and characteristic analysis of voiceprint signal of large power transformer (reactor), this paper proposes a detection and recognition algorithm model and system of transformer working condition based on voiceprint recognition technology, which can judge and detect the working state of transformer. Firstly, 73 groups of transformer audio including 1800 minutes are collected by voice acquisition sensor. And then the noise of the collected transformer voiceprint is processed by segmenting, framing and windowing pretreatment methods. Secondly, the features of transformer voiceprint are extracted and effectively fused by using energy feature, frequency feature, Mel frequency cepstrum coefficient and frequency compression method. Finally, in order to solve the problem of additive superposition of sound from stable working condition and unstable instantaneous noise of transformer, this paper proposes a separation method of voice print superposition based on cosine similarity algorithm, and establishes transformer working condition detection and verification analysis system.

Key words:voiceprint recognition; transformer; working condition detection; verification system

实践表明,大型电力变压器(电抗器)受内部放电、过热、绕组变形、机械部件松动及设备绝缘老化等潜伏性故障因素的影响,随着时间积累会導致在运行过程中出现严重故障。传统的人工判断方法是通过用人耳听取设备运行声音来判断故障类型与故障位置。此类方法具有一定的局限性、模糊性、主观性并缺乏持久性,具体表现为不同技术人员对变压器故障的判断标准可能存在不一致,且一些细微的声音信号无法判定,需要一定知识与经验的积累。由于电力变压器(电抗器)潜伏性故障普遍存在于内部,且难以通过人工方法进行快速、高效、可靠的检测,因此有必要深入系统研究并建立电力变压器(电抗器)噪声的声纹在线监测方法、技术与测试系统,借助高灵敏度的传感测量和现代语音识别技术,使得通过监测声纹信息判断电力变压器(电抗器) 的运行状态成为一种可能。

长久以来,电力变压器(电抗器)的声纹信号被当作噪声而忽略了其价值。电力变压器(电抗器) 不同的故障类型影响着电力变压器(电抗器)的振动状态,进而会产生不同的声波信号,因此应用声纹传感器装置可采集变压器运行中的持续声纹信号,通过对声纹信号的分析与识别可实现对电力变压器(电抗器)的工况检测与诊断。另一方面,现有文献研究的内容往往集中在对电力变压器(电抗器)振动和声音信号本身特性的分析[1-4],对于如何运用语音智能识别技术实现变压器工况检测及系统验证的研究较少,尤其是电力变压器(电抗器)的声纹语料信息库匮乏,同时缺乏系统性的试验分析数据。因此,迫切需要开展相关技术研究,从而为基于人工智能的大型电力变压器(电抗器)声纹识别和故障主动预警技术研究与应用提供理论依据。

为此,基于声纹识别技术,提出一种变压器工况检测及验证系统。通过实地记录现场运行大型电力变压器(电抗器)声纹信号,建立声纹信息语料样本库,并对电力变压器(电抗器)声纹语料库所产生的声纹信号进行分析,从中提取电力变压器(电抗器)设备的运行声纹特征,最后对不同工况进行判别,建立一套变压器工况检测与验证分析系统。其体现在完成在线监测的同时,能够实现非接触式检测,声纹传感器布置方式比较灵活,采集信号时不产生电磁信号,不会干扰设备的正常运行。

1 相关工作

所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。说话人识别又称声纹识别(Voiceprint Recognition),即通过声音来识别“谁在说话”,其目的是让机器听懂人类的语音。主要任务包括:语音信号处理、声纹特征提取、声纹建模、声纹比对、判别决策等。它是一个涉及模式识别、信号处理、物理声学、生理学、心理学、计算机科学和语言学等多个交叉学科的研究。其主要的理论依据是每一个声音都具有独有的特征,通过该特征将不同人的声音进行有效的区分。国外相关机构研究表明[5-6],在某些特定的环境下声纹可以用来作为有效的证据。随着技术的发展,声纹识别技术的研究逐步成为热点之一,相关成果已经被应用到家电、工业、移动通信类产品中。

最早声纹识别技术研究是由贝尔实验室在1952年所建立的10位数字识别系统[5]。由于隐马尔可夫模型(Hidden Markov Model,HMM)模型能够很好地描述语音信号的短时平稳特性[6],基于HMM方法为代表的统计模型方法研究一直是语音识别的主流方法。随后基于GMMHMM模型,Lee等人[7]提出的SPHINX系统,其中GMM(Gaussian Mixture Model)用来对语音的观察概率进行建模,HMM则对语音的时序进行建模。

2006年Hinton等人[8]提出深度置信网络(Deep Belief Network,DBN)解决了深度神经网络训练过程中容易陷入局部最优的问题,从此拉开深度学习在声纹识别中的研究热潮。随后Mohamed等人[9]将DBN应用在声纹识别建模中,并且在TIMI语音识别数据库中取得了较好的结果。2011年DNN(Deep Neural Network) [10]在连续语音大样本中识别上取得10年来最大突破。此后,相比传统GMMHMM声学模型,基于DNNHMM声学模型[11-13]逐步成为研究热点,并且在多种语言、多种任务的语音分析与识别结果上取得了大幅度提升。

随着语音识别技术的快速发展,近年已有学者将声纹识别技术运用到对电力设备进行故障检测的研究中。依据变压器铁芯及绕组噪声及振动机理,余长厅等人[14]建立110 kV变压器振动噪声测量系统,该系统可以初步实现声纹噪声源定位和振动信号特征分析。由于电力变压器运行中的声音信号包含大量变压器运行状态声纹特征,刘云鹏等人[15] 提出一种基于50 Hz倍频倒谱系数和门控循环单元的变压器直流偏磁声纹识别模型。由于变压器在不同工况下的振动声信号不同[16-17],张重远等人[18]提出了一种基于Mel时频谱卷积神经网络的变压器铁芯声纹识别模型,在对3种不同工况的声信号识别率达到了99.71%。吴晓文等人[19]利用小波包分析方法结合谱减法语音增强技术滤除环境噪声,提出了一种特高压交流变电站可听噪声分离方法。王丰华等人[20]通过对变压器声纹信号梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征向量加权降维,同时应用矢量量化(Vector Quantization,VQ)算法提出一种变压器声纹识别模型,通过以10 kV 变压器为对象进行空载试验,取得了较好测试结果。

2 变压器声纹采集、预处理与特征提取

2.1 数据采集

目前对于适用于变压器(电抗器)声纹采集的设备相对较少,采用安徽南瑞继远电网技术有限公司自主设计的基于麦克风阵传感器电力变压器(电抗器)声纹采集设备来进行声纹语料采集,如图1所示。主要优势:能够充分利用声音信号的时空特性,具有较强的抗干扰能力,对变压器背景噪声、声源定位和跟踪具有很好的适应性。

2.2 变压器声纹数据预处理

首先,对采集的变压器音频分段操作。为了使输入的变压器音频都包含统一时长的信息,需要对时长进行限制。通过需要对获得的变压器音频数据进行分段切分。由于变压器声纹数据是一系列离散点,每个点对应一个采样点,故声纹数据的总长度为:

其次,对已经分段的变压器音频数据进行分帧处理。“帧”是声音信号处理的最小单位,其具有足够短的时长,也包含足够多的声音特征。一般认为声音信号在长时间内呈现多变性,在短时间内呈现不变性。即在极短时间内,可以将声音的特征看成是固定不变的。基于这种思想,对整个变压器声纹数据进行进一步切分。在语音信号处理中,一般将帧长设为50 ms,步长一般为1/2或1/3帧长。通过实验分析,变压器声纹相对语音声纹,其变化较少,因此,将变压器声纹帧长设为500 ms,步长设为1/2帧长,以减少数据处理的运算量。

最后,对分帧后变压器音频加窗处理。分帧在减少运算量的同时也会对声音信号带来不好的影响,其直接对音频波形进行简单切分(矩形窗),导致其在边界出现锐利的高频信号,其一般表现为在频谱中高频谐波分量增加,出现吉布斯效应,对后续信号处理产生不利影响。为了减少这种影响,需要对分帧数据进行端点平滑的加窗处理,使用Hamming窗对帧进行加窗处理。Hamming窗的函数为:

2.3 变压器声纹特征提取

2.3.1 能量特征

图2中显示的是变压器运行声音数据的时域谱线,即时间与波形振幅对应关系。在声音信号分析中,瞬时波形的振幅对应数据瞬时的能量,因此当振幅越大时,其能量越大。由图2可知,该数据在起止处出现了两次峰值,分析可知这两处出现了较大的摩擦声。该方法虽然能够直观地展现较大能量杂音出现位置,但是在其他时域中无法区分声音异常,能量特征无法单独检测杂音位置,需要进一步使用其他方法分析。

2.3.2 频率特征

为更深入分析变压器声音波形振动特征,一般认为任何一段声音可以分解为一系列不同周期与幅度的三角函数(正弦函数、余弦函数)的叠加。使用一系列三角函数的频率与幅度来表达这段声音的特征,这种对应关系与时间无关,而与频率有关,故与时域谱对应称为频域。时域向频域的变化使用傅立叶变换(Fourier Transform)实现。傅立叶变换的公式为:

其中f(t)为时域周期函数,F(ω)为其傅立叶变换后得到的频域函数。图2所示的时域波形经过傅立叶变换得到如图3所示的频域波形。

2.3.3 梅尔系数

梅尔频率是模拟人耳听觉特性,其在低频范围内增长速度很快,但在高频范围内,增长速度很慢。频率与梅尔频率的对应关系如下公式:

梅尔频率转换与特征提取,一般是使用梅尔滤波器组实现,其一般包含一串按照梅尔频率转换关系设置的三角滤波器,每个滤波器在梅尔频率中拥有相同的带宽fmelband=mel(fh)-mel(fl)N+2,其中fh与fl为频率范围的最高频与最低频。

在4000 Hz内使用24个梅尔滤波器进行实验,500 ms为帧长的梅尔频率系数如图4。之后经过离散余弦变换(DCT)得到MFCC:

2.3.4 频率压缩

虽然梅尔频率系数有降维优势,且高频压缩效果非常出色,但依然存在着低频分辨率不足的问题,即在低频中其分辨率即使已经与变压器工作频率对应,也无法分辨非正常工作频率的信号,这将导致虽然其能够较正确地判断当前变压器的工作特征,但是无法准确判断是否存在非正常工作频率的噪声,因此需要进一步增加低频分辨率基于梅尔频率“分辨率从高到低变化”的思想,使用类似的频率压缩策略,可分为以下三步:

Step1:将声音信息分为低频、中频、高频三个频段;

Step2:对三种频段使用不同的频率压缩比例;

Step3:压缩取值采取最大值策略,选取每个压缩区间最大值作为压缩结果。

3 变压器声纹相似度检测算法

假设采集的变压器工况声音是由稳定工作状况发出的声音与不稳定的瞬时杂音加性叠加的,忽略可能存在的互相干扰。同时在变压器声纹实验中进行如下假设:

假设1:一段音频应该在绝大部分时间是相似的,即不稳定信号相比之下非常少,且与稳定信号区别很大。

假设2:持续出现的杂音,当其出现频率大于帧采样频率(实验使用2 Hz,即500 ms/帧)时,可以认为是一种稳定的信号。

假设3:不稳定信号应该是瞬时出现的信号,或者短时间持续出现的信号,或者间隔大的信号。

在假设1中,使用余弦相似度算法来计算音频中每个特征向量的相似度。余弦相似度是一種通过计算两个向量的夹角余弦值在评估相似度的算法,根据欧几里得向量点积公式:

其中θ为向量A与B在空间中的夹角,可以得到向量A=[A1,A2,…,AN]与B=[B1,B2,…,BN]的相似度为:

为了将一段音频分离成稳定部分与不稳定部分,提出相似度置换算法:

4 系统及实验分析

在变压器声纹采集、处理、特征提取及分离检测算法基础上,构建一个拥有用户界面的变压器工况检测与验证系统,其可以由用户选择输入音频,并根据情况设置各个分析部分的阈值,最终输出该音频的分析结果,系统界面如图6所示。

在使用上述驗证系统基础上,得到一个近似的稳定向量组,根据之前的稳定与不稳定加性叠加假设,通过直接做差值计算,就可以获得对应的不稳定向量组。通过对变压器实验结果分析,如图7所展示变压器运行不同时段音频的音频分离效果。

(a)原始变压器音频

(b)稳定变压器音频

(c)不稳定变压器音频

5 结 论

通过对73组变压器1800 min音频的分析,提出一种基于声纹识别技术的变压器工况相似度计算方法,初步搭建并实验完成了变压器声纹检测中的工况判断流程,构建研发可视化用户操作系统,并提供了异常杂音分析与检测功能。未来工作将主要集中在提高变压器运行故障识别算法的精度与时效性,进一步完善变压器工况检测验证系统的功能。目前尽管从理论上可以增加变压器长期工况追踪判断功能,但是由于缺少同一变压器的长期观察数据,因此现有系统无法验证其稳定运行的可行性。下一步除了加大对同类型变压器运行时不同的潜在故障类型语料数据样本的采集与获取力度外,还需加强不同类型变压器运行声纹数据语料库建设,为基于声纹识别技术在变压器工况检测的应用提供大数据的样本积累。

参考文献

[1] 辛晓虎,李继胜,纪海英,等.用于变压器中局部放电定位的十字形超声阵列传感器研究[J].中国电机工程学报,2013,33(21):154-162.

[2] 祝丽花,杨庆新,闫荣格,等.考虑磁致伸缩效应电力变压器振动噪声的研究[J].电工技术学报,2013,28(4):1-6.

[3] 莫娟,刘吉轩,苏俊收,等.大型电力变压器的噪声预估研究[J].高压电器,2014,50(6):32-44.

[4] 王学磊,张黎,李庆民,等.电力变压器有源降噪中次级声源的参数优化分析[J].高电压技术,2012,38(11):2815-2822.

[5] DAVIS K H, BIDDULPH R, BALASHEK S. Automatic recognition of spoken digits[J]. Journal of the Acoustical Society of America, 1952, 24(6): 637.

[6] RABINER L R. A tutorial on hidden Markov models and selected applications in speech recognition[J]. Readings in Speech Recognition, 1990,77(2):267-296.

[7] LEE K F, HON H W. An overview of the SPHINX speech recognition system[J]. IEEE Transactions on Acoustics, Speech,and  Signal Processing Speech, 1990, 38(1):35-45.

[8] HINTON G E, OSINDERO S, TEH Y W. A fastlearning algorithm for deep belief nets[J]. Neural Computation, 2006,18(7):1527-1554.

[9] MOHAMED A, DAHL G, HINTON G E. Deep belief networks for phone recognition[C]//Nips Workshop on Deep Learning for Speech Recognition and Related Applications. 2009,1(9): 39.

[10]YU D, DENG L. Deep learning and its applications to signal and information processing[J]. IEEE Signal Processing Magazine, 2011,28(1):145-154.

[11]DAHL G E, YU D, DENG L, et al. Contextdependent pretrained deep neural networks for large vocabulary speech recognition[J]. IEEE Transactions on Audio, Speech and Language Processing, 2012,20(1): 30-42.

[12]CHINTON G, DENG L, YU D, et al. Deep neural networks for acoustic modeling in speech recognition: the shared views of four research groups[J]. IEEE Signal Processing Magazine, 2012,29(6): 82-97.

[13]ABDELHAMID O, MOHAMED A R, JIANG H, et al. Convolutional neural networks for speech recognition[J]. IEEE/ACM Transactions on Audio,Speech,and  Language Processing, 2014,22(10): 1533-1545.

[14]余長厅,黎大健,陈梁远,等.基于声纹及振动的变压器故障诊断技术研究[J].高压电器,2019,55(11):248-254.

[15]刘云鹏,王博闻,岳浩天,等.基于50 Hz倍频倒谱系数与门控循环单元的变压器偏磁声纹识别[J].中国电机工程学报,2020,40(14): 4681-4694.

[16]吴晓文,周年光,彭继文,等.电力变压器噪声特性与相关因素分析[J].电力科学与技术学报,2018,33(3):81-85.

[17]陈青恒,马宏彬,何金良.直流偏磁引起的500 kV电力变压器振动和噪声的现场测量与分析[J].高压电器,2009,45(3):93-96.

[18]张重远,罗世豪,岳浩天,等.基于Mel时频谱卷积神经网络的变压器铁芯声纹模式识别方法[J].高电压技术,2020,46(2):413-423.

[19]吴晓文,周年光,裴春明,等.特高压交流变电站可听噪声分离方法[J].高电压技术,2016(8):2625-2632.

[20]王丰华,王邵菁,陈颂,等.基于改进MFCC和VQ的变压器声纹识别模型[J].中国电机工程学报,2017,37(5):1535-1543.

高级模式
B Color Image Link Quote Code Smilies

QQ|Archiver|手机版|小黑屋|云科服论坛

GMT+8, 2024-12-22 16:00 , Processed in 3.600103 second(s), 31 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表