作為可再生的清潔能源,我國風力發電裝機容量不斷增加,成為繼火電、水電后的第三大能源。由于長期承受惡劣多變的運行環境,風電機組故障率較高,對電力系統的安全穩定運行造成很大影響,帶來巨大的經濟損失和安全隱患。
充分利用機組監控與數據采集系統(Supervisory Control And Data Acquisition, SCADA)提供的大量運行數據,在故障早期監測到風機狀態異常,則可為現場運維人員爭取更多的應急處理時間,有助于提高機組安全經濟性、降低運維成本。
目前,許多學者開展了基于SCADA數據的風電機組故障預警與診斷研究,基本思路有兩種:一種是從SCADA歷史數據中挖掘出已經發生的故障信息,據此建立故障辨識模型;另一種是從SCADA歷史數據中提取正常工況運行數據,建立風機是否異常的判定模型。前者側重于故障類型識別,需要大量故障信息,條件較難滿足;后者則側重于故障早期的異常狀態預警,與前者相比對運維人員更有指導意義。
有學者采用支持向量回歸(Support Vector Regression, SVR)和淺層神經網絡進行正常工況性能預測,并根據預測值與實際值之間的殘差與故障預警閾值的關系,提前進行異常預警。但受限于模型信息容量較小、泛化能力不足等原因,異常工況識別精度需要進一步提高。
由于深度神經網絡對于SCADA系統大數據具有更強的學習能力,因此在性能預測與故障預警領域日益受到重視。其中機器學習領域的XGBoost(eXtreme gredient boosting)算法因具有損失函數精確、模型準確度高、泛化能力強等優勢,常應用于風機故障診斷。有學者通過與樸素貝葉斯、隨機森林和支持向量機等算法比較,表明XGBoost算法運行速度較快,準確度更高,能精準識別風機故障類別。有學者使用XGBoost算法可以有效地診斷風機齒輪箱故障。
SCADA系統記錄的運行數據中既包含風機的正常運行數據也包含異常和故障發生時的數據及部分停機數據,建立正常工況風機性能預測模型時,需要將故障和停機數據加以剔除。此外,由于風速、風向、偏航角等測量信號具有時變性、隨機性和不確定性,數據中不可避免地包含噪聲和異常值、以及由于通信問題導致的空值和壞數據,為確保預測模型的精度,這些異常值需要加以清洗。
因此SCADA數據預處理是風機性能預測與狀態預警中重要的基礎性工作,已有很多文獻對此進行研究,提出了諸多數據清洗方法]。這些方法有的比較繁瑣,有的對數據集特征有一定要求,各有優缺點。
華北電力大學控制與計算機工程學院的研究人員針對風電機組異常工況早期預警開展研究,以某1.5MW風電機組為例,提出利用支持向量數據描述(Support Vector Data Description, SVDD)算法對SCADA數據進行預處理,再采用XGBoost建立正常性能預測模型,進而采用時間滑動窗口模型計算性能評價指標,合理確定預警閾值,最終實現風電機組運行狀態預警。
研究人員從機組監控與數據采集系統(SCADA)數據中選擇與轉速和發電功率密切相關的特征變量,利用SVDD算法對建模數據進行預處理,采用XGBoost建立風機正常性能預測模型。以所建預測模型為基礎,構建時間滑動窗計算性能評價指標,并根據統計學的區間估計理論合理確定風機性能異常預警指標閾值。采用某風電場1.5MW風電機組SCADA系統記錄的若干真實故障案例,開展異常工況預警仿真試驗。
他們的研究結果表明,基于SVDD和XGBoost的風機異常工況預警方法,可以有效地清洗數據,及時識別風電機組異常狀態,對于提高風電機組運行的安全性具有較好的工程實用意義。
本文編自2022年第13期《電工技術學報》,論文標題為“基于支持向量數據描述和XGBoost的風電機組異常工況預警研究”。