異步電機的矢量控制因其穩定可靠、響應速度快等優點,在工業場合中得以大量應用。特別是近年來,異步電機的間接矢量控制(Indirect Field Oriented Control,IFOC)在電動汽車領域的使用上越來越廣泛。在IFOC中,異步電機的輸出性能與電機參數密切相關,因此有必要對異步電機的參數進行辨識和標定。
在電動汽車電機控制領域,參數標定任務并不完全等同于傳統的電機參數辨識任務。傳統的參數辨識方法是在電機控制系統建模的基礎上,使用現代控制理論對系統模型參數進行辨識,所辨識出的數值即為電機的模型參數值。
然而,在電動汽車電機控制領域中,目標有所不同:為了提高整車的動力特性以及延長整車的續航里程,一般希望辨識出的參數能使電動汽車電機在任意給定轉速和給定電流下盡可能地輸出最大轉矩和最高效率。
以往的研究表明,在電機運行過程中,能使電機運行在最優轉矩狀態的參數往往并非固定的電機模型參數,而是隨著電機運行工況的不同而發生變化的值。因此,電動汽車電機在安裝之前,一般會在電機測試臺架上對電機進行測試,根據電機不同的轉速以及不同的電流對電機的參數進行更精細的調整,以確定不同工況下的電機參數最優值,再將這些參數以表格的形式存儲至電機控制器中,以供在電機運行的過程中進行查詢,上述的過程稱之為電動汽車電機的參數標定過程。
以往的電動汽車電機參數標定多采用人工標定法,對工程師的技術要求高、工作強度大、標定周期長、標定精度也不夠理想。因此,如何減少電機參數標定的工作量是近年來電動汽車電機控制領域急需解決的問題。
為解決上述問題,安徽大學電氣工程學院的研究人員介紹了一種研究基于深度確信策略梯度(Deep Deterministic Policy Gradient,DDPG)的電動汽車異步電機參數標定方法。DDPG是近年來提出的一種適用于連續狀態和連續動作空間的深度強化學習算法,采集合適的電機信號作為算法的觀測值和獎勵值送入DDPG,并設計合適的動作策略,便可以對電機的任意狀態進行電機參數的自動標定。
DDPG方法是一種數據驅動型參數標定方法,相比于其他方法,基于DDPG的電動汽車電機參數標定方法的優勢在于:
(1)與傳統電機參數辨識方法獲取的電機模型參數不同,DDPG標定的電機參數是使電機在任意給定轉速和給定電流下都能輸出最優轉矩的參數,同時標定參數的精度不會受到模型誤差和外部干擾的影響,因此更加適合于電動汽車電機控制領域的要求。
(2)與人工標定方法相比,DDPG的參數標定方法是一種端到端的方法,即所有電動汽車工況下的電機參數標定工作均由算法自動完成,無需人類工程師進行輔助操作,因此大大減少了標定工程師的工作量。
研究人員使用了這種連續動作域的深度強化學習方法即深度確信策略梯度(DDPG)的方法,去實現電動汽車異步電機的參數標定任務,并總結如下:
1)該研究成果雖然只局限于電動汽車的離線參數標定,但是標定的結果仍可用于基于轉矩最優的電機參數在線辨識方法。
2)該研究成果雖然只適用于電動汽車異步電機的參數標定,但是只要采用合適的觀測和獎勵值,該方法也適用于其他類型的參數標定,如永磁同步電機、開關磁阻電機等。
3)該研究方法只討論采用輸出轉矩作為獎勵,后續的工作中將會闡述采用其他的信號作為獎勵時,電機所呈現出的獨特性能。
以上研究成果發表在2020年第20期《電工技術學報》,論文標題為“基于深度確信策略梯度的電動汽車異步電機參數標定方法”,作者為漆星、鄭常寶、張倩。