中國儲能網(wǎng)訊:
本文亮點:(1)為準確描述電池的老化機理,從電池充電數(shù)據(jù)提取6個HFs,分為時間、能量、IC三類特征;(2)為降低同類型特征之間的信息冗余,采用雙相關性特征處理方法,篩選出代表性更強的組合HFs;(3)針對傳統(tǒng)SOH估計模型依賴大量HFs測試數(shù)據(jù)的問題,提出一種基于LSTM-XGBoost模型的SOH估計方法來預估電池SOH。
摘 要 準確評估鋰離子電池健康狀態(tài)(state of health, SOH)對保證電動汽車的安全穩(wěn)定運行至關重要。然而,傳統(tǒng)SOH估計方法在有效提取健康特征(health features, HFs)和依賴大量特征測試數(shù)據(jù)上面臨一些挑戰(zhàn)。為此,本文提出一種基于多特征量分析和長短期記憶(long short-term memory, LSTM)-極端梯度提升(eXtreme gradient boosting, XGBoost)模型的鋰離子電池SOH估計方法。首先,為準確描述電池的老化機理,從電池充電數(shù)據(jù)中提取關于時間、能量、IC三大類共6個HFs??紤]到同類型HFs之間存在大量冗余信息,采用一種基于雙相關性的特征處理方法,篩選出可準確表征電池退化趨勢的組合HFs。其次,針對傳統(tǒng)SOH估計模型需要大量HFs測試數(shù)據(jù)的問題,提出一種基于LSTM-XGBoost的SOH估計模型。在該模型中,采用LSTM算法來預測電池剩余循環(huán)次數(shù)的HFs數(shù)據(jù)。同時,為解決LSTM模型進行HFs預測時計算效率不高的問題,采用LSTM-XGBoost模型進行電池SOH估計。利用NASA電池數(shù)據(jù)集進行驗證,結(jié)果表明,所提出方法在不同測試數(shù)據(jù)量下能準確估計鋰電池的SOH,且均方根誤差保持在1%以內(nèi),具有較高的估計精度和魯棒性。
關鍵詞 鋰離子電池;健康狀態(tài);特征分析;長短期記憶神經(jīng)網(wǎng)絡;極端梯度提升
鋰離子電池以其循環(huán)壽命長、安全性高和能量密度大等優(yōu)點,在電動汽車領域得到廣泛應用。電池SOH作為電池管理系統(tǒng)中的主要監(jiān)測數(shù)據(jù)之一,反映了鋰電池的衰退情況。因此,為確保電動汽車安全運行,獲得準確可靠的鋰離子電池SOH顯得至關重要。
目前電池SOH估計方法大致可分為直接測量法、模型驅(qū)動方法和數(shù)據(jù)驅(qū)動方法。直接測量方法通過測量電池容量、內(nèi)阻等參數(shù)來獲取SOH,但依賴于準確的充放電記錄和海量實驗數(shù)據(jù)。模型驅(qū)動法主要包括電化學模型和等效電路模型。電化學模型具有明確的物理意義,但參數(shù)辨識復雜不太適用于在線SOH估計。等效電路模型常與濾波算法結(jié)合,將SOH估計問題轉(zhuǎn)換為參數(shù)估計問題。然而,此方法的估計精度易受到參數(shù)辨識和濾波算法的困擾。數(shù)據(jù)驅(qū)動方法不需要深入的機理研究就能夠描述電池復雜的衰退過程,受到眾多研究者關注。該方法應用電池的歷史數(shù)據(jù),將外部特性映射到電池的放電容量,并利用機器學習等智能算法構建特征和SOH 的非線性映射模型,以實現(xiàn)準確的SOH估計。
近些年來,數(shù)據(jù)驅(qū)動法研究重點主要集中在特征提取、特征處理和估計模型三個方面。在特征提取方面,Mao等人基于電池反復充放電循環(huán)中充電時間逐步減少的特點,選擇等時間間隔的電壓差作為HFs。Zhang等以電池恒壓充電階段逐漸減小的電流作為原始數(shù)據(jù),選定和時間、面積相關等五類特征作為HFs。增量容量分析(ICA)法是將電壓曲線平臺區(qū)域轉(zhuǎn)換為增量容量(IC)曲線的方法,其曲線峰值直觀地展現(xiàn)電池老化的特性。李樂卿等分析了電池充放電數(shù)據(jù),發(fā)現(xiàn)電池IC曲線半峰面積與壽命衰減存在較強的映射關系。
在特征處理方面,相關性分析常被用于衡量各HFs與電池SOH的關聯(lián)程度。Ma等在充放電階段提取關于電壓、電流共15個HFs,并使用Spearman相關系數(shù)來計算HFs與SOH的相關性。然而,同一類別的HFs與電池SOH的關聯(lián)度都很高,這可以歸結(jié)于同類別特征之間存在信息冗余,容易重復關鍵信息。如果將這些HFs全部輸入估計模型,會增加模型的計算復雜度。
在估計模型方面,機器學習法已被廣泛應用于SOH估計。Li等提出一種基于最小二乘支持向量機(LSSVM)框架的退化模型,用于快速估計鋰電池的SOH。但機器學習方法難以提取數(shù)據(jù)的時間相關性特征和深度特征,限制了對SOH估計精度的提高。深度學習在建立非線性映射方面具有優(yōu)良的效果,常見的深度學習算法包括卷積神經(jīng)網(wǎng)絡、LSTM網(wǎng)絡等。Gao等將HFs輸入到LSTM網(wǎng)絡中以實現(xiàn)鋰電池SOH的估計。然而,LSTM網(wǎng)絡在處理大規(guī)模電池數(shù)據(jù)集時,會增加訓練的時間成本,估計精度也會受到影響。XGBoost作為一種高效的集成學習算法,表現(xiàn)出了顯著的非線性擬合能力,近年來在電池狀態(tài)評估等領域得到了深入的研究和應用。Chen等利用XGBoost算法構建SOH估計模型,并在三種類型的電池數(shù)據(jù)集驗證了模型的有效性。
如上文所述,現(xiàn)有的SOH估計方法在特征提取及依賴大量測試數(shù)據(jù)方面受到一定限制。首先,現(xiàn)有的特征提取方法所得到的HFs類型單一,缺少對特征的多角度綜合分析。其次,同類型HFs之間存在信息冗余的問題,需要開發(fā)一種簡單、有效的特征處理方法來篩選出代表性更強的HFs。為克服上述問題,本文提出了一種基于多特征量分析和LSTM-XGBoost模型的鋰離子電池SOH估計方法,其主要貢獻包括:①準確描述電池的老化機理,從電池充電數(shù)據(jù)提取6個HFs,分為時間、能量、IC三類特征;②降低同類型特征之間的信息冗余,采用雙相關性特征處理方法,篩選出代表性更強的組合HFs;③針對傳統(tǒng)SOH估計模型依賴大量HFs測試數(shù)據(jù)的問題,提出一種基于LSTM-XGBoost模型的SOH估計方法來預估電池SOH。
1 SOH定義與HFs的提取
1.1 電池SOH
電池充放電過程是一個高度動態(tài)非線性過程,且SOH是一個隨時間減小的變量。鋰離子電池容量可以直接反映電池性能的退化情況,見表達式(1):
式中,Ct、C0分別表示電池第t次循環(huán)的容量和標稱容量。
1.2 電池數(shù)據(jù)集
本文所用的鋰離子電池老化數(shù)據(jù)來自美國國家航空航天局(NASA)的電池公開數(shù)據(jù)集。本文選取編號為B0005、B0006、B0007的電池測試數(shù)據(jù)進行實驗分析,三組電池均在室溫下以1.5 A進行恒流充電,電壓升高到4.2 V后在恒壓模式下繼續(xù)充電,至電流降至20 mA。在靜置兩小時后,三組電池以2 A恒流工況進行放電。三組電池容量退化曲線如圖1所示。
圖1 電池容量退化曲線
1.3 健康特征量的分析與提取
由圖1可以看出,電池容量隨循環(huán)次數(shù)的增加呈非線性下降,此外曲線表現(xiàn)出局部波動和容量再生特性對SOH的估計有很大影響。因此,本文從電池充電階段的電壓、電流中提取時間、能量、IC三類特征,分別列為HF1~HF6,用于描述電池退化程度,如圖2所示。
圖2 本文提取的HFs
1.3.1 時間HFs
如圖2(a)所示,充電時間作為電池的監(jiān)測參數(shù)之一,當SOH降低時充電時間在CC階段減少,在CV階段增加,可以直觀地反映電池的老化情況。因此,選擇等壓差充電時長(TCVDC)和等流差充電時長(TCCDC),分別作為表征電池退化過程的時間特征HF1和HF2:
式中,k是循環(huán)次數(shù),t1(k)、t2(k)分別對應每次循環(huán)中電壓上升至3.8 V和4.2 V的時間點。t3(k)、t4(k)分別對應每次循環(huán)中電流從1.5 A下降至0.5 A的時間點。
1.3.2 能量HFs
鋰電池的充放電過程是電能和化學能之間的能量轉(zhuǎn)換,隨著充放電循環(huán)次數(shù)的增加,電池內(nèi)的能量會逐漸減少。因此,將等壓差充電能量(ECVDC)、等流差充電能量(ECCDC)分別作為表征電池退化過程的能量特征HF3和HF4。
式中,Vk(t)和Ik(t)分別表示充電階段的電壓和電流。
1.3.3 IC曲線HFs
增量容量分析法通過將電壓、容量進行微分處理把電壓平緩曲線中的平臺區(qū)域轉(zhuǎn)換為IC曲線中可識別的峰值??紤]到NASA數(shù)據(jù)集中沒有收集實時的容量數(shù)據(jù),而在CC階段電流幾乎不變,因此本文使用電流和時間差來計算容量變化,如式(6)所示:
式中,It為第t時刻電流;Vt,Vt-1為第t和t-1時刻的電池端電壓。
圖2(b)顯示了IC曲線與電池電壓的關系??梢园l(fā)現(xiàn),隨著循環(huán)次數(shù)的增加,代表電池電極相變位置的曲線峰值逐漸減小并向右移動,造成此現(xiàn)象的原因是電池老化過程中內(nèi)部活性物質(zhì)嵌入鋰的能力逐漸下降。故本文提取IC峰值(ICP)及其峰值電壓(VP)分別作為IC曲線的HF5和HF6。
三類表征電池退化過程的HF1~HF6經(jīng)歸一化處理后如圖3所示。
圖3 三組電池的HFs
1.4 基于雙相關性的特征處理方法
1.4.1 理論分析
同一類型特征之間可能存在信息冗余,容易重復關鍵信息。為篩選出同一類型特征中最具代表性的HFs,本文提出一種雙相關分析方法來得到反映電池SOH的組合HFs。步驟如下:①采用公式(7)、式(8)計算各HFs與電池SOH的灰色關聯(lián)度;②選擇三類特征相關度中最高的HFs定義為主要HFs;③再使用灰色關聯(lián)度分析法計算主要HFs與其他兩類HFs之間的相關度,將兩類特征中相關度最高的兩個HFs定義為次要HFs;④將主要HFs和兩個次要HFs作為篩選出的組合HFs,輸入至估計模型中。
式中,zo(k)為SOH序列,zi(k)為HFs序列,k=1,2…n;ρ為分辨系數(shù)?;疑P聯(lián)度γi為ξi(k)的平均值,數(shù)值大小越接近于1,SOH序列與HFs序列間的關聯(lián)度就越高。
1.4.2 特征處理結(jié)果
表1評估了三類HFs與SOH之間的相關程度,得到每塊電池的主要HFs。表2展示主要HFs與其他兩類HFs之間的相關度,并確定次要HFs。主要和次要HFs的分析旨在篩選出最具代表性且信息豐富的HFs。其中,主要HFs是與SOH密切相關的關鍵因素,而次要HFs則為主要HFs提供了補充和支持,使得組合HFs包含信息更加全面、可靠。
表1 三類HFs與SOH的相關程度
表2 主要HFs與次要HFs的相關程度
在表1中,代表三組電池主要HFs的灰色關聯(lián)系數(shù)均大于0.94,與SOH具有較強相關性。由表2可知,三組電池主要HFs與次要HFs之間的灰色關聯(lián)度均大于0.92,其中B0005號電池的主要HFs(HF5)與次要HFs(HF1、HF3)的相關性分別達到0.9817、0.9513,這表明本文方法所篩選的組合HFs可以很好表征電池的退化趨勢。
2 基于LSTM模型的特征預測方法
現(xiàn)有SOH估計方法僅能通過已采集電池數(shù)據(jù),估計當前循環(huán)的SOH。本文將已提取的組合HFs輸入至LSTM模型,利用LSTM模型強大的時間序列建模能力,對組合HFs包含的主要HFs和次要HFs分開預測,在有限的電池數(shù)據(jù)情況下擴充HFs數(shù)據(jù)集,得到全周期的組合HFs數(shù)據(jù)。
2.1 LSTM神經(jīng)網(wǎng)絡
LSTM網(wǎng)絡通過輸入門、遺忘門和輸出門更新或者丟棄歷史信息,這使得LSTM獲得了長期記憶能力,特別適用于像HFs這樣長序列的預測。其公式如下:
式中,Xt、ht分別為t時對應的輸入和隱藏狀態(tài);⊙表示同或運算;Wxi,Wxf,Whi,Wxo,Whi,Whf,Who,Whc是權重矩陣;bi,bf,bo,bc是偏置矢量;σ為Sigmoid激活函數(shù)。
2.2 特征預測結(jié)果
為了在有限的電池數(shù)據(jù)情況下擴充HFs數(shù)據(jù)集,得到全周期下的HFs數(shù)據(jù)。以B0005電池(共168次充放電循環(huán))為例,將起始預測分隔點設置為第80次循環(huán),即將組合HFs包含的一個主要HFs和兩個次要HFs前80次循環(huán)數(shù)據(jù)輸入至LSTM模型中,以預測得到三個HFs后88次循環(huán)的特征數(shù)據(jù)。通過此方法,可以減少對后88次循環(huán)特征數(shù)據(jù)的實際采集成本。模型訓練過程中,超參數(shù)神經(jīng)元個數(shù)和訓練次數(shù)分別設置為100和150;學習率和正則化參數(shù)分別設置為0.008和0.0006。后88次循環(huán)組合HFs的預測結(jié)果如圖4所示。為了評估所提出預測方法的性能,采用平均絕對誤差(MAE)、平均絕對百分誤差(MAPE)和均方根誤差(RMSE)三種指標進行分析。
圖4 三組電池組合HFs的預測結(jié)果
從圖4三組電池組合HFs的預測結(jié)果中可以看到,LSTM模型預測的后88次循環(huán)特征曲線基本上與真實曲線重合,在局部波動區(qū)域也能準確跟隨真實數(shù)值。此外,為了驗證LSTM模型的準確性和可靠性,將預測得到的HFs與真實HFs進行誤差比較,結(jié)果如表3所示,各個HFs預測值的MAE均小于0.8%。這表明特征預測方法在精度和泛化性方面表現(xiàn)良好,能夠通過準確預測不同電池的主要和次要HFs,得到精度較高的組合HFs預測值。
表3 三組電池預測的后88次循環(huán)組合HFs誤差
3 基于XGBoost模型的SOH估計方法
3.1 XGBoost模型
XGBoost具有計算效率高的優(yōu)勢,為實現(xiàn)電池SOH的準確、快速估計,將組合HFs的預測結(jié)果作為XGBoost模型的輸入,建立特征和SOH的映射關系。XGBoost算法由不同的決策樹組成,其核心是學習一個新的函數(shù)f(x)來擬合最后預測的殘差。在鋰電池SOH的回歸預測問題上,該算法的目標是使所有樹的預測值圖片盡可能接近真實值SOHi。
3.2 所提出的SOH估計方法
本文提出SOH估計方法框架如圖5所示。第一步:數(shù)據(jù)采集與特征提取。從電池恒壓恒流充電階段數(shù)據(jù)中,提取關于時間、能量、IC曲線相關特征。第二步:特征分析與處理。通過雙相關性分析方法篩選出主要HFs、次要HFs,得到更具有代表性的組合HFs。第三步:特征預測。將分隔點之前循環(huán)的組合HFs數(shù)據(jù)作為LSTM模型的輸入,得到電池剩余循環(huán)次數(shù)的組合HFs預測數(shù)據(jù)。第四步:SOH估計與性能評估。將組合HFs的預測結(jié)果作為XGBoost模型的輸入,從而實現(xiàn)SOH的估計。并與其他模型比較,驗證本文方法的準確性與優(yōu)越性。
圖5 所提SOH估計方法框架
4 實驗結(jié)果與分析
4.1 不同預測起點的對比分析
為驗證所提方法在不同階段的有效性和準確性,將特征起始預測點分別設置為80、100和120,將不同比例的組合HFs預測數(shù)據(jù),輸入到XGBoost模型得到SOH估計值。
由圖6可知,基于本文方法對不同分隔點的SOH曲線能夠準確地跟隨真實SOH,同時也能捕捉到電池老化過程中的容量再生現(xiàn)象。在對B0005和B0007電池的SOH估計中,相對誤差基本保持在±3%以內(nèi)。而B0006電池的相對誤差較于其他電池有所增加,但仍然均小于6%。值得注意的是,SOH估計結(jié)果會受到組合HFs預測值和實際值之間誤差的影響,如果預測得到的HFs數(shù)據(jù)質(zhì)量不高,會增加SOH最終的估計誤差。然而,從表3中的組合HFs預測誤差可以看出每個HFs預測值的MAE均小于0.8%,這表明HFs預測值和實際值之間的誤差較小。結(jié)合表4可知,將預測得到的組合HFs作為模型輸入可能會增加一定的估計誤差,但采用本文方法的三組電池SOH最終估計誤差均小于1.5%,仍然具有較高精度。
圖6 第80、100和120次循環(huán)為分隔點的 SOH 估計結(jié)果
表4 第80、100和120次循環(huán)為分隔點的 SOH 估計誤差
4.2 不同估計模型對比
為進一步驗證所提出模型的有效性,在不同電池中采用徑向基函數(shù)(RBF)、SVM、LSTM以及LSTM-XGBoost模型進行SOH估計精度比較,且以第100次循環(huán)為分隔點。
圖7為四種模型對不同電池的SOH估計結(jié)果和誤差。相較于其他三種模型,使用本文模型進行SOH估計能夠持續(xù)捕獲實際SOH,尤其是在容量再生和局部波動階段。表5列出了三組電池使用不同模型估計SOH的誤差。其中,本文的LSTM-XGBoost模型的估計誤差最小。以B0007電池為例,該模型估計的MAE、MAPE和RMSE分別為0.3868%、0.5277%和0.5044%;而RBF模型的對應誤差分別為0.7312%、1.0245%、0.8934%;SVM模型的誤差分別為0.7155%、0.9761%、0.8099%。此外,LSTM模型的MAPE、RMSE分別為本文模型估計誤差的1.67倍、1.46倍。這是因為XGBoost作為一種集成學習算法,能夠整合多個弱分類器的預測結(jié)果,通過加權組合得到更準確的整體預測結(jié)果。以計算耗時為參考指標,采用本文所提出的XGBoost模型的三塊電池的計算耗時分別為4.30 s、4.41 s、4.24 s,相較于LSTM模型計算時間有顯著減少,但是比RBF、SVM模型略長。這是因為RBF和SVM模型在處理低緯度數(shù)據(jù)時的計算量相對較小,但這兩種模型的預估誤差比本文所提出的模型誤差要大很多。因此,本文所提出的XGBoost模型在準確度和有效性方面適宜于電池SOH估計。
圖7 不同模型的SOH 估計結(jié)果
表5 不同模型的估計誤差與計算量
5 結(jié) 論
針對傳統(tǒng)SOH估計方法存在特征提取不準、嚴重依賴大量特征測試數(shù)據(jù)問題,本文提出一種基于多特征量分析和LSTM-XGBoost模型的鋰離子電池SOH估計方法。首先從電池充電階段的電壓、電流和容量曲線上提取時間相關、能量相關以及IC曲線相關3類特征作為HFs;接著,提出一種雙相關性分析方法進行HFs數(shù)據(jù)處理,在消除同類特征間的冗余同時得到最具相關性和影響力的組合HFs;在此基礎上,為解決傳統(tǒng)SOH估計需要大量測試數(shù)據(jù)的問題,提出一種基于LSTM-XGBoost模型的SOH估計方法,并進行SOH估計。選取NASA數(shù)據(jù)集中B0005、B0006、B0007號電池為測試數(shù)據(jù)。為驗證所提估計方法魯棒性和準確性,以每塊電池前80、100、120次循環(huán)數(shù)據(jù)作為訓練集進行訓練,結(jié)果表明采用所提方法估計得到的SOH誤差MAE均低于1%。為了進一步驗證所提估計方法的優(yōu)越性,以三塊電池前100次循環(huán)數(shù)據(jù)為訓練集,與RBF、SVM及LSTM作比較,驗證了所提估計模型具有更高的精度,其每組SOH估計誤差RMSE和MAE分別在1%、0.8%以內(nèi)。