中國(guó)儲(chǔ)能網(wǎng)訊:
摘 要 準(zhǔn)確估計(jì)鋰離子電池(lithium-ion battery,LIB)的健康狀態(tài)(state of health,SOH)對(duì)于確保儲(chǔ)能電站的安全穩(wěn)定運(yùn)行至關(guān)重要。然而,現(xiàn)有的數(shù)據(jù)驅(qū)動(dòng)方法通常依賴手工特征提取,并且特征的時(shí)間尺度比較單一,很難進(jìn)行高效且精確的電池健康狀態(tài)評(píng)估。為了解決這些問(wèn)題,提出了一種基于多時(shí)間尺度建模自動(dòng)特征提取和通道注意力機(jī)制的健康狀態(tài)估計(jì)模型。該模型首先將充電過(guò)程信息輸入多個(gè)并行的膨脹卷積模塊(dilation convolution module,DCM),從不同時(shí)間尺度進(jìn)行自動(dòng)特征提取,獲得豐富且全面的特征表示。隨后,不同尺度的特征通過(guò)融合后結(jié)合門(mén)控循環(huán)單元(gated recurrent unit,GRU)提取時(shí)間序列的長(zhǎng)期依賴關(guān)系。模型進(jìn)一步融入通道注意力機(jī)制(efficient channel attention,ECA),對(duì)歷史信息進(jìn)行相關(guān)性動(dòng)態(tài)權(quán)重分配,關(guān)注顯著特征。最后,在兩個(gè)公開(kāi)數(shù)據(jù)集上驗(yàn)證了本方法的優(yōu)越性,并與其他常用深度學(xué)習(xí)模型進(jìn)行了比較。結(jié)果表明,本模型具有較高的SOH估計(jì)精度和良好的遷移性,兩個(gè)數(shù)據(jù)集上的均方根誤差分別僅為0.0110和0.0095,在跨數(shù)據(jù)集的遷移實(shí)驗(yàn)中均方誤差僅為0.0092。
關(guān)鍵詞 鋰離子電池;健康狀態(tài);卷積神經(jīng)網(wǎng)絡(luò);注意力機(jī)制;時(shí)間序列
全球積極推進(jìn)“雙碳”目標(biāo)的背景下,對(duì)穩(wěn)定高效儲(chǔ)能系統(tǒng)的需求不斷上升。鋰離子電池(lithium-ion battery,LIB)以其高能量密度、長(zhǎng)效循環(huán)壽命和低自放電特性已成為多種應(yīng)用中首選的儲(chǔ)能解決方案。但是,隨著使用年限的增長(zhǎng),鋰離子電池性能會(huì)逐漸衰退。尤其是當(dāng)電池容量和功率出現(xiàn)顯著下降時(shí),可能引發(fā)故障甚至造成火災(zāi)或交通安全事故。因此,精確評(píng)估電池的健康狀態(tài)(state of health,SOH)對(duì)于保障儲(chǔ)能系統(tǒng)的安全和穩(wěn)定運(yùn)行尤為重要。
為了提升對(duì)電池SOH的估計(jì)準(zhǔn)確性,業(yè)界提出了多種模型方法,主要包括電化學(xué)模型、等效電路模型及數(shù)據(jù)驅(qū)動(dòng)方法。電化學(xué)模型通過(guò)構(gòu)建描述電池內(nèi)部化學(xué)反應(yīng)的詳細(xì)機(jī)理模型,解釋電池老化過(guò)程。然而,這類模型往往涉及復(fù)雜的方程和高度耦合的參數(shù),計(jì)算復(fù)雜度較高,更適用于基礎(chǔ)電化學(xué)研究中。等效電路模型則基于電池充放電過(guò)程中表現(xiàn)出的關(guān)鍵特征參數(shù)(如容量、內(nèi)阻和循環(huán)次數(shù)等),通過(guò)合適的算法構(gòu)建這些參數(shù)與電池SOH之間的數(shù)學(xué)關(guān)聯(lián)性。雖然這種方法在理論上能夠提供較高的預(yù)測(cè)準(zhǔn)確性,但實(shí)際表現(xiàn)嚴(yán)重依賴于所用模型的準(zhǔn)確性和假設(shè)的合理性。除此之外,由于模型依賴的是對(duì)電池物理化學(xué)屬性的先驗(yàn)認(rèn)知,并容易受到各種環(huán)境和操作條件的干擾,使得它們?cè)陬A(yù)測(cè)不同老化狀態(tài)下的電池SOH時(shí)常常存在局限性,進(jìn)而影響其在實(shí)際應(yīng)用場(chǎng)景中的廣泛使用。
基于數(shù)據(jù)驅(qū)動(dòng)的方法,尤其是在近年來(lái)迅猛發(fā)展的深度學(xué)習(xí)領(lǐng)域,通過(guò)整合海量數(shù)據(jù),能夠通過(guò)集成大量的數(shù)據(jù)來(lái)盡可能避免引入復(fù)雜的電化學(xué)機(jī)制,表現(xiàn)出良好的預(yù)測(cè)性能。因此,這一技術(shù)在能源存儲(chǔ)系統(tǒng)中受到了廣泛關(guān)注。數(shù)據(jù)驅(qū)動(dòng)的方法通常是分析LIB數(shù)據(jù),提取與SOH相關(guān)的健康指標(biāo)(health indicators,HI)。例如,王琛等基于增量容量分析法,從充電過(guò)程中提取容量增量曲線的各項(xiàng)特征如峰值高度、峰值電壓及峰面積作為表征電池老化的健康指標(biāo),并通過(guò)Pearson系數(shù)驗(yàn)證了這些健康特征與SOH之間的相關(guān)性。Jia等利用改進(jìn)的麻雀搜索算法(improved sparrow search algorithm,ISSA)優(yōu)化深度極端學(xué)習(xí)機(jī)(deep extreme learning machine,DELM),從隨機(jī)局部放電電壓和電流數(shù)據(jù)中提取關(guān)鍵HI,并將其輸入到DELM中,以預(yù)測(cè)隨機(jī)負(fù)載條件下LIB的SOH。Zhu等從充滿電后的松弛過(guò)程電壓曲線中提取了6個(gè)統(tǒng)計(jì)特征,并采用XGBoost、彈性網(wǎng)和支持向量回歸模型估算涵蓋130個(gè)LiNiCoAl和LiNiCoMn商用電池的3個(gè)數(shù)據(jù)集的電池容量。Lin等通過(guò)對(duì)電壓、溫度與增量容量曲線等多個(gè)數(shù)據(jù)源進(jìn)行分析,提取了影響電池老化進(jìn)程的七個(gè)關(guān)鍵HI作為輸入。該研究采用多模型融合策略以增強(qiáng)模型整體性能,公開(kāi)數(shù)據(jù)集上的驗(yàn)證結(jié)果顯示,此方法能夠?qū)崿F(xiàn)較高的SOH估算精度。
這些現(xiàn)有的數(shù)據(jù)驅(qū)動(dòng)方法在SOH估計(jì)問(wèn)題中確實(shí)可行,但也存在明顯不足,即某些關(guān)鍵特征提取過(guò)程需依賴研究者對(duì)電池老化機(jī)制的深入了解,且需要進(jìn)行大量的數(shù)學(xué)運(yùn)算。此外,還需要找到合適的數(shù)據(jù)驅(qū)動(dòng)模型來(lái)有效處理從電池循環(huán)數(shù)據(jù)中提取的健康特征。因此,如何在更少或不需先驗(yàn)知識(shí)和較低工作量的情況下提取出可以被適當(dāng)?shù)腟OH估計(jì)模型處理的有效健康特征,是一個(gè)持續(xù)的挑戰(zhàn)。一個(gè)可能的解決方案是利用機(jī)器學(xué)習(xí)算法的強(qiáng)大學(xué)習(xí)能力和非線性建模能力,自動(dòng)從原始電池?cái)?shù)據(jù)中提取特征。例如,李超然等將鋰離子電池在恒流-恒壓充電過(guò)程中的電壓、電流、溫度曲線直接作為輸入,應(yīng)用一維深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)來(lái)實(shí)現(xiàn)鋰離子電池容量估算,進(jìn)而獲取SOH。然而,傳統(tǒng)CNN的感受野有限,對(duì)長(zhǎng)時(shí)間序列的學(xué)習(xí)依賴于更深層次的網(wǎng)絡(luò)。Fu等采用了膨脹卷積網(wǎng)絡(luò)來(lái)進(jìn)行特征提取,通過(guò)調(diào)整擴(kuò)孔數(shù)而不增加卷積核參數(shù)數(shù)量,以獲得更長(zhǎng)距離的信息特征,避免了在池化層輸入信息丟失的問(wèn)題。盡管如此,單一時(shí)間尺度的特征提取可能無(wú)法全面捕捉到電池老化的不同層次的信息,從而影響SOH估計(jì)的準(zhǔn)確性與魯棒性。
此外,現(xiàn)有的深度學(xué)習(xí)模型往往忽略對(duì)輸入特征的差異化關(guān)注,可能導(dǎo)致未能捕獲關(guān)鍵特征或過(guò)多地納入無(wú)關(guān)特征,從而影響模型的性能。作為一種創(chuàng)新的深度學(xué)習(xí)技術(shù),注意力機(jī)制能夠?qū)崿F(xiàn)對(duì)特征的自動(dòng)權(quán)重調(diào)整,有效提升模型的特征學(xué)習(xí)能力,因此受到廣泛關(guān)注。毛百海等將自注意力機(jī)制(self-attention,SA)與循環(huán)神經(jīng)網(wǎng)絡(luò)RNN結(jié)合使用,優(yōu)化了對(duì)內(nèi)在關(guān)聯(lián)性強(qiáng)的特征的重視程度,進(jìn)而顯著提升了SOH估計(jì)的預(yù)測(cè)準(zhǔn)確性。Lin等在長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)模型中引入了一種局部注意力機(jī)制,通過(guò)一個(gè)固定窗口中心化地計(jì)算注意力權(quán)重,更加集中地關(guān)注時(shí)序信號(hào)中的關(guān)鍵局部特征。然而,這些方法主要集中于時(shí)序特征間的動(dòng)態(tài)權(quán)重,忽略了特征通道之間的相互依賴性。
因此,為了實(shí)現(xiàn)不同時(shí)間尺度的自動(dòng)特征提取和特征融合,本文提出了一種新的基于MDCNN-GRU-ECA融合模型(multiscale dilated convolutional neural networks-gated recurrent unit-efficient channel attention,MDGE)的SOH估計(jì)方法。首先采用并行的多尺度膨脹卷積來(lái)更好地從電壓、電流等原始電池?cái)?shù)據(jù)中提取不同時(shí)間尺度的時(shí)序特征,并進(jìn)行多尺度特征融合。然后通過(guò)GRU進(jìn)一步捕捉序列數(shù)據(jù)中的時(shí)間依賴關(guān)系,并增強(qiáng)特征表達(dá)能力。再利用通道注意力機(jī)制顯式地建模不同通道之間的依賴關(guān)系,從而提高模型的整體性能。為了驗(yàn)證所提出方法的有效性,通過(guò)兩個(gè)公開(kāi)數(shù)據(jù)集進(jìn)行了驗(yàn)證,并與幾種常用的深度學(xué)習(xí)模型進(jìn)行了比較,結(jié)果顯示MDGE網(wǎng)絡(luò)具有更高的SOH估計(jì)精度。
這里需要明確的是,本文中的“多尺度”特指建模中的時(shí)間尺度,即通過(guò)不同時(shí)間跨度的數(shù)據(jù)特征提取來(lái)提高模型的預(yù)測(cè)能力。這與傳統(tǒng)物質(zhì)科學(xué)研究中常用的多尺度概念(包括空間尺度,如從原子到宏觀尺度的特征)有所不同。在電池健康狀態(tài)估計(jì)中,時(shí)間尺度的多樣性對(duì)于捕捉電池老化過(guò)程中的動(dòng)態(tài)變化至關(guān)重要。
1 數(shù)據(jù)集介紹
1.1 NASA數(shù)據(jù)集
本研究采用的首個(gè)電池測(cè)試數(shù)據(jù)集來(lái)源于美國(guó)國(guó)家航空航天局(National Aeronautics and Space Administration,NASA)艾姆斯卓越預(yù)測(cè)中心(Ames Prognostics Center of Excellence,PCoE)。該數(shù)據(jù)集包含同一電池型號(hào)、容量均為2 Ah的多個(gè)樣本。研究中特別選取了4塊電池的老化數(shù)據(jù),編號(hào)分別為B0005、B0006、B0007和B0018。這些電池在1.5 A恒流(constant current,CC)模式下充電至電池電壓達(dá)到4.2 V,隨后轉(zhuǎn)入恒壓(constant voltage,CV)模式,直至充電電流減至20 mA。放電過(guò)程采用2 A的恒定電流進(jìn)行,直到電池電壓分別降至2.7 V、2.5 V、2.2 V及2.5 V。電池的可用容量通過(guò)此恒流放電過(guò)程獲得。如圖1(a)所示,電池的容量隨著老化逐漸下降。當(dāng)電池的容量衰減至額定值的70%(即1.4 Ah)時(shí),被認(rèn)定為達(dá)到了壽命終點(diǎn)(end of life,EOL)。圖1(b)、(c)展示了電池在第1、50、100、150個(gè)循環(huán)期間的充電電流與電壓圖像,充電參數(shù)的變化揭示了電池老化過(guò)程中顯著的規(guī)律性,該信息對(duì)識(shí)別電池老化信號(hào)具有重要價(jià)值。
圖1 NASA電池?cái)?shù)據(jù)集
1.2 CACLE數(shù)據(jù)集
本研究使用的第二個(gè)電池?cái)?shù)據(jù)集來(lái)源于馬里蘭大學(xué)高級(jí)生命周期工程中心(Center for Advanced Life Cycle Engineering,CALCE)。本部分研究涉及4塊鈷酸鋰電池(型號(hào)CS2),編號(hào)為35、36、37和38,各電池容量為1.1 Ah,且均采用一致的充放電模式。具體操作中,電池以0.5C的倍率進(jìn)行恒流充電至4.2 V,隨后轉(zhuǎn)入恒壓充電直到充電電流降至0.05 A。在放電階段,電池以1C的恒定電流放電至2.7 V截止電壓。4塊電池的容量伴隨循環(huán)次數(shù)增加表現(xiàn)出衰減趨勢(shì),其變化曲線如圖2(a)所示。當(dāng)電池的可用容量下降至額定容量的70%時(shí),被認(rèn)為達(dá)到了壽命終點(diǎn)。此外,圖2(b)展示了編號(hào)CS2_35的電池在某一充電循環(huán)中的電壓與電流變化,而圖2(c)則顯示了不同循環(huán)中恒流充電階段的電壓趨勢(shì)。觀察結(jié)果表明,隨著循環(huán)次數(shù)的增加,充電時(shí)間逐漸縮短,從而揭示了電池性能的逐步退化。
圖2 CALCE電池?cái)?shù)據(jù)集
1.3 數(shù)據(jù)預(yù)處理
SOH可以定義為:
式中,C和Cnorm分別表示LIB的當(dāng)前容量和標(biāo)稱容量。因此,由于Cnorm是LIB的一個(gè)常數(shù)特征,當(dāng)前可用容量C足以代表SOH??紤]到實(shí)際放電過(guò)程受到用戶行為和環(huán)境的影響,而充電過(guò)程通常遵循固定的協(xié)議。因此,通常利用充電過(guò)程測(cè)量信號(hào)來(lái)估計(jì)SOH。
來(lái)自NASA數(shù)據(jù)集的4塊電池在電池充電過(guò)程中共記錄了約50000個(gè)數(shù)據(jù)點(diǎn)。然而,僅有950條曲線數(shù)據(jù)適用于電池SOH的估計(jì)。這一數(shù)量的數(shù)據(jù)點(diǎn)對(duì)于支持神經(jīng)網(wǎng)絡(luò)進(jìn)行深入的參數(shù)學(xué)習(xí)顯得不足。為了優(yōu)化神經(jīng)網(wǎng)絡(luò)訓(xùn)練效果并在一定程度上減少測(cè)量噪聲所引起的估計(jì)誤差,本研究采用了數(shù)據(jù)增強(qiáng)策略。具體方法是,在NASA數(shù)據(jù)集原始數(shù)據(jù)中引入均值為0、幅度在1%~2%之間的高斯白噪聲,通過(guò)該手段擴(kuò)展樣本容量至4750。相較之下,CACLE數(shù)據(jù)集的數(shù)據(jù)量已足夠支持神經(jīng)網(wǎng)絡(luò)的參數(shù)學(xué)習(xí),故未執(zhí)行任何數(shù)據(jù)增強(qiáng)處理。
此外,考慮到卷積神經(jīng)網(wǎng)絡(luò)通常對(duì)輸入數(shù)據(jù)有特定長(zhǎng)度的要求,對(duì)數(shù)據(jù)進(jìn)行了重采樣,使重采樣后的數(shù)據(jù)長(zhǎng)度統(tǒng)一為128。在將來(lái)自CACLE和NASA數(shù)據(jù)集的樣本輸入到神經(jīng)網(wǎng)絡(luò)模型之前,進(jìn)行了必要的歸一化處理,以確保數(shù)據(jù)在適當(dāng)?shù)臄?shù)值范圍內(nèi)。歸一化采用的最小-最大比例法可以表示為公式(2):
式中,Xnormal為歸一化數(shù)據(jù);Xraw為來(lái)自CALCE數(shù)據(jù)集和NASA數(shù)據(jù)集的原始數(shù)據(jù);Xmin和Xmax分別為原始數(shù)據(jù)中的最小值和最大值。
2 SOH估計(jì)網(wǎng)絡(luò)模型
2.1 膨脹因果卷積網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)CNN屬于一類前饋神經(jīng)網(wǎng)絡(luò),其主要由交替堆疊的卷積層、池化層和全連接層組成。在這種網(wǎng)絡(luò)結(jié)構(gòu)中,卷積層通過(guò)局部連接實(shí)現(xiàn),使得低層神經(jīng)元具備特定的感受野,從而能夠高效自動(dòng)提取局部特征。在傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)中,為了整合更廣泛的上下文信息并實(shí)現(xiàn)全局信息的融合,常常借助池化層或較大的卷積核來(lái)擴(kuò)大感受野,但這樣做往往會(huì)引起一定程度的信息損失。為了解決這一問(wèn)題,開(kāi)發(fā)了膨脹卷積神經(jīng)網(wǎng)絡(luò)(dilated CNN),該技術(shù)在不改變特征圖尺寸的前提下增大感受野,避免了信息丟失等副作用。
在處理序列數(shù)據(jù)時(shí),因果性是一個(gè)重要概念,指的是模型的輸出只依賴于先前的輸入,而非未來(lái)的輸入。這一特性對(duì)于時(shí)間序列預(yù)測(cè)等應(yīng)用場(chǎng)景至關(guān)重要。膨脹因果卷積(dilated causal convolution)技術(shù)結(jié)合了膨脹卷積和因果卷積的優(yōu)點(diǎn),專門(mén)用于處理序列數(shù)據(jù),常見(jiàn)于時(shí)間序列分析與生成模型的應(yīng)用中。該技術(shù)的核心在于同時(shí)擴(kuò)大感受野且保持?jǐn)?shù)據(jù)的時(shí)序因果性。
膨脹卷積通過(guò)引入一個(gè)膨脹率參數(shù)r來(lái)修改卷積核的采樣模式。膨脹率定義了卷積核元素之間的間隔。對(duì)于一個(gè)大小為k的卷積核,膨脹卷積的公式可以表示為:
式中,kr為膨脹卷積核;r為膨脹率;i·r為在輸入特征圖f上以r為間隔進(jìn)行采樣。
膨脹卷積技術(shù)在不犧牲特征圖尺寸的前提下有效增大了感受野,進(jìn)而增強(qiáng)了模型對(duì)更大尺度特征的提取能力。然而,由于該技術(shù)造成輸入特征中的空洞現(xiàn)象,不是所有輸入元素都會(huì)參與到后續(xù)的計(jì)算過(guò)程中。為了克服這一限制并實(shí)現(xiàn)多尺度特征提取,采用了多條并行的一維膨脹因果卷積網(wǎng)絡(luò),每條網(wǎng)絡(luò)具有不同的膨脹率參數(shù)。如圖3所示,經(jīng)預(yù)處理的采樣數(shù)據(jù)被分配至各個(gè)不同膨脹率的卷積網(wǎng)絡(luò)中處理。此外,為了提升網(wǎng)絡(luò)的泛化能力和緩解梯度消失問(wèn)題,引入了殘差連接機(jī)制。最終,通過(guò)整合各個(gè)膨脹卷積網(wǎng)絡(luò)的輸出,實(shí)現(xiàn)了對(duì)多時(shí)間尺度特征的有效融合。這種方法在提升模型性能方面展示了出色的潛力,特別是在處理具有復(fù)雜時(shí)間動(dòng)態(tài)的數(shù)據(jù)集時(shí)。
圖3 膨脹因果卷積網(wǎng)絡(luò)
2.2 GRU網(wǎng)絡(luò)
與長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)相似,門(mén)控循環(huán)單元(GRU)也是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變型。其設(shè)計(jì)采用了門(mén)控機(jī)制來(lái)調(diào)節(jié)信息流,主要目的是解決長(zhǎng)期依賴及反向傳播中的梯度問(wèn)題。相較于LSTM,GRU在保持類似性能的同時(shí),能夠提供更高的計(jì)算效率。如圖4展示的GRU結(jié)構(gòu)中,包括兩個(gè)關(guān)鍵的門(mén):更新門(mén)(update gate)和重置門(mén)(reset gate)。這兩個(gè)門(mén)的行為受當(dāng)前輸入和前一個(gè)時(shí)間步的隱藏狀態(tài)共同影響,它們協(xié)同作用確定如何融合歷史信息與當(dāng)前信息。每一次迭代中,GRU通過(guò)這些門(mén)來(lái)控制信息的流通,使得每個(gè)單元能夠根據(jù)需要選擇性地處理輸入信息。這種機(jī)制允許GRU單元在傳遞整條鏈結(jié)構(gòu)的狀態(tài)信息時(shí)具有選擇性地更新或忽略信息。在數(shù)據(jù)輸入至GRU單元時(shí),其正向傳播過(guò)程涉及信息的篩選,這是通過(guò)動(dòng)態(tài)調(diào)整的門(mén)結(jié)構(gòu)實(shí)現(xiàn)的,從而有效平衡了信息的長(zhǎng)期保留與即時(shí)更新。此種設(shè)計(jì)不僅提高了模型對(duì)時(shí)間序列數(shù)據(jù)的處理能力,還增強(qiáng)了模型在面對(duì)不同類型記憶需求時(shí)的適應(yīng)性。
圖4 GRU神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
GRU網(wǎng)絡(luò)的計(jì)算可以分為以下幾個(gè)步驟:
(1)更新門(mén)的計(jì)算
式中,zt為更新門(mén)的輸出;Wz為更新門(mén)的權(quán)重矩陣;ht-1為前一時(shí)間步的隱藏狀態(tài);xt為當(dāng)前時(shí)間步的輸入;σ為sigmoid激活函數(shù)。
(2)重置門(mén)的計(jì)算
式中,rt為重置門(mén)的輸出;Wr為重置門(mén)的權(quán)重矩陣。
(3)候選隱藏狀態(tài)的計(jì)算
式中,圖片為候選隱藏狀態(tài);W為權(quán)重矩陣;⊙表示元素級(jí)別的乘法。
(4)最終隱藏狀態(tài)的計(jì)算
式中,ht為當(dāng)前時(shí)間步的隱藏狀態(tài);(1-zt)⊙ht-1表示保留前一時(shí)間步的信息;zt⊙圖片表示更新到當(dāng)前時(shí)間步的信息。
2.3 ECA注意力機(jī)制
為了有效建模特征通道間的相互依賴性,采用ECA(efficient channel attention)通道注意力機(jī)制。此方法通過(guò)學(xué)習(xí)過(guò)程自動(dòng)識(shí)別各通道的重要性,并據(jù)此調(diào)節(jié)通道特征表達(dá),增強(qiáng)關(guān)鍵通道的特征響應(yīng)力,同時(shí)抑制不重要的通道。此策略較傳統(tǒng)的SENet(squeeze-and-excitation networks)通道注意力機(jī)制采用一維卷積代替全連接層,實(shí)現(xiàn)了在保持功能效果的同時(shí)顯著減少參數(shù)量。
如圖5所示,ECA注意力的實(shí)現(xiàn)包括以下幾個(gè)步驟:
圖5 ECA通道注意力機(jī)制結(jié)構(gòu)
(1)全局平均池化(global average pooling):首先,對(duì)輸入的特征圖每個(gè)通道執(zhí)行全局平均池化,以提取每個(gè)通道的全局統(tǒng)計(jì)信息,實(shí)現(xiàn)特征壓縮并突出全局特征。
(2)一維卷積(1D convolution):使用一個(gè)一維卷積層來(lái)學(xué)習(xí)通道間的相互依賴關(guān)系。其中一維卷積層的核大小根據(jù)通道的數(shù)量來(lái)自適應(yīng)確定,以確保計(jì)算效率。
(3)激活函數(shù):一維卷積后,一維卷積的輸出通過(guò)激活函數(shù)(如sigmoid或tanh)處理,將權(quán)重縮放到[0, 1]區(qū)間內(nèi),反映每個(gè)通道的相對(duì)重要性。
(4)通道加權(quán):最終,根據(jù)得到的權(quán)重對(duì)原始輸入特征圖的各通道進(jìn)行加權(quán)操作,通過(guò)這種方式強(qiáng)化或削弱特定通道的表達(dá)。
2.4 所提的SOH估計(jì)模型架構(gòu)
本文中的輸入是以電池恒流充電過(guò)程的重采樣信號(hào)。假設(shè)第k個(gè)循環(huán)周期的電池SOH為yk,對(duì)應(yīng)的輸入樣本數(shù)據(jù)為Xk=[tk; ik; vk]。其中tk、ik、vk分別為128×1的時(shí)間序列。
膨脹卷積可以通過(guò)擴(kuò)大感受野進(jìn)而更加全面地提取特征,但在處理時(shí)序動(dòng)態(tài)信息時(shí)不夠靈活。GRU在時(shí)間軸上能較好地學(xué)習(xí)相鄰時(shí)間序列數(shù)據(jù)之間的耦合關(guān)系,但在數(shù)據(jù)特征的挖掘和提取方面表現(xiàn)不佳。通過(guò)結(jié)合膨脹卷積的寬廣視野和GRU的深度時(shí)間理解,可以增強(qiáng)模型對(duì)于各種不同序列任務(wù)的泛化能力,使其在面對(duì)不同類型的數(shù)據(jù)時(shí)能表現(xiàn)得更加穩(wěn)健。采用通道注意力機(jī)制使模型能夠聚焦關(guān)鍵特征,從而進(jìn)一步提高模型的泛化能力。
本文設(shè)計(jì)了如圖6所示的網(wǎng)絡(luò)架構(gòu),包含3個(gè)并行的多尺度膨脹因果卷積神經(jīng)網(wǎng)絡(luò),一個(gè)堆疊的GRU網(wǎng)絡(luò),一個(gè)ECA,最后通過(guò)一個(gè)全連接網(wǎng)絡(luò)輸出。具體訓(xùn)練過(guò)程如下:
圖6 提出的MDCNN-GRU-ECA模型網(wǎng)絡(luò)架構(gòu)
第一步,數(shù)據(jù)采樣和預(yù)處理。將電池的恒流充電采集數(shù)據(jù),包括時(shí)間、電流、電壓序列進(jìn)行重采樣,得到3個(gè)長(zhǎng)度為128的1維向量,然后按特征歸一化到[-1, 1]區(qū)間。預(yù)處理之后,將每個(gè)電池分別作為測(cè)試集,其他電池作為訓(xùn)練集。
第二步,模型設(shè)置和初始化。首先根據(jù)經(jīng)驗(yàn),將GRU的隱藏層數(shù)設(shè)為4,隱藏層維度設(shè)為32。學(xué)習(xí)率設(shè)置為10-3,批次大小設(shè)置為64,迭代次數(shù)設(shè)置為100。損失函數(shù)采用均方誤差(mean-square error,MSE),優(yōu)化算法采用Adam優(yōu)化器。此外,根據(jù)后面的幾組實(shí)驗(yàn)確定了最優(yōu)的卷積核大小和膨脹率。
第三步,多尺度自動(dòng)特征提取。將樣本數(shù)據(jù)直接輸入到并行的膨脹因果卷積神經(jīng)網(wǎng)絡(luò)中,提取時(shí)間序列數(shù)據(jù)的特征,然后通過(guò)相加來(lái)進(jìn)行不同尺度的時(shí)間序列特征融合。再通過(guò)Relu非線性激活函數(shù),將特征映射到高維空間。隨后通過(guò)Dropout層使模型中的神經(jīng)元以0.2的概率隨機(jī)停止工作,防止模型過(guò)擬合,提高模型的泛化能力。
第四步,學(xué)習(xí)動(dòng)態(tài)時(shí)序特性。通過(guò)GRU來(lái)捕捉時(shí)間序列數(shù)據(jù)的時(shí)間動(dòng)態(tài)和依賴關(guān)系,然后通過(guò)殘差連接來(lái)緩解深度學(xué)習(xí)的梯度消失問(wèn)題。
第五步,通道自適應(yīng)權(quán)重分配。將GRU層的信息傳輸?shù)紼CA注意力層,計(jì)算不同通道的權(quán)重,和加權(quán)映射。
第六步,輸出結(jié)果。通過(guò)全連接層將多維數(shù)據(jù)轉(zhuǎn)化為一維輸出。
第七步,迭代訓(xùn)練更新。計(jì)算損失函數(shù),并通過(guò)反向傳播算法完成網(wǎng)絡(luò)參數(shù)的更新。然后重復(fù)迭代,直到損失函數(shù)達(dá)到收斂或完成迭代次數(shù)。
第八步,模型評(píng)估。將測(cè)試數(shù)據(jù)輸入到訓(xùn)練好的網(wǎng)絡(luò)中,獲得估計(jì)的SOH值,與真實(shí)值進(jìn)行對(duì)比,通過(guò)不同的指標(biāo)評(píng)價(jià)模型的性能。
2.5 模型遷移和微調(diào)
為進(jìn)一步驗(yàn)證模型的泛化能力和遷移性,進(jìn)行了跨數(shù)據(jù)集的模型遷移實(shí)驗(yàn)。具體為先在NASA數(shù)據(jù)集上訓(xùn)練模型,然后在CACLE數(shù)據(jù)集上進(jìn)行微調(diào)并驗(yàn)證。微調(diào)的過(guò)程是為了適應(yīng)數(shù)據(jù)集間的差異性,但不進(jìn)行大規(guī)模的重新訓(xùn)練,以確保遷移學(xué)習(xí)的有效性。通過(guò)這種方法,評(píng)估模型在不同數(shù)據(jù)集上的表現(xiàn),以測(cè)試其遷移學(xué)習(xí)能力。具體通過(guò)兩種微調(diào)方式進(jìn)行模型遷移:第一種微調(diào)方式(T1-MDGE)先凍結(jié)網(wǎng)絡(luò)中頂端全連接層以外的其他參數(shù),然后在CACLE數(shù)據(jù)集上利用部分電池?cái)?shù)據(jù)完成20次訓(xùn)練迭代。第二種微調(diào)方式(T2-MDGE)與之類似,區(qū)別在于完成15次訓(xùn)練迭代后將網(wǎng)絡(luò)底層中的所有參數(shù)解凍,剩下的5次訓(xùn)練迭代進(jìn)行全網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)。
3 結(jié)果和討論
在本節(jié)中,為了驗(yàn)證本文方法的有效性,將提出的MDGE模型在兩個(gè)不同的數(shù)據(jù)集上進(jìn)行了測(cè)試,并與已存在的兩種常規(guī)模型——CNN和GRU進(jìn)行了比較,這兩種模型均來(lái)源于文獻(xiàn)[26]中關(guān)于SOH估計(jì)任務(wù)的報(bào)道。同時(shí),為了突出多尺度特征融合模型的優(yōu)勢(shì),還增加了對(duì)應(yīng)的單尺度模型進(jìn)行了對(duì)比,即DGE(DCNN-GRU-ECA)。這些模型的輸入數(shù)據(jù)和訓(xùn)練算法與MDGE模型相同。此外,為了進(jìn)一步展示方法的先進(jìn)性,還選取了針對(duì)相同數(shù)據(jù)集的最新SOH估計(jì)研究成果進(jìn)行了誤差的比較分析,并驗(yàn)證了基于該模型的跨數(shù)據(jù)集遷移學(xué)習(xí)策略。使用了兩個(gè)評(píng)價(jià)指標(biāo):平均絕對(duì)誤差(mean absolute error,MAE),均方誤差(root mean square error,RMSE)。它們的計(jì)算方法如式(8)~(9):
3.1 NASA數(shù)據(jù)集SOH估計(jì)結(jié)果分析
膨脹率和卷積核尺寸是影響膨脹卷積神經(jīng)網(wǎng)絡(luò)性能的重要超參數(shù)。為了進(jìn)一步探索這些超參數(shù)對(duì)預(yù)測(cè)性能的影響,本節(jié)使用NASA數(shù)據(jù)集進(jìn)行了一系列實(shí)驗(yàn),其中B06、B07、B18作為訓(xùn)練集,B05作為測(cè)試集。通過(guò)比較MDGE模型在不同膨脹率和卷積窗口長(zhǎng)度下的計(jì)算精度[圖7(a)],觀察到最優(yōu)的超參數(shù)配置是卷積核大小為3,膨脹率為4。實(shí)驗(yàn)結(jié)果表明,無(wú)論是膨脹率還是卷積核尺度的過(guò)度增大或減小均對(duì)計(jì)算精度有不利影響。如圖7(b)所示,在膨脹率設(shè)定為4的條件下,3個(gè)并行部署的膨脹卷積神經(jīng)網(wǎng)絡(luò)(DCNN)模塊對(duì)不同尺度的特征進(jìn)行了提取。這些模塊分別采用1、4及16作為其膨脹因子,使得它們能夠針對(duì)序列信息在不同的時(shí)間尺度上進(jìn)行捕獲。具體來(lái)說(shuō),較小的膨脹因子使得網(wǎng)絡(luò)能夠細(xì)致地捕捉到短期特征,而較大的膨脹因子則使網(wǎng)絡(luò)有能力從寬廣的時(shí)間范圍內(nèi)提取出長(zhǎng)期且較為粗糙的特征。通過(guò)整合多個(gè)不同尺度的膨脹卷積層,網(wǎng)絡(luò)能夠同時(shí)學(xué)習(xí)到多層次的時(shí)間序列特征。因此,恰當(dāng)選擇膨脹率和窗口長(zhǎng)度不僅有助于保證感受野的適度擴(kuò)展,以便捕獲必要的上下文及局部特征信息,同時(shí)可以平衡模型的計(jì)算效率與過(guò)擬合風(fēng)險(xiǎn),從而促進(jìn)模型的整體性能及其泛化能力。后續(xù)將通過(guò)最優(yōu)的超參數(shù)配置驗(yàn)證MDGE模型的性能。
圖7 多尺度特征提取方法的超參數(shù)優(yōu)化
圖8比較了MDGE方法與其他方法在NASA數(shù)據(jù)集中的SOH估計(jì)效果。為了證明結(jié)果的一般性,圖8(a)~(d)分別以B05、B06、B07、B18作為測(cè)試集,剩余的3塊電池作為訓(xùn)練集。表1列出了各模型的評(píng)價(jià)指標(biāo)。可以觀察到,通過(guò)MDGE方法獲得的SOH估計(jì)結(jié)果相對(duì)于其他3種方法更接近于真實(shí)的SOH。根據(jù)表1,MDGE的SOH估計(jì)誤差最低,平均RMSE僅為0.0110,優(yōu)于文獻(xiàn)[31]中的0.0131和DGE方法的0.0160,其次是GRU模型的0.0212和CNN模型的0.0258。同時(shí),MDGE方法的MAE指標(biāo)也低于文獻(xiàn)[31]和[30]。這表明,多時(shí)間尺度相比單一時(shí)間尺度的特征提取方式可以更全面地捕捉數(shù)據(jù)在不同尺度下的動(dòng)態(tài)變化和模式,有助于理解不同時(shí)間跨度上的內(nèi)在特性。此外,與傳統(tǒng)的CNN和GRU模型相比,MDGE和DGE融合模型結(jié)合了CNN的高級(jí)特征提取能力和GRU的序列數(shù)據(jù)處理優(yōu)勢(shì),同時(shí)利用通道注意力機(jī)制提升模型對(duì)關(guān)鍵特征的捕捉能力,能夠?qū)崿F(xiàn)更好的SOH估計(jì)效果。
圖8 NASA數(shù)據(jù)集上不同方法的SOH估計(jì)結(jié)果比較
表1 NASA數(shù)據(jù)集上不同方法的SOH的估計(jì)誤差比較
3.2 CALCE數(shù)據(jù)集SOH估計(jì)結(jié)果分析
為了進(jìn)一步證實(shí)所提方法的可靠性,本節(jié)采用CALCE數(shù)據(jù)集對(duì)擬定的模型進(jìn)行檢驗(yàn)。相較于NASA數(shù)據(jù)集,CALCE數(shù)據(jù)集所涵蓋的電池壽命更長(zhǎng),可為提供更多具有代表性的樣本。
圖9展示了在CALCE數(shù)據(jù)集上,提出的MDGE方法與其他幾種估算方法在鋰離子電池SOH估計(jì)方面的比較結(jié)果。具體操作為分別選取CS2_35、CS2_36、CS2_37、CS2_38四種電池作為測(cè)試集,而將其他電池?cái)?shù)據(jù)指定為訓(xùn)練集使用。表2詳細(xì)列出了各個(gè)模型的估計(jì)誤差數(shù)據(jù),從中可以看出,MDGE模型具有最優(yōu)的估計(jì)效果,其均方根誤差RMSE僅為0.0095,分別比傳統(tǒng)的CNN、GRU及DGE方法降低了67%、43%和23%,同時(shí)也低于文獻(xiàn)[31]中的0.0173和文獻(xiàn)[32]中的0.0373。
圖9 CALCE數(shù)據(jù)集上不同方法的SOH估計(jì)結(jié)果比較
表2 CALCE數(shù)據(jù)集上不同方法的SOH的估計(jì)誤差比較
為了進(jìn)一步驗(yàn)證提出模型的遷移能力,在NASA數(shù)據(jù)集上訓(xùn)練模型,并在CACLE數(shù)據(jù)集上進(jìn)行微調(diào)和測(cè)試。具體來(lái)說(shuō),首先使用NASA數(shù)據(jù)集中包含的電池?cái)?shù)據(jù)(B0005、B0006、B0007、B0018)進(jìn)行訓(xùn)練,訓(xùn)練過(guò)程與之前描述的保持一致。然后,將訓(xùn)練好的模型分別通過(guò)2.5節(jié)中介紹的兩種方式進(jìn)行微調(diào),隨后應(yīng)用于CACLE數(shù)據(jù)集中的電池?cái)?shù)據(jù)。最后在CACLE數(shù)據(jù)集上進(jìn)行預(yù)測(cè),并計(jì)算預(yù)測(cè)誤差。在這個(gè)過(guò)程中,使用CS2_35號(hào)和CS2_37號(hào)電池進(jìn)行SOH估計(jì)的模型,是通過(guò)對(duì)CS2_36號(hào)和CS2_38號(hào)電池的部分?jǐn)?shù)據(jù)進(jìn)行微調(diào)后獲得;同理,對(duì)于CS2_36號(hào)和CS2_38號(hào)電池的SOH估計(jì),所使用的模型則是基于CS2_35號(hào)和CS2_37號(hào)電池的部分?jǐn)?shù)據(jù)進(jìn)行微調(diào)。估計(jì)結(jié)果如圖10和表2所示,可以看出,盡管模型是在NASA數(shù)據(jù)集上訓(xùn)練的,但在CACLE數(shù)據(jù)集上仍然表現(xiàn)出較高的預(yù)測(cè)精度。這表明,提出的MDGE模型具有良好的遷移能力,可以在不同的數(shù)據(jù)集上實(shí)現(xiàn)有效的SOH估計(jì)。其中,T2-MDGE方式優(yōu)于T1-MDGE方式,其平均估計(jì)誤差RMSE僅為0.0092。這可能是由于不同數(shù)據(jù)集中電池類型及相應(yīng)老化特性的差異所致。對(duì)于不同的電池材料,即使在相同的老化狀態(tài)下,充電電壓特性曲線存在較大差異,這意味著在跨數(shù)據(jù)集遷移時(shí)可能需要學(xué)習(xí)不同的特征表示。在僅凍結(jié)部分層的T1-MDGE微調(diào)方式中,底層參數(shù)保持不變可能會(huì)限制模型對(duì)新數(shù)據(jù)的學(xué)習(xí)能力,尤其是在源域和目標(biāo)域差異較大的情況下。而T2-MDGE微調(diào)方式通過(guò)全網(wǎng)絡(luò)的參數(shù)更新,可以減少這種信息損失,使模型能夠更自由地探索新的特征空間,這有助于模型在目標(biāo)域上獲得更好的泛化能力。
圖10 利用遷移學(xué)習(xí)實(shí)現(xiàn)NASA至CALCE數(shù)據(jù)集的SOH估計(jì)實(shí)證結(jié)果
4 結(jié) 論
本研究旨在解決現(xiàn)有數(shù)據(jù)驅(qū)動(dòng)方法在估計(jì)鋰離子電池的健康狀態(tài)SOH時(shí),特征提取能力不足的問(wèn)題。為此提出了一種創(chuàng)新的融合模型,該模型基于多時(shí)間尺度建模自動(dòng)特征提取和通道注意力機(jī)制。具體來(lái)說(shuō),該模型采用了多尺度膨脹因果卷積網(wǎng)絡(luò)MDCNN并行處理架構(gòu),能夠從多個(gè)時(shí)間尺度上捕捉電池充電過(guò)程中的動(dòng)態(tài)信息,并實(shí)現(xiàn)這些信息的有效融合。隨后,通過(guò)GRU網(wǎng)絡(luò)進(jìn)一步提取這些時(shí)間序列中的長(zhǎng)期依賴特征。
此外,為了加強(qiáng)模型對(duì)關(guān)鍵特征的關(guān)注力度,集成了ECA通道注意力機(jī)制,該機(jī)制專注于增強(qiáng)重要特征通道的表示學(xué)習(xí)能力。這一步驟通過(guò)調(diào)整各特征通道中的權(quán)重分配,以優(yōu)化最終特征表示的方式進(jìn)行。模型的最后階段包括一個(gè)全連接層,它將處理后的特征信息轉(zhuǎn)換為最終的輸出維度,即電池的SOH估值。
在兩個(gè)公開(kāi)的鋰離子電池?cái)?shù)據(jù)集上對(duì)提出的模型進(jìn)行了廣泛測(cè)試。測(cè)試結(jié)果顯示,與傳統(tǒng)深度學(xué)習(xí)方法相比,本文提出的基于多尺度自動(dòng)特征提取和通道注意力機(jī)制的融合模型在SOH的估計(jì)精確性方面表現(xiàn)更為優(yōu)越。在跨數(shù)據(jù)集的遷移實(shí)驗(yàn)中,該模型仍然表現(xiàn)出較高的預(yù)測(cè)性能,這進(jìn)一步證明了MDGE模型在處理電池健康管理問(wèn)題上相對(duì)于傳統(tǒng)深度學(xué)習(xí)方法的優(yōu)勢(shì)和在不同數(shù)據(jù)集上的適應(yīng)性。通過(guò)這種方法,可以顯著提高電池管理系統(tǒng)在實(shí)際應(yīng)用中的性能和可靠性,為未來(lái)鋰離子電池健康狀態(tài)評(píng)估與管理提供了一種新的技術(shù)途徑。