基于多特征量分析和LSTM-XGBoost模型的锂离子电池SOH估计方法
本文亮点:(1)为准确描述电池的老化机理,从电池充电数据提取6个HFs,分为时间、能量、IC三类特征;(2)为降低同类型特征之间的信息冗余,采用双相关性特征处理方法,筛选出代表性更强的组合HFs;(3)针对传统SOH估计模型依赖大量HFs测试数据的问题,提出一种基于LSTM-XGBoost模型的SOH估计方法来预估电池SOH。
摘 要 准确评估锂离子电池健康状态(state of health, SOH)对保证电动汽车的安全稳定运行至关重要。然而,传统SOH估计方法在有效提取健康特征(health features, HFs)和依赖大量特征测试数据上面临一些挑战。为此,本文提出一种基于多特征量分析和长短期记忆(long short-term memory, LSTM)-极端梯度提升(eXtreme gradient boosting, XGBoost)模型的锂离子电池SOH估计方法。首先,为准确描述电池的老化机理,从电池充电数据中提取关于时间、能量、IC三大类共6个HFs。考虑到同类型HFs之间存在大量冗余信息,采用一种基于双相关性的特征处理方法,筛选出可准确表征电池退化趋势的组合HFs。其次,针对传统SOH估计模型需要大量HFs测试数据的问题,提出一种基于LSTM-XGBoost的SOH估计模型。在该模型中,采用LSTM算法来预测电池剩余循环次数的HFs数据。同时,为解决LSTM模型进行HFs预测时计算效率不高的问题,采用LSTM-XGBoost模型进行电池SOH估计。利用NASA电池数据集进行验证,结果表明,所提出方法在不同测试数据量下能准确估计锂电池的SOH,且均方根误差保持在1%以内,具有较高的估计精度和鲁棒性。
关键词 锂离子电池;健康状态;特征分析;长短期记忆神经网络;极端梯度提升
锂离子电池以其循环寿命长、安全性高和能量密度大等优点,在电动汽车领域得到广泛应用。电池SOH作为电池管理系统中的主要监测数据之一,反映了锂电池的衰退情况。因此,为确保电动汽车安全运行,获得准确可靠的锂离子电池SOH显得至关重要。
目前电池SOH估计方法大致可分为直接测量法、模型驱动方法和数据驱动方法。直接测量方法通过测量电池容量、内阻等参数来获取SOH,但依赖于准确的充放电记录和海量实验数据。模型驱动法主要包括电化学模型和等效电路模型。电化学模型具有明确的物理意义,但参数辨识复杂不太适用于在线SOH估计。等效电路模型常与滤波算法结合,将SOH估计问题转换为参数估计问题。然而,此方法的估计精度易受到参数辨识和滤波算法的困扰。数据驱动方法不需要深入的机理研究就能够描述电池复杂的衰退过程,受到众多研究者关注。该方法应用电池的历史数据,将外部特性映射到电池的放电容量,并利用机器学习等智能算法构建特征和SOH 的非线性映射模型,以实现准确的SOH估计。
近些年来,数据驱动法研究重点主要集中在特征提取、特征处理和估计模型三个方面。在特征提取方面,Mao等人基于电池反复充放电循环中充电时间逐步减少的特点,选择等时间间隔的电压差作为HFs。Zhang等以电池恒压充电阶段逐渐减小的电流作为原始数据,选定和时间、面积相关等五类特征作为HFs。增量容量分析(ICA)法是将电压曲线平台区域转换为增量容量(IC)曲线的方法,其曲线峰值直观地展现电池老化的特性。李乐卿等分析了电池充放电数据,发现电池IC曲线半峰面积与寿命衰减存在较强的映射关系。
在特征处理方面,相关性分析常被用于衡量各HFs与电池SOH的关联程度。Ma等在充放电阶段提取关于电压、电流共15个HFs,并使用Spearman相关系数来计算HFs与SOH的相关性。然而,同一类别的HFs与电池SOH的关联度都很高,这可以归结于同类别特征之间存在信息冗余,容易重复关键信息。如果将这些HFs全部输入估计模型,会增加模型的计算复杂度。
在估计模型方面,机器学习法已被广泛应用于SOH估计。Li等提出一种基于最小二乘支持向量机(LSSVM)框架的退化模型,用于快速估计锂电池的SOH。但机器学习方法难以提取数据的时间相关性特征和深度特征,限制了对SOH估计精度的提高。深度学习在建立非线性映射方面具有优良的效果,常见的深度学习算法包括卷积神经网络、LSTM网络等。Gao等将HFs输入到LSTM网络中以实现锂电池SOH的估计。然而,LSTM网络在处理大规模电池数据集时,会增加训练的时间成本,估计精度也会受到影响。XGBoost作为一种高效的集成学习算法,表现出了显著的非线性拟合能力,近年来在电池状态评估等领域得到了深入的研究和应用。Chen等利用XGBoost算法构建SOH估计模型,并在三种类型的电池数据集验证了模型的有效性。
如上文所述,现有的SOH估计方法在特征提取及依赖大量测试数据方面受到一定限制。首先,现有的特征提取方法所得到的HFs类型单一,缺少对特征的多角度综合分析。其次,同类型HFs之间存在信息冗余的问题,需要开发一种简单、有效的特征处理方法来筛选出代表性更强的HFs。为克服上述问题,本文提出了一种基于多特征量分析和LSTM-XGBoost模型的锂离子电池SOH估计方法,其主要贡献包括:①准确描述电池的老化机理,从电池充电数据提取6个HFs,分为时间、能量、IC三类特征;②降低同类型特征之间的信息冗余,采用双相关性特征处理方法,筛选出代表性更强的组合HFs;③针对传统SOH估计模型依赖大量HFs测试数据的问题,提出一种基于LSTM-XGBoost模型的SOH估计方法来预估电池SOH。
1 SOH定义与HFs的提取
1.1 电池SOH
电池充放电过程是一个高度动态非线性过程,且SOH是一个随时间减小的变量。锂离子电池容量可以直接反映电池性能的退化情况,见表达式(1):
式中,Ct、C0分别表示电池第t次循环的容量和标称容量。
1.2 电池数据集
本文所用的锂离子电池老化数据来自美国国家航空航天局(NASA)的电池公开数据集。本文选取编号为B0005、B0006、B0007的电池测试数据进行实验分析,三组电池均在室温下以1.5 A进行恒流充电,电压升高到4.2 V后在恒压模式下继续充电,至电流降至20 mA。在静置两小时后,三组电池以2 A恒流工况进行放电。三组电池容量退化曲线如图1所示。
图1 电池容量退化曲线
1.3 健康特征量的分析与提取
由图1可以看出,电池容量随循环次数的增加呈非线性下降,此外曲线表现出局部波动和容量再生特性对SOH的估计有很大影响。因此,本文从电池充电阶段的电压、电流中提取时间、能量、IC三类特征,分别列为HF1~HF6,用于描述电池退化程度,如图2所示。
图2 本文提取的HFs
1.3.1 时间HFs
如图2(a)所示,充电时间作为电池的监测参数之一,当SOH降低时充电时间在CC阶段减少,在CV阶段增加,可以直观地反映电池的老化情况。因此,选择等压差充电时长(TCVDC)和等流差充电时长(TCCDC),分别作为表征电池退化过程的时间特征HF1和HF2:
式中,k是循环次数,t1(k)、t2(k)分别对应每次循环中电压上升至3.8 V和4.2 V的时间点。t3(k)、t4(k)分别对应每次循环中电流从1.5 A下降至0.5 A的时间点。
1.3.2 能量HFs
锂电池的充放电过程是电能和化学能之间的能量转换,随着充放电循环次数的增加,电池内的能量会逐渐减少。因此,将等压差充电能量(ECVDC)、等流差充电能量(ECCDC)分别作为表征电池退化过程的能量特征HF3和HF4。
式中,Vk(t)和Ik(t)分别表示充电阶段的电压和电流。
1.3.3 IC曲线HFs
增量容量分析法通过将电压、容量进行微分处理把电压平缓曲线中的平台区域转换为IC曲线中可识别的峰值。考虑到NASA数据集中没有收集实时的容量数据,而在CC阶段电流几乎不变,因此本文使用电流和时间差来计算容量变化,如式(6)所示:
式中,It为第t时刻电流;Vt,Vt-1为第t和t-1时刻的电池端电压。
图2(b)显示了IC曲线与电池电压的关系。可以发现,随着循环次数的增加,代表电池电极相变位置的曲线峰值逐渐减小并向右移动,造成此现象的原因是电池老化过程中内部活性物质嵌入锂的能力逐渐下降。故本文提取IC峰值(ICP)及其峰值电压(VP)分别作为IC曲线的HF5和HF6。
三类表征电池退化过程的HF1~HF6经归一化处理后如图3所示。
图3 三组电池的HFs
1.4 基于双相关性的特征处理方法
1.4.1 理论分析
同一类型特征之间可能存在信息冗余,容易重复关键信息。为筛选出同一类型特征中最具代表性的HFs,本文提出一种双相关分析方法来得到反映电池SOH的组合HFs。步骤如下:①采用公式(7)、式(8)计算各HFs与电池SOH的灰色关联度;②选择三类特征相关度中最高的HFs定义为主要HFs;③再使用灰色关联度分析法计算主要HFs与其他两类HFs之间的相关度,将两类特征中相关度最高的两个HFs定义为次要HFs;④将主要HFs和两个次要HFs作为筛选出的组合HFs,输入至估计模型中。
式中,zo(k)为SOH序列,zi(k)为HFs序列,k=1,2…n;ρ为分辨系数。灰色关联度γi为ξi(k)的平均值,数值大小越接近于1,SOH序列与HFs序列间的关联度就越高。
1.4.2 特征处理结果
表1评估了三类HFs与SOH之间的相关程度,得到每块电池的主要HFs。表2展示主要HFs与其他两类HFs之间的相关度,并确定次要HFs。主要和次要HFs的分析旨在筛选出最具代表性且信息丰富的HFs。其中,主要HFs是与SOH密切相关的关键因素,而次要HFs则为主要HFs提供了补充和支持,使得组合HFs包含信息更加全面、可靠。
表1 三类HFs与SOH的相关程度
表2 主要HFs与次要HFs的相关程度
在表1中,代表三组电池主要HFs的灰色关联系数均大于0.94,与SOH具有较强相关性。由表2可知,三组电池主要HFs与次要HFs之间的灰色关联度均大于0.92,其中B0005号电池的主要HFs(HF5)与次要HFs(HF1、HF3)的相关性分别达到0.9817、0.9513,这表明本文方法所筛选的组合HFs可以很好表征电池的退化趋势。
2 基于LSTM模型的特征预测方法
现有SOH估计方法仅能通过已采集电池数据,估计当前循环的SOH。本文将已提取的组合HFs输入至LSTM模型,利用LSTM模型强大的时间序列建模能力,对组合HFs包含的主要HFs和次要HFs分开预测,在有限的电池数据情况下扩充HFs数据集,得到全周期的组合HFs数据。
2.1 LSTM神经网络
LSTM网络通过输入门、遗忘门和输出门更新或者丢弃历史信息,这使得LSTM获得了长期记忆能力,特别适用于像HFs这样长序列的预测。其公式如下:
式中,Xt、ht分别为t时对应的输入和隐藏状态;⊙表示同或运算;Wxi,Wxf,Whi,Wxo,Whi,Whf,Who,Whc是权重矩阵;bi,bf,bo,bc是偏置矢量;σ为Sigmoid激活函数。
2.2 特征预测结果
为了在有限的电池数据情况下扩充HFs数据集,得到全周期下的HFs数据。以B0005电池(共168次充放电循环)为例,将起始预测分隔点设置为第80次循环,即将组合HFs包含的一个主要HFs和两个次要HFs前80次循环数据输入至LSTM模型中,以预测得到三个HFs后88次循环的特征数据。通过此方法,可以减少对后88次循环特征数据的实际采集成本。模型训练过程中,超参数神经元个数和训练次数分别设置为100和150;学习率和正则化参数分别设置为0.008和0.0006。后88次循环组合HFs的预测结果如图4所示。为了评估所提出预测方法的性能,采用平均绝对误差(MAE)、平均绝对百分误差(MAPE)和均方根误差(RMSE)三种指标进行分析。
图4 三组电池组合HFs的预测结果
从图4三组电池组合HFs的预测结果中可以看到,LSTM模型预测的后88次循环特征曲线基本上与真实曲线重合,在局部波动区域也能准确跟随真实数值。此外,为了验证LSTM模型的准确性和可靠性,将预测得到的HFs与真实HFs进行误差比较,结果如表3所示,各个HFs预测值的MAE均小于0.8%。这表明特征预测方法在精度和泛化性方面表现良好,能够通过准确预测不同电池的主要和次要HFs,得到精度较高的组合HFs预测值。
表3 三组电池预测的后88次循环组合HFs误差
3 基于XGBoost模型的SOH估计方法
3.1 XGBoost模型
XGBoost具有计算效率高的优势,为实现电池SOH的准确、快速估计,将组合HFs的预测结果作为XGBoost模型的输入,建立特征和SOH的映射关系。XGBoost算法由不同的决策树组成,其核心是学习一个新的函数f(x)来拟合最后预测的残差。在锂电池SOH的回归预测问题上,该算法的目标是使所有树的预测值图片尽可能接近真实值SOHi。
3.2 所提出的SOH估计方法
本文提出SOH估计方法框架如图5所示。第一步:数据采集与特征提取。从电池恒压恒流充电阶段数据中,提取关于时间、能量、IC曲线相关特征。第二步:特征分析与处理。通过双相关性分析方法筛选出主要HFs、次要HFs,得到更具有代表性的组合HFs。第三步:特征预测。将分隔点之前循环的组合HFs数据作为LSTM模型的输入,得到电池剩余循环次数的组合HFs预测数据。第四步:SOH估计与性能评估。将组合HFs的预测结果作为XGBoost模型的输入,从而实现SOH的估计。并与其他模型比较,验证本文方法的准确性与优越性。
图5 所提SOH估计方法框架
4 实验结果与分析
4.1 不同预测起点的对比分析
为验证所提方法在不同阶段的有效性和准确性,将特征起始预测点分别设置为80、100和120,将不同比例的组合HFs预测数据,输入到XGBoost模型得到SOH估计值。
由图6可知,基于本文方法对不同分隔点的SOH曲线能够准确地跟随真实SOH,同时也能捕捉到电池老化过程中的容量再生现象。在对B0005和B0007电池的SOH估计中,相对误差基本保持在±3%以内。而B0006电池的相对误差较于其他电池有所增加,但仍然均小于6%。值得注意的是,SOH估计结果会受到组合HFs预测值和实际值之间误差的影响,如果预测得到的HFs数据质量不高,会增加SOH最终的估计误差。然而,从表3中的组合HFs预测误差可以看出每个HFs预测值的MAE均小于0.8%,这表明HFs预测值和实际值之间的误差较小。结合表4可知,将预测得到的组合HFs作为模型输入可能会增加一定的估计误差,但采用本文方法的三组电池SOH最终估计误差均小于1.5%,仍然具有较高精度。
图6 第80、100和120次循环为分隔点的 SOH 估计结果
表4 第80、100和120次循环为分隔点的 SOH 估计误差
4.2 不同估计模型对比
为进一步验证所提出模型的有效性,在不同电池中采用径向基函数(RBF)、SVM、LSTM以及LSTM-XGBoost模型进行SOH估计精度比较,且以第100次循环为分隔点。
图7为四种模型对不同电池的SOH估计结果和误差。相较于其他三种模型,使用本文模型进行SOH估计能够持续捕获实际SOH,尤其是在容量再生和局部波动阶段。表5列出了三组电池使用不同模型估计SOH的误差。其中,本文的LSTM-XGBoost模型的估计误差最小。以B0007电池为例,该模型估计的MAE、MAPE和RMSE分别为0.3868%、0.5277%和0.5044%;而RBF模型的对应误差分别为0.7312%、1.0245%、0.8934%;SVM模型的误差分别为0.7155%、0.9761%、0.8099%。此外,LSTM模型的MAPE、RMSE分别为本文模型估计误差的1.67倍、1.46倍。这是因为XGBoost作为一种集成学习算法,能够整合多个弱分类器的预测结果,通过加权组合得到更准确的整体预测结果。以计算耗时为参考指标,采用本文所提出的XGBoost模型的三块电池的计算耗时分别为4.30 s、4.41 s、4.24 s,相较于LSTM模型计算时间有显著减少,但是比RBF、SVM模型略长。这是因为RBF和SVM模型在处理低纬度数据时的计算量相对较小,但这两种模型的预估误差比本文所提出的模型误差要大很多。因此,本文所提出的XGBoost模型在准确度和有效性方面适宜于电池SOH估计。
图7 不同模型的SOH 估计结果
表5 不同模型的估计误差与计算量
5 结 论
针对传统SOH估计方法存在特征提取不准、严重依赖大量特征测试数据问题,本文提出一种基于多特征量分析和LSTM-XGBoost模型的锂离子电池SOH估计方法。首先从电池充电阶段的电压、电流和容量曲线上提取时间相关、能量相关以及IC曲线相关3类特征作为HFs;接着,提出一种双相关性分析方法进行HFs数据处理,在消除同类特征间的冗余同时得到最具相关性和影响力的组合HFs;在此基础上,为解决传统SOH估计需要大量测试数据的问题,提出一种基于LSTM-XGBoost模型的SOH估计方法,并进行SOH估计。选取NASA数据集中B0005、B0006、B0007号电池为测试数据。为验证所提估计方法鲁棒性和准确性,以每块电池前80、100、120次循环数据作为训练集进行训练,结果表明采用所提方法估计得到的SOH误差MAE均低于1%。为了进一步验证所提估计方法的优越性,以三块电池前100次循环数据为训练集,与RBF、SVM及LSTM作比较,验证了所提估计模型具有更高的精度,其每组SOH估计误差RMSE和MAE分别在1%、0.8%以内。