基于支持向量机结合遗传算法的天然气水合物相平衡研究
马贵阳, 宫清君, 潘振, 刘培胜, 李存磊
辽宁石油化工大学石油与天然气工程学院

作者简介:马贵阳,1965年生,教授,硕士生导师,博士;主要从事计算流体力学、多孔介质传质传热和天然气水合物生成与预防等方面的研究工作。地址:(113001)辽宁省抚顺市望花区丹东路西段1号。ORCID: 0000-0001-8452-4079。E-mail: guiyangma1@163.com

摘要

天然气水合物(以下简称水合物)具有高储气率和高可靠性等优点,在天然气储存及运输方面具有广泛的应用前景,同时水合物的存在也会给输气管道带来堵塞等严重影响,因此对水合物的生成研究具有重要意义。为此,对Ⅰ型水合物在无添加剂条件下的静态生成规律进行了研究。首先基于水合物动力学实验装置进行一系列实验,然后利用支持向量机(SVM)结合遗传算法(GA)建立了水合物生成预测模型(SVM+GA)。据此将实验中得到的温度和压力数据进行预测和优化处理,并对上述数据进行非线性拟合,得出了相平衡曲线及其方程,计算得出了常温下生成水合物的相平衡压力为33.5 MPa,常压下生成水合物的相平衡温度为237.1 K。将分别由SVM+GA模型、Chen-Guo模型和vdW-P热力学模型所得到的数据与经典的实验数据进行了对比,其平均相对误差分别为2.678%、1.447%和3.249%。结论认为:SVM+GA模型具有较高的计算准确度,比Chen-Guo模型和vdW-P热力学模型更为简便,可为水合物开发研究提供更多的数据。

关键词: 天然气水合物; 可靠性; 支持向量机; 遗传算法; 相平衡曲线; 平均相对误差; 计算准确度
GA-SVM based study on natural gas hydrate phase equilibrium
Ma Guiyang, Gong Qingjun, Pan Zhen, Liu Peisheng, Li Cunlei
College of Petroleum Engineering, Liaoning Shihua University, Fushun, Liaoning 113001, China
Abstract

Natural gas hydrate is endowed with such advantages as high gas storage rate and high reliability, thus it can be widely applied in natural gas storage and transportation. However, the presence of hydrates also incurs gas pipeline blocking and other negative impacts. Therefore, it is of great importance to investigate the genesis of hydrates. In this paper, the static genesis of Type I hydrates under additive-free conditions was studied. First of all, a series of experiments were conducted with the hydrate kinetic experiment apparatus. Then, the temperature and pressure data obtained from the experiments were predicted and optimized with the genetic algorithm and support vector machine (GA-SVM). After non-linear matching of the above data, the phase equilibrium curve and its equation were obtained, based on which, the phase equilibrium pressure when hydrate was generated at atmospheric temperature was computed to be 33.5 MPa, and the phase equilibrium temperature was estimated to be 237.1 K. Finally, data acquired with the SVM-GA model, the Chen-Guo model and the vdW-P thermodynamic model were compared with those classic experimental data. Results show that the average relative errors are 2.678%, 1.447% and 3.249%, respectively. It is concluded that the GA-SVM model is rather accurate and simpler than the Chen-Guo model and the vdW-P thermodynamic model, and can provide more date for the development and research of natural gas hydrates.

Keyword: Natural gas hydrate; Reliability; Genetic Algorithm (GA); Support Vector Machine (SVM); Phase equilibrium curve; Average relative error; Calculation accuracy
0 引言

天然气水合物(Natural Gas Hydrate, 以下简称水合物)是由天然气与水在高压低温条件下形成的类冰状结晶物质, 是一种极具开发潜力的烃类资源, 储量巨大, 且主要埋藏在海底大陆架边缘和冻土层中[1]。1 m3的水合物大约可分解出160 m3天然气(标准状态下), 其碳含量约为现有化石燃料总和的2倍, 一旦取得技术突破, 其必将形成对常规油气的“ 第二次革命” [2, 3]。水合物的形成有时也会引起一系列的生产安全问题, 其若在天然气集输中形成会增加管道的输送阻力、减少输送天然气量甚至会加大管件的毁坏程度; 若在天然气开采中生成很可能会造成井筒的堵塞, 更严重的会使气井停产, 所以有必要对水合物的生成预测进行研究[4, 5]

目前, 国内外学者对水合物的形成条件做了大量的研究, 拥有比较完善的预测模型。BP神经网络模型预测天然气水合物生成, 是采用以经验风险最小化(Empirical Risk Minimize, ERM)的传统统计学理论为基础, 这样容易降低BP神经网络的稳定性, 甚至出现局部过优情况, 对于那些小样本数据还易导致学习机器泛化能力下降[6, 7]。支持向量机(Support Vector Machine, 缩写成SVM)是一种建立在VC维(Vapnik-Chervonenkis Dimension)理论和SRM准则基础之上的预测方法, 更具体地说, SVM是结构风险最小化的近似实现, 适合研究有限样本、非线性、高维度等方面的问题, 比较适合于水合物的生成研究[8, 9, 10]

与传统油气藏不同, 温度和压力的变化很容易对水合物产生影响[11]。所以, 笔者利用遗传算法优化SVM模型对水合物生成的相平衡曲线进行预测, 通过将实验数据和前人的研究成果进行结合, 利用ORIGIN软件辅助MATLAB编程计算出了水合物生成的温压数据, 分别得出了常温、常压下水合物生成的相平衡压力、温度, 并且计算出了水合物的相平衡曲线方程, 为水合物的进一步研究提供了新的思路。

1 水合物的相平衡机理分析

相平衡即一个多相系统在一定的条件下, 各相的性质和数量均不随时间变化而变化的状态。水合物的相平衡研究主要是对水合物起始平衡数据的研究以及直接计算起始平衡数据的方法, 大多数水合物的相平衡均在三相(水合物、液态水、气体)条件下进行的。由Gibbs相定律和热力学第二定律可知:在给定压强和温度下, 物系处于相平衡状态时, 其G值最小。因此相平衡问题可转化为最优化问题, 优化模型如下[12, 13]

式中fijfij0分别表示组分ij相中的偏摩尔逸度和相对于参考态的偏摩尔逸度, Pa; Gij0表示组分ij相中相对于参考态的偏摩尔Gibbs自由能, J/mol; NCNP分别表示组分数、相数; nijnit分别表示组分ij相中的量和组分i的总量, mol; R表示气体常数, J/(mol· K)– 1; T表示热力学温度, K。

本文研究的是纯气体的单组分系统, 其自由度数最多为2, 所以此系统的相平衡关系可用压力— 温度图表示, 即为相平衡曲线图。水合物的相平衡曲线及开采原理如图1所示。

图1 天然气水合物开采原理示意图

2 计算方法的构建
2.1 支持向量机(SVM)

支持向量机是一种基于统计学习理论(Statistical Learning Theory, SLT)的建立在VC维理论和SRM准则基础之上的预测方法, 具有良好的鲁棒性和较强的泛化能力, 避免了过拟合维数灾难(the Curse of the Dimensionality)等现象的出现[14]。支持向量机的回归函数如下:

约束条件为:

式中α i表示每个样本对应的Lagrange乘子; b表示分类阈值, c表示一个常数, 叫惩罚因子, 控制错分样本惩罚的程度, 式(3)就是支持向量机; K(Xi, X)表示核函数, 需要满足Mercer 条件, 本文选取高斯RBF核函数, 即 , 其中g> 0。

由上式可见, 在支持向量机计算过程中涉及到两个参数(惩罚因子c和核函数参数g)。本文采用遗传算法进行对其优化。

2.2 算法优化方法

2.2.1 遗传算法(GA)

遗传算法(Genetic Algorithm, GA)是一种通过模拟自然进化过程搜索最优解的计算模型, 原理是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程[15]。遗传算法从问题解的串集开始搜索, 避免了容易误入局部最优解的传统优化算法, 同时算法本身易于实现并行化, 也大大扩展了应用范围。目前已被广泛应用于不同预测控制的组合优化, 机器学习, 信号处理等方面。遗传算法一般可定义为:

式中P0表示初始种群; ƒ 表示适应度函数; M表示群体规模; Pe表示选择算子; Pc表示交叉算子; Pm表示变异算子; T表示遗传算法终止条件。

关于水合物的生成体系, 常常涉及气、液态(固态)水、水合物等相, 笔者从水合物热力学生成条件进行研究, 则其决策变量的初始种群包括水合物的配位数(Zi)、水的化学位(µ w)、空穴的直径(Ri)、水合物的活度(λ i)、势能为零时两分子核之间的距离(σ )、最大引力势(ε )、客体分子的空穴占有率(θ i)以及温度(T)、压强(p)。其中i取1或者2, 1表示水合物小孔, 2表示水合物大孔[16]

笔者对精度要求较高, 所以用浮点数进行编码, 即将个体的每个基因值用某一区间内的浮点数来表示[17] 。编程中利用方程(6)构建初始种群, 从而有效避免了空间中出现分布不均匀的现象, 以提高全局的搜索能力, 使其更容易搜索到最佳个体。即

式中xn表示所生成的第i个个体中的l数目(l是可变的); xNxM分别表示指明个体中l的上、下界个数; j表示种群的大小[18]

2.2.2 交叉验证算法

通过交叉验证(Cross Validation, CV)方法中的一种(K-fold Cross Validation, K-CV)对SVM进行优化, 得到最佳的参数gc, 之所以用K-CV优化, 是因为其可以有效地避免过学习和欠学习现象的发生。

3 实例应用与讨论
3.1 实验数据的获得与处理

3.1.1 数据获取

笔者利用KDSD-Ⅱ 型水合物动力学实验装置, 在单一天然气、无添加剂的体系下制取Ⅰ 型水合物, 在经过一系列(13组)实验后得到水合物生成时的温度和压强部分数据如表1所示。

表1 水合物达到相平衡时的温度和压强表

将以上源数据样本通过一个非线性函数映射到高维空间, 通过这个映射转换可以进行数据序列的预测, 整个算法在MATLAB环境下编程实现。

3.1.2 数据预处理

笔者在数据处理方面, 首先对其经行归一化[19]预处理, 采用的归一化映射如下:

式中x, yRn; xmin=min(x); xmax=max(x), 即是使用mapminmax函数来实现。

归一化的效果是原始数据被规整到[1, 2]范围内, 即yi∈ [0, 1](i=1, 2, l, …, n) , 这种归一化方式称为[1, 2]区间归一化。

3.1.3 参数优化

笔者通过交叉验证(cross validation, CV)方法得到最佳的参数gc。经过计算, 惩罚因子(c)和核参数(g)分别为7.833和0.276 38, 且利用式(8)得到的验证平均平方误差(Mean Squared Error, MSE)为1.53× 10– 4

最终, 利用SVM算法结合GA的优化方法对水合物的相平衡曲线进行了预测以得到更多的数据, 并运用马尔可夫算法对预测出的数据进行检测[20], 结果如下:

3.2 算法处理

3.2.1 算法理论基础

关于水合物生成的相平衡研究进一步验证了SVM结合GA方法在搜索精度和速度上的有效性, GA中对初始种群的处理如表2所示。

表2 影响水合物生成的原始种群数值表

原始种群中的客体分子的空穴占有率(θ i)及在SVM中水合物的相平衡算法为:

其中

式(10) 是从水合物热力学生成条件下完成的, 可见目标函数应选用类指数函数。

3.2.2 构造目标函数

则目标函数可构造为:

式中p(T)表示相平衡压强; p0AR0分别表示待定系数。

水合物相平衡的约束条件为:

式中µ w, H表示水在水合物中的化学位; µ w, L表示水在富水相中的化学位; µ w, ice表示水在冰中的化学位。

3.2.3 构造适应度函数

遗传算法中适应度函数的选取很重要, 因为其在基本不利用外部信息的情况下, 仅以种群中每个个体的适应度函数值为依据进行进化搜索, 往往GA常常将目标函数直接作为适应度函数[21], 即

3.2.4 运算参数的构造

遗传算法中的一些运行参数设定对GA的运行有很大影响(表3)。

表3 运行参数表

需要指出的是:一般交叉概率(Pc)不宜太大, 如果太大, 它会破坏群体中的优良模式, 对进化运算不利, 取值范围建议是0.4~0.99; 变异概率(Pm)也要适当, 它产生新个体和抑制早熟的能力会较差, 太大则使GA的搜索趋于随机性, 进而使群体中的优良模式受到破坏, 一般建议范围是0.000 1~0.1; 此处的编码串长度(L)指的是浮点数编码方法中的个体编码长度一般取值决策变量的个数[22]

3.3 结果分析与讨论

3.3.1 不适应度与拟合函数

SVM+GA模型模拟的适应度较高, 所以在编程中采用不适应度曲线进行描述(图2), 基于本算法预测出的温度和压强数据而得到的相平衡曲线如图3所示, 公式(15)是依据ORIGIN9.0对所有温压数据进行非线性拟合的结果。由图2可知遗传算法的进化代数为100, 最佳不适应度与平均不适应度也具有较高的吻合度。

图2 适应度曲线图

图3 水合物相平衡曲线图

P0=1.449 26、R0=0.142 57、A=1.67× 10– 17, 其与之前构造的目标函数式(11)一致, 说明适应度函数的构造比较合理。

3.3.2 分析讨论

利用(15)式计算得到的数据与参考实验数据和Chen-Guo模型以及vdW-P热力学模型得到数据进行对比, 绘制成如图4所示的水合物生成温度和压力关系曲线图。可以看出, 各个模型中水合物的相平衡压力都是随着温度的升高而增大, 在262~271 K这段范围内vdW-P热力学模型与实验参考数据偏离较多, 所以通过采用平均相对误差(AADP)来描述各个模型预测值与参考实验数据的差值[23], 即

图4 水合物生成温度和压力关系曲线图

式中n表示水合物相平衡点数目; pturpmod分别表示为参考实验数据和各模型预测的水合物生成相平衡压力。

为了更形象直观的了解模型的预测精度, 表4给出了纯水、无任何促进剂体系下, 各种模型计算的平均误差, 其中相平衡点数n为17。

表4 纯水、无促进剂体系下不同模型的平均相对误差表

表4可知, 本文SVM+GA模型的预测精度虽然跟Chen-Guo模型还有一定的差距, 但要明显优于传统的vdW-P热力学模型。

式(15)研究范围在260~286 K之间具有较高的精度, 但是经过计算发现, 当研究温度超出这个范围时, 其计算精度逐渐降低以致无法计算常温298.15 K(25 ℃)下的相平衡压力和常压(0.101 325 MPa)下的相平衡压力, 或者说计算结果并不可靠。所以在式(15)的基础上进行修正, 得到:

修正后的SVM+GA模型式(15), 其适用范围有所增加, 跟式(13)相比, 其主要是在[250~262 K]和[286~300 K]之间的精度更高, 其相平衡曲线如图5所示。

图5 修改后的水合物相平衡曲线图

如图6所示, 在[262~286 K]温度范围内, 式(17)的精度明显没有式(15)高, 所以在SVM+GA的基础上式(15)和式(17)要结合着灵活使用预测结果才能更加准确。

图6 水合物生成温度和压力关系对比曲线图

根据修改过的SVM+GA模型计算出:常温下的相平衡压强为为33.5 MPa, 常压下的相平衡温度为237.1 K(– 36.05 ℃)。

4 结论

1)基于前人对水合物热力学模型基础, 建立由遗传算法优化支持向量机(SVM+GA)的水合物生成预测模型, 通过数值计算拟合出水合物生成相平衡曲线方程, 并且由拟合出的目标函数可知水合物相平衡压强为正值, 这与现实情况比较吻合。

2)SVM+GA预测模型的相平衡方程有P'和PP'在[262~286 K]的常用温度范围内预测的准度较高; 而P作为P'的补充使SVM+GA模型得到进一步的扩展, 其预测出水合物常温下的相平衡压强为33.5 MPa及常压下的相平衡温度为237.1K(– 36.05 ℃)。由此可知, 相平衡方程P'的精度更高, 应用条件更加符合日常实际, 方程P是在试验或者实际条件难以实现的情况下使用。

3)水合物的SVM+GA预测模型是对Chen-Guo模型、vdW-P模型等经典模型的一种简化, 避免了涉及化学位、Langmuir吸附速率等一些复杂的理论计算, 更加直观的表达了其生成的相平衡条件, 并使其公式化。在预测精度方面与Chen-Guo模型相似, 但明显优于vdW-P模型, 也为今后在水合物领域方面的研究提供了更多的数据, 在实验条件达不到的情况下提供参考。

The authors have declared that no competing interests exist.

参考文献
[1] Khlebnikov VN, Antonov SV, Mishin AS, Bakulin DA, Khamidullina IV, 梁萌, 等. 一种新型CO2置换CH4水合物的开采方法[J]. 天然气工业, 2016, 36(7): 40-47.
Khlebnikov VN, Antonov SV, Mishin AS, Bakulin DA, Khamidullina IV, Liang Meng, et al. A new method for the replacement of CH4 with CO2 in natural gas hydrate production[J]. Natural Gas Industry, 2016, 36(7): 40-47. [本文引用:1]
[2] Naeiji P, Arjomand i A & Varaminian F. Optimization of inhibition conditions of tetrahydrofuran hydrate formation via the fractional factorial design methodology[J]. Journal of Natural Gas Science and Engineering, 2014, 21(21): 915-920. [本文引用:1]
[3] 邹才能, 赵群, 张国生, 熊波. 能源革命: 从化石能源到新能源[J]. 天然气工业, 2016, 36(1): 1-10.
Zou Caineng, Zhao Qun, Zhang Guosheng & Xiong Bo. Energy revolution: From a fossil energy era to a new energy era[J]. Natural Gas Industry, 2016, 36(1): 1-10. [本文引用:1]
[4] 张刘樯, 师凌冰, 周迎. 天然气水合物生成预测及防治技术[J]. 天然气技术, 2007, 1(6): 67-68.
Zhang Liuqiang, Shi Lingbing & Zhou Ying. Prediction and prevention of natural gas hydrate formation[J]. Natural Gas Technology, 2007, 1(6): 67-68. [本文引用:1]
[5] Dejean JP, Averbuch D, Gainville M & Doux F. Integrating flow assurance into risk management of deep offshore field developments[C]//Offshore Technology Conference, 2-5 May 2005, Houston, Texas, USA. DOI: http://dx.doi.org/10.4043/17237-MS. [本文引用:1]
[6] Min JH & Lee YC. Bankruptcy prediction using support vector machine with optimal choice of kernel function parameters[J]. Expert Systems with Applications, 2005, 28(4): 603-614. [本文引用:1]
[7] 蒋华琴, 刘兴高. 免疫PSO-WLSSVM最优聚丙烯熔融指数预报[J]. 化工学报, 2012, 63(3): 866-872.
Jiang Huaqin & Liu Xinggao. Optimal melt index prediction based on ICPSO-WLSSVM algorithm for industrial propylene polymerization[J]. CIESC Journal, 2012, 63(3): 866-872. [本文引用:1]
[8] Vapnik V N. Statistical learning theory[M]. Beijing: Electronic Industry Press, 2004: 293-323. [本文引用:1]
[9] Wu CH, Tzeng GH & Lin RH. A novel hybrid genetic algorithm for kernel function and parameter optimization in support vector regression[J]. Expert Systems with Applications, 2009, 36(3): 4725-4735. [本文引用:1]
[10] 张华, 曾杰. 基于支持向量机的风速预测模型研究[J]. 太阳能学报, 2010, 31(7): 928-932.
Zhang Hua & Zeng Jie. Wind speed forecasting model study based on support vector machine[J]. Acta Energiae Solaris Sinica, 2010, 31(7): 928-932. [本文引用:1]
[11] 粟科华, 孙长宇, 李楠, 钟小禹, 陈光进, 辛显治. 天然气水合物人工矿体高温分解模拟实验[J]. 天然气工业, 2015, 35(1): 137-143.
Su Kehua, Sun Changyu, Li Nan, Zhong Xiaoyu, Chen Guangjin & Xin Xianzhi. Simulation experiments on pyrogenic decomposition of a mature artificial hydrate ore body[J]. Natural Gas Industry, 2015, 35(1): 137-143. [本文引用:1]
[12] 林金清, 李浩然, 韩世钧. 含化学反应体系多相平衡计算方法的研究进展[J]. 计算机与应用化学, 2003, 20(6): 724-730.
Lin Jinqing, Li Haoran & Han Shijun. Progress of computation method for simultaneous chemical and phase equilibrium[J]. Computers and Applied Chemistry, 2003, 20(6): 724-730. [本文引用:1]
[13] 林可鸿, 陈德钊. 混合免疫算法及在相平衡计算中的应用[J]. 化工学报, 2007, 58(6): 1348-1352.
Lin Kehong & Chen Dezhao. Hybrid artificial immune system and its application to calculation of chemical reaction and phase equilibrium[J]. CIESC Journal, 2007, 58(6): 1348-1352. [本文引用:1]
[14] 赵春晓. 基于支持向量机的混沌时间序列预测方法的研究[D]. 沈阳: 东北大学, 2008.
Zhao Chunxiao. Research on chaotic time series prediction method based on support vector machines[D]. Shenyang: Northeastern University, 2008. [本文引用:1]
[15] 周晓君. 强噪声环境机械早期故障微弱信号特征分离算法研究[D]. 重庆: 重庆大学, 2012.
Zhou Xiaojun. Feature extraction algorithms for weak signals showing mechanical incipient faults in a noisy environment[D]. Chongqing: Chongqing University, 2012. [本文引用:1]
[16] 陈光进, 孙长宇, 马庆兰. 气体水合物科学与技术[M]. 北京: 化学工程出版社, 2008.
Chen Guangjin, Sun Changyu & Ma Qinglan. Gas hydrate science and technology[M]. Beijing: Chemical Engineering Press, 2008. [本文引用:1]
[17] 张磊. AUV模糊神经网络控制器优化设计研究[D]. 哈尔滨: 哈尔滨工程大学, 2007.
Zhang Lei. The research of optimal design of autonomous underwater vehicle fuzzy neural network controller[D]. Harbin: Harbin Engineering University, 2007. [本文引用:1]
[18] 刘虎, 罗斌, 吴晟, 侯明. 改进的遗传算法在SVM参数优化中的应用[J]. 云南师范大学学报(自然科学版), 2012, 32(4): 47-51.
Liu Hu, Luo Bin, Wu Sheng & Hou Ming. Application of SVM parameters optimization based on improved genetic algorithm[J]. Journal of Yunnan Normal University (Natural Sciences Edition), 2012, 32(4): 47-51. [本文引用:1]
[19] 梁家政, 薛质. 网络数据归一化处理研究[J]. 信息安全与通信保密, 2010(7): 47-51.
Liang Jiazheng & Xue Zhi. Stand ardized processing based on network data[J]. Information Security and Communications Privacy, 2010(7): 47-51. [本文引用:1]
[20] 刘克, 曹平. 马尔可夫决策过程理论与应用[M]. 北京: 科学出版社, 2015.
Liu Ke & Cao Ping. Markov decision process theory and application[M]. Beijing: Science Press, 2015. [本文引用:1]
[21] 李明. 遗传算法的改进及其在优化问题中的应用研究[D]. 长春: 吉林大学, 2004.
Li Ming. The study on improved genetic algorithm and its application in optimization questions[D]. Changchun: Jilin University, 2004. [本文引用:1]
[22] Davis L. Adapting operator probabilities in genetic algorithms[M]//Proceedings of the Third International Conference on Genetic Algorithms. San Francisco, CA: Morgan Kaufmann Publishers Inc. , 1989: 61-69. [本文引用:1]
[23] 李小森, 吴慧杰, 冯自平, 唐良广, 樊栓狮. 利用统计缔合流体理论状态方程预测混合气体水合物的平衡形成条件[J]. 化学学报, 2007, 65(1): 59-66.
Li Xiaosen, Wu Huijie, Feng Ziping, Tang Liangguang & Fan Shuanshi. Prediction of equilibrium hydrate formation conditions for gas mixtures using the statistical associating fluid theory equation of state[J]. Acta Chimica Sinica, 2007, 65(1): 59-66. [本文引用:1]