受美国“页岩气革命”的影响,页岩气勘探受到了大量的关注(
现有利用测井曲线预测TOC的方法有4类:①利用单曲线或多曲线建立回归关系的预测方法,如利用密度曲线(DEN)预测TOC、利用U含量曲线(U)预测TOC等(R法、CARBOLOG法等(
单元拟合方法优势是建模方法简单,但从信息论的角度来说,单元拟合所使用的地层信息过少(仅使用地层某一地层响应特征与TOC建关系),在该曲线测量效果较差或者储集层TOC较低时,地层关于TOC的响应受到压制,预测精度会有所下降。多元拟合方法所建立的模型为非理论模型,仅能确定响应值与TOC的正负相关性,这种线性或非线性约束存在其不合理性,所建立的模型并不可靠。第2类方法从其理论来说,对储集层的成熟度有要求,对于过成熟页岩效果并不理想。而利用非常规测井预测TOC的方法确实能在一定程度上提高TOC的预测精度,但是测量价格较为昂贵,即使存在效果较好的模型也难以推广。
机器学习算法能通过对样本的学习,自动确定各测井响应值与TOC的综合关系。其最大的优势在于,可以较好的利用大量地层信息对TOC进行综合预测,使得模型较为稳定,不会因为某一曲线失真而使精度大大下降。不同算法由于机理不同效果不尽相同,而机器学习算法的表征函数能力是研究的关键,针对该思路,作者提出了一种基于随机森林回归算法预测TOC的模型,其较现有机器学习预测TOC算法来说具有更强的泛化能力与稳定性。通过对实际资料的处理,认为该模型预测TOC较其他算法精度更高,较为可靠。该模型可有效提高TOC预测的精度和可靠性,对页岩气的勘探开发帮助很大。
1 总有机碳含量与测井响应关系研究
机器学习方法的精度在很大程度上取决于模型的输入,这是因为不同的测井曲线与TOC的相关程度不同,若曲线与TOC的相关性弱或者关系过于复杂,在样本不足的情况下很容易使算法学到错误的函数关系,造成过拟合。利用焦石坝地区2口井(A、B)237块龙马溪组-五峰组页岩岩样资料研究TOC与测井响应值的关系。焦石坝地区为典型的海相页岩储集层,岩性以暗色页岩为主,岩石类型丰富,常见的有含放射虫碳质笔石页岩、碳质笔石页岩、含骨针放射虫笔石页岩、含碳含粉砂泥岩、含碳质笔石页岩以及含粉砂泥岩;主要沉积相是深水陆棚亚相和浅水陆棚亚相沉积的滨外陆棚相;页岩矿物成分主要包括石英、长石、方解石、白云石、黄铁矿和黏土等矿物;页岩有机碳含量总体较高,原始生烃潜力巨大,有机质类型主要为Ⅰ型,为过成熟演化阶段,以生成干气为主;页岩现场含气检测总含气量较高,吸附气量较大;页岩储集空间以孔隙为主,主要为低-中孔、特低渗-低渗储集层。对应的TOC与各测井曲线响应值相关关系表见
表 1