近红外光谱数据预处理——多元散射矫正(MSC)

多元散射矫正(MSC)常用于光谱的数据处理,MSC的可以消除由于在光谱测量过程中散射水平的不同(测量的位置、测量时的光线等不同光谱则有差异)带来的光谱差异,增强光谱与数据之间的相关性。该方法为了消除由于散射水平不同带来的光谱差异(即修正光谱数据的基线平移和偏移现象)需要使用“理想光谱”(光谱的变化和与样品中的成分含量满足直接的线性关系)来进行修正。由于“理想光谱”很难获得,因此在该算法中使用所有光谱数据的平均值来代替“理想光谱”。

MSC算法推导过程:

1、平均光谱:       

2、求取每个光谱和理想光谱之间的基线平移量和偏移量:

                                                       

注:b就是每个光谱的平移量和偏移量,k是光谱的偏移系数

3、每个光谱减去求得的基线平移量和偏移量,得到矫正后的光谱:

                                                          

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

#author qiaoxiaokang
def PlotSpectrum(spec):               # 画图函数

    plt.figure(figsize=(5, 3.2), dpi=200)
    x = np.arange(900, 900 + 5 * spec.shape[1], 5)
    for i in range(spec.shape[0]):
        plt.plot(x, spec[i, :], linewidth=0.6)

    fonts = 8
    plt.xlim(700, 1800)
    # plt.ylim(0, 1)
    plt.xlabel('Wavelength (nm)')
    plt.ylabel('absorbance (AU)')
    plt.yticks(fontsize=fonts)
    plt.xticks(fontsize=fonts)
    plt.tight_layout(pad=0.3)
    return plt

data = pd.read_excel(r'文件路径')
df = data.values
x = data.iloc[:, 1:]
y = data.iloc[:, 0]
X = x.values
Y = y.values
Y = Y.reshape((X.shape[0], 1))
X = np.array(X)    # 必须要加转换成np才不会报错
Y = np.array(Y)    # 必须要加转换成np才不会报错
print(Y.shape)
print(x.shape, y.shape)
pp = PlotSpectrum(X)
pp.show()

# 多元散射矫正
def msc(sdata):
    n = sdata.shape[0]  # 样本数量
    k = np.zeros(sdata.shape[0])
    b = np.zeros(sdata.shape[0])
    M = np.mean(sdata, axis=0)

    from sklearn.linear_model import LinearRegression
    for i in range(n):
        y = sdata[i, :]
        y = y.reshape(-1, 1)
        M = M.reshape(-1, 1)
        model = LinearRegression()   # 线性回归算法
        model.fit(M, y)
        k[i] = model.coef_
        b[i] = model.intercept_                # coef_和intercept_都是模型参数,即为w    coef_为w1到w4    intercept_为w0

    spec_msc = np.zeros_like(sdata)
    for i in range(n):
        bb = np.repeat(b[i], sdata.shape[1])
        kk = np.repeat(k[i], sdata.shape[1])
        temp = (sdata[i, :] - bb) / kk        # 求出矫正后的光谱数据
        spec_msc[i, :] = temp
    return spec_msc

X = msc(X)
pp = PlotSpectrum(X)
pp.show()

详细代码参考,这位大佬的文章 :(115条消息) 近红外光谱建模之光谱预处理python实现(一)_近红外python_潘旭阳的博客-CSDN博客

  • 2
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值