使用插值方法（scipy.interpolate）和二维数据构造一元函数

山高月小水落石出

已于 2022-08-16 14:08:07 修改

阅读量1.4k

点赞数

分类专栏：数学基础 # python 文章标签：算法插值函数构造规律表达

于 2021-04-28 14:42:10 首次发布

本文链接：https://blog.csdn.net/qq_22828175/article/details/116232446

版权

数学基础同时被 2 个专栏收录

22 篇文章 1 订阅

订阅专栏

python

17 篇文章 0 订阅

订阅专栏

通常情况下，当数据点较多时，可构造具有某些特性的带未知参数的函数，采用拟合方法来近似出表达这些数据规律的函数。但当数据点在待求空间中分布较稀疏时，或对待求函数的形态特征、连续性光滑性等已知时，可采用插值（或分段插值）构造出表达该规律的函数。

scipy.interpolate中最常用和全面的一维插值方法是interp1d，但本文采用了CubicSpline，因其可以自定义插值函数起止点处的一阶导数或二阶导数（bc_type），使函数形态特征在某些局部更可控。

import numpy as np
from scipy.interpolate import CubicSpline
from scipy.interpolate import interp1d
import statsmodels.api as sm
import matplotlib.pyplot as plt


def s_curve_interp(n, x=(1, 10, 20, 30), y=(1e-5, 0.1, 0.9, 1)):
    """
    n：需要根据构造的插值函数得到对应y值的x坐标
    x：用于构造插值函数的点的x坐标，n值最好在x的范围内，因为插值函数不合适做外推
    y：用于构造插值函数的点的y坐标；x和y是成对的坐标，遵循奥卡姆剃刀原则，最少只需四个点，即三段插值函数，就可以构造任意大致规律的全局函数；若点数越多，构造出的函数形态就可以控制得越细致。
    return: 构造出的插值函数的x坐标为n时，对应的一个y坐标值
    """
    if x[0] <= n < x[1]:
        cs1 = CubicSpline(x[:2], y[:2], bc_type=((1, y[1] / x[1]**2), (1, y[1] / x[1]**0.5)), extrapolate=False)
        r = cs1(n)
        if r < 0:
            r = cs1(x[0]+1)
    elif x[1] <= n < x[2]:
        cs2 = CubicSpline(x[1:3], y[1:3], bc_type=((1, y[1] / x[1]**0.5), (1, (y[2]-y[1]) / (x[2]-x[1])**2)), extrapolate=False)
        r = cs2(n)
    else:
        cs3 = CubicSpline(x[-2:], y[-2:], bc_type=((1, (y[2] - y[1]) / (x[2] - x[1]) ** 2), (1, (y[3] - y[2]) / (x[3] - x[2]) ** 2)), extrapolate=False)
        r = cs3(n)
        if r > 1:
            r = cs3(x[-1]-1)
    return float(r)


# 用于构造函数的坐标点
data_x = (1, 10, 20, 30)
data_y = (1e-5, 0.1, 0.9, 1)

for i in range(data_x[0], data_x[-1]):
    if s_curve_interp(i+1, data_x, data_y) - s_curve_interp(i, data_x, data_y) < 0:
        raise Exception('构造出的函数应不严格地单调递增，但此时在第 %s 个点处，s型曲线的值降低' % (i+1))
print('各个y坐标值：')
for i in range(data_x[0], data_x[-1]+1):
    print(s_curve_interp(i, data_x, data_y))

# x坐标间距越小，构造出的曲线就会显示得越光滑；因为配置的插值函数在临界点处原函数的左右极限相等，即连续，
# 左右一阶导数相等，即光滑，左右二阶导数相等，即凹凸性相同，所以函数在整个定义域上连续且光滑
# Array of evenly spaced values. For floating point arguments, the length of the result is `ceil((stop - start)/step)`.
# Because of floating point overflow, this rule may result in the last element of `out` being greater than `stop`.
xnew = np.arange(data_x[0], data_x[-1], 0.01)
ynew = [s_curve_interp(i, x=data_x, y=data_y) for i in xnew]
plt.figure()
plt.plot(data_x, data_y, 'o', xnew, ynew, '-')
plt.title('constructed interpolate points')
plt.show()
# 根据构造的函数生成归一化的权重w。因为每个w的分子与构造曲线的每个y值完全相同，而每个w的分母都是sum(ynew)，
# 所以w的分布完全由其分子确定，而其分子的分布与构造曲线y值的分布相同，所以w的分布特征与构造曲线的分布特征完全相同。
plt.figure()
w = [i/sum(ynew) for i in ynew]
plt.plot(list(range(len(w))), w)
plt.title('weights')
plt.show()


#########################################################################################################
# 用scipy.interpolate插值
x = np.linspace(0, 10, num=11, endpoint=True)
y = np.cos(-x**2/9.0)
f = interp1d(x, y, bounds_error=True)
f2 = interp1d(x, y, kind='quadratic')

xnew = np.linspace(0, 10, num=41, endpoint=True)
plt.figure()
plt.plot(x, y, 'o', xnew, f(xnew), '--', xnew, f2(xnew), '--')
plt.legend(['data', 'linear', 'quadratic'], loc='best')
plt.show()


# 用pd.Series.interpolate插值
dta = sm.datasets.co2.load_pandas().data.co2
plt.figure()
co2 = dta.interpolate(inplace=False)  # deal with missing values. see issue
co2.plot(color='r', label='interpolated')
dta.plot(color='g', label='origin')
plt.legend()

连续且光滑的S型函数

山高月小水落石出

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
2
评论
使用插值方法（scipy.interpolate）和二维数据构造一元函数

通常情况下，当拥有较多数据点时，可构造具有某些特性的带未知参数的函数，采用拟合方法来近似出表达这些数据规律的函数。但当数据点在待求空间中分布较稀疏时，或对待求函数的形态特征、连续性光滑性等已知时，可采用插值（或分段插值）构造出表达该规律的函数。scipy.interpolate中最常用和全面的一维插值方法是interp1d，但本文采用了CubicSpline，因其可以自定义插值函数起止点处的一阶导数或二阶导数（bc_type），使函数形态特征在某些局部更可控。import numpy as npfro
复制链接

扫一扫