上一篇说到了sql留存率的代码,那能不能做一个留存率预测呢?Hive-SQL取一个月用户留存率、留存用户数_lanston别熬夜了的博客-CSDN博客
可以用到sklearn-库中的pipeline库进行多项式回归预测,此类预测还可用与一些有趋势的线性或非线性预测,类似于波士顿放假变化趋势和牛市的时候股价上升趋势等等。
代码如下:
首先读取数据
import pandas as pd
import numpy as np
import math
df = pd.read_excel('留存.xlsx')
X = df['X']
Y = df['Y']
定义一个多项式函数,主要返回pipeline ,代码如下
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline
def PolynomialRegression(degree):
return Pipeline([
("poly", PolynomialFeatures(degree)),
("std_scaler