![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析库
文章平均质量分 61
小瓶盖的猪猪侠
这个作者很懒,什么都没留下…
展开
-
sklearn 中 predict 方法和 predict_proba 方法的区别和使用
predict 和 predict_proba的概念1、predict和predict_proba都是用于模型的预测。2、predict返回的是一个预测的值,predict_proba返回的是对于预测为各个类别的概率。3、predict_proba返回的是一个 n 行 k 列的数组,n 表示测试集中样本的个数, 第 i 行 j列的数值是模型预测 第 i 个预测样本为某个标签的概率,并且每一行的概率和为1。实例sklearn_predict = sklearn_logistic.predict(x_原创 2021-05-05 10:14:59 · 2843 阅读 · 0 评论 -
statsmodel.formula.api的OLS与statsmodel.api的OLS不同
在statsmodels.formula.api中,类似于R方法,一个常量会自动添加到数据中,一个截距会在在statsmodels.api中,必须自己添加一个常量(请参见the documentation here)。尝试使用statsmodels.api中的add_constantx1 = sm.add_constant(x1,prepend=True) #prepend=True表示常量放在第一行...原创 2021-05-03 21:51:14 · 1783 阅读 · 0 评论 -
KS检验
1、KS-检验(Kolmogorov-Smirnov test)Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原假设H0:两个数据分布一致或者数据符合理论分布。D=max| f(x)- g(x)|,当实际观测值D>D(n,α)则拒绝H0,否则则接受H0假设。KS检验与t-检验之类的其他方法不同是KS检验不需要知道数据的分布情况,可以算是一种非参数检验方法。当然这样方便的代价就是当检验的数据分布符合特定的分布事,KS检验的灵敏度没有相原创 2021-05-03 11:53:35 · 14168 阅读 · 0 评论 -
使用OLS摘要解释线性回归的结果
下面是一个回归过程,用于拟合收入和教育情况import pandas as pdimport matplotlib.pyplot as pltimport seaborn as smsimport statsmodels.api as snsdata = pd.read_csv('../input/traindatas/char7/Salary_Data.csv')print(sdata.head())n = sdata.shape[0]x_sum = sdata.YearsExperie原创 2021-05-02 20:24:47 · 16044 阅读 · 3 评论