数据科学
文章平均质量分 73
weiyi99999
这个作者很懒,什么都没留下…
展开
-
转:TensorFlow在windows上安装与简单示例
原创作者:https://blog.csdn.net/darlingwood2013/article/details/60322258,如若侵权,联系必删转载 2018-05-28 15:38:32 · 199 阅读 · 0 评论 -
二元分类问题搭建逻辑回归模型
1.读取数据——pandas#利用pandas读取数据import pandas as pddata = pd.read_csv(r"H:\Python\data\adult.data")cols = ['age','education_num','capital_gain','capital_loss','hours_per_week','label']data = data[cols]...原创 2018-06-04 19:21:18 · 3967 阅读 · 0 评论 -
数据科学-矩阵创建运算之NumPy库
Python中主要有两种表示矩阵的方法,一种是matrix类,另一种是二维array,主要区别在于默认的乘法不同,前者默认乘法是矩阵的乘法,后者默认乘法是Hadamard乘法。实际情况中我们使用后一种也就是二维array表示矩阵。你可以用NumPy提供的专门的函数创建特殊的矩阵,也可以像二维数组那样提取矩阵中的某个元素或某行某列1.矩阵创建-NumPyIn [1]: import numpy as...原创 2018-05-30 08:38:09 · 414 阅读 · 0 评论 -
多元分类问题模型实现
多元分类问题可以用多元逻辑回归和One-vs.-all(从二元到多元)两种方法解决,以scikit-learn为例:import osimport numpy as npimport matplotlib.pyplot as pltimport pandas as pdfrom sklearn.linear_model import LogisticRegressiondef re...原创 2018-06-06 10:15:29 · 2865 阅读 · 0 评论 -
线性回归模型机器学习代码实现
模型实现需要四步:1.将数据划分为训练集和测试数据集,解决过度拟合的问题2.利用训练数据集训练模型,估计模型参数3.利用测试数据集评价模型,计算对应的均方差和决定系数4.用图像化的方式,展示模型效果实现代码如下:import osimport sysimport numpy as npimport matplotlib.pyplot as pltimport pandas as pdf...原创 2018-05-31 09:17:20 · 1458 阅读 · 1 评论 -
线性回归分析统计方法代码
利用第三方库Statsmodels训练假定的线性回归模型,即yi=axi+b+εi代码如下:import osimport sysimport numpy as npimport statsmodels.api as smfrom statsmodels.sandbox.regression.predstd import wls_prediction_stdimport matplot...原创 2018-05-31 10:57:41 · 1913 阅读 · 1 评论 -
模型幻觉
在搭建模型的过程中,我们往往会从已知的特征中提取更多新的特征,并以此搭建更为复杂的模型,但是模型越复杂,越会值其本身掉入不断“自我催眠,强化偏见”的过程,从而引起过度拟合的问题。如果将毫不相关的变量加入到模型中,也会得到相应的参数估计值,而这个估计值几乎不可能为0,这就造成了所谓的“模型幻觉”。模型幻觉会引起模型参数的不可靠,更严重的是使得原本可能较为正确的估计扭曲为错误,比如将原来变量的正效应估...原创 2018-06-01 09:44:52 · 879 阅读 · 0 评论 -
Python中模型的存储于读取
模型依据数据的变化是一个不断循环、不断更新的过程,在Python中搭建模型,且读取模型的程序也在Python内部,可以用内置库pickle完成。pickle是负责将Python对象序列化和反序列化的模块,使用pickle.dump函数将训练好的模型保存到磁盘上(具体路径为“modelPath”),当需要使用模型时,可以通过pickle.load函数读取保存在磁盘上的模型。代码如下:import p...原创 2018-06-02 09:18:48 · 5565 阅读 · 0 评论