- 博客(18)
- 资源 (2)
- 收藏
- 关注
原创 机器学习之数据预处理
机器学习之数据预处理 归一化处理from sklearn.preprocessing import StandardScalerX_scaler = StandardScaler()y_scaler = StandardScaler()X_train = X_scaler.fit_transform(X_train)y_train = y_sc...
2017-12-29 16:33:00 146
原创 数据挖掘算法与现实生活中的应用案例
数据挖掘算法与现实生活中的应用案例 数据挖掘算法与现实生活中的应用案例 如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手”、“如何判断一个细胞是否属于肿瘤细胞”等等,这些问题似乎都很专业,都不太好回答。但是,如果了解一点点数据挖掘的知识,你,...
2017-12-29 16:28:00 3627
原创 使用Python一步一步地来进行数据分析总结
学习python两年以来的深刻感受,与原文作者有着同样的感受。原文链接:Step by step approach to perform data analysis using Python你已经决定来学习Python,但是你之前没有编程经验。因此,你常常对从哪儿着手而感到困惑,这么多Python的知识需要去学习。以下这些是那些开始使用Python数据分析的初学者的普遍遇到的问...
2017-12-29 16:12:00 127
原创 机器学习算法中的过拟合与欠拟合
机器学习算法中的过拟合与欠拟合 在机器学习表现不佳的原因要么是过度拟合或欠拟合数据。机器学习中的逼近目标函数过程监督式机器学习通常理解为逼近一个目标函数(f)(f),此函数映射输入变量(X)到输出变量(Y).Y=f(X)Y=f(X)这种特性描述可以用于定义分类和预测问题和机器学习算法的领域。从训练数据中学习目标函数的过程中,我们必须考虑的问题是...
2017-12-29 15:47:00 163
原创 深入对比数据科学工具箱:Python和R之争
深入对比数据科学工具箱:Python和R之争 建议:如果只是处理(小)数据的,用R。结果更可靠,速度可以接受,上手方便,多有现成的命令、程序可以用。要自己搞个算法、处理大数据、计算量大的,用python。开发效率高,一切尽在掌握。概述在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Data An...
2017-12-29 15:46:00 158
原创 转sklearn保存模型
转sklearn保存模型 训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。比如,我们根据房源样本数据训练了一下房价模型,当用户输入自己的房子后,我们就需要根据训练好的房价模型来预测用户房子的价格。这样就需要在训练模型后把模型保存起来,在使用模型时把模型读取出来对输入的数据进行预测。...
2017-12-29 14:03:00 386
原创 pandas常用
pandas常用 #python中的pandas库主要有DataFrame和Series类(面向对象的的语言更愿意叫类) DataFrame也就是#数据框(主要是借鉴R里面的data.frame),Series也就是序列 ,pandas底层是c写的 性能很棒,有大神#做过测试 处理亿级别的数据没问题,起性能可以跟同等配置的sas媲美#DataFrame索引...
2017-12-28 15:19:00 116
原创 转Python SciPy库——拟合与插值
转Python SciPy库——拟合与插值 1.最小二乘拟合实例1import numpy as npimport matplotlib.pyplot as pltfrom scipy.optimize import leastsqplt.figure(figsize=(9,9))x=np.linspace(0,10,1000)X = n...
2017-12-28 14:01:00 1350
原创 转朴素贝叶斯分类器的应用
转朴素贝叶斯分类器的应用 作者: 阮一峰日期: 2013年12月16日 生活中很多场合需要用到分类,比如新闻分类、病人分类等等。本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分类算法。一、病人分类的例子让我从一个例子开始讲起,你会看到贝叶斯分类器很好懂,一点都不难。某个医院早上收...
2017-12-28 11:28:00 119
原创 转贝叶斯推断及其互联网应用(一):定理简介
转贝叶斯推断及其互联网应用(一):定理简介 作者: 阮一峰日期: 2011年8月25日=====================================贝叶斯推断及其互联网应用作者:阮一峰一、什么是贝叶斯推断贝叶斯推断(Bayesian inference)是一种统计学方法,用来估计统计量的某种性质。它是贝叶斯定理(B...
2017-12-28 11:26:00 148
原创 Vim 使用入门快捷键
Vim 使用入门快捷键 Vim 和 Emac 都是利器啊,前段时间决定熟悉一套跨平台的编辑器,以便在 Win,Mac,Ubuntu 下都有相同的编辑体验。于是尝试了一下 Vim,使用了一段时间,确实比 UE 之类的要高效。Win 平台下有 gVim, Mac 下也有 MacVim。 Vim 的学习曲线确实有点陡峭,刚开始不是那么容易习惯的。...
2017-12-28 00:00:00 100
原创 从贝叶斯定理说开去
从贝叶斯定理说开去 简介 贝叶斯定理是18世纪英国数学家托马斯·贝叶斯(Thomas Bayes)提出得重要概率论理论。以下摘一段 wikipedia 上的简介:所谓的贝叶斯定理源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有 N 个...
2017-12-27 23:57:00 239
原创 转特征值和特征向量
转特征值和特征向量 介绍特征向量和特征值在计算机视觉和机器学习中有许多重要的应用。众所周知的例子是PCA(主成分分析)进行降维或人脸识别是特征脸。特征向量和特征值的一个有趣应用在我的另一篇有关误差椭圆的博文中提到。此外,特征值分解形成协方差矩阵几何解释的基础。在这篇文章中,我将简单的介绍这个数学概念,并且展示如何手动获取二维方形矩阵的特征值分解。特征向量...
2017-12-27 23:53:00 503
原创 第四章 特征值与特征向量
第四章 特征值与特征向量 §4.1 特征值与特征向量§4.1.1特征值与特征向量的概念及其计算定义1. 设A是数域P上的一个n阶矩阵,l是一个未知量, 称为A的特征多项式,记 ¦(l)=| lE-A|,是一个P上的关于 l的n次多项式,E是单位矩阵。¦(l)=| lE-A|=ln+a1ln-1+…+an= 0是一个n次代数方程,...
2017-12-27 22:51:00 1294
原创 numpy基础入门
numpy基础入门 1、Numpy是什么很简单,Numpy是Python的一个科学计算的库,提供了矩阵运算的功能,其一般与Scipy、matplotlib一起使用。其实,list已经提供了类似于矩阵的表示形式,不过numpy为我们提供了更多的函数。如果接触过matlab、scilab,那么numpy很好入手。 在以下的代码示例中,总是先导入了numpy:...
2017-12-27 22:43:00 92
原创 python range函数与numpy arange函数
python range函数与numpy arange函数 1.range()返回的是range object,而np.arange()返回的是numpy.ndarray() range尽可用于迭代,而np.arange作用远不止于此,它是一个序列,可被当做向量使用。2.range()不支持步长为小数,np.arange()支持步长为小数3....
2017-12-27 15:52:00 301
原创 转悠望南山 Python闲谈(二)聊聊最小二乘法以及leastsq函数
转悠望南山 Python闲谈(二)聊聊最小二乘法以及leastsq函数 1 最小二乘法概述自从开始做毕设以来,发现自己无时无刻不在接触最小二乘法。从求解线性透视图中的消失点,m元n次函数的拟合,包括后来学到的神经网络,其思想归根结底全都是最小二乘法。1-1 “多线→一点”视角与“多点→一线”视角最小二乘法非常简单,我把它分成两种...
2017-12-26 17:18:00 387
原创 numpy np.newaxis 的实用
numpy np.newaxis 的实用 >> type(np.newaxis)NoneType>> np.newaxis == NoneTrue np.newaxis 在使用和功能上等价于 None,其实就是 None 的一个别名。1. np.newaxis 的实用>> x = np.arange(3)&...
2017-12-25 17:57:00 248
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人