数据分析
cloud-2014
这个作者很懒,什么都没留下…
展开
-
Numpy学习笔记
Numpy(Numerical Python的简称)高性能科学计算和数据分析的基础包。其部分功能如下:ndarray,具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。数组运算,不用编写循环可以读写磁盘数据,操作内存映射线性代数集成c,c++等语言python能够包装c、c++以numpy数组形式的数据。pandas提供了结构化或表格化数据的处理高级接口,还提供了n原创 2017-10-16 21:52:58 · 286 阅读 · 0 评论 -
Pandas学习笔记
Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel原创 2017-10-19 22:07:32 · 324 阅读 · 0 评论 -
一元线性回归实例
#coding:utf-8#一元线性回归实例import sysimport numpy as npfrom sklearn import linear_modelimport matplotlib.pyplot as pltimport sklearn.metrics as sm #计算误差的模块#获取数据def getXY(): filename = "D:\\d原创 2017-10-28 18:00:57 · 1517 阅读 · 0 评论 -
最大似然估计和最小二乘法
通俗理解:1. 最大似然估计两个枪手一个是神枪手历史命中概率0.9,一个是新手历史命中概率0.1十枪射击后发现中了九发,问应该是哪一个人射击的。2. 最小二乘法两把尺子一个误差厘米级的,一个误差毫米级的。量同样的物体10次,发现平均误差是一毫米,问应该是哪一把尺子量的。原创 2017-10-23 08:47:20 · 262 阅读 · 0 评论 -
简单一元线性回归
0. 前提介绍:为什么需要统计量? 统计量:描述数据特征0.1 集中趋势衡量0.1.1均值(平均数,平均值)(mean){6, 2, 9, 1, 2}(6 + 2 + 9 + 1 + 2) / 5 = 20 / 5 = 40.1.2中位数 (median):将数据中的各个数值按照大小顺序排列,居于中间位置的变量给数据排序:原创 2017-10-26 15:33:04 · 1192 阅读 · 0 评论