Python
文章平均质量分 79
大数据分析BDA
Python及机器学习分享
展开
-
【Python】Python学习(四)——import详解
一. 基本要素● module 通常模块是一个文件,可以用import导入,模块的文件格式有:.py .pyc .pyo .pyd .so .dll。● package 包总是一个目录,可以用import 导入包,还可用from…import…导入包中的部分模块。包目录下必须包含__init__.py文件,其他是模块文件和子目录,若子目录中包含__ini原创 2014-11-26 22:43:17 · 1475 阅读 · 0 评论 -
Python数据分析基础(七)——数据聚合与分组
Python数据聚合、分组原创 2017-06-25 22:23:49 · 637 阅读 · 0 评论 -
Python数据分析基础(八)——时间序列
Python时间序列原创 2017-06-25 22:24:43 · 2258 阅读 · 0 评论 -
贝叶斯思维(实例1)——贝叶斯基础框架
贝叶斯基础框架及在选择时的使用原创 2017-07-30 20:56:24 · 5050 阅读 · 0 评论 -
贝叶斯方法(实例1)——概率分布
贝叶斯推断之概率分布原创 2017-08-02 23:21:01 · 4169 阅读 · 0 评论 -
统计思维(实例2)——概率质量函数与累积分布函数
统计思维之概率质量函数与累积分布函数原创 2017-08-13 21:44:18 · 4469 阅读 · 0 评论 -
贝叶斯思维(实例2)——估计
贝叶斯估计原创 2017-08-20 21:08:11 · 3312 阅读 · 1 评论 -
统计思维(实例3)——分布建模
分析分布的CDF原创 2017-12-03 15:45:33 · 2801 阅读 · 0 评论 -
统计思维(实例5)——变量之间的关系
如果能从一个变量的信息中得到另一个变量的信息,那么这两个变量之间就是相关的。原创 2017-12-21 22:21:13 · 6214 阅读 · 0 评论 -
统计思维(实例6)——术语整理
统计术语原创 2017-12-21 22:28:45 · 907 阅读 · 0 评论 -
统计思维(实例7)——估计
估计基本思路原创 2017-12-23 20:49:14 · 1999 阅读 · 0 评论 -
统计思维(实例4)——概率密度函数
概率密度函数原创 2017-12-16 22:19:09 · 7246 阅读 · 0 评论 -
统计思维(实例8)——假设检验
假设检验用数字方式描述一个效应的出现概率原创 2018-01-01 22:16:48 · 2330 阅读 · 1 评论 -
统计思维(实例9)——线性最小二乘法
最小二乘法拟合相关系数度量变量关系的强弱和正负,但并不关注关系的斜率。估计斜率最常用的是线性最小二乘法拟合(linear least squares fit),“线性拟合”是用一条线对变量关系进行建模,“最小二乘法”拟合实现线与数据之间的均方差最小。假设我们要将一个点序列ys表示成另一个序列xs的函数。如果xs和ys之间存在线性关系,截距为inter,斜率为slope,那么我们就可原创 2018-01-10 23:04:04 · 1541 阅读 · 0 评论 -
统计思维(实例10)——回归
回归分析的目的是描述两组变量之间的关系,一组称为因变量(dependent variable),另一组称为解释变量(explanatory variable)。如果回归分析中只有1个因变量和1个解释变量,就属于简单回归(simple regression)。本章讨论多重回归(multiple regression),涉及多个解释变量。有多个因变量的回归分析称为多元回归(multivariate原创 2018-01-13 22:13:09 · 1383 阅读 · 0 评论 -
Python数据分析基础(六)——可视化
Python可视化原创 2017-06-25 22:22:43 · 1915 阅读 · 0 评论 -
Python数据分析基础(五)——数据规整
pandas数据规整原创 2017-06-25 21:31:41 · 523 阅读 · 0 评论 -
【Python】Python的数据分析——前言
一. Python相关的科学计算库● NumPy NumPy是Numerical Python的简称,是Python科学计算的基础库。它提供了如下内容:快速有效的多维数组对象ndarray,数组之间的运算,基于数组的数据读写到磁盘功能,线代运算,傅里叶变换,随机数生成,将C、C++和Fortran集成到Python的工具。● pandas pandas提原创 2014-11-26 22:44:51 · 3922 阅读 · 0 评论 -
【Python】Python的数据分析(三)——数据文件及数据结构
一. 数据文件 pd指pandas简称,df指DataFrame对象。1. csv读取 pd.read_csv('foo.csv')写入 df.to_csv('foo.csv')2. HDF5读取 pd.read_hdf('foo.h5', 'df')写入 df.to_hdf('foo.h5', 'df')3. Excel读取 pd.re原创 2014-12-11 22:24:59 · 24855 阅读 · 0 评论 -
【Python】Python的数据分析(二)——pandas安装及使用
一. 安装pandas1. Anaconda 安装pandas、Python和SciPy最简单的方式是用Anaconda。Anaconda是关于Python数据分析和科学计算的分发包。2. Miniconda 使用Anaconda会安装一百多个依赖包,如果想灵活控制安装的依赖包或带宽有限,使用Miniconda是个不错的选择。 Cond原创 2014-12-11 22:22:16 · 93542 阅读 · 0 评论 -
【Python】Python的数据分析(四)——数据及绘图
1. 创建数组 numpy有五种方式可以创建数组:① 由其他Python数据结构转换(如lists, tuples)>>>x=np.array([0,1,2,3])② 用NumPy内部方法创建(如arange, ones, zeros等)>>>np.arange(2,3,0.1)>>> np.indices((3,3))③ 从磁盘读取标准的或自定义的数据原创 2015-01-03 22:33:54 · 7243 阅读 · 0 评论 -
【Python】Python学习(三)——如何运行Python程序
此处假设已经安装了Python环境,具体安装步骤请参考安装说明。Python的交互式命令为python,提示符是>>>。交互式环境对练习语言和测试程序比较方便。一. 交互式使用注意事项⑴ 只能在python提示符(>>>)后面写入代码,不是系统命令行中。⑵ 打印命令只在文件中需要,在程序文件中打印适当说明方便调试。⑶ 不论是命令行还是文件中都不要以空格或Tab开始。⑷ 注意复合原创 2014-10-27 22:53:10 · 2470 阅读 · 0 评论 -
【Python】Python学习(二)——Python程序如何运行
Python不仅是一种编程语言,也是一个解释器。当Python执行程序语言时,先将程序编译为“字节码”,然后交给“虚拟机”执行。原创 2014-10-27 22:51:39 · 1180 阅读 · 0 评论 -
【学习】Python学习(一)——Python问答
Python的主要特点有:(1)软件质量,Python代码具有很强的可读性,因此在重用和维护方面就比较方便;(2)编码效率,Python没有编译和链接库的过程;(3)程序移植性,不做任何修改,Python可运行在Windows和Linux系统;(4)丰富的支撑库,Python既可集成自身的库,也可使用第三方库;(5)组件集成功能。原创 2014-10-19 23:27:25 · 2179 阅读 · 0 评论 -
【学习】Python语言入门
Python是一门具有强类型(即变量类型是强制要求的)、动态性、隐式类型(不需要做变量声明)、大小写敏感(var和VAR代表了不同的变量)以及面向对象(一切皆为对象)等特点的编程语言。原创 2014-10-09 22:03:24 · 2012 阅读 · 0 评论 -
【学习】python开源框架
1.Django: Python Web应用开发框架,它最出名的是其全自动化的管理后台:只需要使用起ORM,做简单的对象定义,它就能自动生成数据库结构、以及全功能的管理后台。2. Diesel:基于Greenlet的事件I/O框架,Diesel提供一个整洁的API来编写网络客户端和服务器,支持TCP和UDP。3. Flask:一个用Python编写的轻量级Web应用框架。原创 2014-09-14 22:10:20 · 7228 阅读 · 0 评论 -
统计思维(实例1)——统计直方图
Python绘制统计直方图原创 2017-07-02 22:07:43 · 3976 阅读 · 0 评论 -
Python数据分析基础(一)——开发环境
Python开发环境原创 2017-06-25 21:24:02 · 836 阅读 · 0 评论 -
Python数据分析基础(二)——NumPy基础
NumPy基础原创 2017-06-25 21:27:17 · 1359 阅读 · 0 评论 -
Python数据分析基础(三)——pandas
pandas基础原创 2017-06-25 21:28:37 · 846 阅读 · 0 评论 -
Python数据分析基础(四)——数据文件处理
pandas数据文件处理原创 2017-06-25 21:30:26 · 602 阅读 · 0 评论 -
统计思维(实例11)——时间序列分析
时间序列(time series)是来自随时间变化的系统的一系列度量。本章使用的示例来自Zachary M. Jones。Jones的研究目的是调查像大麻合法化这样的政策性决定会对市场产生何种影响。希望大家对本章内容感兴趣,但借此机会重申对数据分析保持专业性态度的重要性。药品是否非法,哪些药品应当属于非法,这是很重要而又难以回答的公共政策问题,人们应当基于诚实准确的数据进行决策。导入和清洗数据从J原创 2018-01-17 22:38:40 · 18555 阅读 · 3 评论