python数据分析
文章平均质量分 58
polarislove1113
这个作者很懒,什么都没留下…
展开
-
【Python数据分析与展示】(一)numpy基础
ndarrayimport numpy as npa = np.array([[1,2,3,4,5], [9,8,7,6,5]])print(a)轴(axis):数据的维度 秩(rank):轴的数量ndarray对象的属性 属性 说明 .ndim 秩,即轴的数量,或维度的数量 .shape ndarray对象的尺度,对于矩阵表示n行m列原创 2017-12-11 16:29:17 · 369 阅读 · 0 评论 -
用python学概率与统计(第十一章)关于总体方差的推断
关于总体方差的推断原创 2017-12-29 15:00:07 · 436 阅读 · 0 评论 -
用python学概率与统计(第九章)假设检验(第十章)
假设检验我们首先对总体参数提出一个原假设(null hypothesis),记做H0H_0, 定义另一个与原假设完全相反的备择假设 (alternative hypothesis)记做HaH_a。 作为普遍情况,研究的假设设为备择假设。如果原假设被拒绝,则备择假设为真。(无论是>=,<=,=,等号总是出现在原假设中)9.2 第一类错误和第二类错误第一类错误:H0为真 ,但是我们拒绝了H0 第二类错原创 2017-12-28 22:40:28 · 1427 阅读 · 0 评论 -
用python学概率与统计(第七章)抽样分布 (第八章) 区间估计
7.4抽样分布任意一个样本统计量的概率分布被称为该统计量的抽样分布、 x¯\overline x 的数学期望等于从总体中抽取样本的总体均值 E(x¯)=μ E(\overline x) = \mu x¯\overline x 的标准差 有限总体σx¯=N−nN−1−−−−−−√(σn√) \sigma_\overline x= \sqrt {\frac{N-n}{N-1}}(\frac{\s原创 2017-12-28 14:47:16 · 2344 阅读 · 0 评论 -
用python学概率与统计(第五章)离散概率分布(第六章)连续概率分布
离散概率分布期望:E(x)=μ=∑xf(x)E(x) = \mu= \sum{xf(x)} 数据期望就是可取值的加权平均数,权重等于概率 方差:Var(x)=σ2=∑(x−μ)2f(x)Var(x) = \sigma^2= \sum{(x-\mu)^2f(x)} 方差是随机变量和其均值的离差平方的加权平均数,权重等于概率 标准差是σ\sigma5.4二项概率分布二项概率满足下列几个条件 1原创 2017-12-27 23:15:21 · 1386 阅读 · 0 评论 -
用python学概率与统计(第四章)概率论简述
组合排列组合:CNn=(Nn)=N!n!(N−n)!C^N_n= (^N_n) = \frac{N!}{n!(N-n)!} 排列:PNn=n!(Nn)=N!(N−n)!P^N_n= n!(^N_n) = \frac{N!}{(N-n)!}import itertoolsIn [61]:r = itertools.combinations(range(4),3)In [62]:rOut[62]原创 2017-12-23 18:47:53 · 1307 阅读 · 0 评论 -
用python学概率与统计(第三章)描述性统计:数值方法
3.2################## ********************************count 非 NA 值的数量 describe 针对 Series 或 DF 的列计算汇总统计 min , max 最小值和最大值 argmin , argmax 最小值和最大值的索引位置(整数) idxmin , idxmax 最小值和最大值的索引值 quan原创 2017-12-21 23:55:32 · 2892 阅读 · 1 评论 -
【Python数据分析与展示】(七)数据加载存储和文件格式
读写文本格式的数据 函数 说明 read_csv 默认分隔符为逗号 read_table 默认分隔符为\t read_fwf 读取等宽列格式文件 默认无分隔符 read_clipboard 读取剪贴板中的文件指定列名 pd.read_csv(“文件路径.csv”, sep=”, name= []) 多层次索引 pd.read_csv(“文件路径.csv”原创 2017-12-19 16:31:00 · 253 阅读 · 0 评论 -
【Python数据分析与展示】(六)处理缺失数据,层次化索引
处理缺失数据pandas用浮点值NaN来表示缺失数据,它只是一个易于被检测出来的标识 方法 说明 dropna 过滤缺失数据,可以用阈值调节容忍度 fillna 用指定值或插值方法填充缺失数据 isnull 返回布尔值标识哪些是NaN notnull isnull的反义Examples df = pd.DataFrame([[np.原创 2017-12-19 13:56:15 · 303 阅读 · 0 评论 -
python科学计算库Sympy指南
SymPy是Python的数学符号计算库,用它可以进行数学公式的符号推导 安装不介绍了 官方文档 这里还是建议使用anacondafrom sympy import *init_printing(use_unicode=True)x,y = symbols('x y') #用符号代表变量,多个变量可以空格,可以逗号隔开。expr = x + 2*yexpanded_expr = expa原创 2017-12-18 23:08:14 · 10049 阅读 · 0 评论 -
【Python数据分析与展示】(五)pandas库数据分析
数据的排序两种方法:根据索引进行排序 .sort_index(axis = 0,ascending = True) .sort_value() 根据指定轴上的数据进行排序 对于Series .sort_value(axis = 0,ascending = True) 对于DataFrame .sort_value(by,axis = 0,ascending = True)b = DataFr原创 2017-12-13 17:27:21 · 474 阅读 · 0 评论 -
用python学概率与统计(第二章)描述性统计:表格法,图形法
频数分布2.1汇总定性数据柱状图import numpy as npimport pandas as pdfrom pandas import Series,DataFrameimport matplotlib.pyplot as plt%pylabdf = pd.read_csv("E:\\data\\SoftDrink.csv")dfdf.describe() grouped_原创 2017-12-21 02:27:02 · 1069 阅读 · 0 评论 -
【Python数据分析与展示】(四)pandas库基本操作
SeriesSeries是由一组数据和数据的索引构成import numpy as npimport pandas as pda = pd.Series ([9,8,7,6],index = ['a','b','c','d']) #如果index处于属性的第二位,可以省略“index =”#a 9 b 8 c 7 d 6dtype: int64a = pd.S原创 2017-12-13 04:23:23 · 447 阅读 · 0 评论 -
【Python数据分析与展示】(三)matplotlib库pyplot
简单例子:import matplotlib.pyplot as plt%pylabplt.plot([1,44,5,6])plt.ylabel("abc")plt.savefig("test",dpi = 600) #png文件plt.plot([1,2,3,4],[1,4,5,6])plt.ylabel("grade")plt.axis([-1,6,0,10])# [xmin, xm原创 2017-12-12 03:09:08 · 549 阅读 · 0 评论 -
【Python数据分析与展示】(八)数据合并、规整化
数据库风格的dataframe合并 mergedf1 = DataFrame({'key':['b','b','a','c','a','a','b'],"data1":range(7)})df2 = DataFrame({'key':['a','b','d'],"data2":range(3)})df1# data1 key0 0 b1 1 b2 2 a原创 2017-12-19 21:56:22 · 333 阅读 · 0 评论 -
【Python数据分析与展示】(二)NUMPY数据存取与函数
numpy存储文件np.savetxt(frame,array,,fmt=’%.18e’,delimiter = None)a = np.arange(100).reshape(5,20)np.savetxt("a.csv",a,fmt = '%d',delimiter = ",")numpy读取文件np.loadtxt(frame,dtype =np.float,delimiter = None原创 2017-12-12 01:35:42 · 351 阅读 · 0 评论 -
用python学概率与统计(第十二章)拟合度检验和独立性检验
十二章原创 2017-12-30 01:10:29 · 3094 阅读 · 0 评论