自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 第8章 分类数据

第8章 分类数据import pandas as pdimport numpy as npdf = pd.read_csv('data/table.csv')df.head() School Class ID Gender Address Height Weight Math Physics 0 S_

2020-06-27 21:10:43 384

原创 3. 常见分布与假设检验

typora-root-url: tupian3 常见分布与假设检验文章目录typora-root-url: tupian3 常见分布与假设检验1 一般随机变量1.1 随机变量的两种类型1.2 离散型随机变量1.3 连续型随机变量2 常见分布2.1 离散型分布2.1.1 二项分布(Binomial distribution)2.1.2 泊松分布(Poisson distribution)2.1.3 二项分布,泊松分布,正态分布的关系2.1.4 其他离散型随机分布几何分布(Geometric distr.

2020-06-27 21:06:42 502

原创 2. 数理统计与描述性统计

typora-root-url: tupian文章目录typora-root-url: tupian一、数理统计概念1.基本概念释义2.统计量与抽样3.常用的统计量二、描述性统计1.数据集中趋势的度量2. python实现3.数据离散趋势的度量4.python实现5. 分布特征6.偏度与峰度7. 公式与python实现一、数理统计概念1.基本概念释义定义:在数理统计中,称研究对象的全体为总体,通常用一个随机变量表示总体。组成总体的每个基本单元叫个体。从总体 XXX 中随机抽取一部分个体 X1,.

2020-06-24 21:37:31 358

原创 Pandas基础6

第6章 缺失数据在接下来的两章中,会接触到数据预处理中比较麻烦的类型,即缺失数据和文本数据(尤其是混杂型文本)Pandas在步入1.0后,对数据类型也做出了新的尝试,尤其是Nullable类型和String类型,了解这些可能在未来成为主流的新特性是必要的import pandas as pdimport numpy as npdf = pd.read_csv('data/table_missing.csv')df.head() School

2020-06-23 22:31:10 199

原创 1. 随机事件与随机变量

一、随机事件1.基本概念释义现实生活中,一个动作或一件事情,在一定条件下,所得的结果不能预先完全确定,而只能确定是多种可能结果中的一种,称这种现象为随机现象。​ 例如,抛掷一枚硬币,其结果有可能是出现正面,也有可能是出现反面;掷骰子游戏中,出现的数字可能是1,2,3,4,5,6其中的任意一个。以上这些现象都是随机现象。使随机现象得以实现和对它观察的全过程称为随机试验,记为**EEE**。随机实验满足以下三个条件:可以在相同条件下重复进行;结果有多种可能性,并且所有可能结果事先已知

2020-06-22 23:12:35 181

原创 pd综合练习

2002 年-2018 年上海机动车拍照拍卖import pandas as pdimport numpy as npdf = pd.read_csv('data/数据集/2002年-2018年上海机动车拍照拍卖.csv')df Date Total number of license issued lowest p...

2020-05-01 22:51:46 793

原创 Pandas基础5

第5章 合并目录第5章 合并一、append与assign1. append方法2. assign方法二、combine与update1. comine方法(a)填充对象(b)一些例子(c)combine_first方法2. update方法(a)三个特点(b)例子三、concat方法四、merge与join1. merge函数以key1为准则连接,如果具有相同的列,则默认suffixes=('...

2020-04-30 21:49:21 105

原创 Pandas基础4

第四章 变形目录第四章 变形一、透视表1. pivot2. pivot_table3. crosstab(交叉表)二、其他变形方法1. melt2. 压缩与展开三、哑变量与因子化1. Dummy Variable(哑变量)2. factorize方法四、问题与练习1. 问题2. 练习【练习一】【练习二】import numpy as npimport pandas as pd df = p...

2020-04-28 22:56:29 140

原创 Pandas基础3

第3章 分组目录第3章 分组一、SAC过程1. 内涵2. apply过程二、groupby函数1. 分组函数的基本内容:2. groupby对象的特点三、聚合、过滤和变换1. 聚合(Aggregation)2. 过滤(Filteration)3. 变换(Transformation)四、apply函数1. apply函数的灵活性2. 用apply同时统计多个指标五、问题与练习import nu...

2020-04-26 20:39:29 120

原创 Pandas基础2

第二章 索引目录第二章 索引一、单级索引loc方法、iloc方法、[]操作符lociloc[]布尔索引isin方法快速标量索引区间索引利用interval_range方法二、多级索引创建多级索引多层索引的切片多层索引中的slice对象IndexSlice本质上是对多个Slice对象的包装索引Slice可以与loc一起完成切片操作,主要有两种用法索引层的交换swaplevel方法(两层交换)reo...

2020-04-23 22:58:54 690

原创 Pandas基础1

目录第一章 Pandas基础第一章 Pandas基础import pandas as pd import numpy as np

2020-04-20 17:50:23 269

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除