自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 动手学数据分析 Task5

动手学数据分析 Task5一、逻辑回归二、随机森林三、模型评估3.1 k折交叉验证3.2 混淆矩阵3.3 ROC曲线一、逻辑回归LogisticRegression(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver='liblinear', max_iter=100, multi_class='

2020-08-27 23:42:02 389

原创 动手学数据分析 Task4

动手学数据分析 Task4一、可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图二、可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况三、可视化展示泰坦尼克号数据集中不同年龄的人生存与死亡人数分布情况一、可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图并列柱状图或叠加柱状图都可以很好地展示这道题的结果,方法也类似,只需在参数中设置stack=True或False。##并列柱状图train.groupby(['Sex','Survived']) ['Survived'].

2020-08-25 22:56:56 286

原创 动手学数据分析 Task3

动手学数据分析 Task3一、concat、merge、join二、groupby一、concat、merge、joinconcat方法可以在两个维度上拼接,默认纵向凭借(axis=0),拼接方式默认外连接pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_int

2020-08-23 16:04:00 176 1

原创 动手学数据分析 Task 2

动手学数据分析 Task 2一、处理缺失值二、分箱操作三、LabelEncoder 和 OneHotEncoder一、处理缺失值常用的函数有dropna()和fillna()。DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)属性说明:默认参数axis=0,根据索引(index)删除指定的行; axis=1,根据列名(columns)删除指定的列默认axis=0,how=‘any’,删除带有空

2020-08-21 21:27:29 152

原创 动手学数据分析 Task 1

动手学数据分析 Task 1一、数据加载二、Pandas基础三、探索性数据分析一、数据加载项目源数据请见 kaggle。1.对于csv中的数据,pandas库提供两种方法来读取,分别为:read_csv()和read_table()。二者的区别为:read_table()以制表符 \t 作为数据的标志,也就是以行为单位进行存储;而read_csv()则是按csv file 中的每一格为单位进行存储。读取数据时最好使用绝对地址。如果要用相对地址却又不知道当前工作目录,则可以用下面的方法获得:impo

2020-08-19 21:19:20 170 1

原创 方差分析

方差分析一、基本概念二、实例一、基本概念方差分析(Analysis of variance, ANOVA) 主要研究分类变量作为自变量时,对因变量的影响是否是显著的。方差分析的方法是由20世纪的统计学家Ronald Aylmer Fisher在1918年到1925年之间提出并陆续完善起来的,该方法刚开始是用于解决田间实验的数据分析问题,因此,方差分析的学习是和实验设计、实验数据的分析密不可分的。实验设计和方差分析都有自己相应的语言。因此,在这里我们通过一个焦虑症治疗的实例,先了解一些术语,并且思考一

2020-06-29 22:21:58 1523

原创 常见分布与假设检验

常见分布与假设检验一、常见分布1、离散型分布1.1 二项分布1.2 泊松分布(描述某段时间内,事件具体发生的概率)2、连续型分布2.1 均匀分布2.2 正态分布2.3 指数分布(描述事件的时间间隔的概率)一、常见分布1、离散型分布1.1 二项分布二项分布可以认为是一种只有两种结果(成功/失败)的单次试验重复多次后成功次数的分布概率。二项分布需要满足以下条件:试验次数是固定的每次试验都是独立的对于每次试验成功的概率都是一样的一些二项分布的例子:销售电话成功的次数一批产品中有缺陷的产品数量

2020-06-26 22:00:42 1334

原创 数理统计与描述性分析

数理统计与描述性分析一、 样本1.1 定义1.2 样本均值和方差1.3 有关证明二、 描述性统计1.1 中位数、众数、分位数1.2 方差、标准差、变异系数1.3 偏度、峰度一、 样本1.1 定义定义:在数理统计中,称研究对象的全体为总体,通常用一个随机变量表示总体。组成总体的每个基本单元叫个体。从总体 XXX 中随机抽取一部分个体 X1,X2,...,XnX_1,X_2,...,X_nX1​,X2​,...,Xn​ ,称 X1,X2,...,XnX_1,X_2,...,X_nX1​,X2​,...,X

2020-06-24 21:02:28 2594

原创 随机事件与随机变量

一、随机事件与随机变量随机事件1 定义2 随机事件的概率3 古典概型4 条件概率5 全概率公式和贝叶斯公式5.1 全概率公式5.2 贝叶斯公式随机变量1 定义2 离散型随机变量和二项分布2.1 离散型随机变量2.2 二项分布3 随机变量的数字特征3.1 期望3.2 方差3.3 协方差随机事件1 定义随机事件需满足以下三个条件:可以在相同条件下重复进行;结果有多种可能性,并且所有可能结果事先已知;做一次试验究竟哪个结果出现,事先不能确定。2 随机事件的概率随机事件的概率主要有以下性质:1

2020-06-21 16:30:45 539

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除