自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

weixin_44835596的博客

主要用于学习笔记,快速掌握知识

  • 博客(10)
  • 收藏
  • 关注

原创 Python笔记——Python与Excel的交互,操作(读取、更改和存储)Excel电子表格

Excel简介Excel是日常用于储存少量数据非常常用的工具,操作简单,并且较为美观。Excel拥有以下特征:组织结构:电子表格应用的工作簿文件将单独的工作表管理起来,而工作表是管理单元格的工具。数据:数据通常使用表格的形式存储,而单元格中包含的是具体的数据点(例如浮点数或字符串),可以为了显示的目的加入格式化信息(例如字体,颜色等),也可以加入某些计算机代码(例如,格点中的数据来自于数值...

2019-07-23 20:50:54 6910 1

原创 统计知识基础(三)常用构造估计量的两种方法——矩估计、最大似然估计

极大似然函数

2019-07-20 00:17:50 6130 1

原创 统计知识基础(二)点估计、区间估计、大数定律及中心极限定理

点估计

2019-07-12 17:23:28 4116

原创 统计知识基础(一)几种重要分布

正态分布用Y表示表示随机变量,若其服从均值为μ\muμ,方差为δ2\delta^2δ2的分布规律,则称其为正态分布Y∼N(μ,δ2)Y\sim N\left(\mu,\delta^2\right)Y∼N(μ,δ2)经常用在自然和社会科学来代表一组不明的随机变量,正态分布的数学期望为μ\muμ,决定了其分布的位置,其方差δ2\delta^2δ2或标准差δ\deltaδ决定了分布的幅度。正...

2019-07-07 17:42:17 1054

转载 MYSQL时间日期类型

时间日期类型1、Date日期类型:系统使用三个字节来存储数据,对应的格式为:YYYY-mm-dd,能表示的范围是从1000-01-01 到9999-12-12,初始值为0000-00-002、Time时间类型:能够表示某个指定的时间,但是系统同样是提供3个字节来存储,对应的格式为:HH:ii:ss,但是mysql中的time类型能够表示时间范围要大的多,能表示从-838:59:59~838...

2019-07-04 14:59:30 239

原创 DBMS数据库查询语句的逻辑/执行顺序

对于初学数据库的初学者来说,查询语句是必要的,特别是对于数据分析人员,因为权限原因,需要掌握更复杂的查询语句。理解,掌握SQL的查询语句对于更快的掌握SQL查询语句有非常大的帮助。因为我是学MYSQL的,所以我只拿MYSQL的语法作为示例。一、SQL语句一般来说,SQL语句的写法是这样的select 字段名或聚合函数或数值或查询结果等 from 表或子查询结果where 条件grou...

2019-07-03 15:31:32 1081

原创 决策树学习笔记——决策树建树原理之C4.5和C5.0以及CART建树原理(二)

决策树学习笔记——决策树建树原理之C4.5和C5.0(二)在上一篇决策树学习笔记——决策树建树原理之ID3建树原理(一).已经简单介绍了ID3算法的建树原理,以及附上了Python计算信息增益的代码。C4.5原理由ID3算法的原理知,ID3算法的弊端在于更倾向于选择水平数量较多的自变量,因为当自变量水平数量较多时,信息增益就越大,并且输入的自变量必须是分类型变量,而C4.5改变了ID3算法中...

2019-05-07 21:36:47 1257

原创 决策树学习笔记——决策树建树原理之ID3建树原理(一)

决策树建树原理之ID3建树原理(一)信息熵在ID3算法之中,建树的时候,是根据信息增益挑选最具有解释能力的变量,在了解信息增益之前需要先了解信息熵和条件熵。对于一个变量AAA,变量AAA中有n1n_1n1​个水平个数,则信息熵的数学表达式如下:Entropy(A)=−∑i=1n1pilog(pi)Entropy(A)=-\sum_{i=1}^{n_1}p_ilog(p_i)Entrop...

2019-05-05 16:39:29 1178

原创 Python 根据AIC准则定义向前逐步回归进行变量筛选(二)

Python 根据AIC准则定义向前逐步回归进行变量筛选(二)AIC简介AIC即赤池值,是衡量模型拟合优良性和模型复杂性的一种标准,在建立多元线性回归模型时,变量过多,且有不显著的变量时,可以使用AIC准则结合逐步回归进行变量筛选。AICD数学表达式如下:AIC=2p+n(log(SSE/n))AIC=2p+n(log(SSE/n))AIC=2p+n(log(SSE/n))其中,ppp...

2019-05-02 17:45:55 24811 7

原创 利用Python中的statsmodels简单建立多元线性回归模型(一)

利用Python中的statsmodels简单建立多元线性回归模型(一)概念简单介绍多元线性回归其实是在一元线性回归的基础上增加了若干个自变量个数,数学表达式如下:其中,yyy是因变量(响应变量),β0β_{0}β0​是截距项,β1β_{1}β1​,β2β_{2}β2​,.........,βiβ_{i}βi​是回归系数,x1x_{1}x1​,x2x_{2}x2​,.........,xi...

2019-04-30 22:59:36 19323 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除