自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 决策树QA

QA1. 采⽤信息增益、信息增益率作为决策树⽣⻓策略,有什么区别;信息增益( ID3算法 )计算使用所有特征划分数据集D,得到多个特征划分数据集D的信息增益,从这些信息增益中选择最大的,因而当前结点的划分特征便是使信息增益最大的划分所使用的特征。不足:a)ID3没有考虑连续特征,⽐如⻓度,密度都是连续值,⽆法在ID3运⽤。b)ID3采⽤信息增益⼤的特征优先建⽴决策树的节点。在相同条件下,取值⽐较多的特征⽐取值少的特征信息增益⼤。c) ID3算法对于缺失值的情况没有做考虑d) 没有考虑过拟合的

2021-07-22 23:16:12 223 2

原创 逻辑回归QA

为什么不能直接用线性回归做分类?1.从线性回归的假设方面来说线性回归模型是基于输出的结果Y是连续的、除去协变量X1,…,Xp带来的均值系统方差后,误差服从正态分布这一假设上的。如果输出变量是二元的,明显违反了这一假设,由此一般认为这样的结论是无效的。实际上就算是二元的,结果也不会特别坏。虽然如果结果是二元的,条件正态的假设不再成立,但是如果假定形式里的结果的期待值是正确地基于协变量的,比如E(Y|X1,…,Xp)是正确的,线性回归的参数估计是无偏的。但是我们基于结果正态的假设而计算出的标准误(stan

2021-07-09 07:04:58 206

原创 2021-03-04 kaggle房价预测

文章目录背景总览数据观察各项主要特征与房屋售价的关系SalePrice峰度(Kurtosis)是描述某变量所有取值分布形态陡缓程度的统计量。偏度(Skewness)是描述某变量取值分布对称性的统计量。分析特征数据数据再分类提取主要特征验证主要特征是否满足要求类别型特征CentralAirOverallQuaYearBuilt 建造年份Neighborhood数值型特征LotAreaGrLivAreaTotalBsmtSFMiscValGarageArea/GarageCars主要特征更加科学的分析数据关系矩

2021-03-04 01:26:28 518 1

原创 2021-02-19 MySQL

数据表相关操作如何创建数据表?完整性约束条件AUTO_INCREMENT自增长和主键配合使用CREATE TABLE IF NOT EXISTS user5(id SMALLINT KEY AUTO_INCREMENT,username VARCHAR(20));INSERT user5 VALUES(1,‘KING’);INSERT user5(username) VALUES(‘queen1’);INSERT user5 VALUES(111,‘KING1’);INSERT us

2021-02-19 10:44:11 146

原创 2021-02-17 MySQL

数据库简介数据库简介数据库数据库系统数据库管理系统MySQL的安装与配置及登陆与退出登陆/退出MySQL修改MySQL命令提示符MySQL常用命令MySQL语句的规范数据库操作(DDL)创建数据库查看上一步操作产生的警告查看当前服务器下的数据库列表查看指定数据库的定义修改指定数据库的编码方式打开指定数据库得到当前打开的数据库名称删除指定数据库数据表相关操作什么是表?创建表完整性约束条件查看数据库中的数据表以及表结构查看数据库下的数据表查看指定表的表结构查看创建表的详细信息MySQL存储引擎什么是存储引擎?.

2021-02-18 07:13:57 124 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除