自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 分类算法之决策树

分类算法之决策树决策树信息的度量和作用信息增益信息增益的计算sklearn决策树API及案例sklearn决策树API案例:泰坦尼克号乘客生存分类模型决策树的优缺点以及改进决策树决策树是一种基本的分类方法,当然也可以用于回归。我们一般只讨论用于分类的决策树。决策树模型呈树形结构。在分类问题中,表示基于特征对实例进行分类的过程,它可以认为是if-then规则的集合。在决策树的结构中,每一个实例都被一条路径或者一条规则所覆盖。通常决策树学习包括三个步骤:特征选择、决策树的生成和决策树的修剪。信息的度量和作

2021-08-10 11:05:17 784

原创 分类算法之K近邻和朴素贝叶斯

分类算法之K近邻和朴素贝叶斯K近邻一个例子弄懂k-近邻sklearn k-近邻算法API朴素贝叶斯概率论基础贝叶斯公式拉普拉斯平滑sklearn朴素贝叶斯实现APIK近邻一个例子弄懂k-近邻电影可以按照题材分类,每个题材又是如何定义的呢?那么假如两种类型的电影,动作片和爱情片。动作片有哪些公共的特征?那么爱情片又存在哪些明显的差别呢?我们发现动作片中打斗镜头的次数较多,而爱情片中接吻镜头相对更多。当然动作片中也有一些接吻镜头,爱情片中也会有一些打斗镜头。所以不能单纯通过是否存在打斗镜头或者接吻镜头来判

2021-08-08 21:21:45 547

原创 数据降维和数据集的操作

数据降维和数据集的操作数据的特征选择sklearn.feature_selectionPCA降维数据集的划分数据集进行分割estimator的工作流程数据的特征选择降维本质上是从一个维度空间映射到另一个维度空间,特征的多少别没有减少,当然在映射的过程中特征值也会相应的变化。举个例子,现在的特征是1000维,我们想要把它降到500维。降维的过程就是找个一个从1000维映射到500维的映射关系。原始数据中的1000个特征,每一个都对应着降维后的500维空间中的一个值。假设原始特征中有个特征的值是9,那么降维

2021-08-07 19:38:51 702

原创 特征工程之特征提取和数据预处理

特征工程数据的特征抽取分类特征变量提取方法文本特征提取(只限于英文)方法方法数据的特征预处理归一化标准化缺失值数据的特征抽取现实世界中多数特征都不是连续变量,比如分类、文字、图像等,为了对非连续变量做特征表述,需要对这些特征做数学化表述,因此就用到了特征提取. sklearn.feature_extraction提供了特征提取的很多方法分类特征变量提取我们将城市和环境作为字典数据,来进行特征的提取。sklearn.feature_extraction.DictVectorizer(sparse =

2021-08-06 19:48:03 1414

原创 数据结构之栈与队列

栈与队列栈队列队列的操作双端队列栈栈(stack),有些地方称为堆栈,是一种容器,可存入数据元素、访问元素、删除元素,它的特点在于只能允许在容器的一端(称为栈顶端指标,英语:top)进行加入数据(英语:push)和输出数据(英语:pop)的运算。没有了位置概念,保证任何时候可以访问、删除的元素都是此前最后存入的那个元素,确定了一种默认的访问顺序。由于栈数据结构只允许在一端进行操作,因而按照后进先出(LIFO, Last In First Out)的原理运作。原理图如下:##栈结构实现栈可以用顺序

2021-07-27 21:23:26 133

原创 数据结构之顺序表

顺序表1. 顺序表的基本形式2. 顺序表的结构与实现2.1 顺序表的结构2.2 顺序表的两种基本实现方式2.3 元素存储区替换2.4 元素存储区扩充2.4.1 扩充的两种策略3. 顺序表的操作3.1 增加元素3.2 删除元素4. Python中的顺序表4.1 list的基本实现技术1. 顺序表的基本形式图a表示的是顺序表的基本形式,数据元素本身连续存储,每个元素所占的存储单元大小固定相同,元素的下标是其逻辑地址,而元素存储的物理地址(实际内存地址)可以通过存储区的起始地址Loc (e0)加上逻辑地址(

2021-07-24 19:49:49 251 2

原创 数据结构与算法入门

引入概念1. 尝试2. 算法的提出2.1 算法的概念2.2 算法的五大特性3 算法效率衡量3.1 时间复杂度与“大O记法”3.2 如何理解“大O记法”3.3 最坏时间复杂度3.4 时间复杂度的几条基本计算规则3.5 算法分析4. 常见时间复杂度5. Python内置类型性能分析5.1 timeit模块5.2 list的操作测试5.3 list内置操作的时间复杂度5.4 dict内置操作的时间复杂度6. 数据结构6.1 概念6.2 算法与数据结构的区别6.3 抽象数据类型(Abstract Data Type

2021-07-24 11:18:06 85

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除