自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 范数的概念

(1)向量范数 如果定义一个向量为:a=[-5,6,8, -10] 向量的1范数即:向量的各个元素的绝对值之和,上述向量a的1范数结果就是:29; 向量的2范数即:向量的每个元素的平方和再开平方根,上述a的2范数结果就是:15; 向量的负无穷范数即:向量的所有元素的绝对值中最小的:上述向量a的负无穷范数结果就是:5; 向量的正无穷范数即:向量的所有元素的绝对值中最大的:上述向量a的负无穷范数结果就是:10; (2)矩阵范数 定义矩阵A = [ -1 2 -3;       4 -6 6] 矩阵的1范数(

2021-07-24 17:37:06 2637

原创 西瓜书把书读薄之决策树

目录 一、串联 决策树(多个判定条件的分类问题)–> 如何判定(划分选择) 二、决策树概念 概念:属于分类问题(在用基尼指数的时候,也有回归树)。 组成部分:一颗决策树一般包括一个根节点(样本全集)、若干个内部节点(测试属性)、若干个子节点(决策结果)。算法如下: 返回的判定条件: 当前节点包含的样本全部属性属于同一类别,无需划分。 当前属性集为空,或是所有样本在所有属性上取值相同,无法划分。(把节点标记为叶节点,类别为样本中类别占比最大的) 当前节点包含的样本集合为空,不能划分。 三、划分选择

2021-05-06 16:11:10 305

原创 jieba切词的函数区别

jieba包分词函数 #jieba.cat()函数 #jieba.lcat()函数 #jieba.posseg.cut()函数 #jieba.posseg.lcut()函数

2021-03-12 16:26:56 1300

原创 数据处理之pandas 中unique()函数与nunique()函数区别

pandas 之unique()函数与nunique()函数区别. 区别: (1)unique()是以 数组形式(numpy.ndarray)返回所选列的所有唯一值(特征的所有唯一值) (2)nunique() Return number of unique elements in the object.即返回的是唯一值的个数; 等同于用法:len(ratings_df[‘title’].unique()) ...

2020-10-26 10:45:54 4528

原创 数据处理之数据去重

基本方法: Pandas中数据去重一般是用duplicated()和drop_duplicates()两个方法进行相结合 函数介绍: duplicated 返回一个布尔向量,其长度为行数,表示行是否重复。 drop_duplicates 删除重复的行。 用法示例: movies_df.shape (45463, 2) movies_df.duplicated(['id', 'title']).sum() #返回重复项总数 30 movies_df.drop_duplicates(['id'], in

2020-10-26 10:44:57 2060

原创 数据处理之Pandas中数据类型转换

Pandas中进行数据类型转换有三种基本方法: 使用astype()函数进行强制类型转换 自定义函数进行数据类型转换 使用Pandas提供的函数如to_numeric()、to_datetime() 举例数据 import numpy as np import pandas as pd data = pd.read_csv('data.csv', encoding='gbk') #因为数据中含有中文数据 data 使用astype()函数进行强制类型转换 data['客户编号'].astype(

2020-10-23 20:36:38 39586 1

原创 Dropout

Dropout原理解析 ##1.Dropout 原理理解 在对于神经网络的每个训练批次中,通过忽略一半的特征检测器(让一半的隐层节点值为0),可以明显地减少过拟合现象。这种方式可以减少特征检测器(隐层节点)间的相互作用,检测器相互作用是指某些检测器依赖其他检测器才能发挥作用。 Dropout说的简单一点就是:我们在前向传播的时候,让某个神经元的激活值以一定的概率p停止工作,这样可以使模型泛化性更强,因为它不会太依赖某些局部的特征,如图1所示。 ##2.Dropout 的工作流程 ...

2020-06-09 16:49:17 504

原创 《机器学习实战之kNN海伦约会》

《机器学习实战之kNN海伦约会》 问题阐述:TypeError: ufunc ‘multiply’ did not contain a loop with signature matching types dtype(’<U32’) dtype(’<U32’) dtype(’<U32’) 网上找了很多资料,一直没有找到到底怎么回事。查看树上给的代码发现: 因为类型原因在读取文件的...

2019-09-29 10:58:00 504 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除