自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 问答 (4)
  • 收藏
  • 关注

原创 【python二级】错误及错误处理

语言程序错误1、语法错误2、运行错误运行过中程序意外终止的错误,最常见的有1/01/0---------------------------------------------------------------------------ZeroDivisionError Traceback (most recent call last)~\AppData\Local\Temp/ipykernel_12736/2354412189.py in

2022-02-08 17:12:20 724

原创 【python二级】format 函数

format函数1、基础用法print("{} {}!".format("hello", "world"))print("{1} {0}!".format("hello", "world"))print("{1} {0} {1}".format("hello", "world"))hello world !world hello !world hello world2、设置参数print("名字:{name}, 性别: {sex}".format(name="Emma", sex="W

2022-02-07 18:13:57 1007

原创 数据挖掘算法原理与实践第5关:生成多项式特征

本关任务:利用sklearn生成多项式特征。为什么需要多项式特征在数据挖掘中,获取数据的代价经常是非常高昂的。所以有时就需要人为的制造一些特征,并且有的特征之间是有关联的。生成多项式特征可以轻松的为我们获取更多的数据,并获得特征的更高维度和互相间关系的项且引入了特征之间的非线性关系,可以有效的增加模型的复杂度。PolynomialFeatures代码实现:import numpy as npfrom sklearn.preprocessing import PolynomialFeatures

2022-01-21 12:53:20 1654

原创 数据挖掘算法原理与实践第四关:离散值编码

本关任务:利用sklearn对标签进行OneHot编码。LabelEncoder用于分类型特征,将特征编码为整数代码实现:from sklearn.preprocessing import LabelEncoderlabel = ['male','female']int_label = LabelEncoder()label = int_label.fit_transform(label)OneHotEncoder将LabelEncoder输出结果输入估计器,估计器会把整数的大小关系考虑

2022-01-21 12:41:54 1097

原创 数据挖掘算法原理与实践第三关:归一化

本关任务:利用sklearn对数据进行归一化。为什么使用归一化归一化是缩放单个样本以具有单位范数的过程。归一化能够加快模型训练速度,统一特征量纲,避免数值太大。值得注意的是,归一化是对每一个样本做转换,所以是对数据的每一行进行变换。而之前我们讲过的方法是对数据的每一列做变换。L1范数归一化L1范数就是向量各元素的绝对值之和,也被称为是"稀疏规则算子,有两个好处:1、特征选择2、可解释性代码实现from sklearn.preprocessing import normalizedata =

2022-01-21 12:24:32 1228

原创 数据挖掘算法原理与实践第二关:线性转换

本关任务:利用sklearn对数据进行非线性转换。为什么要进行线性转换如果特征不服从或者近似服从标准正态分布(即,零均值、单位标准差的正态分布)的话,算法的表现会大打折扣,非线性转换就是将我们的特征映射到**均匀分布或者高斯分布(**即正态分布)。映射到均匀分布将最大的数映射为1,最小的数映射为1,其他的数按从小到大的顺序均匀分布在0到1之间,如有相同的数则取平均值代码实现:from sklearn.preprocessing import QuantileTransformerimport

2022-01-21 11:28:23 646

原创 数据挖掘算法原理与实践第一关:标准化

本关任务:利用sklearn对数据进行标准化。为什么要进行标准化在机器学习中常忽略数据的分布,仅仅对数值做零均值、单位标准差的处理。在一个机器学习算法的目标函数里的很多元素所有特征都近似零均值,方差具有相同的阶。如果某个特征的方差的数量级大于其它的特征,那么,这个特征可能在目标函数中占主导地位,这使得模型不能从其它特征有效地学习。三种标准化方式Z-score标准化公式:结果:对每个特征/每列来说所有数据都聚集在0附近,方差值为1。代码实现:from sklearn import prep

2022-01-21 10:57:13 2217

原创 【linux学习笔记】文件与目录管理

linux学习笔记linux文件与目录管理相对路径与绝对路径目录管理文件与目录的查看文件的复制(cp)、删除(rm)和移动(mv)linux文件与目录管理相对路径与绝对路径绝对路径:路径的写法“一定由根目录 / 写起”,例如: /usr/share/doc 这个目录。相对路径:路径的写法“不是由 / 写起”,例如由 /usr/share/doc 要到 /usr/share/man 下面时,可以写成: “cd …/man”,相对路径意指“相对于目前工作目录的路径!”注意:绝对路径的准确度好,在写程序

2022-01-19 18:39:37 915

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除