自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 机器学习-模型选择与调优

交叉验证:将拿到的训练数据,分为训练集和验证集,以下图为例:将数据分成4份,其中一份作为验证集。然后经过4次(组)的测试,每次都更换不同的验证集。即可得到4组模型的结果,取平均值作为最终结果。又称4折交叉验证在之前的学习中知道数据分为训练集和验证集,但是为了让从训练得到的模型结果更加准确,做以下处理训练集:训练集+验证集测试集:测试集交差验证的目的:为了让被评估的模型更加准确可信。

2023-05-16 19:39:24 173

原创 机器学习-K-近邻算法(KNN)

如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别以图为例,若要确定圆圈的位置,以KNN思想即是对比与其他位点的距离,选取K个最近的,这K个中大多数是属于什么类别,则圆圈也属于什么类别。两个样本的距离可以通过如下公式计算,又叫欧式距离

2023-05-16 16:20:58 193

原创 机器学习-特征降维与相关系数

Sepal_Length,Petal_Length相关系数为0.87,为高度线性相关。进行低方差过滤,设置方差临界值threshold为1,低于临界值的特征值会被删除。n_components为整数表示降维的维度数,小数的话表示保留原特征的百分比。皮尔逊相关系数-反映变量之间相关关系密切程度的统计指标。原维度为3,降维后为1。删除低方差的一些特征。

2023-05-15 21:10:21 256

原创 机器学习-归一化与标准化对比

通过对原始数据进行变换把数据映射到(默认为[0,1]之间)通过对原始数据进行变换,把数据变换到均值为0,标准差为1的范围内。

2023-05-15 15:57:13 126

原创 机器学习-归一化处理

raise InvalidParameterError(sklearn.utils._param_validation.InvalidParameterError: The 'feature_range' parameter of MinMaxScaler must be an instance of 'tuple'. Got [1, 3按照黑马程序员3天快速入门python学习中进行归一化处理更改归一范围出现如下报错。这是原报错代码,添加feature_range设置范围后就报错。即可运行,运行结果如下。

2023-05-15 15:17:59 3599 2

原创 机器学习入门-文本特征提取

此处中文是自己手动分割的,并不太方便,调用jieba函数来更好的进行分词。添加stop_words可以去除指定特征词,展示效果如下。而后与上面步骤相同进行文本特征值提取。初步验证jieba分词是否可行。

2023-05-15 13:03:15 115

原创 机器学习入门-字典特征提取

返回的是稀疏矩阵,这并不是我们想要看到的,所以加上参数,得到想要的结果。注意观察没有加上sparse=False参数的结果。

2023-05-15 12:11:57 108 1

原创 机器学习入门-sklearn数据集

sklearn.datasets加载获取流行数据集获取小规模数据集,数据包含在datasets里*获取大规模数据集,需要从网络上下载,函数的第一个参数是data_home,表示数据集下载的目录,默认是~/scikit_learn_data/load和fetcch返回的数据类型datasets.base.Bunch(字典格式)data:特征数据数组,是[n_samples*n_features]的二维numpy.ndarray数组。

2023-05-14 19:27:14 312

原创 处理机调度的三个层次

高级调度(作业调度):按一定的原则,从外存上处于后备队列的作业中挑选一个或多个作业,给他们分配内存等必要资源,并建立相应的进程(建立PCB),以使他们获得竞争处理机的权利。高级调度辅存(外存)与内存之间的调度,每个作业只调入一次,调出一次。作业调入时会建立相应的PCB,作业调出时才撤销PCB。外存→内存 发生频率最低中级调度(内存调度):引入了虚拟存储技术之后,可将暂时不能运行的进程调至外存等待(此时进程状态为挂起状态),等他重新具备了运行条件且内存又稍有空闲时,再重新调入内存,这么

2022-11-03 20:51:13 992

原创 Linux操作命令提示符

命令提示符为“zp@lab:~$:”,其中zp为用户名,lab为主机名,~代表当前登录用户主目录。常见的提示符有两个#与$,$表示普通用户的终端,#表示root用户的终端,以root用户登录系统时,完整的命令提示符为“root@lab:~#”cd用于改变shell的工作目录...

2022-04-10 21:35:55 1708

原创 基础练习 字母图形

问题描述利用字母可以组成一些美丽的图形,下面给出了一个例子:ABCDEFGBABCDEFCBABCDEDCBABCDEDCBABC这是一个5行7列的图形,请找出这个图形的规律,并输出一个n行m列的图形。输入格式输入一行,包含两个整数n和m,分别表示你要输出的图形的行数的列数。输出格式输出n行,每个m个字符,为你的图形。样例输入5 7样例输出ABCDEFGBABCDEFCBABCDEDCBABCDEDCBABC数据规模与约定1 &lt

2021-12-25 13:15:41 182

原创 基础练习 数列特征

问题描述给出n个数,找出这n个数的最大值,最小值,和。输入格式第一行为整数n,表示数的个数。第二行有n个数,为给定的n个数,每个数的绝对值都小于10000。输出格式输出三行,每行一个整数。第一行表示这些数中的最大值,第二行表示这些数中的最小值,第三行表示这些数的和。样例输入51 3 -2 4 5样例输出5-211数据规模与约定1 <= n <= 10000。num=int(input())nm=list(map(int,input()

2021-12-25 10:38:56 67

原创 c语言每日一练:数列排序

#include<stdio.h>int main(){ int i=0,j=0,k=0,n=0; scanf("%d",&n); int a[200]; for(i=0;i<n;i++) scanf("%d",&a[i]); for(i=n;i>0;i--) { for(j=0;j<n;j++) { if(a[j-1]>a[j]) { k=a[j-1]; a[j-1]=a[j]; a.

2021-12-15 21:08:22 666

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除