自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(66)
  • 收藏
  • 关注

原创 利用GUP训练

网络模型和损失函数是不需要重新赋值的,只有数据需要重新赋值。gpu对比未用gpu:用了gpu的速度快。nvidia-smi查看gpu。

2024-08-29 14:20:24 237 1

原创 完整的模型训练路线

model.train() 和 model.eval ()在官网的torch.nn.Module小节中可以查看train 和evalmodel.train() 将模块设置为训练模式。这只对某些模块有影响,例如Dxopout、BatchNorm等。model.eval ()将模块设置为验证模式。这只对某些模块有影响。这等效于self.Train(False)。最好还是加上。在训练开始前加上.train(),在测试开始前加上.eval()。

2024-08-29 11:21:52 544

原创 神经网络——网络模型

ImageNet数据集太大了,仅训练集就有147.9g。

2024-08-28 12:20:16 786

原创 神经网络——优化器

优化器的基本使用如果要知道各个优化器的详细用法需要对其有一定了解注意要多训练几轮。

2024-08-28 10:45:48 371

原创 损失函数与反向传播

损失函数只能处理float类型的张量。该Loss算法计算输入对数与目标对数之间的交叉熵损失,在训练 C 类分类问题时非常有用。

2024-08-28 10:03:48 283

原创 神经网络——CIFAR10小实战

Sequential的使用:将网络结构放入其中即可,可以简化代码。找了一个对CIFAR10进行分类的模型。

2024-08-28 08:45:32 489

原创 神经网络——非线性激活

Normalization Layers正则化层正则化可以加快神经网络的训练速度,用的比较少,不作介绍,自己看文档一般用于文字识别,自己看文档。在训练过程中,随机将输入张量的部分元素清零。主要作用是防止过拟合。用于自然语言处理。计算两个值之间的距离计算误差。

2024-08-26 16:30:29 767

原创 神经网络——最大池化

最大池化有时也被称为下采样,对应的有上采样。注意ceil_mode参数的使用。

2024-08-26 15:41:45 247

原创 神经网络—卷积层

新生成的卷积核和原来的卷积核不一定相同。

2024-08-26 15:15:28 642

原创 神经网路的基本骨架——nn.Module

torch.nn有很多不同的类别,主要学习Containers。

2024-08-26 14:02:49 386

原创 Dataloader

drop_last参数windows系统下如果出现BrokenPipeError的错误,可以考虑将 num_workers设置为0。

2024-08-26 11:14:52 505

原创 torchvision中的数据集使用

如何将数据集和transforms结合在一起?以CIFAR10为列。

2024-08-23 14:58:34 256

原创 transforms

关注输入和输出类型- 关注官方文档- 关注方法需要什么参数- 不知道返回值类型的时候可以试错或者搜索- print- debug。

2024-08-23 13:58:16 459

原创 Tensorboard

Dataset1.如何获取每一个数据及其label2.告诉我们总共有多少的数据。

2024-08-22 17:53:20 270

原创 Zotero推荐插件

如图,右击标题栏 –> 勾选JCR分区、中科院分区、IF等所需要的列(没有这些列的选项,重启软件试试)–> 选中所有的条目 –> 从easyScholar更新期刊信息。③model设置的是gpt的对话模型,默认为gpt-3.5-turbo支持4k上下文,对于论文来说显得不够用,很容易出现下面的错误。右键任意一个列的名字,会弹出一个右键菜单,可以勾选/取消勾选一个列,并且在最后有两个操作按钮是【列设置】和【视图组】【小工具】:选择需要调整的条目,右键–小工具,即可设置。【配置Green Frog参数】

2024-07-16 16:45:40 812

原创 Zotero安装使用

1.直接通过connector将资源保存到Zotero中,按下图进行操作,在点击Save to Zotero保存到自己的文件夹下。已经创建了一个帐户,已经安装了Zotero,可以用它来从任何地方同步和访问你的库。注意:下载与Zotero版本兼容的插件,如果出现不兼容,可以尝试之前的版本。插件安装方法:Zotero导航栏——工具——附加组件,选择下载好的插件。选择【 Custom】,【Standard】会默认放置C盘。3.使用ISBN、DOI或PubMed ID搜索源。选择自己的路径进行安装!

2024-07-16 14:57:06 448

原创 pydotplus生成图像报错: GraphViz‘s executables not found

报错:GraphViz’s executables not found。(4)重启jupyter,重新执行DecisionTree.ipynb。Graphviz不是一个python tool,仍然需要安装。(2)解压后,编辑环境变量。(3)测试是否安装成功。

2024-05-22 18:46:47 409

原创 Pycharm使用Anaconda虚拟环境

这个警告说明当前所选的后端是非交互式的(non-interactive),因此无法显示图像。这可能是因为 Matplotlib 的后端设置为 ‘Agg’,它是一个非交互式的后端。如果你想要在代码运行时交互式地显示图像,可以考虑使用其他后端,如‘TkAgg’或‘Qt5Agg’。这个错误通常涉及到 Matplotlib 的后端设置问题。Matplotlib 后端是控制图形渲染的引擎,可以尝试更改后端来解决这个问题。在你的代码开头加上这两行代码,尝试用 ‘Agg’ ,看看是否能够解决这个错误。

2024-05-13 10:44:42 719 1

原创 anaconda虚拟环境pytorch安装

注意:Pytorch官网首页目前只更新到支持DUDA12.1的,还没更新到支持CDUA12.3 GPU的安装,官网首页的命令安装后只支持CPU。使用的文中这个末尾带nvidia的之前版本的命令,安装后CUDA12.3可正常在环境中使用GPU的Pytorch。注意:这里查看一下,自己的显卡驱动所能支持的版本,我这显卡驱动支持cuda12.3,所以我安装的cuda和pytorch都很新,你只需要根据自己需要更改版本就好了。以上就是验证PyTorch是否安装成功的常用方法。在命令窗口中直接输入命令–回车安装。

2024-05-10 20:04:41 830 1

原创 《动手学机器学习》资源

(1)关于“代码可在线运行”:读者可以把GitHub上的代码下载下来,用任意支持ipynb格式的在线或本地工具运行,本书不提供在线运行的工具;(2)关于习题答案:本书不提供习题答案,读者自行练习。理论解读视频课程:可扫描书中二维码观看,也可通过。

2024-05-10 10:51:31 463

原创 Anaconda虚拟环境

创建虚拟环境首先要查看当前已有环境,打开Anaconda Prompt,输入。这个环境用的python版本是3.9版本的,如果默认创建,会在C盘!接下来问你是否要安装这些包,输入y。就可以进入virtual 环境中。说明,我们现在已经有这几个环境。此时就完成虚拟环境的安装了。(1)若要创建一个虚拟环境。(2)进入环境,输入命令。回答y,就可以完全移除了。可以看到环境已经创建。

2024-05-10 09:57:28 660 1

原创 Jupyter配置

(3)找到Jupyter Notebook(anaconda)的快捷方式,右键点击【属性】。在目标一行中,去掉最后面的C:\Users\YX\Desktop。(1)打开【Anaconda Prompt】,输入【jupyter notebook --generate-config】命令。从运行结果可知【jupyter_notebook_config.py】的位置。去掉前面的【#】,在单引号‘’中添加路径为事先新建的文件夹。(2)使用【记事本】打开。

2024-05-06 16:16:54 473 1

原创 Anaconda安装教程

Anaconda是一个数据科学平台,提供一个发行版的 Python 以及大量常用的数据科学包、库和工具。通过包含诸如 NumPy、Pandas、SciPy、Matplotlib等核心库,以及 Jupyter Notebook等开发工具,使数据分析、机器学习和数据可视化变得更加容易。Anaconda还包括一个包管理器 conda ,用于安装、更新和管理软件包,确保不同包之间的依赖关系得到妥善处理。

2024-05-06 15:30:23 622 1

原创 回归与聚类——K-Means(六)

随机设置K个特征空间内的点作为初始的聚类中心。对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚类中心点作为标记类别。接着对着标记的聚类中心之后,重新计算出每个聚类的新中心点(平均值)。如果计算得出的新中心点与原中心点一样,那么结束,否则重新进行第二步过程

2024-04-26 10:53:06 598

原创 回归与聚类——模型保存与加载(五)

获取数据、划分数据集、标准化、预估器、保存模型、得出模型、模型评估。

2024-04-26 10:06:57 429

原创 分类算法——ROC曲线与AUC指标(九)

AUC只能用来评价二分类AUC非常适合评价样本不平衡中的分类器性能。

2024-04-25 10:27:44 285

原创 分类算法——模型评估(八)

假设这样一个情况,如果99个样本癌症,1个样本非癌症,不管怎样我全都预测正例(默认癌症为正例),准确率就为99%但是这样效果并不好,这就是样本不均衡下的评估问题。在分类任务下,预测结果与正确标记之间存在四种不同的组合,构成混淆矩阵(适用于多分类)问题:如何衡量样本不均衡下的评估?召回率:99/99 = 100%答:ROC曲线与AUC指标。

2024-04-25 10:03:34 676

原创 分类算法——逻辑回归(七)

逻辑回归是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。逻辑回归的应用场景广告点击率是否为垃圾邮件是否患病金融诈骗虚假账号看到上面的例子,我们可以发现其中的特点,那就是都属于两个类别之间的判断。逻辑回归就是解决二分类问题的利器。逻辑回归的原理1输入逻辑回归的输入就是一个线性回归的结果。2激活函数sigmoid函数分析:回归的结果输入到sigmoid函数当中输出结果:

2024-04-24 10:45:26 891

原创 回归与聚类——岭回归(四)

岭回归,其实也是一种线性回归。只不过在算法建立回归方程时候,加上正则化的限制,从而达到解决过拟合的效果。带有L2正则化的线性回归——岭回归。

2024-04-23 11:53:18 329

原创 回归与聚类——过拟合与欠拟合(三)

欠拟合过拟合分析第一种情况:因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。第二种情况:机器已经基本能区别天鹅和其他动物了。然后,很不巧已有的天鹅图片全是白天鹅的,于是机器经过学习后,会认为天鹅的羽毛都是白的,以后看到羽毛是黑的天鹅就会认为那不是天鹅。过拟合:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在测试数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。(模型过于复杂)欠拟合:一个假设在训练数据上不能获得更好的拟合,并且在。

2024-04-23 11:32:03 513

原创 回归与聚类——性能评估(二)

回归当中的数据大小不一致,是否会导致结果影响较大。所以需要做标准化处理。均方误差(Mean Squared Error)MSE)评价机制:注:y^i为预测值,y-为真实值我们也可以尝试去修改学习率此时我们可以通过调参数,找到学习率效果更好的值。

2024-04-23 10:48:46 554

原创 机器学习——分类算法总结

2024-04-22 16:34:12 409

原创 回归与聚类——线性回归(一)

(1)定义与公式线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。

2024-04-22 11:52:48 1365

原创 分类算法——集成学习方法之随机森林(六)

在当前所有算法中,具有极好的准确率能够有效地运行在大数据集上,处理具有高维特征的输入样本,而且不需要降维能够评估各个特征在分类问题上的重要性。

2024-04-19 17:29:05 746 1

原创 分类算法——决策树(五)

优点:简单的理解和解释,树有可视化缺点:决策树学习者可以创建不能很好地推广数据的过于复杂的树,这被称为过拟合改进:减枝cart算法(决策树API当中已经实现,随机森林参数调优有相关介绍)随机森林注:企业重要决策,由于决策树很好的分析能力,在决策过程应用较多,可以选择特征信息熵、信息增益的计算DecisionTreeClassifier进行决策树的划分export_graphviz导出到dot文件。

2024-04-18 11:26:54 1208

原创 分类算法——文章分类(五)

优点:朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。对缺失数据不太敏感,算法也比较简单,常用于文本分类。分类准确度高,速度快。缺点:由于使用了样本属性独立性的假设,所以如果特征属性有关联时其效果不好。条件概率、联合概率计算方式与特征独立的关系贝叶斯公式的计算。

2024-04-17 19:07:53 449

原创 分类算法——朴素贝叶斯(四)

上式中,P(产品,超重|喜欢)和P(产品,超重)的结果均为0,导致无法计算结果。这是因为样本量太少了,不具有代表性,本来现实生活中,肯定是存在职业是产品经理并且体重超重的人的,P(产品,超重)不可能为0;而且事件“职业是产品经理”和事件“体重超重”通常被认为是相互独立的事件,但是,根据我们有限的7个样本计算“P(产品,超重)=P(产品)P(超重)”不成立。也就是说,朴素贝叶斯,之所以朴素,就在于假定了特征与特征相互独立。4、在女神喜欢的条件下,职业是程序员,体重是超重的概率?1、女神喜欢的概率?

2024-04-17 11:53:14 623

原创 分类算法——模型选择与调优(三)

数据介绍:将根据用户的位置,准确性和时间戳预测用户正在查看的业务官网:https://www.kagge.com/navoshta/grid-knn/data。

2024-04-16 18:25:49 716

原创 分类算法——KNN算法(二)

1KNN原理K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法,总体来说KNN算法是相对比较容易理解的算法。定义如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。来源:KNN算法最早是由Cover和Hart提出的一种分类算法、距离公式两个样本的距离可以通讨如下公式计算,又叫欧式距离距离计算有:曼哈顿距离(绝对值距离)、明可关斯基距离2电影类型分析其中?

2024-04-12 15:49:10 591

原创 分类算法——sklearn转换器和估计器(一)

在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API。从中可以看出,fit_transform的作用相当于transform加上fit。标准化:(X- mean) / std。

2024-04-12 14:54:58 1010

变量进阶-数据结构和算法-归并排序

包括(变量进阶 高级变量类型),(函数进阶 面向对象),(函数进阶 面向对象),(面向对象 文件操作),(栈,循环队列,二叉树,排序算法),(堆排 归并)

2024-08-31

王道python训练营Linux基础+python基础xmind

王道python训练营,包括(Linux用户配置 目录查看),(Linux目录查看 文件内容操作),(python基础)

2024-08-31

基于深度学习的图像隐写方法综述xmind

基于深度学习的图像隐写方法综述xmind

2024-08-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除