机器学习
文章平均质量分 54
五阿哥爱跳舞
零散知识记录,分享投稿全流程经验;
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
KAN vs MLP
KAN基于表示定理:任意一个多元函数,可以用多个单元函数复合(例如+法)表示出来。不需要用特别深的神经网络。定理的不好的点:没有描述单元函数本身有多复杂。原创 2024-08-27 11:20:48 · 619 阅读 · 0 评论 -
人工智能模型的结构化代码分析与复现方法(pytorch深度学习类、LLM类)
(模型架构)定、数、模、训、测、上;(数据挖掘)分、理、洗、构、选、提;原创 2024-06-06 20:52:44 · 559 阅读 · 0 评论 -
【实验】深度学习trick总结
【深度学习】深度学习模型训练的tricks总结。原创 2023-07-02 17:40:15 · 831 阅读 · 0 评论 -
文心大模型之优质提示开发课
prompt 提示词开发方法原创 2023-05-17 10:09:32 · 298 阅读 · 0 评论 -
统计学方法选择
【如何选择统计学方法?T检验、单因素方差分析、秩和检验、卡方检验到底应该选择哪一个?一个视频轻松搞定】 https://www.bilibili.com/video/BV18X4y1k7GB/?share_source=copy_web&vd_source=d510211a29926bb617b51dda0cd32185统计学方法选择T检验和方差分析中要满足的条件就是:1.符合正态分布,2.符合方差齐性; 不满足时使用非参数检验。原创 2023-05-12 17:00:25 · 449 阅读 · 0 评论 -
百度文心一言-新闻发布会20230316
大语言模型一旦发布,就会有用户的反馈,迭代速度就会非常快。原创 2023-03-16 14:38:41 · 496 阅读 · 0 评论 -
机器学习中的交叉熵
真是标签使用one hot编码的意义就是,表示的是随机变量(样本)的概率分布;交叉熵对于连续变化的信号(连续型随机变量的信号的效果是很差的,连续的一般用均方差),离散型一般用交叉熵,效果也较好。本文出于此目的,想要把交叉熵从原理到机器学习中的应用捋一遍,方便以后回顾以及和网上的你们进行不断的探讨学习。“衡量预测结果和标签之间的分布差异,从而优化模型,使得我们的模型预测的结果能够与真实结果同分布。从例子中可以看出,给出的正确预测概率值越高的那个预测,标签对预测结果的交叉熵其实是最小的。原创 2022-11-27 23:25:18 · 1052 阅读 · 0 评论 -
网易云课程:深度学习与PyTorch入门实战
网易云课程:深度学习与PyTorch入门实战01 深度学习初见1.1 深度学习框架简介1.2 pytorch功能演示2开发环境安装3回归问题3.1简单的回归问题(梯度下降算法)3.3回归问题实战3.4 分类问题引入3.6手写数字识别体验4Pytorch基础4.1张量数据类型4.2创建Tensor4.3 索引与切片4.4 维度变换5随机梯度下降5.1什么是梯度?5.2 什么是梯度局部极小值鞍点影响搜索过程的其他因素5.3 常见函数的梯度激活函数与loss梯度1激活函数与Loss梯度26.5 感知机的梯度推导-原创 2021-07-27 12:53:58 · 1336 阅读 · 1 评论 -
深度学习模型训练的时候,一般把epoch设置多大?深度模型中的超参数要如何调整?模型训练的诸多问题?
1机器学习模型评估混淆矩阵、ROC曲线和AUC以及PR曲线、以及用学习曲线判断过拟合https://blog.csdn.net/qq_27575895/article/details/81476871原创 2021-11-17 17:32:09 · 4344 阅读 · 0 评论 -
机器学习-评价指标的选择
二分类和多分类的评价指标原创 2022-03-03 22:28:40 · 581 阅读 · 0 评论 -
决策树到随机森林
决策树和随机森林)决策树随机森林决策树从决策树到随机森林:树型算法的原理与实现添加链接描述决策树是一种监督学习算法。它适用于类别和连续输入(特征)和输出(预测)变量分类和回归树(简称 CART)是 Leo Breiman 引入的术语,指用来解决分类或回归预测建模问题的决策树算法。它常使用 scikit 生成并实现决策树: sklearn.tree.DecisionTreeClassifier 和 sklearn.tree.DecisionTreeRegressor 分别构建分类和回归树。随机森林原创 2022-04-02 21:54:45 · 425 阅读 · 0 评论 -
机器学习方法分类
《机器学习》有监督学习无监督学习参考资料有:李航:《统计机器学习》周志华:《机器学习》-西瓜书 ,《南瓜书》(作者非周志华)花书《Machine Learning》-机器学习有监督学习监督学习的主要应用分类问题标注问题 (举例:给定一个单词组成的句子,对这个句子中的每一个单词进行词性标注,即对一个单词序列预测其对应的词性标记序列)回归问题(举例:根据以往的某公司每天的股票价格,来预测该公司下一个时间点的股票价格。目标是从过去的数据歇息一个模型,使它可以基于当前的信息预测公司下一时间原创 2021-07-01 22:01:07 · 182 阅读 · 0 评论 -
机器学习-损失函数的选择
二分类、多分类与多标签问题的区别,对应损失函数的选择,你知道吗?原创 2022-03-03 22:30:12 · 701 阅读 · 0 评论 -
paddle使用教程和错误汇总
no attribute ‘get_fetch_list’原因:由于paddle升级,1.8版本不回报错,2.0以后需要注明允许静态图操作解决办法:在程序最开始调用下paddle.enable_static()原创 2021-11-25 13:57:21 · 1898 阅读 · 0 评论 -
【论文】机器学习论文常用实验以及实验效果评估部分常用代码大总结
表格+五折交叉验证的折线图。原创 2022-10-01 23:07:11 · 1219 阅读 · 0 评论 -
pytorch改变tensor尺寸的技术
https://www.jb51.net/article/177785.htm原创 2022-09-29 19:19:53 · 487 阅读 · 0 评论 -
DGL教程
注意:往图中添加的特征必须都是tensor格式。dgl图构造器来构造图,需要知道。此时图中没有节点和边的特征。原创 2022-09-26 10:09:13 · 2247 阅读 · 0 评论 -
BatchNorm
就是对每个batch的同一个通道中的数字打平之后,求均值和标准差,来进行0-1标准化。一个batch样本的,特征列进行0均值,1标准差的标准化。就是(特征值-特征列的均值)/(特征列的标准差)5 对批次内所有的特征进行归一化,不是单一样本。原创 2022-09-11 16:21:35 · 382 阅读 · 0 评论 -
pytorch笔记
outpu:)原创 2022-09-10 14:26:36 · 3744 阅读 · 0 评论 -
【AI程序架构】深度学习设计程序的结构-可读性、易用性(可扩展性)
在做深度学习实验或项目时,为了得到最优的模型结果,中间往往需要很多次尝试和修改。合理的文件组织结构,以及一些小技巧可以极大提高代码的易读性和可用性。从事深度学习研究时,程序都需要实现以下几个功能:在学习某个深度学习框架时,掌握其基本知识和接口固然重要,但如何合理组织代码,使得代码具有良好的可读性和可扩展性也必不可少。本文不会深入讲解过多知识性的东西,更多的则是传授一些经验,这些内容可能有些争议,因其受我个人喜好和coding风格影响较大,你可以将这部分当成是一种参考或提议,而不是作为必须遵循的准则。归根到底原创 2022-09-03 17:21:23 · 457 阅读 · 0 评论 -
[机器学习]深度学习中的层和块到底是什么
指的是框架中的每一层操作,例如这里的nn.Linear()或者nn.ReLU激活层. 而所有的各种操作层组合起来的结构,例如上图中的MLP是一个块,它可以包含1个操作层也可以包含多个操作层. 块又可以被用来构建新的块,嵌套使用.原创 2022-09-02 10:32:46 · 1292 阅读 · 0 评论 -
[机器学习]深度学习初学者大疑问之nn.Linear(a,b)到底代表什么?
nn.Linear()到底是在做什么?得到了什么。原创 2022-08-24 17:07:33 · 3362 阅读 · 3 评论 -
【统计机器学习】香港科技大学暑期学校结课总结
另外,roc到99%,98%,这个问题本身已经没有多大意义了,其实一个分类问题的roc(roc-auc)能够达到80%左右就不错了,再对问题添加一些可解释性的解释,那么这个方法就不错了,具有发表的意义.当然了,也可以将二者结合起来. 因此最好再补充两个指标,f1-score和roc-auc score,这两个指标可以将acc和recall综合起来看. 这样四个指标,来说明分类问题就比较完备了.对于分类问题,除了acc,最好再给一个recall指标,这两个指标同时来说明模型的好坏更有说服力.原创 2022-08-24 00:36:33 · 552 阅读 · 0 评论 -
零基础看深度学习python代码的基本方法
方法讲完了,剩下这几句就不管了。翻译法(推断法)百度法(检索法)打印测试法代码拆解法进入类里观察法。原创 2022-08-23 17:18:55 · 6042 阅读 · 5 评论 -
[统计机器学习]SVM
1. 最大类间距 2.kernel trick原创 2022-08-13 20:06:00 · 376 阅读 · 0 评论 -
[统计机器学习] 线性分类模型
代码】[统计机器学习] 线性分类模型。原创 2022-08-05 10:54:33 · 347 阅读 · 0 评论 -
【统计机器学习】线性回归模型理论与实践
预测房价、很明显的线性回归任务,而且特征数目少于20,首选线性回归。原创 2022-08-02 17:41:20 · 647 阅读 · 0 评论 -
【深度学习】数据准备-pytorch自定义图像分割类数据集加载
假设我现在有20张图片和使用labelme打好的30张标签图像。分别放在train和train_label这两个文件夹中,并且一一对应进行命名。如何将这些图片加载到深度学习的流程中,作为样本和标签项目匹配的训练集和测试集呢?.........原创 2022-07-28 17:09:11 · 2262 阅读 · 0 评论 -
【机器学习】pytorch如何加载自定义数据集并进行数据集划分
数据集包含样本序号、样本标签、和基因疾病对的特征(由二者特征拼接而成dim=256)原创 2022-07-22 00:13:01 · 1393 阅读 · 0 评论 -
【机器学习】机器学习中到底需不需要进行样本平衡
这个问题是由任务导向的,并不是说一定要平衡。需要根据判断面对的任务的意义,来是否平衡数据。原创 2022-07-21 21:19:42 · 780 阅读 · 0 评论 -
【报错】ValueError: It seems that you are using the Keras 2 and you are passing both
ValueErrorItseemsthatyouareusingtheKeras2andyouarepassingboth。原创 2022-07-21 10:42:52 · 441 阅读 · 0 评论 -
【人工智能项目实践】Day2基于CNN的ciffar10图像分类任务 FashionMNIST图像分类任务 人脸微笑数据处理
数据集下载通过代码自动下载即可。原创 2022-07-21 00:38:36 · 357 阅读 · 0 评论 -
【机器学习】如何在训练过程中挑选比较好的模型保存(pytorch)
先设置大的epoch,跑完一遍,绘制每个epoch的训练集和测试集的损失折线图,然后根据测试集的损失,选一个中间的epoch即可,测试集的损失,一定程度上反映了模型的预测性能根据1的结果,在训练结束后保存(常用)每个epoch保存一个模型,根据打印的最好的结果选。根据测试集(验证集)合的实验结果保存模型(可以是精度达到多少,可以是loss降低到多少,可以是记录两次损失之差,小于某个值就break)......原创 2022-07-20 16:21:36 · 3808 阅读 · 0 评论 -
《蒲公英书》1
机器学习 蒲公英书笔记原创 2022-07-19 21:45:06 · 530 阅读 · 0 评论 -
【人工智能项目实践】Day1基于逻辑回归的芯片质量检测任务(分类问题) 以及手写数字识别
项目实战原创 2022-07-19 20:02:12 · 677 阅读 · 0 评论 -
【机器学习】多层感知机如何调超参数
我们知道,感知机(没有隐藏层)可以处理线性可分的数据(4.1有解释,不用管记住就行),因此除非你已经知道你的数据不是线性可分的,就用感知机就行。所以,验证数据的线性可分性这一点并没有坏处,因为我们没有必要使用比任务要求更加复杂的模型(多层感知机)来解决简单技术(感知机)就能够解决的线性可分问题。来自MLP的学术文献和个人的经验等,我们收集并经常依赖于一些经验法则(RoTrulesofthumb),也发现它们是可靠的指南(这些指导往往是准确的,即使不准确也能够告诉我们每一步应该干什么)......原创 2022-07-19 00:07:27 · 2410 阅读 · 0 评论 -
【机器学习】《动手学深度学习》d2l 李沐B站视频配套学习笔记
动手学深度学习原创 2022-07-02 11:39:49 · 6252 阅读 · 0 评论
分享