人工智能/机器学习/深度学习
自学过程记录于分享,一个新手的成长之路
SmartDemo
加油,努力!
展开
-
高度偏斜特征处理:log(x)、sqrt(x)、box-cox、Yeo-Johnson
高度偏斜的特征 : 数据分布不均匀、不对称的特征处理之后:使其分布更接近正态分布或至少减少偏斜程度。原创 2024-07-30 15:36:34 · 150 阅读 · 0 评论 -
传统数据增强
【代码】传统数据增强。原创 2023-02-27 22:46:02 · 121 阅读 · 0 评论 -
逻辑回归logistic regression
逻辑回归是二分类模型,等价于线性回归+sigmoid。原创 2023-02-20 17:47:20 · 100 阅读 · 0 评论 -
Lp正则化
的概念(参数量尽可能少的模型),且简单模型一定比复杂模型效果好,因为复杂模型容易过拟合。如果一件事情有两个解决方案,那么最优的方案一定是简单的那个。L2-norm是两个黑点的距离(与 一、L1 和 L2范数 相呼应)L1:解空间为菱形,交点在轴上,w为0,所以会产生稀疏性结果。Lasso回归是在逻辑回归的损失函数后添加L1正则。L2:解空间为圆形,交点一般在象限里,w不为0。>= 0是系数,权衡经验风险和模型复杂度。岭回归是在逻辑回归的损失函数后添加L2正则。降低模型复杂度,减小过拟合的风险。原创 2023-02-15 21:38:14 · 952 阅读 · 0 评论 -
隐马尔科夫模型基础
是一种生成模型,是隐藏的马尔科夫链随机生成不可观测的状态序列,再由各个状态生成观测序列的过程。原创 2023-02-15 12:10:48 · 189 阅读 · 0 评论 -
K折交叉验证
一、自己实现K折交叉验证:切片。二、直接调用KFold实现交叉验证:随即下标。原创 2023-02-10 13:46:38 · 417 阅读 · 0 评论 -
生物学与神经网络的联系
x1,x2...xn,每个神经元收到n个其他神经元传递过来的输入信号,这些信号通过带权重的连接传递给细胞体,(即输入信号的加权和,或者说累积电平),后一部分先计算总输入值与该神经元阈值的。,然后通过激活函数的处理,产生输出从轴突传送给其它神经元。“M-P神经元模型”也称“阈值逻辑单元“,其中。原创 2022-11-29 10:40:41 · 534 阅读 · 0 评论 -
pdp部分依赖图
个体间的变化差异通过个体条件期望(Individual Conditional Expectation,ICE)曲线观察。:部分依赖图(Partial Dependence Plot)显示了。计算部分依赖的特征与其他特征不相关。一个变量的pdp图是不全面的。对机器学习模型的预测结果的。过度解释几乎没有数据的区域。pdp绘制的是平均响应。原创 2022-11-02 11:01:24 · 2831 阅读 · 0 评论 -
LinearRegression简单实现
代码】LinearRegression简单实现。原创 2022-07-20 17:44:29 · 181 阅读 · 0 评论 -
隐马尔可夫之前向算法
目录 一、前向算法定义过程过程解析二、例题问题答案三、代码 资料:李航《统计学习方法》原创 2022-07-07 17:59:39 · 581 阅读 · 0 评论 -
半监督学习
参考:1、半监督深度学习小结 - 知乎 (zhihu.com)2、半监督深度学习训练和实现小Tricks - 知乎 (zhihu.com)原创 2022-06-21 11:09:13 · 276 阅读 · 0 评论 -
将自制数据集转换成cifar10格式
def imread(im_path, shape=None, color="RGB"): im = cv2.imread(im_path, cv2.IMREAD_UNCHANGED) if color == "RGB": im = cv2.cvtColor(im, cv2.COLOR_BGR2RGB) if shape != None: im = cv2.resize(im, shape) return imc = 1024 # 32*.原创 2022-04-29 22:32:13 · 1518 阅读 · 0 评论 -
将tensor转化为图像
import numpy as npimport cv2import torch# opencv支持的图像数据是numpy格式,数据类型为uint8,而且像素值分布在[0,255]之间data,labels = torch.load("F:/zmz/pycharm/Co-teaching-master/data/processed/test.pt")print(data[0])print(labels[0].data)# 将tensor转化成numpyimg_numpy = data[0.原创 2022-04-01 22:51:06 · 8700 阅读 · 0 评论 -
全局平均池化层(GLP)
一、全局平均池化全局平均池化层(GAP)在2013年的《Network In Network》(NIN)中首次提出,于是便风靡各种卷积神经网络。为什么它这么受欢迎呢?一般情况下,卷积层用于提取二维数据如图片、视频等的特征,针对于具体任务(分类、回归、图像分割)等,卷积层后续会用到不同类型的网络,拿分类问题举例,最简单的方式就是将卷积网络提取出的特征(feature map)输入到softmax全连接层对应不同的类别。首先,这里的feature map是二维多通道的数据结构,类似于三个通道(红黄...原创 2022-04-01 09:31:43 · 11694 阅读 · 0 评论 -
Caffe的MakeFile.config文件配置
参考链接:1、cpu+Anaconda+Caffe:https://blog.csdn.net/u011353881/article/details/70537116原创 2020-03-24 03:35:15 · 186 阅读 · 0 评论