- 博客(218)
- 资源 (4)
- 收藏
- 关注
原创 GNN 图神经网络
邻接矩阵A:adjacency matrix用来表示节点间的连接关系。特征矩阵X:feature matrix用来表示节点的特征。度矩阵D:degree matrix用来表示节点的连接数。
2023-12-25 21:30:31 165
原创 1-GAN
人脸检测、图像识别、语音识别,机器总是在做出描述或判断[能不能创造这个世界不存在的东西?GAN,全称Generative Adversarial Networks,中文叫生成式对抗网络。GAN它包含三个部分(生成、判别和对抗),训练GAN的最终目标是(也就是生成能够以假乱真的内容), 能够完成类似功能的还有玻尔兹曼机,变分自编码器等等,它们被称为生成模型。GAN分为两个模块,以及。生成网络负责依据通常选择正态或均匀分布为先验分布产生图片、语音等内容,产生的内容是数据集中没有见过的,也可以称为虚假内容。
2023-12-21 16:10:34 938
原创 0-U-net
UNET架构最初被提出作为医学图像分割问题的解决方案。自2015年以来,它已经成为许多机器学习任务的首选架构。中的出色表现,它变得更加流行。扩散模型变体,都会以某种方式使用UNET[
2023-12-21 15:00:21 159
原创 《论文阅读28》Unsupervised 3D Shape Completion through GAN Inversion
而对抗,就是指GAN两个网络交替训练的过程,其中生成网络为了欺骗判别网络,会不断提升自己的生成效果,做到以假乱真,令判别网络一直认为生成网络产生的内容是真实的:而判别网络为了不被生成网络欺骗也会不断提升自己的判别效果,做到拥有一双“火眼金睛”一直能识别出生成网络产生的虚假内容。即生成网络为了在判别网络中得到高分,会不断提升自己的性能,而判别网络为了能准确地给生成网络打低分,也会不断提升自己的性能,双方就是在一种对抗的过程中互相提升自己,这就是GAN。,而非真实图片,因此它产生的结果是具有随机性的。
2023-12-20 21:23:28 400 1
原创 1、统计一个数组0-7数字的个数
加f后可以在字符串里面使用用花括号括起来的变量和表达式,使花括号里的变量和表达式也能用字符串表示。函数print加上 f 的作用:即print(f" “)
2023-12-17 21:25:08 98
原创 [已解决]AttributeError: module ‘numpy‘ has no attribute ‘float‘
1、问题: AttributeError: module 'numpy' has no attribute 'float'
2023-11-03 15:04:58 2694 3
原创 《论文阅读28》OGMM
概率3D点云配准方法在克服噪声、异常值和密度变化方面表现出有竞争力的性能。本文将点云对的配准问题转化为两个高斯混合物的配准问题,通过最小化两个相应混合物之间的统计差异度量。backbone: DGCNN特征提取器OGMM可以更好地检测重叠区域,这要归功于新引入的重叠分数(借鉴2021 CVPRPredator。
2023-10-18 20:36:04 1068
原创 OpenCV 15(SIFT/SURF算法)
Harris和Shi-Tomasi角点检测算法,这两种算法,以下图为例,在左侧小图中可以检测到角点,但是。尺度不变特征转换即SIFT (Scale-invariant feature transform)。它用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量,此算法由 David Lowe在1999年所发表,2004年完善总结。应用范围包含物体辨识、机器人地图感知与导航、影像缝合、3D模型建立、手势辨识、影像追踪和动作比对等领域。
2023-10-04 23:05:38 647
原创 OpenCV 14(角点特征Harris和Shi-Tomasi)
角点是图像很重要的特征,对图像图形的理解和分析有很重要的作用。角点在三维场景重建运动估计,目标跟踪、目标识别、图像配准与匹配等计算机视觉领域起着非常重要的作用。在现实世界中,角点对应于物体的拐角,道路的十字路口、丁字路口等。所以,我们说角点是一个好的图像特征。
2023-10-03 16:55:47 433
原创 OpenCV 13(模版匹配和霍夫变换)
所谓的模板匹配,就是在给定的图片中查找和模板最相似的区域,该算法的输入包括模板和图片,整个任务的思路就是按照滑窗的思路不断的移动模板图片,计算其与图像中对应区域的匹配度,最终将匹配度最高的区域选择为最终的结果。将模板块每次移动一个像素 (从左往右,从上往下),在每一个位置,都计算与模板图像的相似程度。对于每一个位置将计算的相似结果保存在结果矩阵(R)中。如果输入图像的大小(WxH)且模板图像的大小(wxh),则输出矩阵R的大小为)将R显示为图像,如下图所示。
2023-10-03 15:52:36 1120 1
原创 NLP 04(GRU)
GRU (Gated Recurrent Unit)也称门控循环单元结构,它也是传统RNN的变体,同LSTM一样,它的核心结构可以分为两个部分去解析:更新门、重置门。
2023-09-30 19:42:00 1271 2
原创 NLP 03(LSTM)
LSTM (Long Short-Term Memory) 也称长序列之间的语义关联梯度消失或爆炸现象LSTM的结构更复杂,它的核心结构可以分为四个部分去解析:遗忘门、输入门、细胞状态、输出门。
2023-09-30 17:50:14 1667 1
原创 NLP 01(介绍)
自然语言处理 (Natural Language rrocessing,简称NLP) 是计算机科学与语言学中关注于计算机与人类语言间转换的领域。
2023-09-30 15:12:22 1307
原创 机器学习 09 随机森林
过拟合是指模型在训练数据上表现良好,但在新的数据上表现不佳的情况。当我们训练一个模型时,我们希望它能够在训练数据上表现良好,但是我们也希望它能够在新的数据上表现良好。④使用早停技术(Early stop technology)来在验证集上监测模型的性能,并在性能不再提高时停止训练,从而避免过拟合,从而使模型更加泛化。训练模型时,损失函数关于迭代次数的图像一直下降到很小的数值并不是什么好事,这恰恰暗示了我们的模型存在过拟合的风险。当我们有更多的训练数据时,模型可以更好地学习数据的特征,从而减少过拟合的风险。
2023-09-29 16:55:23 90
原创 《论文阅读27》SuperGlue: Learning Feature Matching with Graph Neural Networks
Attention [61,64,62,26]可以通过关注特定的元素和属性来执行全局和数据相关的局部聚合,因此更加灵活。通过观察到自我注意力可以被视为完整图上的消息传递图神经网络[23,4]的实例,我们将注意力应用于具有多种类型边缘的图,类似于[28,72],并使SuperGlue能够学习关于两组局部特征的复杂推理。动机:在图像匹配问题中,可以利用世界的一些规律:3D世界在很大程度上是平滑的,有时是平面的,如果场景是静态的,则给定图像对的所有对应关系都从单个对极变换导出,并且一些姿势比其他姿势更可能。
2023-09-27 11:20:39 1290
原创 《论文阅读23》3DMatch: Learning Local Geometric Descriptors from RGB-D Reconstructions
CVPR 2017。
2023-09-26 09:01:26 335
原创 Transformer 01(自注意机制Self-attention)
窗口开的太大,对于每个FC network的参数量会变的很多,计算量很大,那怎么办?输入与输出一样多:Sequence labeling。a1和a4的相关性是由谁确定的呢?b1 ... b4是同时计算出来的。新的向量乘以α,然后相加。乘以Wv得到新的向量。
2023-09-19 11:14:54 137
原创 数据增强
当你训练一个机器学习模型时,你实际做工作的是,以便将特定的输入(一副图像)映像到输出(标签)。我们优化的目标是使模型的损失最小化, 以正确的方式调节优化参数即可实现这一目标[][人工智能的核心是机器学习,深度学习需要大量的数据,那么每个技术都定义了一个增强因子,用以增强数据集(也成为数据增强因子)1、翻转2、旋转关于这个操作,需要注意的一个关键问题是,在旋转之后,图像维度可能不会被保留。如果是正方型图像,旋转90度之后图像的尺寸会被保存。
2023-09-12 21:49:23 174
原创 神经网络 07(正则化)
在设计机器学习算法时不仅要求在训练集上误差小,而且希望在新样本上的泛化能力强。许多机器学习算法都。因为神经网络的强大的表示能力经常遇到,所以需要使用不同形式的正则化策略正则化通过对算法的修改来,目前在深度学习中使用较多的策略有,接下来我们对其进行详细的介绍。
2023-09-12 19:39:47 831
原创 神经网络 05(损失函数)
在深度学习中, 损失函数是用来衡量的方式是比较网络输出和真实输出的差异,损失函数在不同的文献中名称是不一样的,主要有以下几种命名方式:损失函数 (loss function)代价函数(cost function)目标函数(objective function)误差函数(error function)
2023-09-12 16:51:41 677
原创 神经网络 04(神经网络的搭建)
tf.Keras 中构建模有两种方式,一种是通过 构建,一种是通过 类构建。前者是按一定的顺序对层进行堆叠,而后者可以用来构建较复杂的网络模型。首先我们介绍下用来构建网络的全连接层:Sequential() 提供一个层的列表,就能快速地建立一个神经网络模型,实现方法如下所示: tf.keras 提供了 Functional API,建立更为复杂的模型,使用方法是将层作为可调用的对象并返回张量,并将输入向量和输出向量提供给 的 和 参数,实现方法如下:通过 model 的子
2023-09-12 16:08:53 404
原创 神经网络 03(参数初始化)
它从 [-limit,limit] 中的均匀分布中抽取样本, 其中 limit 是 sqrt(6 / (fan_in + fan_out)), 其中 fan_in 是输入神经元的个数, fan_out 是输出的神经元个数。它从以 0 为中心,标准差为 stddev = sqrt(2 / (fan_in + fan_out)) 的正态分布中抽取样本, 其中 fan_in 是输入神经元的个数, fan_out 是输出的神经元个数。,需要初始化的参数有两类:一类是权重W,还有一类是偏置b,偏置b初始化为0即可。
2023-09-12 15:42:36 919 1
原创 神经网络 02(激活函数)
在神经元中引入了激活函数,它的,通过激活函数,。激活函数的作用:增加模型的非线性分割能力提高模型鲁棒性缓解梯度消失问题加速模型收敛等常用的激活函数。
2023-09-12 13:03:02 677
原创 神经网络 01(介绍)
人工神经网络 (Artificial Neural Network,简写为ANN)也简称为神经网络 (NN),是一种模仿生物神经网络结构和功能的。人脑可以看做是一个生物神经网络,由众多的神经元连接而成。各个神经元传递复杂的电信号,树突接收到输入信号,然后对信号进行处理,通过轴突输出信号。下图是。
2023-09-12 12:14:15 457
原创 TensorFlow 03(Keras)
tf.keras是TensorFlow 2.0的,为TensorFlow的代码提供了新的风格和设计模式,大大提升了TF代码的简洁性和复用性,官方也推荐使用tf.keras来进行模型设计和开发。
2023-09-12 09:58:38 490
原创 TensorFlow 02(张量)
张量Tensor张量是一个。与NumPy ndarray对象类似,tf.Tensor对象也具有数据类型和形状。如下图所示:此外,tf.Tensors可以保留在GPU中。TensorFlow提供了丰富的操作库 (tf.add,tf.matmul,tf.linalg.inv等),它们使用和生成tf.Tensor。
2023-09-12 09:29:01 558
原创 Tensorflow 01(介绍)
一经发布,就受到了广泛的关注,并在计算机视觉、音频处理、推荐系统和自然语言处理等场景下都被大面积推广使用,现在已发布2.3.0版本,接下来我们深入浅出的介绍Tensorflow的相关应用。1、使用tf.data加载数据。使用tf.data实例化读取训练数据和测试数据2、模型的建立与调试:使用动态图模式Eager Execution和著名的神经网络高层API框架Keras,结合可视化工具 TensorBoard,简易、快速地建立和调试模型;
2023-09-12 09:13:26 458
原创 计算机视觉 01(介绍)
机器学习是实现人工智能的一种途径,深度学习是机器学习的一个子集,也就是说深度学习是实现机器学习的一种方法。与机器学习算法的主要区别如下图所示[参考:黑马]:自动提取特征深度学习模仿人类大脑的运行方式,从经验中学习获取知识。这也是深度学习被看做黑盒子,的原因。随着计算机软硬件的飞速发展,现阶段通过深度学习来模拟人脑来解释数据,包括图像,文本,音频等内容。目前深度学习的主要应用领域有: 语音识别,计算机视觉,自动驾驶。
2023-09-11 22:50:28 503
原创 《论文阅读20》RoReg: Pairwise Point Cloud Registration With Oriented Descriptors and Local Rotations
稿件于2022年9月5日收到;2023年1月18日修订;2023年2月5日接受。
2023-09-10 22:23:14 595 1
原创 OpenCV 12(图像直方图)
直方图可以让你了解总体的图像像素强度分布,其X轴为像素值(一般范围为0~255),在Y轴上为图像中具有该像素值像素数。- 横坐标: 图像中各个像素点的灰度级.- 纵坐标: 具有该灰度级的像素个数.画出上图的直方图:或者以柱状图的形式:- 归一化直方图- 横坐标: 图像中各个像素点的灰度级- 纵坐标: 出现这个- **直方图术语**:`dims`:需要统计的特征的数目。例如:`dims=1`,表示我们仅统计灰度值。`bins`:每个特征空间子区段的数目。
2023-09-09 18:13:46 801
原创 OpenCV 11(图像金字塔)
*图像金字塔**是图像中,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构。简单来说,图像金字塔最初用于机器视觉和图像压缩。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似。我们将一层一层的图像比喻成金字塔,。**常见两类图像金字塔****高斯金字塔 ( Gaussian pyramid)**: 用来向下/降采样,主要的图像金字塔。
2023-09-09 17:11:50 535 1
原创 OpenCV 10(图像轮廓)
返回元组, 内容是一个旋转矩形(RotatedRect)的参数: 矩形的起始坐标x,y, 矩形的宽度和高度, 矩形的选择角度.轮廓面积是轮廓重要的统计特性之一,通过轮廓面积的大小可以进一步分析每个轮廓隐含的信息,例如通过轮廓面积区分物体大小识别不同的物体。- RETR_LIST = 1, 检测的轮廓不建立等级关系, 即检测所有轮廓, 较为常用。在查找到轮廓后, 可能会有很多细小的轮廓, 我们可以通过轮廓的面积进行过滤.- color 轮廓的颜色, 如 (0, 0, 255)表示红色。
2023-09-09 16:22:49 690
卫星数据集(每一幅有70副残缺的部分点云数据)
2023-12-25
CoFiNet论文 英文视频讲解文稿
2023-10-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人