图的向量化表示概述

Fryant24

于 2019-01-23 15:23:37 发布

阅读量5.8k

点赞数 5

分类专栏：机器学习文章标签：机器学习图

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_34720411/article/details/86611076

版权

机器学习专栏收录该内容

4 篇文章

订阅专栏

图的向量化表示，意即通过多维向量空间中的一点来表示一个图的特征，方便使用机器学习的方法对其进行分类操作。
首先讨论怎么从一副普通的图像中提取出特征图：
原图是（a），然后对其做碎片化，得到图（b），对原图做二值化得到图（c），图（b）和图（c）叠合得到图（d）。对于图（d）做下列定义：
各个色块被定义为特征图的各个节点，节点编号集合是颜色集合{黑，蓝，棕，绿，灰，橙，粉，紫，红，白，黄}；两个色块之间有公共边缘的就认为存在边，边的长度是公共边缘上像素点的个数，离散化表示为{短，中，长}。
在我们的化学式检索中，这项工作变得更加简单：每一个原子（原子团）代表着一个节点，节点的编号自然就是这个原子（原子团）的名称；每一个化学键就是一条边，边的编号集合为{单，双，三，……}。至此，完成了特征图的提取。
在这里插入图片描述
得到特征图之后，需要将其表示为一个特征向量，典型的做法是图指纹的方法。

Fingerprint的方法
给定一个集合H=〖{h_i}〗_(1≤i≤n)，包含了n个图的“部分”，任意图g就被转换成为了n维向量空间中的一点：
g→（#（h_1,g），#(h_2,g)，……，#(h_n,g)）
其中#（h_i,g）代表着每一个“部分”h_i在此图中出现的次数。这一方法的要点在于选取合适的H集合。在化学式检索工作中，可以考虑一些典型的官能团或特定结构来组成这个集合，不过这需要一定的化学研究。
Embedding of Graphs via Label Frequencies的方法
这个方法其实是Fingerprint方法的一个变式，减少了预操作，比较适合化学结构式检索来应用。在此办法中，集合H由以下几个部分组成：所有节点，任意两个节点之间连一个编号为e_1的边，任意两个节点之间连一个编号为e_2的边……计算这些“部分”或者说是小结构在此图中出现的次数，由此得到一个向量。此方法的好处在于，向量的维度分类前已经确定，不用随着研究目标的不同来改变集合H的形式，增加了特征提取的全面性。

博客等级

码龄9年

5
原创

10
点赞

32
收藏

4
粉丝

关注

私信

热门文章

分类专栏

最新评论

在标准linux系统上编译运行cobalt浏览器
码农有梦想: 大佬、运行到cobalt/build/gyp_cobalt -C debug linux-x64x11这一步报错有没有解决办法啊 WARNING:gyp_utils.py(107)] Failed to retrieve build number: HTTP Error 404: Not Found Traceback (most recent call last): File "cobalt/build/gyp_cobalt", line 131, in <module>
字符粘连切分方法
小方123a: 作者你好！想请教一下怎么获得字符上、下边界的轮廓曲线图呢一时转不过弯来想不到办法还是说有什么函数可以方便的画出来吗谢谢啦

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。