TigerGraph GNN课程一：图数据切分与GNN模型数据加载实践

TigerGraph

于 2022-12-05 15:24:46 发布

阅读量485

点赞数

分类专栏：产品应用文章标签：人工智能数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TigerGraph/article/details/128186793

版权

产品应用专栏收录该内容

6 篇文章 0 订阅

订阅专栏

在这里插入图片描述
在机器学习领域，我们需要审慎处理到手的真实数据集，在训练的各个阶段都会有不同的方法在样本上进行操作和验证。如何切分数据集并进行分批训练，是每一个机器学习项目都会面临的问题。

数据切分
对于机器学习模型，如何利用好已有的数据集是模型效果优劣的前提条件。切分训练集、验证集和使用测试集的过程，需要考虑数据的各类情况：有效样本的多少，样本中的时序信息，样本潜在的分组，样本平衡性问题等。切分的目标是在给定的数据集下，使得模型能够在训练集上快速的收敛，并在测试集有更好的近似泛化误差。

mini-batch训练
在传统机器学习中，因为样本数量的限制，会用交叉验证的方式防止过拟合；深度学习模型因为数据量过大无法完成全量训练，或因为单个样本的训练收敛效果不佳而使用 mini-batch。使用适当大小的mini-batch能在每一个小的数据集上完成梯度下降，并通过向量化运算加速模型训练，提高效率。
图神经网络模型在表征能力有了很大的提高, 在最近的研究中也探索出了高价值的应用场景：如蛋白质结构的预测，路径规划，推荐场景等等。这些模型都是囊括了对现实世界复杂图关系的信息。在图上构建的深度学习模型，需要执行更复杂的数据采集与计算。

本次图课堂直播课程我们邀请到了TigerGraph的高级客户成功顾问叶力豪老师，结合实际操作经验详细解读在不同图神经网络模型与各类数据集上如何利用TigerGraph和Machine Learning Workbench （机器学习工作台）进行数据切分模型和数据加载。手把手带你轻松掌握图数据切分与GNN模型数据加载实践。

关注TigerGraph公众号输入“20221208“即可报名参会。参与线上直播与讲师互动，就有机会获得TigerGraph虎牌定制保温杯！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。