数据分析
文章平均质量分 89
@BangBang
这个作者很懒,什么都没留下…
展开
-
机器学习中的数据分析和管理
大数据,标签数据,噪声数据。机器学习项目都需要看数据。数据是机器学习项目的一个关键方面,我们如何处理这些数据是至关重要的。当数据量增长时,需要对它们进行管理,允许它们为多个项目服务,或者只是有一种更好的方法来检索数据,考虑使用数据库系统是很自然的。它可以是关系数据库或平面文件格式。可以是本地的,也可以是远程的。在这篇文章中,我们将探索不同的格式和库,你可以用来存储和检索。主要可以学习到以下几方面的内容:使用SQLite、Python dbm库、Excel和谷歌表管理数据如何使用外部存储的数据来训练原创 2022-05-22 22:50:23 · 1158 阅读 · 0 评论 -
SOM网络2: 代码的实现
训练完成后,返回输出节点的。,相当于固化了模型的权重。表征了当前的训练样本。原创 2022-08-01 17:01:15 · 394 阅读 · 0 评论 -
SOM网络1:原理讲解
SOM自组织映射神经网络,是一种类似于kmeans``的聚类算法,用于寻找数据的聚类中心。它可以将相互关系复杂非线性的高纬数据,映射到具有简单几何结构及相互关系的低纬空间。(低纬映射能够反映高纬特征之间的拓扑结构)自组织映射(Self-organizingmap,SOM)通过学习输入空间中的数据,生成一个低维、离散的映射(Map),从某种程度上也可看成一种降维算法。SOM是一种无监督的人工神经网络。不同于一般神经网络基于损失函数的反向传递来训练,它运用竞争学习近邻关系函数拓扑结构。由于基于无监督。.....原创 2022-08-01 14:24:39 · 3820 阅读 · 1 评论 -
应用kaggle进行机器学习项目开发
你可能听说过Kaggle数据科学竞赛,但你知道Kaggle还有许多其他功能,可以帮助你完成机器学习项目吗?对于为机器学习项目寻找数据集的人,Kaggle允许你访问别人的公共数据集,并共享你自己的数据集。对于那些希望构建和训练自己的机器学习模型的人,Kaggle还提供了浏览器上notebook开发环境和一些免费的GPU时长。你也可以查看其他人的公开的notebook!除了网站之外,Kaggle还有一个命令行界面(CLI),你可以在命令行中使用它来访问和下载数据集。概述本博客分为五个部分;它们是:Ka原创 2022-05-29 14:45:58 · 1435 阅读 · 0 评论 -
使用Google colab进行机器学习项目开发
您是否曾经想要一个易于配置的交互环境来运行您的机器学习代码,免费访问图GPU?Google Colab 正是我们要找的。在云上运Jupyter notebooks是一种方便易用的方式,但是免费版本对GPU的使用也做了一定的限制,但不影响我们基本的代码开发使用GPU。通过本博客,可以了解到以下技能:Google Colab 使用免费GPU加速训练使用Google Colab 的扩展包将数据保存到Google Drive, 为pandas ,DataFrame等提供交互式显示。使用Google Col原创 2022-05-23 17:03:05 · 1218 阅读 · 2 评论