机器学习——Python
文章平均质量分 62
20210811
摆烂.MVP
慧极必伤 情深不寿
展开
-
AI基础知识
开源数据集(爬虫):mnist手写体数据集、coco数据集、ImageNet、Open Images、VisualQA。VGG、ResNet、Yolo、Fastrcnn、Unet、Maskrcnn、Gan对抗生成网络、Diffusers。1)、ReLu(缓解了梯度消失的问题)、Leaky Relu、ELU、GELU(大模型transform里用的多)基本RNN:循环网络的基本构成、LSTM:解决简单RNN面临的长期依赖的问题、GRU、NTM。神经网络构成:输入层、卷积层、激活函数、BN层、池化层、输出层。原创 2024-03-25 14:14:11 · 247 阅读 · 0 评论 -
关于神经网络
我只会循环百度,循环问ChatGPT。。。原创 2023-04-06 19:07:35 · 478 阅读 · 1 评论 -
关于数据集
但并非所有的数据集都需要进行训练集和测试集的划分,有些数据集可能只需要用于模型的训练,而不需要进行模型的测试评估,比如说一些用于预训练模型的数据集。因此,数据集是否需要划分训练集和测试集,取决于具体的应用场景和任务需求。需要注意的是,数据量并不是唯一的影响因素,可能还有其他的因素也会影响验证方法的表现,例如特征的数量、特征的质量、数据集的类别分布等。时间序列划分:对于具有时间序列特性的数据集,按照时间顺序将数据集分为训练集、验证集和测试集,一般训练集和验证集取前一段时间的数据,测试集取后一段时间的数据。原创 2023-04-06 16:06:22 · 1506 阅读 · 0 评论 -
关于CNN卷积神经网络
*这个数据集非常适合图像聚类,因为它具有一定的难度,可以测试深度神经网络的性能,并且它也具有足够的图像样本以便学习到不同的特征和类别。过拟合的主要原因是模型的复杂度过高,模型可以轻松地记住训练集中的每一个样本和其对应的标签,但是对于新的数据却无法进行准确的预测。以上是一个基本的图像聚类流程。需要注意的是,这只是一个基本的流程,具体实现可能涉及到许多细节问题,如模型选择、参数调整、聚类算法的选择和调整等。卷积层的卷积核通常是一个小的矩阵,该矩阵可以在输入数据上滑动,与输入数据的每个局部区域进行卷积运算。原创 2023-04-06 14:59:43 · 1377 阅读 · 0 评论 -
关于聚类的定义
聚类算法通过一定的计算,把数据集划分为不同的簇,旨在使同一簇内的数据相似性最高,簇与簇之间差距最大。将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。聚类可以用于识别、划分图像数据集、组织和导航,以及对聚类后的图像进行相似性可视化。原创 2023-04-06 14:52:24 · 854 阅读 · 0 评论 -
对图像分析聚类
可以读取多张本地或者云端数据集图片,并进行特征提取分析,图像聚类评估的Python代码。原创 2023-03-26 19:50:02 · 188 阅读 · 0 评论 -
小demo,关于分类
标红,现在我不能运行这个代码。我把csv文件放这里。csv没法放链接,但是下面视频这个博主的评论区有,自己去GitHub下载吧,很快的。啊啊啊我的pycharm不知道为什么就是下载了OpenCV库也是把。原创 2023-03-26 19:50:58 · 72 阅读 · 0 评论 -
使用KMeans对图片进行聚类
聚类数的选择对聚类结果影响很大,如果聚类数太小,可能会将不同的群体归为同一簇,导致聚类结果不准确;在KMeans算法中,fit() 方法用于拟合聚类模型,即对输入数据进行聚类,并得到聚类结果。具体来说,fit()方法会根据输入数据和指定的聚类数,通过迭代算法优化聚类中心的位置,以最小化聚类误差(即样本点到所属簇中心的距离平方和)。聚类完成后,可以通过 kmeans.labels_ 属性获取每个数据点所属的簇的标签(即聚类结果),通过kmeans.cluster_centers_ 属性获取每个簇的中心点。原创 2023-03-25 18:19:37 · 958 阅读 · 0 评论