昇思学习打卡营
文章平均质量分 92
学习使用MindSpore框架和Ascend设备
VertexGeek
人工智能和Linux重度患者
展开
-
昇思25天打卡营第25天|基于MoblieNetv2的垃圾分类
MobileNet网络是由Google团队于2017年提出的专注于移动端、嵌入式或IoT设备的轻量级CNN网络,相比于传统的卷积神经网络,MobileNet网络使用深度可分离卷积(Depthwise Separable Convolution)的思想在准确率小幅度降低的前提下,大大减小了模型参数与运算量。并引入宽度系数 α和分辨率系数 β使模型满足不同应用场景的需求。原创 2024-07-13 09:10:52 · 1126 阅读 · 0 评论 -
昇思25天学习打卡营第24天|MindSpore红酒分类实验
K近邻算法(K-Nearest-Neighbor, KNN)是一种用于分类和回归的非参数统计方法,最初由 Cover和Hart于1968年提出(Cover等人,1967),是机器学习最基础的算法之一。它正是基于以上思想:要确定一个样本的类别,可以计算它与所有训练样本的距离,然后找出和该样本最接近的k个样本,统计出这些样本的类别并进行投票,票数最多的那个类就是分类的结果。KNN的三个基本要素:K值,一个样本的分类是由K个邻居的“多数表决”确定的。K值越小,容易受噪声影响,反之,会使类别之间的界限变得模糊。原创 2024-07-12 14:44:50 · 1157 阅读 · 0 评论 -
昇思25天学习打卡营第23天|基于MindNLP+MusicGen生成自己的个性化音乐
与传统方法不同,MusicGen采用单个stage的Transformer LM结合高效的token交织模式,取消了多层级的多个模型结构,例如分层或上采样,这使得MusicGen能够生成单声道和立体声的高质量音乐样本,同时提供更好的生成输出控制。MusicGen不仅能够生成符合文本描述的音乐,还能够通过旋律条件控制生成的音调结构。原创 2024-07-11 15:02:06 · 726 阅读 · 0 评论 -
昇思25天打卡营第22天|RNN实现情感分类
最后我们设计一个预测函数,实现开头描述的效果,输入一句评价,获得评价的情感分类。将输入句子进行分词;使用词表获取对应的index id序列;index id序列转为Tensor;送入模型获得预测结果;打印输出预测结果。原创 2024-07-10 15:29:13 · 577 阅读 · 0 评论 -
昇思25天学习打卡营第21天|LSTM+CRF序列标注
序列标注指给定输入序列,给序列中每个Token进行标注标签的过程。序列标注问题通常用于从文本中进行信息抽取,包括分词(Word Segmentation)、词性标注(Position Tagging)、命名实体识别(Named Entity Recognition, NER)等。以命名实体识别为例:如上表所示,清华大学和北京是地名,需要将其识别,我们对每个输入的单词预测其标签,最后根据标签来识别实体。原创 2024-07-09 15:15:30 · 653 阅读 · 0 评论 -
昇思25天学习打卡营第20天|Vision Transformer
近些年,随着基于自注意(Self-Attention)结构的模型的发展,特别是Transformer模型的提出,极大地促进了自然语言处理模型的发展。由于Transformers的计算效率和可扩展性,它已经能够训练具有超过100B参数的空前规模的模型。ViT则是自然语言处理和计算机视觉两个领域的融合结晶。在不依赖卷积操作的情况下,依然可以在图像分类任务上达到很好的效果。原创 2024-07-08 23:24:12 · 825 阅读 · 0 评论 -
昇思25天学习打卡营第19天|SSD目标检测
SSD,全称Single Shot MultiBox Detector,是Wei Liu在ECCV 2016上提出的一种目标检测算法。使用Nvidia Titan X在VOC 2007测试集上,SSD对于输入尺寸300x300的网络,达到74.3%mAP(mean Average Precision)以及59FPS;对于512x512的网络,达到了76.9%mAP ,超越当时最强的Faster RCNN(73.2%mAP)。通过算法产生候选框,然后再对这些候选框进行分类和回归。原创 2024-07-07 16:46:02 · 870 阅读 · 0 评论 -
昇思25天学习打卡营第18天|ShuffleNet图像分类
ShuffleNetV1是旷视科技提出的一种计算高效的CNN模型,和MobileNet, SqueezeNet等一样主要应用在移动端,所以模型的设计目标就是利用有限的计算资源来达到最好的模型精度。ShuffleNetV1的设计核心是引入了两种操作:Pointwise Group Convolution和Channel Shuffle,这在保持精度的同时大大降低了模型的计算量。因此,ShuffleNetV1和MobileNet类似,都是通过设计更高效的网络结构来实现模型的压缩和加速。原创 2024-07-06 15:18:29 · 976 阅读 · 0 评论 -
昇思25天学习打卡营第17天|ChatGLM-6B聊天demo
本次实验,基于MindNLP和ChatGLM6B模型搭建一个小的聊天应用,ChatGLM6B 是基于 GLM-4 模型开发的开源对话机器人,拥有 62 亿个参数,能够进行自然流畅的语言交流。在对话中,ChatGLM6B 可以胜任文案写作、代码调试等任务,还能够根据用户需求进行角色扮演,满足用户在虚拟场景中的互动需求。同时,ChatGLM6B 也具备多模态理解能力,可以解析图片、视频等多种类型的信息,进一步拓展了其在实际应用中的场景。原创 2024-07-05 15:44:25 · 536 阅读 · 0 评论 -
昇思25天学习打卡营第15天|通过GPT实现情感分类
情感分类任务是自然语言处理(NLP)中的一个重要应用,旨在通过分析文本中的情感倾向,将其分类为正面、负面或中性等情感类别。这一任务通常涉及使用机器学习或深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)或Transformer模型,对文本进行特征提取和情感分析,以实现对用户评论、社交媒体帖子等文本数据的情感极性判断,从而帮助企业、研究机构等理解和响应用户情感,优化产品和服务。原创 2024-07-03 22:21:06 · 316 阅读 · 0 评论 -
昇思25天学习打卡营第16天|文本解码原理——以MindNLP为例
在大模型中,文本解码通常是指在自然语言处理(NLP)任务中使用的大型神经网络模型(如Transformer架构的模型)将编码后的文本数据转换回可读的原始文本的过程。这些模型在处理自然语言时,首先将输入文本(如一段话或一个句子)编码成高维空间中的向量表示,这些向量能够捕捉到文本的语义和上下文信息。在编码过程中,模型通过多层神经网络将文本的每个字符、单词或标记(token)转换成对应的向量。这些向量随后在模型的解码阶段被处理,以生成或选择最合适的序列来表示原始文本的含义。原创 2024-07-04 16:12:45 · 803 阅读 · 0 评论 -
昇思25天学习打卡营第14天|GPT2文本摘要
GPT-2(Generative Pre-trained Transformer 2)是由OpenAI开发的一种基于Transformer架构(decoder-only)的大型自然语言处理模型。它通过在大规模文本数据上进行预训练,能够理解和生成自然语言文本。GPT-2的特点在于其庞大的模型规模和强大的生成能力,能够生成连贯且上下文相关的文本,适用于多种自然语言处理任务,如文本生成、翻译、问答系统等。原创 2024-07-02 14:54:00 · 668 阅读 · 0 评论 -
昇思25天学习打卡营第13天|BERT
BERT全称是来自变换器的双向编码器表征量(Bidirectional Encoder Representations from Transformers),它是Google于2018年末开发并发布的一种新型语言模型。与BERT模型相似的预训练语言模型例如问答、命名实体识别、自然语言推理、文本分类等在许多自然语言处理任务中发挥着重要作用。模型是基于Transformer中的Encoder并加上双向的结构,因此一定要熟练掌握Transformer的Encoder的结构。原创 2024-07-01 22:56:44 · 958 阅读 · 0 评论 -
昇思25天学习打卡营第12天|ResNet50-图像分类
ResNet50网络是2015年由微软实验室的何恺明提出,获得ILSVRC2015图像分类竞赛第一名。原创 2024-06-30 16:53:52 · 1215 阅读 · 0 评论 -
昇思25天学习打卡营第11天|ResNet50迁移学习
在实际应用场景中,由于训练数据集不足,所以很少有人会从头开始训练整个网络。普遍的做法是,在一个非常大的基础数据集上训练得到一个预训练模型,然后使用该模型来初始化网络的权重参数或作为固定特征提取器应用于特定的任务中。本章将使用迁移学习的方法对ImageNet数据集中的狼和狗图像进行分类。原创 2024-06-29 16:25:47 · 635 阅读 · 0 评论 -
昇思25天学习打卡营第10天|FCN图像语义分割
FCN主要用于图像分割领域,是一种端到端的分割方法,是深度学习应用在图像语义分割的开山之作。通过进行像素级的预测直接得出与原图大小相等的label map。因FCN丢弃全连接层替换为全卷积层,网络所有层均为卷积层,故称为全卷积网络。原创 2024-06-28 19:10:01 · 999 阅读 · 0 评论 -
昇思25天学习打卡营第9天|使用静态图加速
AI编译框架分为两种运行模式,分别是动态图模式以及静态图模式。MindSpore默认情况下是以动态图模式运行,但也支持手工切换为静态图模式。原创 2024-06-27 20:43:14 · 429 阅读 · 0 评论 -
昇思25天学习打卡营第8天|保存与加载
上一章节主要介绍了如何调整超参数,并进行网络模型训练。在训练网络模型的过程中,实际上我们希望保存中间和最后的结果,用于微调(fine-tune)和后续的模型推理与部署,本章节我们将介绍如何保存与加载模型。原创 2024-06-26 18:14:28 · 452 阅读 · 0 评论 -
昇思25天学习打卡营第7天|模型训练
本文介绍了如何使用MindSpore进行模型训练原创 2024-06-25 19:57:40 · 1000 阅读 · 0 评论 -
昇思25天学习打卡营第6天|函数式自动微分
神经网络的训练主要使用反向传播算法,模型预测值(logits)与正确标签(label)送入损失函数(loss function)获得loss,然后进行反向传播计算,求得梯度(gradients),最终更新至模型参数(parameters)。自动微分能够计算可导函数在某点处的导数值,是反向传播算法的一般化。自动微分主要解决的问题是将一个复杂的数学运算分解为一系列简单的基本运算,该功能对用户屏蔽了大量的求导细节和过程,大大降低了框架的使用门槛。原创 2024-06-24 18:10:11 · 778 阅读 · 0 评论 -
昇思25天学习打卡营第5天|网络构建
神经网络模型是由神经网络层和Tensor操作构成的,mindspore.nn提供了常见神经网络层的实现,在MindSpore中,Cell类是构建所有网络的基类(这个类和pytorch中的modul类是一样的作用),也是网络的基本单元。一个神经网络模型表示为一个Cell,它由不同的子Cell构成。使用这样的嵌套结构,可以简单地使用面向对象编程的思维,对神经网络结构进行构建和管理。原创 2024-06-23 20:57:43 · 973 阅读 · 0 评论 -
昇思25天学习打卡营第4天|数据变换(Transforms)
数据变换是指将已有的数据转换成可以提供给模型直接训练和验证的数据格式,在深度学习中一般被称为数据预处理,之前在介绍数据集的时候已经有了一个简单的使用,下面将具体介绍如何使用MindSpore中已有的方法,对数据进行处理。原创 2024-06-22 19:36:16 · 795 阅读 · 0 评论 -
昇思25天学习打卡营第3天|数据集Dataset
数据是深度学习的基础,高质量的数据输入将在整个深度神经网络中起到积极作用。有一种说法是模型最终训练的结果,10%受到算法影响,剩下的90%都是由训练的数据质量决定。(doge)MindSpore提供基于Pipeline的,通过和实现高效的数据预处理。其中Dataset是Pipeline的起始,用于加载原始数据。MindSpore自带的提供了内置的文本、图像、音频等数据集加载接口,并提供了自定义数据集加载接口。此外MindSpore的领域开发库也提供了大量的预加载数据集,可以使用API一键下载使用。原创 2024-06-21 20:43:02 · 1022 阅读 · 0 评论 -
昇思25天学习打卡营第2天|张量Tensor
张量是一种特殊的数据结构,与数组和矩阵非常相似。张量()是MindSpore网络运算中的基本数据结构(也是所有深度学习模型的基础数据结构),下面将主要介绍张量和稀疏张量的属性及用法。张量(Tensor)是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 𝑛 维空间内,有 N的R次方个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。原创 2024-06-20 20:46:08 · 1057 阅读 · 0 评论 -
昇思25天学习打卡营第1天|快速入门
本节通过MindSpore已经封装好的API,快速实现一个深度学习模型的数据集准备、训练评估,模型参数保存和加载,对新手朋友十分友好。原创 2024-06-19 22:30:40 · 929 阅读 · 0 评论