自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 本地pycharm跑cnn baseline遇到的一些问题及解决方案datawhale夏令营

因为本人电脑没有独立显卡,所以下载的torch是cpu版的,官网https://pytorch.org/get-started/locally/#no-cuda。然后我是在anaconda上安装的,就直接在anaconda的prompt上,首先开一个pytorch的虚拟环境。这里的train-loader出现了问题,然后发现应该是数据路径的问题,导致数据读取为零。出现这种问题,我把下图的shuffle参数把原来的true改为false,问题解决了。第三个问题出现在数据中。第二个具体代码的问题。

2023-07-26 23:02:00 121 1

原创 脑PET图像分析和疾病预测Baseline精读

在数据集准备时,我们用到了一个重要的库,nibabel用于加载和处理医学图像数据,nibabel库是专门对一些常见医学和神经影像文件格式的读写访问,一个nibabel图像由三个方面组成,3d或4d图像数据数组,一个告知图像数组在引用空间中的位置的仿射数组,描述图像的图像元数据,通常以图像头部的形式。加载PET图像数据,并从中随机选择10个通道。本次使用了逻辑回归模型对PET图像进行了分类,我们知道关于分类模型,我们还可以用到决策树,支持向量机,cnn等,这些我都会在后面一一尝试,尽可能提高模型的分数。

2023-07-22 21:48:44 420 1

原创 计算机视觉-Datawhale task_1

这次学习中,学习了opencv的初步架构和图像插值运算算法。** 图像插值是在基于模型框架下,从低分辨率图像生成高分辨率图像的过程,用以恢复图像中所丢失的信息。插值指的是利用已知数据去预测未知数据,图像插值则是给定一个像素点,根据它周围像素点的信息来对该像素点的值进行预测。**在图像处理中,平移变换、旋转变换以及放缩变换是一些基础且常用的操作。这些几何变换并不改变图象的象素值,只是在图象平面上进行象素的重新排列。在一幅输入图象[u,v][u,v][u,v]中,灰度值仅在整数位置上有定义。然而,输出图

2021-09-14 23:29:00 134

原创 动手学数据分析 task_4 数据可视化

本次学习数据可视化 ,主要大家学习了一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。在打比赛的过程中,数据可视化可以让我们更好的看到每一个关键步骤的结果如何,可以用来优化方案,是一个很有用的技巧。导入库在jupyterlab中 用这种方式去导入matplotlib 库了解matplotlib最基本的可视化图案有哪些?分别适用于那些场景?柱状图展示多个分类的数据变化和同类别各变量之间的比较情况。适用:对比分类数据。局限:分类过多则无法展示数据特点。条

2021-07-20 00:07:05 151 2

原创 动手学数据分析task_3

在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。task_3 我们将学习数据重构任务1将数据合并使用concat方法 合并list_up = [text_left_up,text_right_up]result_up = pd.concat(list_up,axis=1)result_up.head()这里的concat函数是panda的连接函

2021-07-18 00:28:28 78

原创 task_2 数据清洗及特征处理

本次学习 ,让大家了解数据分析的一些操作,主要做了数据的各个角度的观察。那么在这里,我们主要是做数据分析的流程性学习,主要是包括了数据清洗以及数据的特征处理,数据重构以及数据可视化。这些内容是为数据分析最后的建模和模型评价做一个铺垫task _2主要是数据清洗数据清洗我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或

2021-07-16 00:37:07 67

原创 2021-07-13动手学数据分析 task_1数据加载及探索性数据分析

本次是学习如何用python进行数据分析。它分为三个单元进行,接下来的内容是第一单元 数据加载及探索性数据分析。学习内容1.数据集的下载,这一部分由组织的文件获取2.导入pandas和numpypandas是基于numpy的一种工具,该工具是为了解决数据分析任务而建的,pandas纳入了大量库和一些标准的数据库模型,提供了高效率的操作大型数据集所需要的工具,pandas提供了大量快速便捷的处理数据的函数和方法,使python成为了强大而高效的数据分析环境的重要因素之一。3.载入数据3.1 使

2021-07-14 00:18:57 84

原创 零基础语音识别task6 语音识别扩展阅读

终于是到了最后一个任务了,真不容易~~坚持下来了,还是学到了不少东西,交了不少好友最后的task,它对语音识别内容进行了扩展,更充分的了解到了机械学习算法和模型和深度学习在语音领域的应用本文参考datawhile组织与天池联合发起的零基础入门系列赛事第八场 —— 零零基础入门语音识别-食物声音识别挑战赛01 语音识别基础与发展语音识别全称为“自动语音识别”,Automatic Speech Recognition (ASR), 一般是指将语音序列转换成文本序列。语音识别最终是统计优化问题,给定输入序

2021-04-22 20:30:04 359

原创 零基础语音识别task_5模型的改进与优化

这次学习我们首先学习了过拟合与欠拟合,过拟合是指模型对于训练数据拟合呈过当的情况,反映到评估指标上,就是模型在训练集上的表现很好,但在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好的情况。可以看出,图(a)是欠拟合的情况,拟合的黄线没有很好地捕捉到数据的特征,不能够很好地拟合数据。图(c)则是过拟合的情况,模型过于复杂,把噪声数据的特征也学习到模型中,导致模型泛化能力下降,在后期应用过程中很容易输出错误的预测结果。...

2021-04-21 23:28:49 364

原创 零基础语音识别task4

这次学习了cnn模型的搭建与训练,本次模型用到的是比较容易搭建的Keras 框架,Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。现在Keras已经和TensorFlow合并,可以通过TensorFlow来调用。cnn网络的基本框架!这里简单将一下我对卷积核的理解,我们把上一步提取到的特征来进行卷积,下图是卷积核(filter),不同的卷积核卷积出来的数据是不一样的,我们这些训练就是要训练这些卷积核,不断的

2021-04-20 00:19:18 128

原创 零基础语音识别task3

这次我们学习了除了baseline的梅尔频谱另外的一些语音特征,过零率 (Zero Crossing Rate)频谱质心 (Spectral Centroid声谱衰减 (Spectral Roll-off)梅尔频率倒谱系数 (Mel-frequency cepstral coefficients ,MFCC)色度频率 (Chroma Frequencies)1.过零率,过零率是一个信号符号变化的比率,即,在每帧中,语音信号从正变为负或从负变为正的次数。2.频谱质心频谱质心(Spectra

2021-04-18 00:43:52 1448

原创 零基础入门语音识别task_2赛题数据集的学习

task2学习了赛题数据集,本比赛的背景是食物的声音的分类,是一个充满趣味性的任务,本次比赛的数据集来自Kaggle的“Eating Sound Collection”(可商用), 数据集中包含20种不同食物的咀嚼声音,赛题任务是给这些声音数据建模,准确分类。然后是音频处理库的学习,python有很多厉害的库,这次用到的是Librosa,它通常用于分析音频信号,但更倾向于音乐,它包括用于构建MIR(音乐信息检索)系统的nuts 和 bolts,它的功能:加载展示一个声音文件的特性声谱表示特征提取

2021-04-15 18:53:03 104

原创 零基础语音识别入门baseline_task1

初步了解了baseline,并成功跑通。然后讲一下我理解的整个baseline的过程1.首先导入了个音频库,里面是动物吃不同食物的声音。2.然后是特征提取以及数据集的建立,这里运用了mfcc的方法,个人理解,mfcc就是在语音识别领域,将语音物理信息(频谱包络和细节)进行编码运算得到的一组特征向量。里面的mel滤波器组,将语音变换到mel域,mel域是仿照人耳设计的,更符合人耳的听觉特性。3.cnn卷积神经网络卷积层,池化层,关键的两个步骤,主要我的理解是将众多特征向量的特征拟合,变成另

2021-04-14 11:56:09 296

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除