icdatsc-CSDN博客

原创本地pycharm跑cnn baseline遇到的一些问题及解决方案datawhale夏令营

因为本人电脑没有独立显卡，所以下载的torch是cpu版的，官网https://pytorch.org/get-started/locally/#no-cuda。然后我是在anaconda上安装的，就直接在anaconda的prompt上，首先开一个pytorch的虚拟环境。这里的train-loader出现了问题，然后发现应该是数据路径的问题，导致数据读取为零。出现这种问题，我把下图的shuffle参数把原来的true改为false，问题解决了。第三个问题出现在数据中。第二个具体代码的问题。

2023-07-26 23:02:00 220 1

原创脑PET图像分析和疾病预测Baseline精读

在数据集准备时，我们用到了一个重要的库，nibabel用于加载和处理医学图像数据，nibabel库是专门对一些常见医学和神经影像文件格式的读写访问，一个nibabel图像由三个方面组成，3d或4d图像数据数组，一个告知图像数组在引用空间中的位置的仿射数组，描述图像的图像元数据，通常以图像头部的形式。加载PET图像数据，并从中随机选择10个通道。本次使用了逻辑回归模型对PET图像进行了分类，我们知道关于分类模型，我们还可以用到决策树，支持向量机，cnn等，这些我都会在后面一一尝试，尽可能提高模型的分数。

2023-07-22 21:48:44 699 1

原创计算机视觉-Datawhale task_1

这次学习中，学习了opencv的初步架构和图像插值运算算法。** 图像插值是在基于模型框架下，从低分辨率图像生成高分辨率图像的过程，用以恢复图像中所丢失的信息。插值指的是利用已知数据去预测未知数据,图像插值则是给定一个像素点,根据它周围像素点的信息来对该像素点的值进行预测。**在图像处理中，平移变换、旋转变换以及放缩变换是一些基础且常用的操作。这些几何变换并不改变图象的象素值，只是在图象平面上进行象素的重新排列。在一幅输入图象[u，v][u，v][u，v]中，灰度值仅在整数位置上有定义。然而，输出图

2021-09-14 23:29:00 192

原创动手学数据分析 task_4 数据可视化

本次学习数据可视化，主要大家学习了一下Python数据可视化库Matplotlib，在本章学习中，你也许会觉得数据很有趣。在打比赛的过程中，数据可视化可以让我们更好的看到每一个关键步骤的结果如何，可以用来优化方案，是一个很有用的技巧。导入库在jupyterlab中用这种方式去导入matplotlib 库了解matplotlib最基本的可视化图案有哪些？分别适用于那些场景？柱状图展示多个分类的数据变化和同类别各变量之间的比较情况。适用：对比分类数据。局限：分类过多则无法展示数据特点。条

2021-07-20 00:07:05 216 2

原创动手学数据分析task_3

在前面我们已经学习了Pandas基础，第二章我们开始进入数据分析的业务部分，在第二章第一节的内容中，我们学习了数据的清洗，这一部分十分重要，只有数据变得相对干净，我们之后对数据的分析才可以更有力。task_3 我们将学习数据重构任务1将数据合并使用concat方法合并list_up = [text_left_up,text_right_up]result_up = pd.concat(list_up,axis=1)result_up.head()这里的concat函数是panda的连接函

2021-07-18 00:28:28 117

原创 task_2 数据清洗及特征处理

本次学习，让大家了解数据分析的一些操作，主要做了数据的各个角度的观察。那么在这里，我们主要是做数据分析的流程性学习，主要是包括了数据清洗以及数据的特征处理，数据重构以及数据可视化。这些内容是为数据分析最后的建模和模型评价做一个铺垫task _2主要是数据清洗数据清洗我们拿到的数据通常是不干净的，所谓的不干净，就是数据中有缺失值，有一些异常点等，需要经过一定的处理才能继续做后面的分析或建模，所以拿到数据的第一步是进行数据清洗，本章我们将学习缺失值、重复值、字符串和数据转换等操作，将数据清洗成可以分析或

2021-07-16 00:37:07 124

原创 2021-07-13动手学数据分析 task_1数据加载及探索性数据分析

本次是学习如何用python进行数据分析。它分为三个单元进行，接下来的内容是第一单元数据加载及探索性数据分析。学习内容1.数据集的下载，这一部分由组织的文件获取2.导入pandas和numpypandas是基于numpy的一种工具，该工具是为了解决数据分析任务而建的，pandas纳入了大量库和一些标准的数据库模型，提供了高效率的操作大型数据集所需要的工具，pandas提供了大量快速便捷的处理数据的函数和方法，使python成为了强大而高效的数据分析环境的重要因素之一。3.载入数据3.1 使

2021-07-14 00:18:57 132

原创零基础语音识别task6 语音识别扩展阅读

终于是到了最后一个任务了，真不容易~~坚持下来了，还是学到了不少东西，交了不少好友最后的task，它对语音识别内容进行了扩展，更充分的了解到了机械学习算法和模型和深度学习在语音领域的应用本文参考datawhile组织与天池联合发起的零基础入门系列赛事第八场 —— 零零基础入门语音识别-食物声音识别挑战赛01 语音识别基础与发展语音识别全称为“自动语音识别”，Automatic Speech Recognition (ASR), 一般是指将语音序列转换成文本序列。语音识别最终是统计优化问题，给定输入序

2021-04-22 20:30:04 427

原创零基础语音识别task_5模型的改进与优化

这次学习我们首先学习了过拟合与欠拟合，过拟合是指模型对于训练数据拟合呈过当的情况，反映到评估指标上，就是模型在训练集上的表现很好，但在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好的情况。可以看出，图（a）是欠拟合的情况，拟合的黄线没有很好地捕捉到数据的特征，不能够很好地拟合数据。图（c）则是过拟合的情况，模型过于复杂，把噪声数据的特征也学习到模型中，导致模型泛化能力下降，在后期应用过程中很容易输出错误的预测结果。...

2021-04-21 23:28:49 452

原创零基础语音识别task4

这次学习了cnn模型的搭建与训练，本次模型用到的是比较容易搭建的Keras 框架，Keras 是一个用 Python 编写的高级神经网络 API，它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。现在Keras已经和TensorFlow合并，可以通过TensorFlow来调用。cnn网络的基本框架!这里简单将一下我对卷积核的理解，我们把上一步提取到的特征来进行卷积，下图是卷积核（filter），不同的卷积核卷积出来的数据是不一样的，我们这些训练就是要训练这些卷积核，不断的

2021-04-20 00:19:18 171

m0_57173763的博客