TASK2 学习打卡计划

最新推荐文章于 2024-07-12 16:16:27 发布

qq_45820344

最新推荐文章于 2024-07-12 16:16:27 发布

阅读量256

点赞数

文章标签： python 深度学习

本文链接：https://blog.csdn.net/qq_45820344/article/details/105080945

版权

datawhale学习/baseline

数据的探索性分析（EDA）/baseline
（因为是算初学者，我的笔记会特别的幼稚哈哈哈哈。）

step1 导入函数工具箱/Step 2:数据读取

因为是算初学者，我的笔记会特别的幼稚哈哈哈哈。
输入的工具
numpy pandas warnings matplotlib seaborn jn display time (基础的）

Panda

学习链接：https://blog.csdn.net/qq_26591517/article/details/8004129
运用panda可以对数据进行读取（数据读取函数库）
使用：

数据降维处理：
数据规约产生更小但保持数据完整性的新数据集。在规约后的数据集上进行数据分析和挖掘将更有效率。
主要的代表模型 PCA LDA LLE 等
学习链接：
https://www.cnblogs.com/michael-xiang/p/10467555.html#%E5%8F%82%E8%80%83

info
info的使用
describe

通过 .describe() 可以查看数值特征列的一些统计信息
Train_data.describe()
（类似于统计建模所能得出的数据种类，包括mean，middle之类的）

step3 征与标签构建

数据的选取：（选择目标种类的数据类型）

A= B.select_dtypes(exclude/include='C').colums
print(A)

构建训练和测试样本
（这里不是很懂，先截图下来慢慢理解） *没有get到的点*
绘制标签统计图：
plt.（用于绘制多种图形，扇形，直方图等）
学习链接：https://blog.csdn.net/WYK1823376647/article/details/84561612?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158502636019725219928659%2522%252C%2522scm%2522%253A%252220140713.130056874…%2522%257D&request_id=158502636019725219928659&biz_id=0&utm_source=distribute.pc_search_result.none-task
（涉及一些 plt.x(Y/X)

缺省值（default value）
缺省值（quē shěng zhí）就是默认值。是指一个属性、参数在被修改前的初始值

step 4 模型训练与预测

lgb/xgb
在这里插入图片描述
这部分对我来说还有点陌生，组长已经给我们分享过一个很好的b站视频，看了一点点，有略微懂，但还不知道如何实操。

切分数据集
MAE 图像质量评估指标

学习链接：（包括 MAE | MSE | PSNR | SSIM）
https://blog.csdn.net/stone_fall/article/details/89389269?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158503683919195162527856%2522%252C%2522scm%2522%253A%252220140713.130056874…%2522%257D&request_id=158503683919195162527856&biz_id=0&utm_source=distribute.pc_search_result.none-task

切分数据集（Train,Val）进行模型训练，评价和预测
Train
Predict
在这里插入图片描述

EDA学习：

https://blog.csdn.net/haoran_yang/article/details/102939682?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158501828819724846418907%2522%252C%2522scm%2522%253A%252220140713.130056874…%2522%257D&request_id=158501828819724846418907&biz_id=0&utm_source=distribute.pc_search_result.none-task

感觉这些对于新手的我还是有点点吃力的，阅读理解上不是很难，不过要真正的运用可能还是需要自己动手打磨。
奥利给！！！！！

qq_45820344

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
TASK2 学习打卡计划

datawhale学习/baseline数据的探索性分析（EDA）/baseline（因为是算初学者，我的笔记会特别的幼稚哈哈哈哈。）step1 导入函数工具箱/Step 2:数据读取因为是算初学者，我的笔记会特别的幼稚哈哈哈哈。输入的工具numpy pandas warnings matplotlib seaborn jn display time (基础的）Panda学习链接...
复制链接

扫一扫