datawhale学习/baseline
数据的探索性分析(EDA)/baseline
(因为是算初学者,我的笔记会特别的幼稚哈哈哈哈。)
step1 导入函数工具箱/Step 2:数据读取
因为是算初学者,我的笔记会特别的幼稚哈哈哈哈。
输入的工具
numpy pandas warnings matplotlib seaborn jn display time (基础的)
Panda
学习链接:https://blog.csdn.net/qq_26591517/article/details/8004129
运用panda可以对数据进行读取(数据读取函数库)
使用:
数据降维处理:
数据规约产生更小但保持数据完整性的新数据集。在规约后的数据集上进行数据分析和挖掘将更有效率。
主要的代表模型 PCA LDA LLE 等
学习链接:
https://www.cnblogs.com/michael-xiang/p/10467555.html#%E5%8F%82%E8%80%83
info
describe
通过 .describe() 可以查看数值特征列的一些统计信息
Train_data.describe()
(类似于统计建模所能得出的数据种类,包括mean,middle之类的)
step3 征与标签构建
数据的选取:(选择目标种类的数据类型)
A= B.select_dtypes(exclude/include='C').colums
print(A)
构建训练和测试样本
(这里不是很懂,先截图下来慢慢理解)
绘制标签统计图:
plt.(用于绘制多种图形,扇形,直方图等)
学习链接:https://blog.csdn.net/WYK1823376647/article/details/84561612?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158502636019725219928659%2522%252C%2522scm%2522%253A%252220140713.130056874…%2522%257D&request_id=158502636019725219928659&biz_id=0&utm_source=distribute.pc_search_result.none-task
(涉及一些 plt.x(Y/X)
缺省值(default value)
缺省值(quē shěng zhí)就是默认值。是指一个属性、参数在被修改前的初始值
step 4 模型训练与预测
lgb/xgb
这部分对我来说还有点陌生,组长已经 给我们分享过一个很好的b站视频,看了一点点,有略微懂,但还不知道如何实操。
切分数据集
MAE 图像质量评估指标
学习链接:(包括 MAE | MSE | PSNR | SSIM)
https://blog.csdn.net/stone_fall/article/details/89389269?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158503683919195162527856%2522%252C%2522scm%2522%253A%252220140713.130056874…%2522%257D&request_id=158503683919195162527856&biz_id=0&utm_source=distribute.pc_search_result.none-task
切分数据集(Train,Val)进行模型训练,评价和预测
Train
Predict
EDA学习:
https://blog.csdn.net/haoran_yang/article/details/102939682?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158501828819724846418907%2522%252C%2522scm%2522%253A%252220140713.130056874…%2522%257D&request_id=158501828819724846418907&biz_id=0&utm_source=distribute.pc_search_result.none-task
感觉这些对于新手的我还是有点点吃力的,阅读理解上不是很难,不过要真正的运用可能还是需要自己动手打磨。
奥利给!!!!!