天池/kaggle比赛
文章平均质量分 64
天池/kaggle比赛
Bessie_Lee_gogogo
24届毕业生,已就业,后续内容输出至微信公众号:木子计算机领域学习。
方向:1、预测算法研究(梦想去总部做算法);2、CTF比赛(寻找初心);3、碎碎叨叨。
感谢大家关注,如果曾经的大学时期博客能让帮助到大家,希望后续工作时期公众号的博文也能帮助大家。
展开
-
[李宏毅深度学习作业] 作业1:ML2021Spring-hw1 COVID-19 Cases Prediction【以时间线为记录】
写在开头:此篇博客主要是记录李宏毅老师2021年春季的深度学习作业1的笔记过程,以时间的角度进行记录。COVID-19 Cases Prediction8月27号[初步操作]初步查看数据集+用基础的RF进行测试结果8月28号[运行样例代码]李宏毅助教代码运行+理解1、Setup Hyper-parameters [设置超参数]2、Load data [下载数据]3、Load model [下载模型]4、Start Training[开始训练]5、Testing[测试]6、Submit.原创 2022-08-30 16:33:25 · 4202 阅读 · 4 评论 -
【kaggle】Spaceship Titanic - 预测哪些乘客被运送到另一个维度【CatBoost - 10%】
【kaggle】Spaceship Titanic - 预测哪些乘客被运送到另一个维度【CatBoost - 10%】有看不懂的地方直接评论区私聊即可,看到就会回复。原创 2022-07-26 01:52:37 · 1994 阅读 · 4 评论 -
天池学习赛 -【零基础入门语音识别-食物声音识别】Task1 食物声音识别-Baseline【代码详细手写解释】
文章目录一、Task1 食物声音识别-Baseline二、对应解析三、参考链接一、Task1 食物声音识别-Baseline天池对应代码链接二、对应解析三、参考链接tqdm的解释深度学习中Dropout原理解析深度学习中Flatten层的作用核心网络层Dense简单认识Adam优化器Keras.metrics中的accuracy总结keras中两种交叉熵损失函数的探讨还有好多链接没有粘贴进去,因为看的文件比较多,就收藏了一些对应的链接,希望可以帮助到和我一样看不懂代码的人。原创 2022-03-13 15:04:32 · 4220 阅读 · 0 评论 -
【天池学习赛】工业蒸汽量预测 - 【1】赛题理解 和【2】数据探索
工业蒸汽预测【1】赛题理解【2】数据探索【1】赛题理解1、下载数据,查看数据集,得到target2、评估指标为:MSE(均方误差)from sklearn.metrics import mean_squared_errory_test = [1,2,3]y_predict = [1.2, 2.1, 3.2]mean_squared_error(y_test, y_predict)# 输出0.0300000000000000233、判断赛题模型:本题为回归问题【2】数据探索1、相原创 2022-03-23 19:05:06 · 2679 阅读 · 0 评论 -
天池工业蒸汽量预测学习赛 - day1赛题理解
作为第一次进行天池学习赛的学习新人,如有错误,请多指教!拿到一个赛题的时候呢,首先要对赛题进行理解,其次是数据探索,特征工程,然后是模型训练,模型验证,最后特征优化和模型融合根据前段时间的阅读(1-20面)得出以下数据清洗的方法与例子赛题理解:赛题目的根据给定的数据,对模型进行训练,然后的到预测集的预测数据,预测数据越准确,模型越好数据概览下载完数据以后,找到训练集与测试集,找到目标变量的值评估指标预测结果以均方误差MSE作为评判标准。前面一个y是真实值,后面一个y是预测值当MSE值原创 2021-10-26 09:02:47 · 265 阅读 · 0 评论 -
【天池系列比赛基础知识】特征降维中的特征选择【VarianceThreshold - 方差阈值】手写笔记
博客由来今天看天池特征工程这一块的时候,本来想着,特征降维这一个模块我就看看书眼熟一下就过去了,但是我发现,全是代码堆积,然后解释也就一点点,更像是无脑的去背代码,真没意思,所以也就有了你们现在看到的这一篇博客。本篇博客我不想看把sklearn的英文API翻译成中文然后给你们贴进去,感觉这样和抄没有区别,所以换了一个思路,也算是提高一下自己这四级刚过线的垃圾英语吧!那我们开始步入正题特征降维中的特征选择VarianceThreshold类代码实例:from sklearn.feature_s原创 2022-04-14 00:21:53 · 650 阅读 · 1 评论 -
【天池学习赛基本内容】 - 绘制可视化数据 【箱型图】+ 官网API理解与代码分析
一、实际操作代码直接展示1、绘制一个箱型图fig = plt.figure(figsize=(4, 6)) # 指定绘图对象宽度和高度sns.boxplot(train_data['V0'],orient="v", width=0.5)# 这里的train_data是天池学习赛中预测蒸汽量的训练集2、绘制一群箱型图# 画箱式图column = train_data.columns.tolist()[:39] # 列表头fig = plt.figure(figsize=(20, 40)原创 2022-03-30 16:06:00 · 614 阅读 · 2 评论 -
【天池基础学习】 - 线性回归关系图 ~>【regplot官方文档】
一般的绘制线性回归关系图数据是:天池学习赛中蒸汽预测的数据,可以在官网自行下载import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snstrain_data_file = "./zhengqi_train.txt"test_data_file = "./zhengqi_test.txt"train_data = pd.read_csv(train_data_file,原创 2022-03-31 20:22:51 · 1386 阅读 · 0 评论 -
【天池基础知识】直方图,Q~Q图、KDE分布图+对应的官方API文档
直方图+Q~Q图1、单个代码plt.figure(figsize=(10,5))ax=plt.subplot(1,2,1)sns.distplot(train_data['V0'],fit=stats.norm)ax=plt.subplot(1,2,2)res = stats.probplot(train_data['V0'], plot=plt)2、多个代码train_cols = 6train_rows = len(train_data.columns)plt.figure(f原创 2022-03-31 17:19:38 · 4320 阅读 · 0 评论 -
【天池基础知识】 - 查看特征变量的相关性(计算相关性系数+画出热力图+筛选特征变量+Box-Cox变换)
文章目录1、计算相关性系数2、画出热力图3、筛选特征变量4、Box-Cox变换1、计算相关性系数使用函数corr()代码展示:train_corr = train_data.corr()train_corr只截取一部分:2、画出热力图1、单纯的画一个热力图:ax = plt.subplots(figsize=(20,16))ax = sns.heatmap(train_corr)2、画一个含有对应相关性数字的热力图ax = plt.subplots(figsize=(20,1原创 2022-04-01 12:54:18 · 4307 阅读 · 0 评论 -
【天池比赛基础知识】特征工程中的特征处理部分【手写记录】标准化+区间缩放+归一化+特征二值化+one-hot编码+缺失值处理+数据转换+总结
【天池比赛基础知识】特征工程中的特征处理部分【手写记录】标准化+区间缩放+归一化+特征二值化+one-hot编码+缺失值处理+数据转换+总结原创 2022-04-11 19:09:09 · 289 阅读 · 2 评论