Kaggle/阿里云天池
文章平均质量分 96
对于学生党,做项目,最简单直接的方法就是参加竞赛。推荐两个参加竞赛的地方,一个是国外的 Kaggle,另一个是国内的阿里云天池。两个竞赛的奖金也都很丰富,根据自己的喜好,参赛即可。
付付要努力呀
越努力越幸运,希望经过自己的努力不断提升自己,成为一个更好的自己!!加油!!
展开
-
车牌识别项目全过程——opencv知识自学(1)
目录什么是opencv?图像获取图像变换改变大小什么是opencv?OpenCV是一个开源的计算机视觉框架。是用来处理图像数据的开源库,即一套与图像相关的算法库。在2016年以后,深度学习的应用越来越广泛,OpenCV里也添加了CNN之类的模块,可以与Tensorflow、Caffe2这些框架训练出来的模型对接。图像获取import cv2gray_img = cv2.imread(r'C:\Users\fujie\Pictures\shunli.jpg',1) # 读入图像cv2.im原创 2022-04-19 15:18:17 · 16404 阅读 · 15 评论 -
kaggle——信用卡欺诈检测项目实战
笔记第一步:了解题目,确定任务第二步:场景分析第三步:数据预处理看是否有缺失值查看样本类别分布数据不均衡解决办法数据值标准化/归一化第四步:特征工程1)查看特征分布情况,把不同类别下特征分布相差不大的特征删除掉2)特征缩放第五步:模型训练处理不平衡样本交叉验证求取最好的模型参数第六步:模型评估使用下采样数据训练与测试使用下采样数据训练与测试(不同的阈值对结果的影响)使用下采样数据训练,原始数据进行测试原始数据进行K折交叉验证使用原始数据进行训练和测试查看ROC曲线逻辑回归阈值选择过采样总结第一步:了解题目原创 2021-08-01 21:26:01 · 11680 阅读 · 10 评论 -
基于二手车价格预测——特征工程
特征工程特征工程异常值处理箱型图法:缺失值处理数据分桶特征归一化特征工程我的理解就是在建模解决实际问题时,会在建模前收集可能与实际业务有关的特征,但这些特征可能是一些单一的特征,通过EDA发现这些特征值有异常值,缺失值等,不同的模型对特征的要求不一样,这些特征直接进入模型的效果往往不好,因此,我们需要对特征进行清洗,加工,筛选才能进入模型。以下数据处理过程以二手车价格预测比赛为例。异常值处理异常值处理方法有很多如3西格玛法,箱型图,孤立森林等箱型图法:代码:def outliers_pr原创 2021-04-18 21:07:59 · 825 阅读 · 0 评论 -
二手车交易价格预测方案——数据分析EDA
二手车交易价格预测题目解析题目解析这个比赛是天池的一个数据挖掘入门赛,要求根据提供的数据预测二手车的交易价格,属于回归问题,推荐系统最常用的模型是LightGBM和XGBoost等。1、学习目标理解赛题数据和目标,清楚评分体系2、了解赛题3、评价标准本赛题的评价标准为MAE(Mean Absolute Error)二、数据分析(记录一些python的语法)...原创 2021-04-15 10:00:59 · 4187 阅读 · 0 评论