![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 71
zoubaihan
妄想成为一个有境界的馒头
展开
-
Precision和Recall的计算方法
https://www.cnblogs.com/pprp/p/11241954.html转载 2022-03-30 16:12:21 · 806 阅读 · 0 评论 -
Conda配置清华源加速安装Python包(2021.11最新版)
本教程适用范围本教程**适用于64位windows操作系统。**其他操作系统可以根据本教程的思路以此类推,探索配置方法。起因目前网上给Conda配置清华源的教程很多,但是由于网上信息新老版本参差不齐,有的是几年前的,清华源早就换了url,加之清华源本身也很拉胯,常常会出现大家下载了conda,使用默认的下载路径下载太慢、配置了清华源又根本下载不了的问题。本教程保证配置之后百分之百可以快速安装conda包。配置方法首先点电脑上的开始–>Anaconda Prompt,打开conda命令行,然原创 2021-11-06 20:23:34 · 6061 阅读 · 6 评论 -
二手车交易价格预测代码全解析(三)特征工程与缺失值处理
路漫漫其修远兮,吾将上下而求索。缺失值处理思路先回顾一下第二节的内容。第二节我们讲到特征构造,不但分析了特征之间的相关性、删除了没有用的特征,还构造了一些新的特征。比如used_time(使用时长)、brand_and_price_mean(品牌与价格)等。我们在构造新的特征的时候,就将新特征中的缺失值用fillna()函数补充上了。但也要注意到,我们原有的特征列还存在很多缺失值,需要进行处理。这里的思路是:(1)缺失的数量很少:直接用中位数或者平均值代替。(2)缺失的数量很多:用机器学习模型.原创 2021-03-31 11:32:32 · 1054 阅读 · 0 评论 -
二手车交易价格预测代码全解析(二)数据分析与特征工程
查看缺失值和重复值在这里说一下哪些算缺失值。比如某一列明明该有一个数,但是却压根就没有数。这会导致程序运行的时候报错,提示无法转换NaN(Not a Number)。天池给的这数据集里缺失值特别多,刚开始跑程序的时候到处都报错NaN。所以查看一下缺失值情况是必要的,下面代码用来查看缺失值和重复值:missing=data_all.isnull().sum()missing=missing[missing>0]print(missing)print(data_all['bodyType'].原创 2021-03-30 17:57:24 · 1260 阅读 · 1 评论 -
二手车交易价格预测代码全解析(一)背景介绍与数据集加载
背景介绍这两天开始研究天池上面的数据挖掘入门比赛:二手车交易价格预测。本来觉得是一个比较简单的项目吧,套用一下keras解决波士顿房价回归预测的模型,写一个简单的神经网络把数据输入进去,就可以了。因此我一直以为深度学习的基本步骤是:(1)数据准备(2)模型选择&模型开发(3)模型评估(evaluate)(4)模型预测(5)模型调优(调参)万万没想到啊,这个二手车交易价格预测,要想预测得准确,就要优化基本的机器学习方法。个人觉得和深度学习比起来,机器学习太难了,难在他底层全都是数学。整原创 2021-03-30 11:53:40 · 2971 阅读 · 0 评论