自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 问答 (2)
  • 收藏
  • 关注

数据结构与算法:递归

递归递归三要素整数转换为任意进制递归调用的实现递归可视化:分形树递归三要素1 基本结束条件2 演进3 调用自身整数转换为任意进制def toStr(n,base): convertString='123456789ABCDEF' if n<base: return convertString[n] else: ret...

2020-03-28 18:09:15 177

原创 二手车预测PART2:特征工程

常见的特征工程包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;特征归一化/标准化:标准化(转换为标准正态分布);归一化(抓换到 [0,1] 区间);针对幂律分布,可以采用公式:数据分桶:等频分桶;等距分桶;Best-KS 分桶(类似利用基尼指数进行二分类);卡方分桶;缺失值处理:不处理(针对类似 XGB...

2020-03-28 13:37:27 181

原创 机器学习:Percetron Learning Algorithm(感知机学习算法)

percetron:感知器x代表点,y代表画叉或圈,h代表直线找到一个错误点,如果y=+1,则x与w之间的夹角过大,对w进行重新赋值,令w=w+x;反之w=w-x3是对的,由于w(t+1)=w(t)+y(n)*x(n),所以若两边同乘y(n)和x(n),则可以知道3是对的。...

2020-03-23 14:23:28 264

原创 二手车预测part1

数据集的探索(EDA)#主要使用工具:pandas, numpy, matplotlib, seaborn, missingno#总体流程##第一步:数据的导入train_data=pd.read_csv('D:/天池数据集/二手车/used_car_train_20200313.csv',engine='python',sep=' ')test_data=pd.read_csv('D:...

2020-03-22 13:24:37 504

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除