- 博客(4)
- 资源 (4)
- 收藏
- 关注
原创 关于DBSCAN算法的通俗理解
DBSCAN算法的通俗理解:1. 有一个人有很多朋友的人A。A和B,是很要好的朋友。A和C,也是很要好的朋友。则B是A的直接密度可达,C也是A的直接密度可达。2. B和C也有很多朋友。B也有一个很要好的朋友,D。C也有一个很要好的朋友,E。但是D和E,跟A并不像A跟B和D一样要好,对A来说,就是“好朋友的好朋友”。那么D和E是关于A的“密度可达”。3. 那么对于D和E两个人来说
2017-09-08 15:50:43 2560 1
原创 ARIMA算法&指数平滑总结
ARIMA算法:三大步:建模——诊断——预测1. 建模:(1)对数据绘图,观测是否为平稳时间序列;对于非平稳时间序列要先进行d阶差分运算,化为平稳时间序列;(2) 经过第二步处理,已经得到平稳时间序列。要对平稳时间序列分别求得其自相关系数ACF和偏自相关系数PACF,通过对自相关图和偏自相关图的分析,得到最佳的阶层 p 和阶数 q(3) 由以上得到的d、q、p,
2017-08-14 10:17:55 8346
原创 基于R语言的用户征信行为分类预测模型搭建总结
数据集:15万行数据量,11个数据维度。目标变量为是否有重大违约倾向(定义为超过90天没有还贷)建模流程:1. 缺失值处理发现数据集的数据缺失主要集中在亲属数量和月收入两个属性。其中,亲属数量却缺失属性为3000多条,且这3000多条记录中,月收入属性也同时缺失,故直接删除。对于有1万多条缺失记录的月收入,采用线性回归和多重插补填补缺失值。进行线性回归时,可能由于其他自
2016-07-25 18:41:18 8464 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人