算法
goskiller
咨询公司出身,投身互联网金融,主抓数据分析和挖掘建模,在工作和带领团队中偶有所得
展开
-
R语言使用协同过滤算法(usercf)解决投资推荐问题
针对投资者智能推荐金融产品是不是一个好主意?实际上许多互联网金融公司已经开始了这方面的尝试,陆金所的用户中心界面下方的‘为您推荐’栏目就是这方面的尝试,具体如下图:这个就是典型的基于用户相似度做智能推荐的产品,现在我们就来揭开一种基于用户相似度做推荐算法的神秘面纱吧!!本博客主要参考文献张丹在这篇博客http://blog.fens.me/r-mahout-user原创 2016-07-21 19:03:03 · 4820 阅读 · 1 评论 -
基于pearson(皮尔逊)相似度的用户推荐算法
最近因为写一些数据分析报告,把写博客的进度耽误了一点,不过不要紧,我最近优化了一下做出的推荐算法,用pearson相似度替换了欧氏距离相似度,优化了推荐算法代码,另外将700多个用户的推荐投资品循环计算了。先说一下pearson相似度:pearson相似度与欧式距离相似度的最大区别在于它比欧式距离更重视数据集的整体性;因为pearson相似度计算的是相对距离,欧式距离计算的是绝对距原创 2016-08-11 11:04:48 · 20178 阅读 · 4 评论 -
用R语言实现简单的Kmeans聚类
最近主要在做针对投资者的统计及聚类分析,希望能找出投资者的一些特征,方便做投资者的精准营销。首先使用的是SPSS的modeler,毕竟操作可视化,比较简单,就是运行大量数据比较慢,挺费时间。后来又想用R验证一下聚类的准确性,直接登陆Rstudio,找了kmeans的包,也计算了,发现了SPSS聚类除了没有R计算的效率快,分类也没有R精准,彻底断了我继续使用SPSS的想法,现将R聚类分析过程原创 2016-09-30 16:24:05 · 11189 阅读 · 0 评论 -
用R做一个完整的数据挖掘项目
最近运营部门希望我们帮助他们找出合适的短信营销对象,通过短信营销能够提高他们的投资者再次投资转化率,那么如何找到这个精准人群就是我们部门必须出手做的事情了?但是从几百万投资者中找出最近要复投的用户,这数据挖掘工作究竟该如何入手呢?不着急,我先上结果给大家先看看。 (这是我5月9日给出的一波预测会复投的新用户ID,当日下午做营销,5月11日晚20:00的结果)(这是业务部门5月8原创 2017-05-26 13:36:37 · 8914 阅读 · 6 评论 -
用R中prophet包做时序预测
最近又接到一个预测项目需求,主要是预测每天投资用户会投资不同产品多少金额,属于每天即时预测,需要拿最近一年的数据做测试集,来预测每天不同期限产品分别被投资多少金额,然后通过这些金额每天找借款端匹配借款需求,借款端运营通过资金端需求来动态调整营销活动,通过资金需求多少来有效运营借款需求,形成与资金端的良性互动,节约闲置资金成本。 就这样一个需求,如何实现?我首先想到通过业务经验原创 2017-09-20 13:37:23 · 1979 阅读 · 0 评论 -
使用R的prophet包做一个简单的时序预测
上一篇博客针对prophet包上传了自己的代码,今天这篇博客我跟大家讲述一下prophet包工作原理,以及我对该模型做的一些优化。 上次使用prophet包做项目主要分为了四个部分,分别是读取数据,设定节假日(奇异点),训练模型,输出自定义结果这四部分,现在我就上个项目做分别讲解。 一、初始化:装载模型包并读取数据 library(prophet原创 2017-10-23 13:48:31 · 945 阅读 · 0 评论