- 博客(8)
- 资源 (1)
- 收藏
- 关注
原创 预测信用卡欺诈
预测信用卡欺诈@(A01-11. 机器学习)[GBM]一、项目简介Credit Card Fraud Detection是一个典型的分类问题,欺诈分类的比例比较小,直接使用分类模型容易忽略。在实际应用场景下往往是保证一定准确率的情况下尽量提高召回率。一个典型案例是汽车制造行业,一旦发生一例汽车安全故障,同批次的车辆需要全部召回,造成了巨大的经济损失。二、数据印象详细分析过程见在线脚本。2.1. 简单
2017-05-07 15:25:43 4361
原创 字符串匹配问题-KMP总结
搞了半天,终于明白一些了。一、问题描述 在字符串Str(长度为n)中找到字符串Target(长度为m)的位置。通常假设n>=m。 字符串Str, Target的字符属于字符空间集合S, S的大小为N。 在文本编辑器中经常使用。二、问题推导 基本思路:设置一个位移s=0;从Target中取出一个字符,然后从Str[s]中拿出
2013-11-08 17:24:14 1664
原创 使用Mahout搭建推荐系统之入门篇4-Mahout实战
用意: 结合上篇博客,写写代码熟悉一下Mahout。很多地方想法都比较粗糙,亟待指正。代码放在了:https://github.com/xiaoqiangkx/qingRS一、基本内容 1. 加载数据: 判断userID和itemID的大小关系 2. 过滤数据: 评分较少的用户直接过滤掉, 那些评分均一致且评分数量多的用户过滤掉. 计算过滤百分比, 如果过滤过多
2013-11-07 17:21:10 5113 4
原创 使用Mahout搭建推荐系统之入门篇3-Mahout源码初探
用意: 希望了解Mahout中数据的存储方式, 它如何避免java object带来的冗余开销。学完知识,要进行些实战去分析数据。花了些时间看了看Mahout的源码和官方资料,记录下自己的一些收获。一、Mahout内容补充 1. Mahout本质上是一个开源的机器学习框架. http://mloss.org/software/ 有大量的机器学习开源框架, mahou
2013-11-07 16:44:32 4413 9
原创 使用Mahout搭建推荐系统之入门篇2-玩转你的数据1
用意: 搞推荐系统或者数据挖掘的, 对数据要绝对的敏感和熟悉, 并且热爱你的数据. 分析数据既要用统计分析那一套,又要熟悉业务发掘有趣的特征(feature). 后者有意思的多,但是因为我业务做的不多,还不太熟悉, 跪求大牛们分析业务经历. 听豆瓣上的大神"懒惰啊我"说过,有一个Nokia的比赛,有一个团队直接用陀螺仪参数就发现了性别分布,因为男生手机都放在口袋里, 而女生往往放在包里面. 不知道
2013-11-03 10:25:56 2106
原创 使用Mahout搭建推荐系统之入门篇1-搭建REST风格简单推荐系统
用意: 网络上有很多关于使用mahout搭建推荐系统的文章,但是还没有一个从建立推荐系统原型至部署到简单服务器的完整教程. 虽然部分朋友对推荐系统很感兴趣, 但是因hadoop的复杂而却步. 同时对于那些没有任何Web开发经验的朋友来说, 一个完整的小型推荐系统可以很大的激发学习的兴趣和动手的冲动. 我觉得动手的冲动比看书的冲动要重要的多.
2013-11-03 10:16:58 2609 3
原创 java 文档下载地址
JAVA下载JDK1.5 JDK1.6 JDK1.7 官方完全完整版下载JDK(Java Development Kit,Java开发包,Java开发工具)是一个写Java的applet和应用程序的程序开发环境。它由一个处于操作系统层之上的运行环境还有开发者编译,调试和运行用Java语言写的applet和应用程序所需的工具组成。 JDK(Java Development K...
2012-04-07 20:43:25 184
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人