自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

三少GG

解决一些遇到的小麻烦

  • 博客(28)
  • 资源 (5)
  • 收藏
  • 关注

原创 sublime几款常用插件

Sublime Textsublime text 2 有一个注释插件很好用,这里推荐一下,DocBlockr这个插件可以很好的生成js ,php 等语言函数注释,只需要在函数上面输入/** ,然后按tab 就会自动生成注释然后自己补充好函数功能,参数说明,返回类型可以自动生成,如果不能可以手动输入。太细的点这里就不说了。/////////////

2013-12-31 15:12:30 2581

原创 linux中fork()函数详解

http://blog.csdn.net/jason314/article/details/5640969 一、fork入门知识     一个进程,包括代码、数据和分配给进程的资源。fork()函数通过系统调用创建一个与原来进程几乎完全相同的进程,也就是两个进程可以做完全相同的事,但如果初始参数或者传入的变量不同,两个进程也可以做不同的事。    一个进程调用fork(

2013-12-30 21:46:26 1063

转载 NoSQL数据库笔谈

NoSQL数据库笔谈databases ,appdir , node , paper颜开 , v0.2 , 2010.2序思想篇CAP最终一致性变体BASE其他I/O的五分钟法则不要删除数据RAM是硬盘,硬盘是磁带Amdahl定律和Gustafson定律万兆以太网手段篇一致性哈希

2013-12-29 14:39:49 912

转载 Linux Epoll程序实例

Linux Epoll介绍和程序实例1. Epoll是何方神圣?Epoll可是当前在Linux下开发大规模并发网络程序的热门人选,Epoll 在Linux2.6内核中正式引入,和select相似,其实都I/O多路复用技术而已,并没有什么神秘的。其实在Linux下设计并发网络程序,向来不缺少方法,比如典型的Apache模型(Process Per Connection,简称PPC),TP

2013-12-26 14:28:26 1460

转载 最好的epoll讲解--转自”知乎“

2013-10-27更新:由于此文陆陆续续收到赞同,而且其中有些地方并不完全正确,特在本文最后予以订正我不了解楼主的层次,我必须从很多基础的概念开始构建这个答案,并且可能引申到很多别的问题。首先我们来定义流的概念,一个流可以是文件,socket,pipe等等可以进行I/O操作的内核对象。不管是文件,还是套接字,还是管道,我们都可以把他们看作流。之后我们来讨论I/O的操作,通

2013-12-26 14:26:28 3559

原创 可伸缩系统的架构经验||消息队列

可伸缩系统的架构经验FEB 27TH, 2013 | COMMENTS最近,阅读了Will Larson的文章Introduction to Architecting System for Scale,感觉很有价值。作者分享了他在Yahoo!与Digg收获的设计可伸缩系统的架构经验。在我过往的架构经验中,由于主要参与开发企业软件系统,这种面向企业内部的软件系统通常不会有

2013-12-25 18:41:41 1302

转载 构建高并发高可用的电商平台架构实践

[置顶] 构建高并发高可用的电商平台架构实践分类: 云计算 电商&开放平台架构电商高并发高可用实践目录(?)[+]从各个角度总结了电商平台中的架构实践,由于时间仓促,定了个初稿,待补充完善,欢迎大家一起交流。转载请声明出处:http://blog.csdn.net/yangbutao/article/details/122

2013-12-25 16:46:57 2281

转载 weka 数据定义

数据挖掘:概念与技术(原书第3版)2.1.2 标称属性标称意味“与名称相关”。标称属性(nominal attribute)的值是一些符号或事物的名称。每个值代表某种类别、编码或状态,因此标称属性又被看做是分类的(categorical)。这些值不必具有有意义的序。在计算机科学中,这些值也被看做是枚举的(enumeration)。例2.1 标称属性。假设hair_color(头发颜色)

2013-12-23 18:27:21 1272

翻译 Weka and Hadoop

Mark Hall on Data Mining & WekaWeka and Hadoop Part 3This is the third of three posts covering some new functionality for distributed processing in Weka. The first and second i

2013-12-23 00:06:46 5021

翻译 大数据挖掘为什么不选择R?

Tools: any thoughts on open source R vs. Rapid-I ?R Pros:- it's a programming language: you can do what you want- number of algorithms: many analysis and data transformation schemes alre

2013-12-22 21:36:32 1333

转载 大数据实际案例系列一

大数据几个实际案例“大数据”的经典定义是可以归纳为4个V:海量的数据规模(volume)、快速的数据流转和动态的数据体系(velocity)、多样的数据类型(variety)和巨大的数据价值(value)。        大数据首先要考虑的应该是“大”——海量的数据规模。谷歌执行董事长艾瑞克.施密特曾说,现在全球每两天所创造的数据量等同于从人类文明至2003年间产生的数据量的总和。

2013-12-22 10:26:57 3959

原创 weka源码分析

weka源码获得与导入1、下载weka3.7,解压其中的weka-src.jar的文件,包含lib,src,META-INF三个文件夹和另外两个文件;2、在Eclipse下新建java project,命名为weka,在src下新建名为weka的包;3、在此项目下import-->File System-->选择.../weka/src/main/java/weka,并全部导入;4

2013-12-21 23:45:37 2367

原创 大数据挖掘公司介绍

1.  optimove2.Alteryx 3. Revolution Analytics

2013-12-19 23:34:26 1576

原创 Weka J48决策树算法(C4.5)源码学习

http://weka.wikispaces.com/SubversionJ48 C4.5决策树算法源码学习 TODO: J48 的分类效率分析。题记: 之前虽然对 J48 用得比较多,是由于它能方便的区别特征的好坏。 工作了,希望自己能更深入, 如是开始了这个算法学习系列。 希望和大家共同进步。个人对看算法源代码也没有很好的流程,计划先采用 按类Class 做架构

2013-12-19 18:03:18 11771 2

转载 R语言为Hadoop注入统计血脉

R语言为Hadoop注入统计血脉RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析。Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现。有了RHadoop可以让广大的R语言爱好者,有更强大的工具处理大数据1G, 10G, 100G, TB, PB。 由于大数据所带来的单机性能问题,可能会一去不复返了。

2013-12-19 15:49:54 1760

原创 流失预测模型

http://blog.sina.com.cn/s/blog_c308e7dd0101cp4h.html流失预测模型在很多行业都有引用到切实的市场运营当中,而接下来就开门见山的说一下游戏行业有关用户流失模型的建立。目标:关于游戏用户的流失,普片的衡量指标有周流失与月流失,接下来研究的问题有两个:① 有关付费用户的月登陆流失问题

2013-12-17 01:53:46 3334

翻译 【加精】商业预测模型的展望

http://www.predictiveanalyticsworld.com/lower-costs-with-predictive-analytics.phpSix Ways to Lower Costs with Predictive AnalyticsBy Eric Siegel, Ph.D.Conference Chair, Predictive

2013-12-12 10:18:31 3475

原创 大数据统计分析公司介绍-决策树

1.About Revolution AnalyticsRevolution Analytics is the leading commercial provider of software and services based on the open source R project for statistical computing. The company brings hi

2013-12-11 20:49:47 2211

原创 决策树的三种Hadoop开源实现

1.Implementation of C4.5 Algorithm using Hadoop Map Reduce Paradigm2. Mahout, a collection of machine learning algorithms for Hadoop, didn't yet have a C4.5-like implementation for dec

2013-12-11 18:18:11 3958 2

转载 决策树模型组合之随机森林与GBDT

机器学习中的算法(1)-决策树模型组合之随机森林与GBDT版权声明:    本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com前言:    决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快

2013-12-11 18:00:21 1003

转载 C4.5决策树算法介绍

http://blog.sina.com.cn/s/blog_68ffc7a40100urn3.html1. 算法背景介绍分类树(决策树)是一种十分常用的分类方法。他是一种监管学习,所谓监管学习说白了很简单,就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为

2013-12-11 11:15:33 11031

转载 Weka进行数据挖掘简介

使用Weka进行数据挖掘    (2012-7-26 03:07:26)标签: Weka , 数据挖掘    分类:数据挖掘1.简介数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取,算法选择和参数调优上。那么,一个可以方便

2013-12-10 23:12:13 3852

转载 开源实时大数据流挖掘---SAMOA

Introducing SAMOA, an open source platform for mining big data streams.https://github.com/yahoo/samoaMachine learning and data mining are well established techniques in the world of IT and especia

2013-12-10 17:01:10 2592

转载 storm简介

storm简介悟时场景伴随着信息科技日新月异的发展,信息呈现出爆发式的膨胀,人们获取信息的途径也更加多样、更加便捷,同时对于信息的时效性要求也越来越高。举个搜索场景中的例子,当一个卖家发布了一条宝贝信息时,他希望的当然是这个宝贝马上就可以被卖家搜索出来、点击、购买啦,相反,如果这个宝贝要等到第二天或者更久才可以被搜出来,估计这个大哥就要骂娘了。再举一个推荐的

2013-12-10 14:10:44 873

转载 Churn Model系列三:游戏领域

分析以数据挖掘技术预测用户流失情况的方法发布时间:2012-05-19 15:11:43 Tags:Decision Trees,Naive Bayes,数据挖掘技术,永恒之塔,预测用户流失作者:Dmitry Nozhnin所有网络服务及在线游戏的硬伤是什么?也就是游戏开始头几分钟或几小时内出现的大量用户流失情况。已经有不少人通过多种方式探索这个问题的解

2013-12-05 16:39:04 2214

转载 Churn Model系列二:产品经理角度

用户为何流失:流失用户研究方法及流程发表于 2012-03-07 00:09 来源:腾讯WSD大量的用户流失给我们的产品带来极大的挑战,用户为什么流失?流失之后去哪儿了?怎么挽留现有用户?怎么“召回”已流失用户?本文以“手机QQ音乐播放器流失用户研究”为例,谈一下自己的理解,供大家参考。一、先把相关术语搞清楚  有些术语团队内部之前会有定义,没有错误的话,只

2013-12-05 16:20:57 1196

原创 Churn Model 系列一:业务角度

用户流失模型:http://www.newnorth.com/creating-a-predictive-churn-mode-part-1l/Creating a Predictive Churn Model : Part 1

2013-12-05 11:14:17 2526

转载 Mahout系列一

http://www.cnblogs.com/fengfenggirl/p/associate_mahout.html Mahout学习资料整理Oct122013作者:逍遥冲   发布:2013-10-12 16:38   分类:Hadoop,架构   阅读:1,103 浏览数   抢沙发   Mahout简介Mahout 是 Apache So

2013-12-01 18:39:23 1224

证件照蓝底换白底PS方法

简单的证件照底色更改:蓝底换白底PS方法

2013-07-07

hyren_20100507_slide.ppt

hog+svm+adaboost 相关知识普及

2011-03-30

MySql.Data.dll 6.2.1.0版

MySql.Data.dll 6.2.1.0版本 现在可以下到的一个地方要10个积分,很不地道 现在1分即可下载,而且是最新版本!

2011-01-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除