自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

转载 supervisor使用教程

supervisor是一个进程控制系统,由python编写,它提供了大量的功能来实现对进程的管理.仅仅需要创建配置文件,指定程序的执行路径即可。    1.程序的多进程启动,可以配置同时启动的进程数,而不需要一个个启动    2.程序的退出码,可以根据程序的退出码来判断是否需要自动重启    3.程序所产生日志的处理    4.进程初始化的环境,包括目录,用

2014-12-10 16:00:09 1867

转载 查询mysql总结和预处理一

查询mysql总结和预处理  一、连接到mysql: $dbc = mysqli_connect(host,user,password,databasename); 等价于:$dbc = mysqli_connect(host,user,pwd);mysqli_select_db($dbc,db_name); 如果发生错误,可以调用:mysqli_connect

2014-12-08 21:29:32 1177

转载 SHELL编写redis启动脚本

#!/bin/bash # # Init file for redis # From: JC# Email:jiechao2013@gmail.com# chkconfig: - 80 12 # description: redis daemon # # processname: redis # config: /opt/re

2014-08-20 22:03:18 1255

转载 Git fetch、git pull

Git fetch和git pull都被用于同步远程代码到自己的机器上;1)Git fetch :从远程获取最新版本到本地,不会自动mergegit fetch origin master                         //从远程的origin仓库的master主分支下载最新的版本到origin/master分支上git log -p master..or

2014-08-16 18:35:09 631

转载 shared_ptr

shared_ptr是一个最像指针的"智能指针",他非常有用。包装了new操作符在堆上分配的动态对象,实现的是引用计数型的智能指针 。一个 shared_ptr 实体可被多个线程同时读取;两个的 shared_ptr 实体可以被两个线程同时写入,“析构”算写操作;如果要从多个线程读写同一个 shared_ptr 对象,那么需要加锁。EXAMPLE 1:

2014-08-16 17:37:52 702

转载 Windows中使用google protobuf

我使用的是最新版本的protobuf(protobuf-2.5.0),编程工具使用VS2010。简单介绍下google protobuf:google protobuf 主要用于通讯,是google出的一个结构化信息传递工具,有着效率高、占存储少的优点,常被用于网络通讯。Google protobuf主要是针对Linux下的开发,但是为了照顾windows的开发人员,google也

2014-07-22 09:59:53 874

转载 智能推荐系统开发中的十个关键注意点

亚马逊的CEO Jeff Bezos曾经说过,他的梦想是“如果我有100万个用户,我就要为他们做100万个亚马逊网站”。智能推荐系统承载的就是这个梦想,即通过数据挖掘技术,为每一个用户实现个性化的推荐结果,让每个用户更便捷的获取信息。为了实现这个梦想,过去十余年间,无数顶尖技术专家和工程师投身于推荐算法和技术的研究与应用中,很多优秀的方法被提出,很多技术难题被攻克。在今天的互联网应用中,越来越多“

2014-06-16 17:31:46 2250

转载 推荐系统中所使用的混合技术介绍

推荐系统中所使用的混合技术介绍文/陈运文在推荐系统实际运用中,各种混合技术是其中一项极为重要的核心技术。在工程实践中我们发现,混合技术对提升推荐效果、改进推荐系统的性能等都有重要意义,因此本文对该专题进行如下的一些总结和介绍。引言在这个信息爆炸的时代,消费者面临众多选择、未知的领域、过载的信息时,往往无所适从;然而与此同时,内容的生产者(例如商家)也在苦苦寻觅合适的用户,寻找最便捷

2014-06-16 17:25:16 1141

转载 Netflix Prize 和推荐系统

在这篇包含两个部分的博文中,我们将揭开 Netflix 最有价值的资产——推荐系统的面纱。在第一部分,我们将介绍 Netflix Prize 对推荐领域的贡献,Netflix 推荐服务的主要模块,以及推荐服务如何满足网站的商业需求。在第二部分,我们将介绍我们使用的数据和模型,讨论如何将离线的机器学习实验与线上的 A/B 测试相结合。Netflix Prize 和推荐系统在 2006 年

2014-03-11 22:10:55 3943

转载 相似性度量

User CF 和 Item CF 都依赖于相似度的计算,因为只有通过衡量用户之间或物品之间的相似度,才能找到用户的“邻居”,才能完成推荐。上文简单的介绍了相似度的计算,但不完全,下面就对常用的相似度计算方法进行详细的介绍:1. 基于皮尔森相关性的相似度 —— Pearson correlation-based similarity皮 尔森相关系数反应了两个变量之间的线性相关程度,它的

2014-03-11 22:02:00 748

转载 各种聚类算法的比较

聚类的目标是使同一类对象的相似度尽可能地小;不同类对象之间的相似度尽可能地大。目前聚类的方法很多,根据基本思想的不同,大致可以将聚类算法分为五大类:层次聚类算法、分割聚类算法、基于约束的聚类算法、机器学习中的聚类算法和用于高维度的聚类算法。摘自 数据挖掘中的聚类分析研究综述 这篇论文。  1、层次聚类算法  1.1聚合聚类  1.1.1相似度依据距离不同:Single-Link:最近距

2014-03-03 17:48:01 3637

转载 Weka中的特征选择(Attribute selection)

按照http://weka.wiki.sourceforge.net/Use+Weka+in+your+Java+code的说法,在使用weka进行分类时,其实没有必要在代码中直接使用特征选择类,因为已经有meta-classifier和filter可以进行特征选择。Weka里有个称为AttributeSelectedClassifier的带有特征选择的分类器,和一个称为GreedySte

2014-01-17 14:26:23 11076

转载 KMeans聚类算法(转载)

KMeans算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。k-means 算法基本步骤(1)  从 n个数据对象任意选择 k 个对象作为初始聚类中心;(2)  根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离

2014-01-07 12:16:03 881

转载 基本Kmeans算法介绍及其实现(转载)

1.基本Kmeans算法[1]选择K个点作为初始质心  repeat      将每个点指派到最近的质心,形成K个簇      重新计算每个簇的质心  until 簇不发生变化或达到最大迭代次数  时间复杂度:O(tKmn),其中,t为迭代次数,K为簇的数目,m为记录数,n为维数空间复杂度:O((m+K)n),其中,K为簇的数目,m为记录数,n为维数2.

2014-01-06 17:03:17 891

转载 数据挖掘中所需的概率论与数理统计知识、上

数据挖掘中所需的概率论与数理统计知识、上  (关键词:微积分、概率分布、期望、方差、协方差、数理统计简史、大数定律、中心极限定理、正态分布)导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前读书时大学课本灌输给你的观念,一探正态分布之神秘芳踪,知晓其前后发明历史由来),相信,每一个学过概率论与数理统计的朋友都有必要了解数理统

2014-01-05 23:12:31 1464

转载 生物信息学相关网站

生物信息学与生物计算:http://bioinformatics.weizmann.ac.il/ 这是生物信息学和生物计算学的网站,由Weizmann科学研究所,生物服务部和Crown人类基因组学中心支持。研究领域主要涵盖序列分析,蛋白质组学和基因组学等。该网站提供了数据库,电子论坛,教育,新闻,软件,招聘启事等。该网站还提供了相关链接,包括欧洲分子生物学以色列国家网点,以色列国家基因组基础设

2014-01-02 16:55:46 14589 2

转载 Google在KDD2013上关于CTR的一篇论文(转载)

最近在做CTR,刚好Google在KDD发了一篇文章,讲了他们的一些尝试,总结一下:先是一些公式的符号说明:一、优化算法CTR中经常用Logistic regression进行训练,一个常用的Loss Function为Online gradient descent(OGD)是一个常用的优化方法,但是在加上L1正则化后,这种方法不能产生有效的稀疏模型。相比之下 Regula

2013-12-30 13:11:15 1015

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除