上善之若水-CSDN博客

转载 supervisor使用教程

supervisor是一个进程控制系统，由python编写，它提供了大量的功能来实现对进程的管理.仅仅需要创建配置文件，指定程序的执行路径即可。 1.程序的多进程启动，可以配置同时启动的进程数，而不需要一个个启动 2.程序的退出码，可以根据程序的退出码来判断是否需要自动重启 3.程序所产生日志的处理 4.进程初始化的环境，包括目录，用

2014-12-10 16:00:09 1961

转载查询mysql总结和预处理一

查询mysql总结和预处理　　一、连接到mysql: $dbc = mysqli_connect(host,user,password,databasename); 等价于：$dbc = mysqli_connect(host,user,pwd);mysqli_select_db($dbc,db_name); 如果发生错误，可以调用：mysqli_connect

2014-12-08 21:29:32 1228

转载 SHELL编写redis启动脚本

#!/bin/bash # # Init file for redis # From: JC# Email:jiechao2013@gmail.com# chkconfig: - 80 12 # description: redis daemon # # processname: redis # config: /opt/re

2014-08-20 22:03:18 1322

转载 Git fetch、git pull

Git fetch和git pull都被用于同步远程代码到自己的机器上；1）Git fetch ：从远程获取最新版本到本地，不会自动mergegit fetch origin master //从远程的origin仓库的master主分支下载最新的版本到origin/master分支上git log -p master..or

2014-08-16 18:35:09 670

转载 shared_ptr

shared_ptr是一个最像指针的"智能指针"，他非常有用。包装了new操作符在堆上分配的动态对象，实现的是引用计数型的智能指针。一个 shared_ptr 实体可被多个线程同时读取；两个的 shared_ptr 实体可以被两个线程同时写入，“析构”算写操作；如果要从多个线程读写同一个 shared_ptr 对象，那么需要加锁。EXAMPLE 1：

2014-08-16 17:37:52 756

转载 Windows中使用google protobuf

我使用的是最新版本的protobuf（protobuf-2.5.0），编程工具使用VS2010。简单介绍下google protobuf：google protobuf 主要用于通讯，是google出的一个结构化信息传递工具，有着效率高、占存储少的优点，常被用于网络通讯。Google protobuf主要是针对Linux下的开发，但是为了照顾windows的开发人员，google也

2014-07-22 09:59:53 912

亚马逊的CEO Jeff Bezos曾经说过，他的梦想是“如果我有100万个用户，我就要为他们做100万个亚马逊网站”。智能推荐系统承载的就是这个梦想，即通过数据挖掘技术，为每一个用户实现个性化的推荐结果，让每个用户更便捷的获取信息。为了实现这个梦想，过去十余年间，无数顶尖技术专家和工程师投身于推荐算法和技术的研究与应用中，很多优秀的方法被提出，很多技术难题被攻克。在今天的互联网应用中，越来越多“

2014-06-16 17:31:46 2301

转载推荐系统中所使用的混合技术介绍

推荐系统中所使用的混合技术介绍文/陈运文在推荐系统实际运用中，各种混合技术是其中一项极为重要的核心技术。在工程实践中我们发现，混合技术对提升推荐效果、改进推荐系统的性能等都有重要意义，因此本文对该专题进行如下的一些总结和介绍。引言在这个信息爆炸的时代，消费者面临众多选择、未知的领域、过载的信息时，往往无所适从；然而与此同时，内容的生产者（例如商家）也在苦苦寻觅合适的用户，寻找最便捷

2014-06-16 17:25:16 1188

转载 Netflix Prize 和推荐系统

在这篇包含两个部分的博文中，我们将揭开 Netflix 最有价值的资产——推荐系统的面纱。在第一部分，我们将介绍 Netflix Prize 对推荐领域的贡献，Netflix 推荐服务的主要模块，以及推荐服务如何满足网站的商业需求。在第二部分，我们将介绍我们使用的数据和模型，讨论如何将离线的机器学习实验与线上的 A/B 测试相结合。Netflix Prize 和推荐系统在 2006 年

2014-03-11 22:10:55 4250

转载相似性度量

User CF 和 Item CF 都依赖于相似度的计算，因为只有通过衡量用户之间或物品之间的相似度，才能找到用户的“邻居”，才能完成推荐。上文简单的介绍了相似度的计算，但不完全，下面就对常用的相似度计算方法进行详细的介绍：1. 基于皮尔森相关性的相似度 —— Pearson correlation-based similarity皮尔森相关系数反应了两个变量之间的线性相关程度，它的

2014-03-11 22:02:00 820

转载各种聚类算法的比较

聚类的目标是使同一类对象的相似度尽可能地小；不同类对象之间的相似度尽可能地大。目前聚类的方法很多，根据基本思想的不同，大致可以将聚类算法分为五大类：层次聚类算法、分割聚类算法、基于约束的聚类算法、机器学习中的聚类算法和用于高维度的聚类算法。摘自数据挖掘中的聚类分析研究综述这篇论文。　　1、层次聚类算法　　1.1聚合聚类　　1.1.1相似度依据距离不同：Single-Link:最近距

2014-03-03 17:48:01 3834

转载 Weka中的特征选择(Attribute selection)

按照http://weka.wiki.sourceforge.net/Use+Weka+in+your+Java+code的说法，在使用weka进行分类时，其实没有必要在代码中直接使用特征选择类，因为已经有meta-classifier和filter可以进行特征选择。Weka里有个称为AttributeSelectedClassifier的带有特征选择的分类器，和一个称为GreedySte

2014-01-17 14:26:23 11320

转载 KMeans聚类算法（转载）

KMeans算法是很典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。k-means 算法基本步骤（1）从 n个数据对象任意选择 k 个对象作为初始聚类中心；（2）根据每个聚类对象的均值（中心对象），计算每个对象与这些中心对象的距离；并根据最小距离

2014-01-07 12:16:03 943

转载基本Kmeans算法介绍及其实现（转载）

1.基本Kmeans算法[1]选择K个点作为初始质心 repeat 将每个点指派到最近的质心，形成K个簇重新计算每个簇的质心 until 簇不发生变化或达到最大迭代次数时间复杂度：O(tKmn)，其中，t为迭代次数，K为簇的数目，m为记录数，n为维数空间复杂度：O((m+K)n)，其中，K为簇的数目，m为记录数，n为维数2.

2014-01-06 17:03:17 946

转载数据挖掘中所需的概率论与数理统计知识、上

数据挖掘中所需的概率论与数理统计知识、上（关键词：微积分、概率分布、期望、方差、协方差、数理统计简史、大数定律、中心极限定理、正态分布）导言：本文从微积分相关概念，梳理到概率论与数理统计中的相关知识，但本文之压轴戏在本文第4节（彻底颠覆以前读书时大学课本灌输给你的观念，一探正态分布之神秘芳踪，知晓其前后发明历史由来），相信，每一个学过概率论与数理统计的朋友都有必要了解数理统

2014-01-05 23:12:31 1506

转载生物信息学相关网站

生物信息学与生物计算：http://bioinformatics.weizmann.ac.il/ 这是生物信息学和生物计算学的网站，由Weizmann科学研究所，生物服务部和Crown人类基因组学中心支持。研究领域主要涵盖序列分析，蛋白质组学和基因组学等。该网站提供了数据库，电子论坛，教育，新闻，软件，招聘启事等。该网站还提供了相关链接，包括欧洲分子生物学以色列国家网点，以色列国家基因组基础设

2014-01-02 16:55:46 15190 1

转载 Google在KDD2013上关于CTR的一篇论文（转载）

最近在做CTR，刚好Google在KDD发了一篇文章，讲了他们的一些尝试，总结一下：先是一些公式的符号说明：一、优化算法CTR中经常用Logistic regression进行训练，一个常用的Loss Function为Online gradient descent(OGD)是一个常用的优化方法，但是在加上L1正则化后，这种方法不能产生有效的稀疏模型。相比之下 Regula

2013-12-30 13:11:15 1062

qeeainburg的专栏