自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

bug在左,生活在右

半个程序员,半个算法工程师,半个数据分析师,一个俗人!

  • 博客(9)
  • 资源 (4)
  • 收藏
  • 关注

原创 R文件里有中文时运行错误

如果XXX.R文件里有中文,如plot(x,y,main="第一个图片")时,运行Rscript XXX.R或者在R GUI中运行source("XXX.R")时运行错误,无法识别其中的中文,解决方案:source("XXX.R",encoding="utf-8")就可以了

2014-12-17 16:26:46 1240

原创 R语言直接保存图形而不显示图形

保存为jpeg图形时:setwd("d://")jpeg(file="Rplot.jpeg")plot(1:10)#此处为想要画的图形的语句dev.off()同理,也可以保存为png或pdf格式。

2014-12-11 14:24:24 9136 1

转载 数据挖掘的一些课程

1、Information Retrieval and WebSearch信息检索与Web搜索,信息检索是指从大规模数据集合中搜索满足我们需求的信息(通常是非格式化数据,如文本);      commoncrawl项目,commoncrawl是EUplanetData项目的产物,里面还有很多对webtables或半结构化数据解析的结果,或带RDFa,microformats等语义标注的网页

2014-12-08 14:22:03 1942

原创 R语言作图保存在pdf中时无法显示中文标题

有两个方法可以实现:1、直接在pdf( )这个函数中设置family这个参数,进行字体设置但是字体单一,只有标准宋体,如: > pdf("d:/def.pdf",family="GB1") > plot(x,y,xlab="高度",ylab="体重",main="统计") > dev.off() 2、调用 Cairo程序包,使用CairoPDF( )函数

2014-12-08 11:28:49 13978

原创 matlab直接保存图形而不显示图形

for ii=1:10h=figure(ii);x=0:0.01:ii;y=sin(x);plot(x,y);set(h,'visible','off');str=sprintf('figure(%d)',ii);saveas(h,str,'jpg');end

2014-12-08 10:56:52 6611

原创 csdn怎么关注其他人的blog

1、把博主博客加入自己的收藏夹2、如果你想关注或加他为好友,对不起,CSDN还没有在博客上开发这种功能的技术方法:进入博主主页,比如我的主页http://blog.csdn.net/faith_mo_blog把这个网址中“blog”换为“hi”也就是:“http://hi.csdn.net/faith_mo_blog”就ok了,然后进入空间,就能看见 关注 或 加好友 字样。3

2014-12-05 15:23:50 1034

转载 基于lucene实现自己的推荐引擎

采用基于数据挖掘的算法来实现推荐引擎是各大电子商务网站、SNS社区最为常用的方法,推荐引擎常用的Content-Based推荐算法及协同过滤算法(Item-Based 、User-based)在电子商务推荐系统入门v2.0 、电子商务推荐系统入门基础 中已经有所阐述。但从实际应用来看,对于大部分中小型企业来说,要在电子商务系统完整采用以上算法有很大的难度。1、常用推荐引擎算法问题1

2014-12-05 15:04:23 728

转载 淘宝在数据处理领域的项目及开源产品介绍

淘宝在数据存储和处理领域在国内互联网公司中一直保持比较靠前的位置,而且由于电子商务领域独特的应用场景,淘宝在数据实时性和大规模计算及挖掘方面一直在国内保持着领先,因此积累了很多的实践的经验和产品。TimeTunnel基于Hbase打造的消息中间件,具有高可靠、消息顺序、事务等传统特性,还能按时间维度反复订阅最近历史的任意数据高性能的broker,单节点达2万TPS,实际支持上千长链

2014-12-05 15:02:28 1452

转载 网页推荐

来源:http://www.cnblogs.com/ibook360/archive/2011/12/14/2287685.html思路:先查出该商品有哪些人(IP),然后把这些人(IP)浏览过的商品进行分组统计,把前n个(建议10个以下)的商品列出来。实现例子:新增1个浏览日志表: 浏览日志表VisitLog 用户IDPla

2014-12-05 14:58:42 583

PRML_translation 机器学习经典书籍中文版

机器学习经典书籍PRML中文版 高清PDF 本来想提供大家免费下载的 不知道CSDN怎么设置免费

2018-01-16

IBM InfoSphere BigInsights Version 3.0.0安装手册

IBM的BigInsights安装手册,英文版,对应版本为3.0.0

2015-03-03

商业智能流程

用Sql 2005创建商业智能中的数据挖掘流程

2012-09-06

jdk 1.5+tomcat 5.5软件包下载

jdk 1.5+tomcat 5.5软件包下载,满足用户找资源的迫切需要,使用起来更方便

2011-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除