r语言
春风沂水
这个作者很懒,什么都没留下…
展开
-
【学习笔记】构建一个基础的推荐系统
学习目标:《自己动手做搜索引擎》学习内容:欧式距离余弦距离皮尔逊系数Jaccard距离学习时间:1小时学习产出:笔记构建一个基础的推荐系统本节将使用相似用户给出的评级为Toby推荐他没有评级过的电影。有如下几个步骤:1.抽取出Toby没有评级过的电影。2.找到所有其他用户给这些电影的评级。3.将所有用户(不包括Toby自己)对第一步中找到的电影的评级乘以与Toby的相似度。4.计算每一部电影作品的评级和,并除以所有相似度之和。基于近邻算法的推荐引擎个性化推荐引擎基原创 2022-04-23 10:04:03 · 1000 阅读 · 0 评论 -
R中处理空间面板模型的包spdep的用法
1、载入相应的包文件 建议安装R3.3.3此包适用install.packages("spdep")library(spdep)install.packages("spDataLarge")library(spDataLarge)2、读取需要处理的原始文件文件放在什么位置就如何读mydata=read.csv(“D:/regionResearchMethods/Ch4_R/industr原创 2017-12-23 14:55:33 · 10598 阅读 · 3 评论 -
数据分析之《菜鸟侦探挑战数据分析》-4-文本挖掘
1、文本挖掘 GitHub上的MeCab-Chinese 中文的分词器工具-下载地址 https://github.com/panyang/MeCab-Chinese 参考这篇文章的工具: http://blog.sina.com.cn/s/blog_54f07aba0101slum.html 这篇包装不上,参考下一篇 https://www.cnblogs.com/zzhz原创 2017-11-26 18:41:06 · 757 阅读 · 0 评论 -
读《区域经济研究实用方法》-第四章-R语言在空间数据分析中的应用
空间数据 既描述了在哪里,也描述了怎么样 可变面元 划分区域的方法不同,导致结果不同。 空间依赖 地球学第一定理—离得越近的事物联系越强 基本操作运算mydate = read.csv("D:/regionResearchMethods/regionResearchMethods/Ch4_R/industrialProduction.csv")mode(mydate)class(my原创 2017-12-22 12:25:18 · 569 阅读 · 0 评论 -
数据分析之《菜鸟侦探挑战数据分析》-2-R语言-列联表-卡方检验
数据来源: 图灵社区 http://www.ituring.com.cn/book/1809 1、创建列联表dat <- read.csv("sample.csv") table(dat)管道处理,用左边的数据生成表install.packages("dplyr")library(dplyr) dat %>% table //等价于 table(dat)独立性检验dat2 <- da原创 2017-11-21 15:27:54 · 3597 阅读 · 0 评论 -
《数据挖掘与商务分析R语言》-1-数据预处理-R语言-Lattice包-条形图
数据来源说明 https://www.biz.uiowa.edu/faculty/jledolter/DataMining/datatext.html 1、绘制条形图barchartdon <- read.csv(file.choose())don[1:5,]table(don$Class.Year)barchart(table(don$Class.Year),horizontal=FAL原创 2017-11-29 22:10:55 · 1554 阅读 · 0 评论 -
数据分析之《菜鸟侦探挑战数据分析》-1-R语言-均值方差t检验
1、均值是400,样本是397,面包的重量是否减少了,读文件,方法一 breads <- read.csv("breads.csv")读文件,方法二 breads <- read.csv(file.choose())计算样本均值和方差mean(breads$weight)//均值sd(breads$weight)//方差date weight 2015/1/7 386.7 20原创 2017-11-19 23:08:10 · 594 阅读 · 0 评论 -
数据分析之《菜鸟侦探挑战数据分析》-6-r语言-时间序列-逻辑回归分析-自相关-日历图
1、绘制时间序列图# 加载小太郎家的失窃数额数据xiaotailang <- read.csv("xiaotailang.csv", colClasses = c("numeric", "factor", "Date", "factor", "factor"))# 安装便于处理时间序列数据的程序包install.packages("xts")library(xts)# 给数据设置日期libr原创 2017-11-28 22:56:36 · 1121 阅读 · 0 评论 -
数据分析之《菜鸟侦探挑战数据分析》-5-r语言-聚类分析
对以下数据进行数据分析 1. 女20~29 男20~29 女30~39 男30~39 女40~49 男40~49 女50~59 男50~59 女60~69 男60~69 待客 10 1 13 13 7 5 6 8 16 5 促销 10 5 10 8 13 9 22 14 21 9 孩子 10 1 6 4 7原创 2017-11-28 21:59:25 · 343 阅读 · 0 评论 -
数据分析之《菜鸟侦探挑战数据分析》-R语言
1、模拟实验和直方图 商业街抽奖,平均每100人就能有一人获得一等奖,这家每天人流量超过100人,但一周之后只有5人获得一等奖,问是否不合理,属于欺诈?x <- c("未中奖","中奖")> sample(x,1000,prob = c(99,1),replace = TRUE) 随机抽样抽1000次概率如上,有放回h <- c("未中奖","中奖")res <- replicate(10原创 2017-11-18 20:48:06 · 1128 阅读 · 0 评论 -
欢迎使用CSDN-markdown编辑器
1、r的内积和外积 向量内积(点乘) a.b=x1*y1+x2*y2 其中a(x1,x2) b(y1,y2) 结果是标量 一个数值 向量外积(叉乘) a×b=|a|*|b|*sin 结果是一个向量(矢量)x<-c(1,2,3)y<-c(4,5,6)e<-c(1,1,1)z=2*x+y+exy =x%*%y//内积xyxyz = x%o%y//外积xyz2、R读文件rt<-read.原创 2017-09-04 16:41:04 · 238 阅读 · 0 评论