R解析文件--找出常用地址

解析文件–找出常用地址

如何使用R来解析?
文件数据为三列,电话,地址,访问时间
要求输出每个电话的常用地址

  • 找出每个手机号的所有地址
    因为是字符串,不能用大小等于
    因为手机号是有序排列,利用match就可以
x<-read.csv("C:/Users/elenawang/Desktop/csv_res.csv",header=F)
mobi<-x$V1
loc<-x$V2
l<-length(mobi)
b<-levels(factor(mobi))
lb<-length(b)
max<-match(b[2],mobi)-1
local0=loc[1:max]
c<-levels(factor(local0))
data<-data.frame(mobile=b[1],location=c)
for(i in 2:(lb-1)){
  min=match(b[i],mobi)
  max=match(b[i+1],mobi)-1
  local1=loc[min:max]
  c=levels(factor(local1))
  data1<-data.frame(mobile=b[i],location=c)
  data<-rbind(data,data1)
}
print(b[lb])
min=match(b[lb],mobi)
local2=loc[min:l]
c<-levels(factor(local2))
data2<-data.frame(mobile=b[lb],location=c)
data<-rbind(data,data2)
write.csv(data, file = "C:/Users/elenawang/Desktop/res_loc.csv", row.name
```p/res_loc.csv", row.name
  • 关联做频率

利用grep

可以得到所有地址的一个频率,根据设定阈值,取出常用地址
进一步改进:
添加10天内常用地址,一个月内常用地址,两个月内常用地址。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值