表的结构如下:
需要将4月4号,四月5号六号的数据分到6号,因为数据是三天一抓,用这三天的和作为一次抓取数据的记录,下段代码需要将日期进行分组加一列新标签:加好如下图所示:
#接下来需要对特定区间段的日期加标签,例如4月7号,4月8号,4月9号都定义在4月9号的标签
sentiment<-read.csv("C:/Users/11565/Desktop/合并二/可以用数据/sentiment_1.csv",na.strings="",stringsAsFactors = F)
x11<-as.data.frame(table(sentiment$date))
write.table(x11,"date.csv",col.names = T,row.names = F,sep = ",")#读出来的date并没有排序
#在读date之前需要date内部的日期从小到大排列一下
x12<-read.csv("C:/Users/11565/Desktop/合并二/可以用数据/date.csv",na.strings="",stringsAsFactors = F)
i=1
while (i<(length(sentiment$date)+1)){
#for (i in (1:length(sentiment$date)))
j=1
while (j<(length(x12[,1])+1)){
if (sentiment$date[i]%in%(x12[,1][j:(j+2)])){
sentiment$biaoqian[i]=x12[,1][(j+2)]
break#if语句如果执行的话,就会跳出循环,因为这一行已经找到了对应的日期,如果if语句没有找到对应的日期,j就会继续+3,继续寻找相应的匹配标签
}
j<-j+3
}
i<-i+1
}
write.table(sentiment,"sentiment_2.csv",col.names = T,row.names = F,sep = ",")