分析stack overflow的关于R问题title

很好奇stack overflow上面的问题的语言分布,然后就用R语言调用它提供的REST API做了一个小程序测试一下。因为使用么有access_token的request会有请求限制,所有今天只是测试了一下R语言的问题。
获取所有的R语言问题的title,然后画一个简单的word cloud看看。still因为token的问题,我的R title只有30100条。

require("httr")
require("jsonlite")

titleData <- vector()

initPage <- 1
rSearchData <- GET("http://api.stackexchange.com/2.2/search/advanced?page=1&pagesize=100&tagged=r&site=stackoverflow")


while(content(rSearchData)$has_more){
    itemLength <- length(content(rSearchData)$items)
    itemData <- content(rSearchData)$items
    for(i in 1:itemLength) {
        itemTitle <- itemData[i][[1]]$title
	    titleData <- c(titleData, itemTitle)
    }
	
	initPage <- initPage+1
	urlStr <- paste("http://api.stackexchange.com/2.2/search/advanced?page=", initPage, "&pagesize=100&tagged=r&site=stackoverflow", sep = "")
	rSearchData <- GET("http://api.stackexchange.com/2.2/search/advanced?pagesize=100&tagged=r&site=stackoverflow")
}

itemLength <- length(content(rSearchData)$items)
itemData <- content(rSearchData)$items
for(i in 1:itemLength) {
    itemTitle <- itemData[i][[1]]$title
	titleData <- c(titleData, itemTitle)
}

str(titleData)

因为请求次数的问题,数据就save下来继续用了。

library("tm")
library("SnowballC")
library("wordcloud")
library("RColorBrewer")

titleData <- read.table("titleData.csv",sep=",")
titleData <- titleData[,2]


docs <- Corpus(VectorSource(titleData))
inspect(docs)
docs <- tm_map(docs, removeWords, stopwords("english"))

dtm <- TermDocumentMatrix(docs)
m <- as.matrix(dtm)
mSum <- sort(rowSums(m),decreasing=TRUE)
dF <- data.frame(word = names(mSum),freq=mSum)


set.seed(1234)
wordcloud(words = dF$word, freq = dF$freq, min.freq = 1,
          max.words=200, random.order=FALSE, rot.per=0.35, 
          colors=brewer.pal(8, "Dark2"))

word cloud

heap-buffer-overflow是一种错误,通常出现在使用C语言编写代码时。它指的是访问了堆中分配的内存块之外的部分,导致数据越界访问。这种错误可能会导致程序崩溃、数据损坏或者安全漏洞的产生。 在解决heap-buffer-overflow问题时,一般需要以下几个步骤: 1. 首先,需要定位具体出错的位置。可以通过调试工具、代码审查或者日志来追踪错误发生的地方。 2. 确认出错的原因。这可能涉及到对代码的仔细分析,包括内存分配、指针操作等。 3. 修改代码,以确保在访问堆中分配的内存时不会越界。可以通过检查数组边界、指针的有效性来避免这种错误。 4. 进行测试和验证,确保修改后的代码能够正常运行,并且不再出现heap-buffer-overflow错误。 需要注意的是,解决heap-buffer-overflow问题可能会因具体情况而异。每个问题都需要具体分析和处理,确保代码的安全性和正确性。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Leetcode中解决stack/heap-buffer-overflow错误](https://blog.csdn.net/lijianyi0219/article/details/111510086)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [buffer_overflow:缓冲区溢出](https://download.csdn.net/download/weixin_42099633/19247971)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值