- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 如何使用R语言制作词云
关于wordcold2函数的用法不再赘述,查以使用help(wordcloud2)查看有关帮助,其中的参数是不难理解的,可以运行一下帮助文档的示例(Examples),体会一下其中的用法。其中数据清洗过程注释掉了一行,有进候我们不需要某些词进入词云,这时可以取消注释,对其中的关键词进行修改后,再重新运行,输出的词云图就没有这个词了。在实际的数据分析中,我们常常需要把一段文字进行词云的制作,这个时候首先要行分词,接下来要统计词频,对其中的词语进行清洗,最后绘制词云。
2024-07-24 10:22:13 304
原创 如何计算问卷各维度的得分(基于Excel、SPSS和R实现)
笔者经常遇到有人有这样的疑问,调查对象所做的是一道一道题,但数据分析的时候得到的是各维度的分数?这是个基础问题,也是数据分析过程中必须要理解的问题。其实这个问题并不复杂,我们思考这样一个问题,学生在做一套试卷,做了是一道一道题,那么为什么选择题、填空题和简答题会各有一个分数,其实很简单,就是把各类别题的得分加起来。再举一个例子,比如某高中生的政治78分、历史89分、地理92分、物理75分、化学82分、生物90分,那么文科和理科各是多少分?
2024-07-23 17:24:17 1536
原创 R语言中,使用group_by+summarise函数批量计算单选题的频数和比例
最近最到了一个问题,就是收到问卷之后,有好几道单选题,对于单选题我们通常需要计算频数和比例,那么使用R语言对单选题进行批量计算呢?在tidyverse风格下,我们可以使用group_by+summarise函数实现单选题的频数和百分比的计算。但对于多个单选题的批量计算,我首先想到的是使用for循环,但是尝试下来感觉不好。后来发现在group_by参数里,使用get()函数,就能解决问题。我们先建立在Excel里建立一个模拟数据,另存为data.csv,注意选择UTF-8的csv格式。
2024-04-11 08:38:37 398
原创 R语言将变量分组的四种方法(含cut函数介绍)
在数据处理的过程中,我们有时候需要将连续的数据数据转换为类别数据,比如将收入分成高、中和低三组,将学生成绩分为优、良、中、及格和不及格五组。本来将基于R语言,采用三种方法来实现;第一种是对变量直接进行重新赋值,第二种是使用within函数对语句进行组织,第三种是cut函数。首先我们定义一个数据框,这个数据框饭知学生姓名和数学成绩两个变量。mathScore <- data.frame(name=c("刘文涛","王宇翔","田思雨","徐丽娜","丁文彬","李志国","王智强","宋丽媛","
2021-10-07 23:08:43 44782 7
原创 使用R语言绘制心形图
今天七夕,正好看到高等数学的心形线,想到心形线的函数应该可以用R语言来绘制,就尝试了一下。心形线的参数方程为:其中r是半径,t为弧度。有了参数方程之后,我们的作图就变得简单了,其基本思路是:首先计算出x和y座标的位置,接下为使用plot函数绘图,最后使用polygon函数填充即可。下面我们就尝试一下:par(pin=c(1.5, 1.5)) #设定图形的大小,长和宽定义为2,此处可以进行调整t<-seq(0, 2*pi, 0.01) #设定弧度的值x=2*(cos(t)-0.5*c
2021-08-14 13:36:08 11419 4
原创 使用R语言筛选数据中的重复行
在进行数据的预处理时,我们常常关注有无重复数据,如果两行数据完全一致,则可能存在数据的重复录入等情况,此时就要对这两行数据进行核实。但这个过程如何用R语言实现?笔者近期对这个问题进行了探索。 我们首先虚拟一个数据,并将这个数据保存为CSV文件,命名为: ![在这里插入图片描述](https://img-blog.csdnimg.cn/2020080712061095.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,sh...
2020-08-07 13:11:47 27141 2
R语言入门-主要统计方法的R语言实现-心理统计学与R语言
2022-06-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人