又到一年一度的考研考博报名环节,想要快速了解某个实验室或导师的科研能力(文章产出、研究方向),如何做到呢?今天分享给大家一个简单高效的统计可视化方法,希望多多提意见,谢谢。
一、可视化的结果图片,在图片中我们能得出,导师的工作主要是Agriculture方向,其中主要作物wheat、maize,主要内容:model、water use efficiency、yield、climate change、ecology、carbon、Meteorology、evapotranspiration、atmospheric等等,基本了解了研究方向是作物-生态(气候)-水资源利用之间的关系。
二、如何实现的?
2、详细代码
library( jiebaR)
require( jiebaRD)
yu <- scan( "C:/Users/administrator/Desktop/yu.txt" , sep = '\n' , what = '' , encoding = 'UTF-8' )
segp1 <- qseg[ yu]
length( segp1)
[ 1 ] 6635
segp2 <- segp[ nchar( segp1) > 1 ]
class( segp2)
[ 1 ] "character"
segp3 <- table( segp3)
class( segp3)
[ 1 ] "table"
segp4 <- segp[ ! grepl( '[0-9]+' , names( segp3) ) ]
segp5 <- sort( segp4, decreasing = T) [ 1 : 1000 ]
segp5
library( wordcloud2)
wordcloud2( segp5)
> sex = c( "女" , "女" , "女" , "男" , "男" )
> table( sex)
sex
男 女
2 3
>
segp1 <- sort( segp, decreasing = T) [ 1 : 1000 ]
> segp1
segp
Sciences model water Agriculture use wheat
130 127 108 87 84 84
Water climate change yield Environmental efficiency
75 74 73 67 65 63
Ecology temperature soil carbon Meteorology Atmospheric
61 61 57 53 51 50
variability winter conductance evapotranspiration Resources crop
50 45 39 39 37 36
forest leaf photosynthesis vegetation maize ecosystem
36 35 35 34 33 32
growth surface canopy management models radiation
32 31 30 30 30 29
balance river impacts index productivity energy
28 28 27 27 27 26
三、如何将关键词进行正确的结合?如climate change,本来是一个词汇但分词强行分成了climate和change两个,所以如果有想法或已经有结果的朋友,分享下吧。