![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R
文章平均质量分 62
缘~
只想好好努力
展开
-
基于腾讯视频影视作品数据分析
数据来源通过从腾讯视频网站爬取电影电视数据,共爬取5069部电影,1950部电视剧。但在不同的时间节点,数据源会变化,如视频的评分、播放量等,因此不同时间结点结果存在偏差!!!仅供娱乐 1) 数据采集通过R开发爬虫工具从腾讯视频网站爬取数据 2) 数据清洗大都使用R,以及EXCEL工具 3) 数据分析也采用R 4) 数据可视化使用Gephi国内外导演与演员之间的合作下图是选取评分较高原创 2017-12-10 16:46:16 · 4901 阅读 · 1 评论 -
爬取腾讯视频网站数据
1 数据获取腾讯视频的网站中隐含的是一个非结构化的数据。R语言的“XML”包中htmlParse和getNodeSet非常强大,通过htmlParse可以抓取页面数据并形成树状结构,getNodeSet可以对抓取的数据根据XPath语法来选取特定的节点集合。“revst”包的html_nodes与html_attr可以分别获得节点和属性。 下面是爬取腾讯视频网站中电影数据的一部分关键代码:1.1加原创 2017-12-10 17:05:05 · 7456 阅读 · 1 评论