大数据
缘~
只想好好努力
展开
-
大数据分析理解
分析和挖掘是手段,发现和预测是终极目标原创 2017-12-09 21:08:54 · 373 阅读 · 0 评论 -
基于腾讯视频影视作品数据分析
数据来源通过从腾讯视频网站爬取电影电视数据,共爬取5069部电影,1950部电视剧。但在不同的时间节点,数据源会变化,如视频的评分、播放量等,因此不同时间结点结果存在偏差!!!仅供娱乐 1) 数据采集通过R开发爬虫工具从腾讯视频网站爬取数据 2) 数据清洗大都使用R,以及EXCEL工具 3) 数据分析也采用R 4) 数据可视化使用Gephi国内外导演与演员之间的合作下图是选取评分较高原创 2017-12-10 16:46:16 · 4886 阅读 · 1 评论 -
爬取腾讯视频网站数据
1 数据获取腾讯视频的网站中隐含的是一个非结构化的数据。R语言的“XML”包中htmlParse和getNodeSet非常强大,通过htmlParse可以抓取页面数据并形成树状结构,getNodeSet可以对抓取的数据根据XPath语法来选取特定的节点集合。“revst”包的html_nodes与html_attr可以分别获得节点和属性。 下面是爬取腾讯视频网站中电影数据的一部分关键代码:1.1加原创 2017-12-10 17:05:05 · 7440 阅读 · 1 评论 -
大数据挖掘流程
大数据挖掘流程商业理解:从商业角度数据理解:数据收集,并描绘数据数据准备:分析收集到的数据并选择合适的存储介质建模分析:选择多种建模方法模型评估:选择最佳模型模型部署:展现结果原创 2017-12-07 20:05:42 · 578 阅读 · 0 评论