自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 微博热搜数据统计-2021央视春晚播出期间

数据说明:2021年2月12日晚上20:00-24:00 每各5分钟,收集热搜榜上TOP1-TOP50的热搜内容。1.各热搜上微博热搜榜单(TOP50)的时间长度。解释:图中字越大上榜的时间越长。2.热搜分类3.春晚节目与热搜关键词网络图 《画卷》...

2021-02-28 20:42:09 2148

原创 【面试题】醉汉岛上行走问题

题目:有一个正方形的岛,用二维方形矩阵表示。岛上有一个醉汉,每一步可以往上下左右四个方向之一移动一个。如果超出矩阵他就死了。假设每一步方向的选择是随机的,请计算n步后他还活着的概率。例如:输入矩阵大小2X2,起点(0,0),n=1 输出0.5输入矩阵大小3X3,起点(1,1),n=1 输出1输入矩阵大小3X3,起点(0,0),n=1 输出0.375解题的思路:(先放上文字版的,等之后忙完了再放上图解)利用广度优先的算法穷举了所有可能的路径,并将可存活的点压入队列中。其中只要发现坐.

2021-02-26 11:38:37 799 2

原创 明星大侦探数据分析-第一季~第五季

开年啦。人间小苦瓜再次上线继续努力努力。算是明星大侦探的忠实粉丝,在看节目的同时,经常会看到弹幕写着:”XXX的直觉很准“,”XXX当了好多次凶手了,这次也没跑了“等之类的弹幕,因此希望能够通过收集数据分析推测案情,揣测一下玩家心理。由于第六季采取了双侦探的新模式,所以分成两个部分来分析了。而且第六季还没完结,那就等完结了再写吧。《明星大侦探》每期节目明星玩家在设置的游戏剧情中分别扮演【侦探】和【嫌疑人】两种角色。【侦探】游离于剧情故事之外进行案件分析与侦查,而五位【嫌疑人】当中隐藏着真正的【

2021-02-22 23:56:43 2801

原创 围脖热搜榜数据收集削笔机

嘀嘀嘀嘀,这里是人间小苦瓜的削笔机(小笔记)简简单单做个笔记吧目前网页数据有两种,一种是静态页面:直接右键检查页面元素,然后保存成html利用Beautifulsoup来解析;另外一种是动态获取的,那就通过截取数据包,查看获取信息的网页地址,一般都是.json格式的内容,所以可以用json来解析。from bs4 import BeautifulSoupsoup = BeautifulSoup(open('weibo_rank.html'),'lxml')查找的话,我一般遵守查到第一,其

2021-02-03 09:56:56 156

原创 影视寒冬下的影视作品“质检报告”——电视剧篇

影视寒冬下的影视作品“质检报告”——电视剧篇从网上的报道来看,大部分人认为从2018年开始,影视行业开始进入了影视寒冬时期。税收上涨和更严格的备案审核等原因的出现,关2020已有5328家影视公司注销,再加上年初疫情影响,让很多影视人觉得这个寒冬有点望不到头。但是同时又有很多人认为影视寒冬的出现是一个整顿和改革的最好时机。“所谓“影视寒冬”,不过是又一次行业洗牌,反而是个利好!”他们认为,就如同大浪淘沙一般,去其糟粕取其精华,才能出现更好的作品。那么这一次的行业大洗牌到底带来了什么实质上的变化。本片

2020-11-05 10:02:00 1171 1

原创 《在一起》评论分析1.0版

1豆瓣part1.1豆瓣评分1.2评论关键词–大家都在讨论什么1.3正面评价关键词1.4负面评价关键词2腾讯视频弹幕part2.1绪论《在一起》在多个平台同步更新,在本篇分析中选择腾讯视频弹幕作为样本进行分析。一共20集,包括了10个故事。在分析中,将以故事作为单元。<每一故事的播放量>2.2《在一起》弹幕数量<一共10个故事>2.3弹幕关键词–大家都在关注些什么2.3.1 总体关键词云+TOP202.3.2 每个故事的关键词云+TOP202.4弹幕评分

2020-10-11 23:48:51 1462 1

原创 企鹅弹幕提取并制作关键词云4

-无业游民找工作莫得结果的第十四天,继续人间小苦瓜和关键词云的爱恨情仇快速指路:1.1腾讯视频弹幕提取并制作关键词云1:弹幕在哪里1.2腾讯视频弹幕提取并制作关键词云2:scrapy弹幕的获取1.3企鹅弹幕提取并制作关键词云3:自动爬取全集+sql数据库写入1.4企鹅弹幕提取并制作关键词云4:jieba分词+collections词频统计+wordcloud制作关键词云本篇用到的库如下:import jieba #jieba分词import collections #词频统计库import

2020-09-14 21:46:00 355

原创 企鹅弹幕提取并制作关键词云3

-无业游民找工作莫得结果的第七天,继续人间小苦瓜和关键词云的爱恨情仇快速指路:1.1腾讯视频弹幕提取并制作关键词云1:弹幕在哪里1.2企鹅视频弹幕提取并制作关键词云2:scrapy弹幕的获取1.3企鹅弹幕提取并制作关键词云3:自动爬取全集+sql数据库写入1.3 scrapy爬取弹幕爬取弹幕的部分在这一小节基本可以结束了。主要是对之前的代码进行修正和添加了SQL代码(真的是毕业之后就再也没用过数据库,语法都忘了好多。为了CDA的考试,就链接一下数据库吧。)1.3.1 连续爬取一个视频的弹幕如

2020-09-07 18:39:04 308

原创 企鹅弹幕提取并制作关键词云2

-无业游民找工作莫得结果的第四天,继续人间小苦瓜和关键词云的爱恨情仇-1.2 scrapy爬取弹幕

2020-09-03 18:31:16 319

原创 腾讯视频弹幕提取并制作关键词云

-无业游民找工作莫得结果的第三天,继续人间小苦瓜和关键词云的爱恨情仇-1.1 弹幕的获取我用google浏览器打开了腾讯视频,然后选择了电视剧《小欢喜》第一集作为试验品。(对不起了TnT)保持视频在后方播放的情况下,右键点开“检查”元素,选中“network”,command+f打开查找,输入一个看到的弹幕。在输入“第一”之后,找到对应的流量。全选中这个流量保存下来之后进行格式研究。这个json文件中就包含了弹幕和弹幕信息。站在巨人的肩膀上加自己半蒙半猜的方式分析一下这个信息中的内容(有新的内容

2020-09-03 17:39:25 1453

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除