一、Python所有方向的学习路线
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、学习软件
工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
三、入门学习视频
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
_id | comment | rating | sharing_url | show_time_tip | is_voted | uri | platforms | vote_count | create_time | status | ip_location | id | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 4088229895 | 窝囊废属实是雷佳音的统治区 | {‘count’: 1, ‘max’: 5, ‘star_count’: 4, ‘value’: 4} | https://www.douban.com/doubanapp/dispatch?uri=/movie/36208094/interest/4088229895 | False | False | douban://douban.com/movie/36208094/interest/4088229895 | [] | 8862 | 2024-02-12 10:42:47 | done | 河南 | 4088229895 |
1 | 4085537171 | 我就说昨天小品沈腾为啥突然叫李逵了,原来是马丽电影里的初恋叫李逵。案子挺好的,立意也很好,但为啥前一个小时非得给我们看雷佳音马丽夫妻吵架。 | {‘count’: 1, ‘max’: 5, ‘star_count’: 4, ‘value’: 4} | https://www.douban.com/doubanapp/dispatch?uri=/movie/36208094/interest/4085537171 | False | False | douban://douban.com/movie/36208094/interest/4085537171 | [] | 7575 | 2024-02-10 11:27:49 | done | 上海 | 4085537171 |
2.2 数据清洗预处理
- 将影评评分从嵌套字典中抽取到一个独立字段
- 删除无用的字段
- 预处理空值
2.2.1 预处理数据展示
_id | comment | rating | sharing_url | show_time_tip | is_voted | uri | platforms | vote_count | create_time | status | ip_location | id | rating_value | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 4088229895 | 窝囊废属实是雷佳音的统治区 | {‘count’: 1, ‘max’: 5, ‘star_count’: 4, ‘value’: 4} | https://www.douban.com/doubanapp/dispatch?uri=/movie/36208094/interest/4088229895 | False | False | douban://douban.com/movie/36208094/interest/4088229895 | [] | 8862 | 2024-02-12 10:42:47 | done | 河南 | 4088229895 | 4 |
1 | 4085537171 | 我就说昨天小品沈腾为啥突然叫李逵了,原来是马丽电影里的初恋叫李逵。案子挺好的,立意也很好,但为啥前一个小时非得给我们看雷佳音马丽夫妻吵架。 | {‘count’: 1, ‘max’: 5, ‘star_count’: 4, ‘value’: 4} | https://www.douban.com/doubanapp/dispatch?uri=/movie/36208094/interest/4085537171 | False | False | douban://douban.com/movie/36208094/interest/4085537171 | [] | 7575 | 2024-02-10 11:27:49 | done | 上海 | 4085537171 | 4 |
3. 数据可视化分析
3.1 评论占比分布图
3.1.1 饼图可视化代码
from cutecharts.charts import Pie
from cutecharts.components import Page
label = ['看过', '想看']
def pie\_base() -> Pie:
chart = Pie("2024-02-18【第二十条】 看过/想看 短评占比图")
chart.set_options(labels=label)
chart.add_series(list(pd.value_counts(df['status'])))
return chart
pie_base().render_notebook()
3.2 评分占比分布图
3.2.1 数据解释
{5: 2359, 4: 1212, 3: 507, 2: 143, 1: 70, 0: 30}
3.2.2 个人浅薄洞察
高分占比较大:评分为5分和4分的占比相对较高,分别为51.52%和26.57%,可以看出大部分观众对该电影给予了积极的评价。可能是因为电影的制作质量较高、题材新颖,或者口碑宣传效果很好,所以有了好的反馈。
3.3 【看过-评论】提及人物出现频次柱状图
通过对看过该电影的人的评价进行NER(命名实体识别)抽取,我们可以了解到一些人名被提及的次数。
3.3.1 柱状图可视化代码
from cutecharts.charts import Bar
from cutecharts.components import Page
def bar\_base() -> Bar:
chart = Bar("2024-02-18【第二十条】看过 人员出现次数柱状图", width="1000px")
chart.set_options(labels=list(person.keys()), x_label="I'm xlabel", y_label="I'm ylabel")
chart.add_series("评论出现次数", list(person.values()))
return chart
bar_base().render('ner.html')
3.3.2 提及人物出现频次柱状图
3.3.3 数据解释
{
'赵丽颖': 687,
'刘耀文': 560,
'雷佳音': 477,
'马丽': 473,
'张艺谋': 439,
'郝秀萍': 200,
'韩明': 137,
'高叶': 119,
'韩雨': 80,
'赵丽': 74,
'吕玲玲': 57,
'张译': 54,
'张贵生': 34,
'李茂娟': 31,
'王永强': 23,
'范伟': 16,
'罗翔': 13,
'韩雨辰': 11
}
3.3.4 个人浅薄洞察:
- 主要演员或导演的影响力:出现次数较多的人名有赵丽颖、刘耀文、雷佳音等。他们在电影中的表现应该对观众留下了深刻的印象,所以他们的名字在评论中被频繁提及。
- 观众关注点的反映:某些人名的出现次数较少。虽然他们的影响力不如主要演员或导演大,但仍然可以看出观众对于电影中各种角色和元素的关注。
- 市场营销效果的评估:通过分析NER抽取结果,电影宣发部门可以了解观众对于不同演员或导演的关注程度。可以帮助他们评估市场营销策略的有效性,指导后续的宣传工作,以提高电影的知名度和观众吸引力。
写在最后
综合分析来看,《第二十条》在观众中引起了较大的关注,大部分观众给予了较高的评分,表明电影在整体上获得了一定程度的认可和喜爱。
通过NER抽取,我们也了解到观众对于电影中的主要演员和导演的关注程度,这有助于我们进一步了解电影的受众群体和市场表现。
接下来,我们将在下一篇博客中继续深入挖掘评论中的好评和差评,以更全面地了解观众对于这部电影的评价。敬请期待!
需要采集数据的可以联系我~
(1)Python所有方向的学习路线(新版)
这是我花了几天的时间去把Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
最近我才对这些路线做了一下新的更新,知识体系更全面了。
(2)Python学习视频
包含了Python入门、爬虫、数据分析和web开发的学习视频,总共100多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。
(3)100多个练手项目
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!