记得经常用脑-CSDN博客

原创基于豆瓣爬取的电影数据所做的分析（练习）

数据来源是知乎乎友做完数据分析展示，分享提供的。我们来学习一下。数据项有：豆瓣评论数，豆瓣评分，上映日期，主演，制片国家或者地区，别名，导演，片长，类型，编剧，语言。一共大概有两千多条数据。不是特别的多。我们首先来根据评分判断一下，是否服从正太分布。 fig = plt.figure(figsize = (10,6)) plt.subplots_adjust(hspace=0.2...

2019-02-26 23:05:12 4090

原创关于姓氏的一些全国分布情况的统计与分析

1.数据来源：感谢知乎乎友倾情提供。（两百多万条） 2.工具：spyder+excel+qgis 第一步数清洗：我们有两个excel文件，转成csv，用panda的read_csv()函数读取，利用concat函数将二者按照列合并。还有一个行政代码对照表。 df1=pd.read_csv('data01.csv',encoding='utf-8') df2=pd.read_cs...

2019-02-22 15:46:19 2060 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 基于豆瓣爬取的电影数据所做的分析（练习）

原创 关于姓氏的一些全国分布情况的统计与分析

空空如也

空空如也

原创基于豆瓣爬取的电影数据所做的分析（练习）

原创关于姓氏的一些全国分布情况的统计与分析