- 博客(2)
- 收藏
- 关注
原创 基于豆瓣爬取的电影数据所做的分析(练习)
数据来源是知乎乎友做完数据分析展示,分享提供的。我们来学习一下。 数据项有:豆瓣评论数,豆瓣评分,上映日期,主演,制片国家或者地区,别名,导演,片长,类型,编剧,语言。一共大概有两千多条数据。不是特别的多。 我们首先来根据评分判断一下,是否服从正太分布。 fig = plt.figure(figsize = (10,6)) plt.subplots_adjust(hspace=0.2...
2019-02-26 23:05:12 4090
原创 关于姓氏的一些全国分布情况的统计与分析
1.数据来源:感谢知乎乎友倾情提供。(两百多万条) 2.工具:spyder+excel+qgis 第一步数清洗: 我们有两个excel文件,转成csv,用panda的read_csv()函数读取,利用concat函数将二者按照列合并。还有一个行政代码对照表。 df1=pd.read_csv('data01.csv',encoding='utf-8') df2=pd.read_cs...
2019-02-22 15:46:19 2060 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人