数据分析
记得经常用脑
这个作者很懒,什么都没留下…
展开
-
关于姓氏的一些全国分布情况的统计与分析
1.数据来源:感谢知乎乎友倾情提供。(两百多万条)2.工具:spyder+excel+qgis第一步数清洗: 我们有两个excel文件,转成csv,用panda的read_csv()函数读取,利用concat函数将二者按照列合并。还有一个行政代码对照表。df1=pd.read_csv('data01.csv',encoding='utf-8')df2=pd.read_cs...原创 2019-02-22 15:46:19 · 2092 阅读 · 1 评论 -
基于豆瓣爬取的电影数据所做的分析(练习)
数据来源是知乎乎友做完数据分析展示,分享提供的。我们来学习一下。数据项有:豆瓣评论数,豆瓣评分,上映日期,主演,制片国家或者地区,别名,导演,片长,类型,编剧,语言。一共大概有两千多条数据。不是特别的多。 我们首先来根据评分判断一下,是否服从正太分布。fig = plt.figure(figsize = (10,6))plt.subplots_adjust(hspace=0.2...原创 2019-02-26 23:05:12 · 4134 阅读 · 0 评论