![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据分析
三街打工人
好好学习,努力奋斗。
展开
-
ArcGIS和Anaconda3之间的python冲突(spyder用不了)解决方法
今天解决了一个长久以来面临的技术问题,趁着现在还记得怎么处理,赶紧写下来,一方面觉得以后自己还会遇到这样的问题,另一方面也为其他面临同样问题的人给点建议。问题描述:首先电脑上安装了anaconda3和arcgis10.2.其中anaconda3带有python3,arcgis10.2自带python2.之前为了在anaconda中使用arcgis的自带包arcpy,因此在anacon...原创 2020-04-17 17:46:10 · 1175 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(十三)_5
实例分析14.5 2012联邦选举委员会数据库import pandas as pdimport numpy as npfec = pd.read_csv('datasets/fec/P00000001-ALL.csv')#导入数据fec.info()#查看信息的相关数据描述E:\anaconda\lib\site-packages\IPython\core\interactive...原创 2020-02-12 11:31:03 · 405 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(十三)_4
实例分析14.4 USDA食品数据库import jsondb = json.load(open('datasets/usda_food/database.json'))len(db)6636#数据中是字典形式,可以取关键词看数据内容db[0].keys()dict_keys(['id', 'description', 'tags', 'manufacturer', 'gro...原创 2020-02-11 10:48:59 · 328 阅读 · 1 评论 -
利用Python进行数据分析第二版复现(十三)_3
数据分析实例14.3 1880-2010年间全美婴儿姓名可以从http://www.ssa.gov/oact/babynames/limits.html 网址下载相关数据import pandas as pdnames1880 =pd.read_csv('datasets/babynames/yob1880.txt', names=['name', 'sex', '...原创 2020-02-10 12:13:47 · 727 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(十三)_2
实例分析14.2 MovieLens 1M数据集这个数据集是关于电影的评分数据。import pandas as pdpd.options.display.max_rows = 10unames = ['user_id', 'gender', 'age', 'occupation', 'zip']users = pd.read_table('datasets/movielens/u...原创 2020-02-09 11:29:02 · 632 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(十三)1
今天开始是第十四章实例部分,想了一下,还是决定分开学习,争取每个都学会。第14章 数据分析案例14.1 来自Bitly的USA.gov数据利用json模块及loads函数逐行加载已经下载好的数据文件。import jsonpath = 'datasets/bitly_usagov/example.txt'records = [json.loads(line) for line in o...原创 2020-02-08 11:47:02 · 246 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(十二)
第13章 Python建模库介绍13.1 pandas与模型代码的接口import pandas as pdimport numpy as npdata = pd.DataFrame({ 'x0': [1, 2, 3, 4, 5], 'x1': [0.01, -0.01, 0.25, -4.1, 0.], 'y': [-1.5, 0., 3.6, 1.3, -2....原创 2020-02-07 15:37:22 · 310 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(十一)
第12章 pandas高级应用12.1 分类数据有一些数据会包含重复的不同值的小集合的情况。可以用unique和value_counts进行分类提取。import numpy as npimport pandas as pdvalues = pd.Series(['apple', 'orange', 'apple','apple'] * 2)pd.unique(values)#可以统...原创 2020-02-06 12:26:46 · 155 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(十)
第11章 时间序列时间序列数据主要有:时间戳、固定时间、时间间隔以及实验或过程时间。11.1 日期和时间数据类型及工具一般使用datetime.datetime数据类型。from datetime import datetimenow= datetime.now()print(now)print(now.year,now.month,now.day)#datetime是用毫秒的方式...原创 2020-02-05 19:03:46 · 215 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(九)
第10章 数据聚合与分组运算分组统计数据,并对各组进行数据处理分析,是数据分析中的重要环节之一。pandas提供了一个groupby功能。10.1 GroupBy机制“split-apply-combine”(拆分-应用-合并),先把数据按着自己的需求或者算法要求的形式进行分组,然后应用相关的数据分析方法,最后合并处理结果。import numpy as npimport pandas ...原创 2020-02-04 16:48:35 · 380 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(八)
第09章 绘图和可视化9.1 matplotlib API入门%matplotlib notebookimport matplotlib.pyplot as pltimport numpy as npimport pandas as pddata = np.arange(10)plt.plot(data)<IPython.core.display.Javascript ...原创 2020-02-03 15:34:40 · 434 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(七)
第08章 数据规整:聚合、合并和重塑8.1 层次化索引import pandas as pdimport numpy as npdata = pd.Series(np.random.randn(9), index=[['a', 'a', 'a', 'b', 'b', 'c', 'c', 'd', 'd'], ...原创 2020-02-02 16:36:33 · 616 阅读 · 1 评论 -
利用Python进行数据分析第二版复现(六)
第07章 数据清洗和准备7.1 处理缺失数据pandas使用浮点值NaN(Not a Number)表示缺失数据。Python内置的None值在对象数组中也可以作为NA.列出了一些关于缺失值处理的函数。import pandas as pdimport numpy as npstring_data = pd.Series(['aardvark', 'artichoke', np....原创 2020-02-01 18:14:58 · 259 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(五)
第06章 数据加载、存储与文件格式pandas提供了一些用于将表格型数据读取为DataFrame对象的函数。表1对它们进行了总结,其中read_csv和read_table可能会是你今后用得最多的。import pandas as pdimport numpy as npdf = pd.read_csv('examples/ex1.csv')df ...原创 2020-01-31 20:08:45 · 822 阅读 · 0 评论 -
利用Python进行数据分析第二版复现(四)
import pandas as pdfrom pandas import Series,DataFrame5.1 pandas的数据结构介绍要使用pandas,你首先就得熟悉它的两个主要数据结构:Series和DataFrame。虽然它们并不能解决所有问题,但它们为大多数应用提供了一种可靠的、易于使用的基础。SeriesSeries是一种类似于一维数组的对象,它由⼀组数据(各种Nu...原创 2020-01-30 17:20:26 · 533 阅读 · 0 评论 -
利用Python进行数据分析复现(三)
第4章 numpy基础:数组和矢量计算使用numpy计算比纯python计算快10到100倍(甚至更快),并且使用内存更少。NumPy的ndarray:一种多维数组对象numpy的N维数组对象(ndarray),该对象是一个快速而灵活的大数据集容器。import numpy as npdata=np.random.randn(2,3)dataarray([[ 0.00668162,...原创 2020-01-16 23:13:18 · 383 阅读 · 0 评论 -
利用Python进行数据分析(二)
前文(一)第三章 Python的数据结构、函数和文件数据结构元组用括号括着的数组;用tuple可以将任意的序列或迭代器转换成元组;通过方括号访问元组中的元素;元组中的元素类型可能是可变对象,但一旦创建了元组,元组中的对象就不能修改了。x=4,5,6x(4, 5, 6)tuple([4,2,0])(4, 2, 0)tup=tuple('hallo world')t...原创 2020-01-12 12:11:04 · 298 阅读 · 0 评论 -
利用python进行数据分析复现(1)
一直以来,都想学习python数据分析相关的知识,总是拖拖拉拉,包括这次这个分享也是。《利用python进行数据分析 第2版》是一次无意之间在简书上看到的一个分享,我决定将很详细。一直都想着可以复现一下。但总有理由,忘记和拖拉。这次我想通过分享的方式来监督自己学习。争取一周更一次。中间每天都还是要学习,只是周末再分享。放上原链接: https://www.jianshu.com/p/04d180...原创 2020-01-05 11:31:02 · 649 阅读 · 0 评论