《利用python进行数据分析》学习笔记
文章平均质量分 56
mike112223
深度学习,计算机视觉
展开
-
《利用python进行数据分析》学习笔记(三)
处理US Baby Names 1880-2010 data set导入表格数据import pandas as pdyears = range(1880, 2011)pieces = []columns = ['name', 'sex', 'births']for year in years: path = 'ch02/names/yob%d.txt' % y...原创 2017-06-15 09:32:47 · 621 阅读 · 0 评论 -
《利用python进行数据分析》学习笔记(四)
Numpy学习笔记四主要针对本书的第四章进行总结。ndarryNumpy最重要的特点就是其N维数组对象,可以利用这种数组对整块数据执行数学运算。data.shapedata.dtype每个数组都有一个shape和一个dtype。创建ndarry# 利用array创建data = [[1,2,3],[8.1,2,4]]arr = np.array(d...原创 2017-06-23 10:32:06 · 343 阅读 · 0 评论 -
《利用python进行数据分析》学习笔记(六)
数据加载、存储与文件格式读写文本格式的数据# 文件带有标题行df = pd.read_csv('ch06/ex1.csv')df = pd.read_table('ch06/ex1.csv', sep=',')# 文件没有标题行pd.read_csv('ch06/ex2.csv', header=None)pd.read_csv('ch06/ex2.csv', nam...原创 2017-06-30 18:19:36 · 448 阅读 · 0 评论 -
《利用python进行数据分析》学习笔记(五)(上)
pandas摘抄一下pandas的特点:具备按轴自动或显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误。集成时间序列功能既能处理时间序列数据也能处理非时间序列数据的数据结构数学运算和简约(比如对某个轴求和)可以根据不同的元数据(轴编号)执行灵活处理缺失数据合并及其他出现在常见数据库(例如基于SQL的)中的关系型运算...原创 2017-06-23 16:50:39 · 1198 阅读 · 0 评论 -
《利用python进行数据分析》学习笔记(二)
处理MovieLens 1M data set由于代码段不是很多,就将笔记和查漏补缺部分合在一起了。导入表格数据import pandas as pdupath = os.path.expanduser('ch02/movielens/users.dat')rpath = os.path.expanduser('ch02/movielens/ratings.dat')m...原创 2017-06-14 11:19:07 · 829 阅读 · 0 评论 -
《利用python进行数据分析》学习笔记(一)
处理usa.gov数据导入数据import jsonpath = 'usagov_bitly_data2012-03-16-1331923249.txt'records = [json.loads(line) for line in open(path)]对时区进行计数因为不是所有记录都有时区字段,所以必须加入if判断,否则报错。# time_zones =...原创 2017-06-12 19:08:27 · 7400 阅读 · 0 评论 -
《利用python进行数据分析》学习笔记(五)(下)
汇总和计算描述统计pandas对象拥有一组常用的数学和统计方法。它们大部分都属于约简和汇总统计,用于从Series中提取单个值(如sum或mean)或从DataFrame的行或列中提取一个Series。df = DataFrame([[1.4, np.nan], [7.1, -4.5], [np.nan, np.nan], [0.75, -1.3]],...原创 2017-06-27 13:06:01 · 534 阅读 · 0 评论