利用python进行数据分析
文章平均质量分 82
xiaobaicai4552
这个作者很懒,什么都没留下…
展开
-
数据分析第一章
知识点:序列化和反序列化1.使用'w'写入的数据只能是字符串或者二进制,否则会报错info = {'name':'buyang', 'age':28}fr = open('test.txt', 'w')fr.write(info)TypeError: write() argument must be str, not dict稍作修改:info = {'name':'buyang', 'ag...原创 2018-04-16 21:20:27 · 236 阅读 · 0 评论 -
数据分析第二章Numpy
1.数组切片和列表切片最大的区别是数组切片不会创建原数组的副本,而列表切片是创建原数组的副本再进行操作import numpy as npa = np.array([0,1,2,3])b = a[:2]b[:] = 5 #必须写成b[:]切片形式才有此效果,如果写成b=5,相当于重新定义了变量b,a不会发生修改print(a)#输出[5 5 2 3]此外还需要注意numpy数组没有...原创 2018-04-17 21:56:52 · 524 阅读 · 0 评论 -
数据分析第三章pandas入门(三)
1.算术运算和数据对齐frame1 = DataFrame( np.arange(9).reshape((3,3)), index=['yz', 'nj', 'bj'], columns=list('bcd') )frame2 = DataFrame( np.arange(12).reshape((4, 3)), index=['sz','yz', 'nj', 'wx'], columns=li...原创 2018-04-22 15:44:09 · 295 阅读 · 0 评论 -
数据分析第三章pandas入门(四)
1.汇总和计算描述统计frame = DataFrame([ [1.4, np.nan], [7.1, -4.5], [np.nan, np.nan], [0.75, -1.3] ], index=list('abcd'), columns=['one', 'two'])print(frame)print(frame.sum())print(frame.sum(axis=1)) one...原创 2018-04-22 18:12:01 · 248 阅读 · 0 评论 -
数据分析第三章pandas入门(一)
1.Seriesimport numpy as npfrom pandas import DataFrame,Seriesa = np.array([1,2,3,4])obj = Series(a)print(obj)0 11 22 33 4在我们没有指定索引的时候,会自动生成0到N-1的索引import numpy as npfrom pandas import...原创 2018-04-18 21:58:17 · 289 阅读 · 0 评论 -
数据分析第四章数据加载存储与文件格式
1.读取文本格式数据import pandas as pddf = pd.read_csv('ex1.csv')print(df) a b c d message0 1 2 3 4 hello1 5 6 7 8 world2 9 10 11 12 foo如果文本内容是这样的(没有columns):df = pd.read_c...原创 2018-04-23 16:49:32 · 323 阅读 · 0 评论 -
数据分析第三章pandas入门(二)
1.索引对象frame2 = DataFrame(population, index=[2001, 2002])frame2.index[0] = 2003print(frame2.index)TypeError: Index does not support mutable operationsindex对象是不可修改的,即不能将index类型当作一个对象的方式来修改其中的值,要修改只能整...原创 2018-04-22 11:34:08 · 467 阅读 · 0 评论