python
文章平均质量分 87
能思想的苇草2
这个作者很懒,什么都没留下…
展开
-
利用python进行数据分析学习笔记1(NumPy)
常用模块的命名惯例import numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport seaborn as snsimport statsmodels as smnumpy基础NumPy的ndarray是一种多维数组对象,创建一个ndarray实例import numpy as npdata = np.random...原创 2018-06-24 15:04:42 · 1331 阅读 · 0 评论 -
利用python进行数据分析学习笔记(数据聚合与分组运算)
GroupBy机制df = pd.DataFrame({'key1' : ['a', 'a', 'b', 'b', 'a'], 'key2' : ['one', 'two', 'one', 'two', 'one'], 'data1' : np.random.randn(5), 'da...原创 2018-06-24 15:04:29 · 1710 阅读 · 0 评论 -
利用python进行数据分析学习笔记1(pandas入门)
pandas引入import pandas as pdSeries和DataFrame用的比较多from pandas import Series,DataFramepandas的数据结构介绍Series类似一维数组的对象,由一组数据和索引组成。传入一个列表作为Series的参数创建Seires。obj = pd.Series([4,7,-5,3]) #创建Series通过Serie...原创 2018-06-24 15:04:44 · 1422 阅读 · 0 评论 -
利用python进行数据分析学习笔记1(数据加载,存储与文件格式)
读写文本格式的数据将工作目录下的一个csv文件读入一个DataFrame中df = pd.read_csv('examples/ex1.csv')也可以是哟个read_table方法,并指定分隔符pd.read_table('examples/ex1.csv',sep=',')有些数据文件没有标题行,如果直接读取,会将第一行默认设置为标题行,传入header=None参数可以避免。pd.read_...原创 2018-06-24 15:04:39 · 1383 阅读 · 0 评论 -
利用python进行数据分析学习笔记1(数据清洗和准备)
处理缺失数据创建一个含缺失值的Seriesstring_data = pd.Series(['aardvark', 'artichoke', np.nan, 'avocado'])string_data.isnull()通过isnull方法返回一个布尔型Series,缺失值显示为True。通过索引可以将非缺失值设置为缺失值string_data[0] = None处理缺失数据的函数dropna,...原创 2018-06-24 15:04:36 · 3267 阅读 · 0 评论 -
利用python进行数据分析学习笔记(数据规整:聚合、合并和重塑)
层次化索引data = pd.Series(np.random.randn(9), index=[['a','a','a','b','b','c','c','d','d'], [1,2,3,1,3,1,2,2,3]])data.index创建一个Series,通过index属性可以获取其索引。使用索引和切片选择层次化Series...原创 2018-06-24 15:04:34 · 784 阅读 · 0 评论 -
利用python进行数据分析学习笔记(绘图和可视化)
matplotlib API入门引入matplotlibimport matplotlib.pyplot as plt创建一个简单的图形data = np.arange(10)plt.plot(data)Figure和Subplotmatplotlib的图像都位于Figure对象中,可以用plt.figure创建一个新的Figure。fig = plt.figure()fig.show()弹出...原创 2018-06-24 15:04:31 · 3293 阅读 · 0 评论