数据分析
文章平均质量分 92
BiweiYan
这个作者很懒,什么都没留下…
展开
-
数据分析之Pandas(二):索引、过滤 、算术运算、 函数应用和映射
索引对象Pandas的索引对象负责管理轴标签和其他元数据。构建Series和DataFrame时,所用到的任何数组或其他序列的标签都会被转换成一个Index。原创 2017-08-06 13:10:52 · 866 阅读 · 0 评论 -
数据分析之Pandas(一):Series、DataFrame基本操作及索引对象
Pandas简介 Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas是基于NumPy构建的,是为了解决数据分析任原创 2017-08-05 20:00:50 · 2391 阅读 · 0 评论 -
《Python数据分析常用手册》一、NumPy和Pandas篇
本文转自http://www.cnblogs.com/prpl/p/5537417.html一、常用链接:Python官网:https://www.python.org/各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn数据分析常用库的离线安装包(pip+wheels)(百度云):http://pan.ba转载 2017-08-07 10:58:37 · 1792 阅读 · 2 评论 -
数据分析之Pandas(三):汇总、统计、相关系数和协方差
pandas对象中拥有一组常用的数学和统计方法,跟NumPy数组相比,它们是基于没有缺失数据的加上构建的。In [71]: df = DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]],index=['a','b','c','d'],columns=['one','two'])In [72]: dfOut[72]:原创 2017-08-09 10:33:45 · 18464 阅读 · 2 评论 -
Python中的rank()理解
rank 表示在这个数在原来的Series中排第几名,有相同的数,取其排名平均(默认)作为值。obj = pd.Series([7,-5,7,4,2,0,4])obj.rank()0 6.51 1.02 6.53 4.54 3.05 2.06 4.5dtype: float64在obj中,4和4的排名是第4名和第五名,取平均得4.5。7和7原创 2017-09-12 21:55:35 · 29350 阅读 · 2 评论