![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python数据分析
schdut
记录学习笔记,欢迎交流讨论。
展开
-
pandas入门(三)
三、汇总和计算描述统计pandas对象拥有一组常用的数学和统计方法。它们大部分都属于约简和汇总统计。df = DataFrame([1.4, np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]],index=list('abcd'),columns=['one','two'])dfdf.sum() # 忽略NA值 # 把行变成一个df.s原创 2018-01-14 21:28:50 · 278 阅读 · 0 评论 -
pandas入门(二)
二、基本功能本节中,我将介绍Series和DataFrame中的基本功能。1. 重新索引pandas对象的一个重要方法是reindex(),其作用是创建一个适应新索引的新对象。如下,obj = Series([4,7,-5,3], index=['d','b','a','c'])obj# 调用reindex()将会根据新索引进行重排,如果某个索引值当前不存在,就引入缺失值。原创 2018-01-14 20:36:18 · 310 阅读 · 0 评论 -
pandas入门(一)
根据利用Python进行数据分析一书整理而成。pandas是本书后续内容的首选库。它含有是数据分析工作变得更快更简单的高级数据结构。pandas是基于NumPy构建的,让以NumPy为中心的应用变得更简单。pandas引入约定:from pandas import Series,DataFrameimport pandas as pd一、pandas的数据结构介绍要原创 2018-01-14 16:14:58 · 301 阅读 · 0 评论 -
NumPy基础知识整理(二)
根据利用Python进行数据分析一书整理而成。三、利用数组进行数据处理NumPy数组是你可以将许多数据处理任务表述为简洁的数组表达式(否则需要编写循环)。用数组表达式代替循环的做法,通常被称为矢量化。一般来说,矢量化数组运算要比等价的纯Python方式快上一两个数量级(甚至更多)。1. 将条件逻辑表述为数组运算numpy.where函数是三元表达式 x if condit原创 2018-01-14 13:32:39 · 258 阅读 · 0 评论 -
NumPy基础知识整理(一)
根据利用Python进行数据分析一书整理而成。NumPy 是 Python 中高性能科学计算和数据分析的基础包。它是本书所介绍的几乎所有高级工具的构建基础。理解 NumPy 有助于理解Pandas。一、ndarray: 一种多维数组对象NumPy 最重要的一个特点就是其N维数组对象(ndarray,不产生歧义的情况下也可以称之为数组),该对象是一个快速而灵活的大数据集容器,可以利用这原创 2018-01-14 11:10:16 · 463 阅读 · 0 评论 -
两个常用的数据标准化方法及Matlab和Python实现
参考:数据归一化和两种常用的归一化方法,博主对原文进行了润色并添加了Matlab实现。数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果。为了消除指标(特征)之间的量纲影响,数据集需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两...原创 2017-12-12 19:13:12 · 32633 阅读 · 13 评论