自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

MicroWisdom博客

https://github.com/MicroWisdom/

  • 博客(12)
  • 收藏
  • 关注

原创 Python学习笔记-数据分析-Pandas07—数据分组及相关操作

Pandas数据结构—数据分组及相关操作一、分组 groupby二、基本操作(一)三、基本操作(二)四、基本操作(三)一、分组 groupbygroupby参数如下:by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs基本操作的一些方法:get_...

2019-04-15 21:27:36 321

原创 Python学习笔记-数据分析-Pandas06—合并、连接、修补、去重、替换

Pandas数据结构—合并、连接、修补、去重、替换一、合并(一) merge二、合并(二)join三、连接 concat四、修补 combine_first、updata五、去重 duplicated六、替换 replace一、合并(一)-mergemerge有点类似vlookup,但是比vlookup更灵活。merge的参数有很多:left, right, how=‘inne...

2019-01-05 22:19:38 463

原创 Python学习笔记-数据分析-Pandas05—字符串数据

Pandas有一些专门针对字符串数据的处理方法,方便对字符串进行操作。- python中也有类似的方法。- 字符串是一个不可变序列。import numpy as npimport pandas as pd# 利用np.nan来填充空值ps = pd.Series(['he','b','c','D','Python','666',np.nan,'hello'])df = pd.Dat...

2018-12-24 20:33:36 200

原创 Python学习笔记-数据分析-Pandas04—数值的计算和统计

这部分会说一些常用的跟数值计算和统计相关的内容axis、skipna、Series和DataFrame的常用计算方法、唯一值unique()、值计数value_counts()、成员资格isin()一、axis、skipnaaxis表示汇总计算:该参数默认为0,表示以列来汇总计算;而当axis=1时是以行来汇总计算。skipna表示是否忽略NaN:该参数默认True,就是忽略NaN。如果...

2018-12-07 20:28:19 400

原创 Python学习笔记-数据分析-Pandas03—时间时期

Pandas的时间序列主要包括以下内容:时间模块(datetime)、时刻数据(Timestamp)、时间戳索引(DatetimeIndex)、时期(Period)、时间序列的索引及切片和重采样。共6部分内容。一、时间模块:datetime(datetime本身并不是pandas里的东西,其属于系统自带的模块。)datetime主要包括datetime.date(), datetime.da...

2018-12-02 22:24:30 546

原创 Python学习笔记-数据分析-Pandas02-Dataframe

Dataframe其实是一个表格型的数据结构,包含一组有序的列,可以理解为一个二维数组。Dataframe中的数据以一个或多个二维数组块进行存放的,与列表、字典或一维数组的结构不同。其值类型可以是数值、字符串、布尔值等。一、Pandas-Dataframe的概念和创建1、Dataframe 简单介绍Dataframe 是一个带有index(行标签)和columns(列标签)的表格型的数据结...

2018-11-08 20:06:08 534

原创 Python学习笔记-数据分析-Pandas01-Series

Pandas是数据分析中的一个重要模块。给我的感觉有点像平时在用的excel一样重要。因为Pandas中的内容很多,这里只介绍一些我认为是核心的内容。更多的内容可以通过阅读文档来学习。介绍的内容大致如下:Series、Dataframe、datetime、Timestamp、DatetimeIndex、Period、时间序列的索引和切片、时间序列的重采样、数值计算和统计、文本数据、合并 mer...

2018-10-28 15:28:39 290

原创 Python学习笔记-数据分析-Numpy05-数据的输入输出

Numpy数据的输入输出import numpy as npimport os# 先设置一下工作路径# 在写路径的时候,如果直接拷贝路径过来的话会所“\”的斜杠,我个人习惯前面加上r,防止对字符串进行转义。这里就不需要将“\”改成“/”.os.chdir(r'E:\Jupyter\test')# 或者写出os.chdir('E:/Jupyter/test')一、读取写入.npy文件...

2018-10-21 20:05:55 320

原创 Python学习笔记-数据分析-Numpy04-随机数

Numpy随机数1、随机数是数据分析中很重要的一个辅助工具。里面包含正太分布、均匀分布等等很多类型。通过随机数可以生成我们想要的符合某个特性的数据,以便我们学习新的工具包或者测试某个算法。2、这里主要使用到numpy.random。它有比较多的方法,这里只介绍一些常用的。import numpy as np# 这里导入matplotlib模块,主要是为了用图表来辅助分析import m...

2018-10-21 17:28:10 546

原创 Python学习笔记-数据分析-Numpy03-索引和切片

Numpy的索引和切片1、索引和分片的主要作用是查找数据,通过索引和切片能够快速的定位到需要的数据。在后期的数据清洗、数据整理等方面都要用到。2、Numpy的索引和切片主要分为:基本索引和切片 / 布尔型索引和切片一、基本索引和切片# Numpy中索引和切片的基本操作# 一维数组# 一维数组类似list。ar1 = np.arange(20)print('一维数组ar1:', ar...

2018-10-21 16:56:01 353

原创 Python学习笔记-数据分析-Numpy02-通用函数

Numpy通用函数一、数组形状— —.T/.reshape()和.resize()**1、numpy.T :转置,例如原shape为(3,4)/(2,3,4),转置结果为(4,3)/(4,3,2) → 所以一维数组转置后结果不变# 数组形状:.Timport numpy as npar1 = np.arange(1,11)ar2 = np.zeros((2,5))print(ar1)...

2018-10-20 21:42:05 317 2

原创 Python学习笔记-数据分析-Numpy01-基础数据结构

Numpy是Python开源的科学计算工具包,主要的特点如下:强大的N维数组对象:ndarray对数组结构数据进行运算(不用遍历循环)随机数、线性代数、傅立叶变换等多种功能说明:1、本人的笔记均在win10(64)环境下的Jupyter- Notebook中直接编写,如有需要可以直接拷贝代码。2、注释中除了有关于代码的解释,还有本人在学习中的一些拙见。3、本人代码注释...

2018-10-14 21:10:38 334

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除