Pandas
旱地有根胡萝卜
后来,你拉我一起看雨,大雨里百鬼夜行,我们混在其中,比鬼还高兴……
展开
-
pandas总结-----2
数据格式转换DataFrame数据类型每一列的数据格式是一致的1、查看格式df['院校名称'].dtype 2、格式转化df['院校名称']=df['院校名称'].astype('str')在进行格式转化时可能会出现报错,这是因为数据格式不一致,可以根据报错信息找到具体出错的数据,对该报错数据进行处理之后再进行格式转化。排序默认排序是根据index进行排序的1,按照投票...原创 2020-04-22 15:01:52 · 207 阅读 · 0 评论 -
Pandas总结-----1
Pandas数据类型Series一维数组,类似于列表形式1,初始化s= pd.Series([1,3,5,'LOL',6,np.nan,9])1 12 33 54 LOL5 66 NaN7 9dtype: object2,指定索引第一种方法:s= pd.Series([1,3,5,'LOL',6,np...原创 2020-04-22 15:01:04 · 403 阅读 · 0 评论 -
Pandas高级处理--数据离散化
高级处理–数据离散化为什么要离散化连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数,离散化方法经常作为数据挖掘的工具。什么是数据的离散化连续属性的离散化就是将连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间的属性值。案例:读取股票的数据data = pd.read_csv("./data/........原创 2020-04-22 14:58:56 · 229 阅读 · 0 评论 -
Pandas高级处理--合并
高级处理–合并将多张表的数据合并在一起进行分析pd.concat实现数据合并pd.concat([data1, data2],axis=1) 按照行或列进行合并,axis=0为列索引,axis=1为行索引 举例:将文件夹下的所有excel文件进行合并并且保存import osimport pandas as pddir = './中职'filenames = os.lis...原创 2020-04-22 14:57:32 · 340 阅读 · 0 评论 -
pandas结构与简单介绍
pandaspandas介绍2008年开发的专门用于数据挖掘的开源python库以numpy为基础,借力numpy模块在计算方面性能高的优势基于matplotlib,能够简单的画图独特的数据结构为什么使用pandas便捷的数据处理能力读取文件方便封装了matplotlib、numpy的画图和计算pandas使用工具jupyter命令框输入命令:jupyter notebo...原创 2020-04-22 14:55:54 · 211 阅读 · 0 评论