python_pandas
火锅午餐肉
这个作者很懒,什么都没留下…
展开
-
pandas_Series_DataFrame
SeriesSeries是一个一维的数组对象,它包含一个值序列和一个对应的索引序列import pandas as pda=pd.Series(5, index=['op','asd','fgfd'])print(a)>>>op 5asd 5fgfd 5dtype: int64#================也可以通过字典创建====...原创 2019-06-27 15:40:33 · 174 阅读 · 0 评论 -
pandas_替换_重命名索引_分箱_随机抽样_字符串操作(Series)
替换可以使用replace将pandas对象中的指定值替换为别的值import pandas as pdimport numpy as npdf = pd.DataFrame({0:[5,7,1,5],1:[2,9,7,2],2:[5,8,4,4]})df.replace({4:[np.nan],5:['as']}) #将4和5 分别替换为 nan和as重命名轴索引使用renam...原创 2019-07-17 18:29:51 · 840 阅读 · 0 评论 -
pandas_索引_df删除 行/列_切片(Series/df)
索引pandas的索引对象可以包含重复的标签DataFrame对象也可以有重复的columns或者index 但是请尽量不要这么做!索引可以再创建的时候设置,但是不可以创建好后更改为别的值更改索引,也是在原有索引范围内更改,多出的索引值自动填充 NaN 或者指定填充值缺失值指定填充方式method参数,比如ffill表示向前填充,bfill表示向后填充import pandas a...原创 2019-07-01 18:39:45 · 5030 阅读 · 0 评论 -
pandas_算术和广播(np/df/Series)_函数和映射
算术和广播Series建立两个一维数据 s1 = pd.Series([4.2,2.6, 5.4, -1.9], index=list('acde')) s2 = pd.Series([-2.3, 1.2, 5.6, 7.2, 3.4], index= list('acefg')) s1 a 4.2 c ...原创 2019-07-08 13:49:48 · 338 阅读 · 0 评论 -
Pandas_文件读_文件写_其他格式文件读写
文件读read_excel : 从EXCEL的XLS或者XLSX文件中读取数据read_hdf : 读取用pandas存储的HDF5文件read_html : 从HTML文件中读取所有表格数据read_json : 从JSON字符串中读取数据read_sas : 读取SAS系统中定制存储格式的数据集read_sql : 将SQL查询的结果读取出来read_stata : 读取stat...原创 2019-07-09 18:52:33 · 593 阅读 · 0 评论 -
Pandas_数据库交互_删除缺失值_补全缺失值_删除重复值
数据库交互1.使用流行的Python的SQL工具包SQLAlchemy,它能简化你的数据库操作。2.同时,pandas提供了一个read_sql函数,允许你从通用的SQLAlchemy连接中轻松地读取数据3.在Anaconda中,已经默认安装了SQLAlchemy,可以直接使用import sqlalchemy as sqla import pandas as pddb = sqla....原创 2019-07-17 15:13:10 · 453 阅读 · 0 评论 -
Pnadas基础_分层索引
分层索引MultiIndex就是一个分层索引对象tup = [('beijing',2000),('beijing',2019), ('shanghai',2000),('shanghai',2019), ('guangzhou',2000),('guangzhou',2019)] values = [10000,100000,60...原创 2019-08-08 20:43:10 · 473 阅读 · 0 评论