pandas
文章平均质量分 55
十三先生po
哈哈哈哈哈哈哈哈哈哈嗝儿
展开
-
python中pandas关于合并,access、excel合并
参考网址一文搞定Pandas中的数据合并pandas实现两个dataframe数据的合并:按行和按列在实际处理数据业务需求中,我们经常会遇到这样的需求:将多个表连接起来再进行数据的处理和分析,类似SQL中的连接查询功能。pandas中也提供了几种方法来实现这个功能,表现最突出、使用最为广泛的方法是merge。注意:记得重新复制,否则数据无法保存下来,即:data = data.append(xx)...原创 2022-04-12 12:44:18 · 2336 阅读 · 0 评论 -
TypeError: concatenate() got multiple values for argument ‘axis‘
问题背景使用朴素贝叶斯后,想把列值进行合并,使用numpy.concatenate方法时报错:TypeError: concatenate() got multiple values for argument ‘axis‘问题解决原因是有一列是没有列维度值的,需要使用方法添加一下,目标列的基本情况为使用reshape方法进行重置y2_test_predict.reshape(5,1)最后用合并成功!# y2_test_predict没有列维度,需要reshape重置一下test_d原创 2022-03-06 15:48:23 · 7814 阅读 · 1 评论 -
pandas对某一指定列或行进行修改
pandas 根据某一列的值修改某一列的值问题背景有一列数据,是在整列数据中提取出来的指定行和列的数据,想修改这列数据的值变成其他值问题解决无效写法1 对提取的列直接赋值detail_tstep_group3[detail_tstep_group3.渠道名称 == '广州A组2']['12月数据首单达标情况'] = 7执行代码后会提示使用loc方法而且没有赋值成功无效写法2 提取列之后使用loc方法赋值按照执行代码后的建议,使用loc方法,但我嵌套错了detail_tst原创 2022-01-26 16:39:43 · 9427 阅读 · 1 评论 -
pandas添加索引列名称
想将索引列的名称也加上,效果如下原來的数据列表结构如下添加代码# 添加索引列名称pay_rate.index.name = '出勤天数'实现效果原创 2022-01-26 11:08:07 · 3761 阅读 · 2 评论 -
pandas修改列columns、行index的顺序或名称
Python dataframe修改列顺序(pandas学习)DataFrame修改列名,调整列顺序,调整index修改列顺序重新对整个列的名称进行调整原来数据的列是这样的直接调整,最简单的方法,但如果是多列的话就不太适用了concat_crs1[['by12_in1','by1_in1','by12_in12']]将列取出后赋值给另外一个变量,将原来列删除后,将这一列重新指定位置加进去df_id = df.iddf = df.drop('id',axis=1)df.inse原创 2022-01-26 09:34:57 · 4911 阅读 · 0 评论 -
pandas 表对行过滤后,在对特定列赋值
pandas df表对行过滤后,在对特定列赋值原表想把这个频数改掉concat_crs.loc[concat_crs.频数 == 0,'频数'] = '均出现'concat_crs.loc[concat_crs.频数 == 1,'频数'] = '12月出现'concat_crs.loc[concat_crs.频数 == -1,'频数'] = '1月出现'修改成功...原创 2022-01-25 11:54:44 · 341 阅读 · 0 评论 -
pandas读取文件中不读取第一索引列
成功解决pandas读取文件中不读取第一索引列pandas.read_csv()读取csv文件,默认第一列为index(索引)的解决办法修改为如下代码即可使index设为默认从0开始:原本是df = pd.read_csv(fpath,index_col=False )修改为df = pd.read_csv(fpath,index_col=0 )将索引项设置为第0行(从0开始数,0为第一个元素,其实就是第一行)比较详细的解答:pandas.read_csv...原创 2022-01-25 10:22:56 · 12114 阅读 · 0 评论 -
pandas 数据框中显示所有列,行的名称
如何在 pandas 数据框中显示所有列名称?pandas中关于DataFrame行,列显示不完全(省略)的解决办法想将所有行和列展开(不用索引号)pd.set_option('display.max_columns', None)pd.set_option('display.max_rows', None)如果恢复的话,可以改变后面的变量pd.set_option('display.max_columns', 10)...原创 2022-01-14 14:45:43 · 1926 阅读 · 0 评论 -
python中numpy和pandas的区别
pandas是基于numpy数组构建的,但二者最大的不同是pandas是专门为处理表格和混杂数据设计的,比较契合统计分析中的表结构,而numpy更适合处理统一的数值数组数据。pandas数组结构有一维Series和二维DataFrame。转载 2021-11-25 16:45:27 · 863 阅读 · 0 评论 -
python数据分析之民航业客户建模分析实战
目录1背景与挖掘目标1.1 航空信息属性表(一部分列)1.2 分析方法和过程2 数据预处理3 描述性分析1背景与挖掘目标客户关系管理是企业的核心业务。客户管理的关键在于客户分类。通过客户分类,区分无价值和高价值客户,再针对不同价值的客户制定个性化服务方案,不同的营销策略,将有限的企业资源集中于高价值客户,实现企业利润最大化。面对激烈竞争,各个航空公司都推出了推广营销活动来吸引更多客户,国内某航空公司面临 旅客流失/竞争力下降和航空资源未充分利用等经营危机。通过建立合理的客户价值评估模型,对客户进行原创 2021-10-28 21:55:05 · 3159 阅读 · 0 评论 -
python使用jieba模块进行文本分析和搜索引擎推广“旅行青蛙”数据分析实战
需要导入的模块import numpy as npimport pandas as pdimport jiebaimport jieba.analyse中文分词基础步骤1 载入数据原创 2021-10-22 15:15:03 · 5368 阅读 · 0 评论 -
python数据分析的四阶段以及电商数据描述性分析和探索性分析
目录数据分析的四阶段分析流程建议1 需求数据情况需求产出2 数据规整(数据预处理,数据清洗,数据重构)数据分析的四阶段提出需求:确定目标准备数据:数据搜集和规整,最花时间(公司内部:办公室相关人员;系统、网站管理员找数据库)(公开信息:互联网爬虫)分析数据描述性分析:指标计算和可视化探索性分析:建模,预测 (设计建模,基础含量高,市场上绝大报告没有)总结和建议分析流程建议案例简介:本案例的业务问题和数据来自 xx生鲜平台。。。平台介绍:电商平台相关介原创 2021-10-15 16:34:23 · 1195 阅读 · 1 评论 -
python使用pandas时替换列数据报错TypeError: unsupported operand type(s) for +: ‘int‘ and ‘str
目录问题背景处理问题方法1:直接删除方法2:使用列数据类型转换方法问题背景在使用pandas时查询一份csv文件并进行缺失值处理,附上pandas学习网址python使用pandas模块介绍以及使用,dataframe结构,Series结构,基本数据操作,DataFrame运算,pandas画图,存储https://blog.csdn.net/weixin_55579895/article/details/120709917处理缺失值时发现nan值以外的“?”标记数值,先将他变成nan值,然后使原创 2021-10-13 17:44:43 · 3981 阅读 · 0 评论 -
[Errno 13] Permission denied: ‘test1.csv‘
问题背景使用pandas模块读取csv文件的时候报错[Errno 13] Permission denied: 'test1.csv'解决问题读取前先将打开检查的文件关闭否则报错,成功读取原创 2021-10-13 14:29:36 · 740 阅读 · 0 评论 -
python使用pandas模块设置行列索引后单元数值全变Nan值
问题背景使用pandas模块设置行列索引后单元数值全变Nan值代码如下# 错误# 构造行索引序列st_code = ['股票'+str(i) for i in range(st_change.shape[0])]print(st_code)# 添加行索引data = pd.DataFrame(st_change, index=st_code)data解决问题原因分析这种写法可能不适用正确写法:方法1:对dataframe结构的行索引index直接更改,有可能出问题,取决于赋什原创 2021-10-12 16:57:04 · 2601 阅读 · 0 评论 -
python使用pandas模块介绍以及使用,dataframe结构,Series结构,基本数据操作,DataFrame运算,pandas画图,存储,缺失值处理,离散化,合并
目录1 pandas介绍1.1 Pandas介绍1.2 为什么使用Pandas1.3 案例:在numpy当中创建的股票涨跌幅数据形式1.4 DataFrame1.4.1 DataFrame结构1.4.2 DatatFrame的常用属性和方法1 pandas介绍1.1 Pandas介绍面板 数据 (三维数据)分析 计量经济学(数据分析80% 跑计量20%)以Numpy为基础,借力Numpy模块在计算方面性能高的优势基于matplotlib,能够简便的画图独特的数据结构1.2 为什么使用Pa原创 2021-10-12 10:29:27 · 6943 阅读 · 1 评论