数据处理基础

丁野人生

于 2020-11-09 10:41:46 发布

阅读量483

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49399679/article/details/109426910

版权

1.agg
数据集.agg({‘字段1’：‘count’,‘字段2’：‘sum’})
explain：对字段1计数，对字段2 求和
2.concat
pd.concat([数据表1, 数据表2],axis = 1)
explain：把两个数据表按列拼接
pd.concat([数据表1, 数据表2],axis = 1).T
explain：把这个结果转置
3.删除某一列等于0的所有行
X=xxhg[‘字段’] == 0
xxhg_a= xxhg.loc[-X]
xxhg_a就不回包含字段那一列等于0的了
4.rename=[’’,’’,’’,’’] # 这个是想添加的字段名
xxhg.columns=rename
输出xxhg就可以了
5.path=‘D:/test’ 路径可以查找文件的属性-位置
dcpfile = os.listdir(path)
就能返回test文件夹的所有文件名，包含后缀.xlsx等
6.locals() 会以字典类型返回当前位置的全部局部变量
示例：def test(arg):
print (locals())
输入test(4)，输出{‘arg’: 4}
7.startswith判断字符串是否以指定字符或子字符串开头。
示例：str = “this is string example…wow!!!”
输入str.startswith( ‘is’, 2, 4 ) 输出True
# 第二个参数是设置字符串检测的起始位置，第三个参数是设置字符串检测的结束位置，如果检测到字符串则返回True，否则返回False

8.矩阵.sum(axis=1)
矩阵按照行相加

9.No module named ‘scorecardpy’
解决办法：pip3 install scorecardpy

10.np.vstack
按（行顺序）堆叠数组构成一个新的数组
a = np.array([[1,2,3]])
b = np.array([[4,5,6]])
c = np.vstack((a,b))
c的输出是2行3列

11.np.hstack
按水平方向（列顺序）堆叠数组构成一个新的数组

12.把某一列符合特定条件的换成另外一个值。方法是新建一列
数据集[‘diff_p1’]=数据集[‘diff_p’]
数据集.loc[数据集[‘diff_p’]>=8,‘diff_p1’]=8
输出的结果就是diff_p大于8的全是8了

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据处理基础

1.agg数据集.agg({‘字段1’：‘count’,‘字段2’：‘sum’})explain：对字段1计数，对字段2 求和2.concatpd.concat([数据表1, 数据表2],axis = 1)explain：把两个数据表按列拼接pd.concat([数据表1, 数据表2],axis = 1).Texplain：把这个结果转置3....
复制链接

扫一扫

丁野人生 CSDN认证博客专家 CSDN认证企业博客

码龄4年

7: 原创

139万+: 周排名

168万+: 总排名

1867: 访问

: 等级

89: 积分

1: 粉丝

0: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

最新评论

Alicloud
ctotalk: 感谢分享,学习了
1018time serice
不正经的kimol君: 忍不住就是一个赞，写得很棒，欢迎回赞哦~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。