查漏补缺

最新推荐文章于 2024-04-11 16:16:44 发布

weixin_47442524

最新推荐文章于 2024-04-11 16:16:44 发布

阅读量94

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47442524/article/details/116493994

版权

pandas

set_index( )与reset_index( )设置索引

set_index( )：将某一列替换成索引

DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)
-keys：列标签或列标签/数组列表，需要设置为索引的列
-drop：默认为True，删除用作新索引的列
-append：是否将列附加到现有索引，默认为False。
-inplace：输入布尔值，表示当前操作是否对原数据生效，默认为False。
-verify_integrity：检查新索引的副本。否则，请将检查推迟到必要时进行。将其设置为false将提高该方法的性能，默认为false。

reset_index( )：将dataframe还原

DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=’’)
-level：数值类型可以为：int、str、tuple或list，默认无，仅从索引中删除给定级别。默认情况下移除所有级别。控制了具体要还原的那个等级的索引。
-drop：当指定drop=False时，则索引列会被还原为普通列；否则，经设置后的新索引值被会丢弃。默认为False。
-inplace：输入布尔值，表示当前操作是否对原数据生效，默认为False。
-col_level：数值类型为int或str，默认值为0，如果列有多个级别，则确定将标签插入到哪个级别。默认情况下，它将插入到第一级。
-col_fill：对象，默认‘’，如果列有多个级别，则确定其他级别的命名方式。如果没有，则重复索引名。
还原分为两种情况：
1）对原来的数据表进行reset
2）对使用过set_index()函数的数据表进行reset

isin()：清洗数据，删选过滤掉DataFrame中一些行

numpy.isin(element, test_elements, assume_unique=False, invert=False)
-element：输入数组
-test_elements：用于测试每个元素值的值。如果它是array或数组，则将其展平。有关非类数组参数的行为，请参见注释。
-assume_unique：bool, 可选参数，如果为True，则假定输入数组都是唯一的，这可以加快计算速度。默认值为False。
-invert：bool, 可选参数，如果为True，则将返回数组中的值取反，就像计算元素不在test_elements中一样。默认值为False。np.isin(a, b, invert=True)等价于(但比…快)np.invert(np.isin(a, b))。

机器学习

estimator.score 返回的是R^(2)，因此在确定预测结果的准确率时通过estimator.score(x_test,y_test)

weixin_47442524

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
查漏补缺

pandasset_index( )与reset_index( )设置索引set_index( )：将某一列替换成索引DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)-keys：列标签或列标签/数组列表，需要设置为索引的列-drop：默认为True，删除用作新索引的列-append：是否将列附加到现有索引，默认为False。-inplace：输入布尔值，表示当前操
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。