查漏补缺

pandas

set_index( )与reset_index( )设置索引

set_index( ):将某一列替换成索引

  • DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)
    -keys:列标签或列标签/数组列表,需要设置为索引的列
    -drop:默认为True,删除用作新索引的列
    -append:是否将列附加到现有索引,默认为False。
    -inplace:输入布尔值,表示当前操作是否对原数据生效,默认为False。
    -verify_integrity:检查新索引的副本。否则,请将检查推迟到必要时进行。将其设置为false将提高该方法的性能,默认为false。

reset_index( ):将dataframe还原

  • DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=’’)
    -level:数值类型可以为:int、str、tuple或list,默认无,仅从索引中删除给定级别。默认情况下移除所有级别。控制了具体要还原的那个等级的索引 。
    -drop:当指定drop=False时,则索引列会被还原为普通列;否则,经设置后的新索引值被会丢弃。默认为False。
    -inplace:输入布尔值,表示当前操作是否对原数据生效,默认为False。
    -col_level:数值类型为int或str,默认值为0,如果列有多个级别,则确定将标签插入到哪个级别。默认情况下,它将插入到第一级。
    -col_fill:对象,默认‘’,如果列有多个级别,则确定其他级别的命名方式。如果没有,则重复索引名。
  • 还原分为两种情况:
    1)对原来的数据表进行reset
    2)对使用过set_index()函数的数据表进行reset

isin():清洗数据,删选过滤掉DataFrame中一些行

  • numpy.isin(element, test_elements, assume_unique=False, invert=False)
    -element:输入数组
    -test_elements:用于测试每个元素值的值。如果它是array或数组,则将其展平。有关非类数组参数的行为,请参见注释。
    -assume_unique:bool, 可选参数,如果为True,则假定输入数组都是唯一的,这可以加快计算速度。默认值为False。
    -invert:bool, 可选参数,如果为True,则将返回数组中的值取反,就像计算元素不在test_elements中一样。默认值为False。np.isin(a, b, invert=True)等价于(但比…快)np.invert(np.isin(a, b))。

机器学习

  • estimator.score 返回的是R^(2),因此在确定预测结果的准确率时通过estimator.score(x_test,y_test)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值