机器学习常用的方法

  • A.shapy() 查看A几行几列
  • pandas.merge(a, b, on=’‘list_name’’)表链接
  • pd.concat(objs, axis=0, join=‘outer’, join_axes=None,ignore_index=False,keys=None, levels=None, names=None, verify_integrity=False,copy=True)表链接
  • pd.dropna()函数。过滤缺失数据
  • finall()函数对缺失值进行填充。A[“a”] = A[“a”].finall(0)
  • DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds) 该函数最有用的是第一个参数,这个参数是函数。一般为lambda
  • pd.Series,只是一个一维数据结构,它由index和value组成。
    x=Series([‘a’,True,1])索引默认为0,1,2…
    dataframe,是一个二维结构,除了拥有index和value之外,还拥有column。
    -利用loc[‘行名’]、iloc[行索引]提取行数据
  • pd.get_dummies()用来解决中文。one-hot原理。
  • np.reshape(重塑) 给数据一个新的形状而不改变其数据。
  • numpy中concatenate函数 数组拼接。
  • numpy.argmax(a, axis=None) 返回axis参数最大的索引 axis:参数为None时默认比较整个数组,参数为0按列比较,参数为1按行比较。
  • data.drop_duplicates(subset=[‘A’,‘B’],keep=‘first’,inplace=True)
    • 去除重复项,subset是列名,keep是保留第一次出现的数据,inplace=True表示在原数据上修改。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值