重新学习python的一些语法

 最近在做个贷预测时发现,在R和python里调用lgb,设置同样的参数,R的结果要比python差20个百分点,于是想重新学习一下python的语法结构,果断抛弃R语言。找了别人分享的一段baseline,记录了一些其中没见过的函数。

1)、pd.set_option()

        好像是设置输出台显示dataframe的格式,最大行列数、小数位数等

# 显示所有列
pd.set_option('display.max_columns', None)
pd.set_option('display.max_columns', 5)  #最多显示5列
# 显示所有行
pd.set_option('display.max_rows', None)
pd.set_option('display.max_rows', 10)#最多显示10行
#显示小数位数
pd.set_option('display.float_format',lambda x: '%.2f'%x) #两位

2)、data.shape[0] : 返回数据框的行数

         data.shape[0] : 返回数据框的行数

         data.columns : 返回数据框列名

3)、np.zeros()

np.zeros(shape, dtype=float, order='C')

        返回:返回来一个给定形状和类型的用0填充的数组;

        参数:shape:形状

        dtype:数据类型,可选参数,默认numpy.float64

 4)、Kflod.split()

KFold(n_split, random_state, shuffle)

        n_split:需要划分多少折数
        shuffle:是否进行数据打乱
        random_state:随机数 

        KFold()方法中的split():

for n_fold, (trn_idx, val_idx) in enumerate(folds_.split(data_))

        split(a,b) 方法会根据折数对a和b进行划分。
        例如n_splits = 10,则划分为10折,其中9折在a中,1折在b中进行选择。最后返回的是相应数据的下标

5)、data.iloc[index] : 根据行索引访问数据框

6)、re.search() : 扫描整个字符串,并返回第一个成功的匹配

import re
 
content = 'Hello 123456789 Word_This is just a test 666 Test'
result = re.search('(\d+)', content)

print(result)
print(result.group())    # print(result.group(0)) 同样效果字符串

        结果:

<_sre.SRE_Match object; span=(6, 15), match='123456789'>
123456789
('123456789',)

7)、pd.offsets.DateOffset() : 日期偏移

#日期变量date
date = pd.Timestamp('2017-01-01 09:10:11')
do = pd.offsets.DateOffset(month = 1)
print(date + do)

#输出结果为
Timestamp('2017-02-01 09:10:11')

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值