重新学习python的一些语法

最新推荐文章于 2022-05-14 10:09:49 发布

z80179030z

最新推荐文章于 2022-05-14 10:09:49 发布

阅读量136

点赞数 1

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/z80179030z/article/details/121042682

版权

python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

最近在做个贷预测时发现，在R和python里调用lgb，设置同样的参数，R的结果要比python差20个百分点，于是想重新学习一下python的语法结构，果断抛弃R语言。找了别人分享的一段baseline，记录了一些其中没见过的函数。

1）、pd.set_option()

好像是设置输出台显示dataframe的格式，最大行列数、小数位数等

# 显示所有列
pd.set_option('display.max_columns', None)
pd.set_option('display.max_columns', 5)  #最多显示5列
# 显示所有行
pd.set_option('display.max_rows', None)
pd.set_option('display.max_rows', 10)#最多显示10行
#显示小数位数
pd.set_option('display.float_format',lambda x: '%.2f'%x) #两位

2）、data.shape[0] : 返回数据框的行数

data.shape[0] : 返回数据框的行数

data.columns : 返回数据框列名

3）、np.zeros()

np.zeros(shape, dtype=float, order='C')

返回：返回来一个给定形状和类型的用0填充的数组；

参数：shape:形状

dtype:数据类型，可选参数，默认numpy.float64

4）、Kflod.split()

KFold(n_split, random_state, shuffle)

        n_split：需要划分多少折数
        shuffle：是否进行数据打乱
        random_state：随机数

KFold()方法中的split()：

for n_fold, (trn_idx, val_idx) in enumerate(folds_.split(data_))

split(a,b) 方法会根据折数对a和b进行划分。
例如n_splits = 10，则划分为10折，其中9折在a中，1折在b中进行选择。最后返回的是相应数据的下标

5）、data.iloc[index] : 根据行索引访问数据框

6）、re.search() : 扫描整个字符串，并返回第一个成功的匹配

import re
 
content = 'Hello 123456789 Word_This is just a test 666 Test'
result = re.search('(\d+)', content)

print(result)
print(result.group())    # print(result.group(0)) 同样效果字符串

结果：

<_sre.SRE_Match object; span=(6, 15), match='123456789'>
123456789
('123456789',)

7）、pd.offsets.DateOffset() : 日期偏移

#日期变量date
date = pd.Timestamp('2017-01-01 09:10:11')
do = pd.offsets.DateOffset(month = 1)
print(date + do)

#输出结果为
Timestamp('2017-02-01 09:10:11')

z80179030z

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录