PYTHON
起个名字好难.JPG
不积跬步无以至千里。
展开
-
Python中保存和重载已建好的模型
保存:如果我们想保存不同参数下的xgboost模型以供之后重载使用,且我们将已建好的一个xgb模型命名为model, 我们可以直接使用:model.save_model('0001.model') 或者使用:model.dump_model('dump.raw.txt') # dump model model.dump_model('dump.raw.txt','featmap.txt') # d...原创 2018-06-30 17:23:32 · 7215 阅读 · 0 评论 -
python3将dict转为dataframe
对于定义的字典data = { 'row1' : [1,2,3,4], 'row2' : ['a' , 'b' , 'c' , 'd'] },按照官方文档方法,将其转化为dataframe:不定义列名时:pd.DataFrame.from_dict(data, orient='index')结果如下: 0 1 2 3row1 1 2 3 4row2 a b c d定义列名时:...原创 2018-07-08 11:38:34 · 39417 阅读 · 1 评论 -
Python 字典(Dictionary) __contains__(key)方法
Python 2 中字典(Dictionary) has_key() 函数用于判断键是否存在于字典中,如果键在字典dict里返回true,否则返回false。使用如下: dict.has_key(key)举个栗子: dict = {'Name':'coco','Sex':'Female'} # 定义字典 print(dict.has...原创 2018-09-20 21:07:19 · 46273 阅读 · 2 评论 -
怎么用Pandas DataFrame统计每一行0值的个数?
这里有两种方法:1. 首先可以通过(df == 0).astype(int).sum(axis=1),举个例子:in[34]:df = pd.DataFrame({'a':[1,0,0,1,3],'b':[0,0,1,0,1],'c':[0,0,0,0,0]})in[35]:dfOut[35]: a b c0 1 0 01 0 0 02 0 1 03 1 0 04...原创 2018-06-28 17:21:37 · 30823 阅读 · 3 评论 -
Python去掉或保留数据集中的重复行
有的时候我们会遇到这样的情况,数据集中一些列或所有列在某些行上取值相同,我们想要删掉完全重复的行,或者保留这些重复行,仅仅删除与其重复的那些行,那我们该怎么做呢? DataFrame.drop_duplicates(subset = None, keep = 'first')我们处理重复行的想法可以通过DataFrame.drop_duplicates()中的参数完全实现。其中subset这个参数...原创 2018-07-11 10:42:09 · 11074 阅读 · 0 评论 -
使用matplotlib画柱状图
强调这里是指绘制柱状图(bar)而非条形图(hist),即行坐标是离散变量。代码如下:# 引入必要库import matplotlib.pyplot as pltimport numpy as npfig, ax = plt.subplots()x = np.arange(number) # number指行坐标离散变量取值个数plt.bar(x,y) # y为列坐标取值plt.xticks(...原创 2018-07-04 21:05:30 · 510 阅读 · 0 评论