![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
futurewq
活到老,学到老
展开
-
python heapq
heapq用来将数组转化为一个小根堆。arr = list(1,2,4,5,6,3)heapq.heapify(arr) 将arr转化为一个小根堆heapq.heappop(arr) 取小根堆arr的堆顶元素heapq.heappush(arr, x) 将元素x插入小根堆原创 2022-03-28 20:20:45 · 851 阅读 · 0 评论 -
Jupyter调用其他jupyter notebook文件内函数的一种简单方法
python开发环境Jupyter notebook良好的交互式和模块化收到很多Python开发人员青睐,但是jupyter notebook是以json格式保存文件内容的,而不是Python文件那样的普通格式,所以不能直接被python解析器解析,如何调用.ipynb种的module也成为一个问题。本文介绍一种方法,使得只要在我们的工作目录下放置一个python文件,就可以正常调用jupyter notebook文件。Jupyter Notebook官网介绍了一种简单的方法:http://jupyte转载 2021-08-14 10:35:38 · 4483 阅读 · 0 评论 -
python collections模块
1.dequedeque是双边队列,具有队列和栈的性质,在list的基础上增加了移动、旋转和增删等。常用方法d = collections.deque()d.append('a') 在最右边添加一个元素,此时d=deque('a')d.appendleft('b')在最左边添加一个元素,此时d=deque(['b', 'a'])d.extend(['c','d']) 在最右边添加所有元素,此时d=deque(['b','a','c','d'])d.extendleft(['e',原创 2021-07-01 19:32:00 · 52 阅读 · 0 评论 -
python 函数
函数定义函数代码块以def关键词开头,后接函数标识符名称和圆括号()。 任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。 函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。 函数内容以冒号起始,并且缩进。 return [表达式]结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回 None。函数参数与作用域在python...原创 2019-03-05 19:50:04 · 243 阅读 · 0 评论 -
python基础
python的输入和输出python中的标识符在 Python 里,标识符由字母、数字、下划线组成。在 Python 中,所有标识符可以包括英文、数字以及下划线(_),但不能以数字开头。Python 中的标识符是区分大小写的。以下划线开头的标识符是有特殊意义的。以单下划线开头 _foo 的代表不能直接访问的类属性,需通过类提供的接口进行访问,不能用 from xxx imp...原创 2019-02-26 21:26:51 · 130 阅读 · 0 评论 -
python基础3
1.dict字典d = {key1:value1, key2:value2}键必须是唯一的,不可变的,比如字符串、数字、元组。值可以是任何类型。字典可以修改,可以添加。字典的常用操作d = {1: 'qq', 2: 'ww', 3: 'ee'}#获取字典所有键keys = d.keys()for key in keys: print(key, end=' '...原创 2019-03-03 20:32:23 · 161 阅读 · 0 评论 -
啥是佩奇
参考链接https://mp.weixin.qq.com/s/whtJOrlegpWzgisYJabxOg转载 2019-03-08 22:15:55 · 182 阅读 · 0 评论 -
python文件、os模块、datetime模块、类和对象、正则表达式、re模块、http请求
1.python文件open()方法用于打开一个文件,可以设置打开文件方式比如读、写。file对象常用函数:file.close()关闭文件file.flush()刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件,而不是被动的等待输出缓冲区写入。file.next()返回文件下一行file.read([size])从文件读取指定的字节数,如果未给定或为负数则读取所有...原创 2019-03-07 22:01:11 · 210 阅读 · 0 评论 -
catboost
CatBoost = Category + Boosting2017年7月21日,俄罗斯Yandex开源CatBoost,亮点是在模型中可直接使用Categorical特征并减少了tuning的参数。建树的过程:1.初步计算splits对每个数值特征二值化,选择可能的分桶方式,结果用于选择树结构。binarization method (feature_border_type) 和...转载 2019-04-20 19:55:11 · 763 阅读 · 0 评论 -
python基础2
1.列表python中的列表为list,列表中的数据项不需要有相同的数据类型。python列表脚本操作符python列表截取列表的一些函数和方法#创建列表,列表中的数据项不需要有相同的数据类型list1 = [1, 2]print('列表长度', len(list1))#获取元素列表的最大最小元素时,列表中的元素之间要具有比较性print('列表最大元素'...原创 2019-02-28 21:29:12 · 194 阅读 · 0 评论 -
lightGBM算法梳理
首先,GBDT是一个非常流行的机器学习算法,另外基于GBDT实现的XGBoost也被广泛使用。但是当面对高纬度和大数据量时,其效率和可扩展性很难满足要求。主要的原因是对于每个特征,我们需要浏览所有的数据去计算每个可能分裂点的信息增益,真是非常耗时的。基于此,提出了两大技术:Gradient-based One-Side Sampling (GOSS) and Exclusive Feature B...原创 2019-02-04 15:03:28 · 853 阅读 · 0 评论 -
Titanic 模型评估
1.逻辑回归#evaluate logisitic modelX_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=2018)clf.fit(X_train, Y_train)Y_train_pred = clf.predict(X_train)Y_test_pred...原创 2019-01-10 13:38:58 · 410 阅读 · 0 评论 -
Titanic 模型调优
1.逻辑回归#逻辑回归调优from sklearn.linear_model.logistic import LogisticRegressionfrom sklearn.cross_validation import train_test_split,cross_val_scorefrom sklearn.metrics import *import matplotlib.pypl...原创 2019-01-12 11:00:43 · 282 阅读 · 0 评论 -
Titanic 模型融合
1.投票法#模型融合X = train[['Pclass', 'Sex', 'SibSp', 'Parch', 'Cabin', 'Embarked', 'title', 'isalone', 'Family', 'mother', 'person', 'ticket-same', 'age', 'fare']]Y = train['Survived']#投...原创 2019-01-13 18:24:08 · 311 阅读 · 0 评论 -
Titanic模型集成
1.使用随机森林做预测并绘制ROC曲线X = train[['Pclass', 'Sex', 'SibSp', 'Parch', 'Cabin', 'Embarked', 'title', 'isalone', 'Family', 'mother', 'person', 'ticket-same', 'age', 'fare']]Y = train['Survi...原创 2019-01-08 13:39:00 · 250 阅读 · 0 评论 -
决策树学习
目录1.什么是决策树2.决策树的三个算法3.决策树的三个算法的剪枝方式4.决策树的应用场景5.决策树的原理与sklearn中的接口对应关系1.什么是决策树 决策树是一种基本的分类与回归方法。决策树模型呈现树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定位在特征空间与类空间上的条件概率分布。其主要优点...原创 2019-01-15 21:01:57 · 429 阅读 · 0 评论 -
集成学习基础、adaboost、随机森林
目录1.集成学习概念2.个体学习概念3.boosting bagging AdaBoost算法讲解:4.结合策略(平均法、投票法、学习法)5.随机森林思想6.随机森林的推广7.随机森林的优缺点8.sklearn参数9.随机森林应用场景1.集成学习概念集成学习通过构建并结合多个学习器来完成任务,有时被称为多分类系统、基于委员会的学习等。如图1显示...原创 2019-01-27 17:58:29 · 493 阅读 · 0 评论 -
GBDT算法梳理
目录1.前向分布算法2.负梯度拟合3.损失函数4.回归5.二分类、多分类6.正则化7优缺点8.sklearn参数9.应用场景为了对GBDT有一个更清楚的认识,首先简单将GBDT和Adaboost做一个du对比性的说明。GBDT使用的是加法模型和前向分布算法,而AdaBoost算法是前向分布加法算法的特例,前向分布算法学习的是加法模型,当基函数为基本分类器时,...原创 2019-02-02 15:23:47 · 441 阅读 · 0 评论 -
AdaBoost原理详解
http://www.cnblogs.com/pinard/p/6133937.html转载 2019-02-03 03:27:34 · 1160 阅读 · 0 评论 -
XGB算法梳理
目录 1.CART树2.算法原理3.损失函数4.分裂节点算法5.正则化6.对缺失值的处理7.xgb的其他优化8.xgb参数9.xgb常问面试问题1.CART树CART树(分类与回归树),可以用于分类也可以用于回归。其内部节点特征的取值为“是”和“否”,节点的左分支取值为“是”,节点de的右分支取值为“否”。对于回归树使用平均误差最小化准则,对于分类树...原创 2019-02-03 03:38:45 · 16308 阅读 · 1 评论 -
csv中的null在pandas和os中的存储内容
数据为下面的csv文件通过padas和os读取该文件,代码如下import pandas as pddir = 'shiyan.csv'df = pd.read_csv(dir)data1 = df[df.b.notnull()].loc[:,:]print('data1:')print(data1)data2 = df[df.b.astype(str) != 'nan'...原创 2018-09-07 16:32:42 · 529 阅读 · 0 评论