- 博客(18)
- 收藏
- 关注
原创 阿里云天池机器学习训练营任务二
1. 实验室介绍1.1 XGBoost的介绍XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型,而是一个可供用户轻松解决分类、回归或排序问题的软件包。它内部实现了梯度提升树(GBDT)模型,并对模型中的算法进行了诸多优化,在取得高精度的同时又保持了极快的速度,在一段时间内成为了国内外数据挖掘、机器学习领域中的大规模杀伤性武器。更重要的是,XGBoost在系统优化和机器学习原理方面都进行了深入的考虑。毫不夸张的讲,XGBoos
2022-03-28 20:37:48
77
原创 阿里云天池机器学习训练营任务一
逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热,但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。而对于逻辑回归而且,最为突出的两点就是其模型简单和模型的可解释性强。逻辑回归模型的优劣势:优点:实现简单,易于理解和实现;计算代价不高,速度很快,存储资源低; 缺点:容易欠拟合,分类精度可能不高1.1 逻辑回归的应用逻辑回归模型广泛用于各个领
2022-03-28 20:35:19
71
原创 阿里云天池机器学习训练营任务四
幸福感是一个古老而深刻的话题,是人类世代追求的方向。与幸福感相关的因素成千上万、因人而异,大如国计民生,小如路边烤红薯,都会对幸福感产生影响。这些错综复杂的因素中,我们能找到其中的共性,一窥幸福感的要义吗?赛事简介天池新人实战赛是针对数据新人开设的实战练习专场,以经典赛题作为学习场景,提供详尽入门教程,手把手教你学习数据挖掘。天池希望新人赛能成为高校备受热捧的数据实战课程,帮助更多学生掌握数据技能。新人实战前,免费AI课程走一波...
2022-03-28 20:17:34
2603
原创 阿里云天池机器学习训练营任务三
LightGBM是2017年由微软推出的可扩展机器学习系统,是微软旗下DMKT的一个开源项目,由2014年首届阿里巴巴大数据竞赛获胜者之一柯国霖老师带领开发。它是一款基于GBDT(梯度提升决策树)算法的分布式梯度提升框架,为了满足缩短模型计算时间的需求,LightGBM的设计思路主要集中在减小数据对内存与计算性能的使用,以及减少多机器并行计算时的通讯代价。LightGBM可以看作是XGBoost的升级豪华版,在获得与XGBoost近似精度的同时,又提供了更快的训练速度与更少的内存消耗。正如其名字中的Li
2022-03-28 20:14:23
68
原创 阿里云天池机器学习训练营任务二
XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型,而是一个可供用户轻松解决分类、回归或排序问题的软件包。它内部实现了梯度提升树(GBDT)模型,并对模型中的算法进行了诸多优化,在取得高精度的同时又保持了极快的速度,在一段时间内成为了国内外数据挖掘、机器学习领域中的大规模杀伤性武器。更重要的是,XGBoost在系统优化和机器学习原理方面都进行了深入的考虑。毫不夸张的讲,XGBoost提供的可扩展性,可移植性与准确性推动了机器学习计算
2022-03-28 20:12:37
64
原创 阿里云天池机器学习训练营任务一
逻辑回归模型广泛用于各个领域,包括机器学习,大多数医学领域和社会科学。例如,最初由Boyd 等人开发的创伤和损伤严重度评分(TRISS)被广泛用于预测受伤患者的死亡率,使用逻辑回归 基于观察到的患者特征(年龄,性别,体重指数,各种血液检查的结果等)分析预测发生特定疾病(例如糖尿病,冠心病)的风险。逻辑回归模型也用于预测在给定的过程中,系统或产品的故障的可能性。还用于市场营销应用程序,例如预测客户购买产品或中止订购的倾向等。在经济学中它可以用来预测一个人选择进入劳动力市场的可能性,而商业应用则可以用来预测房主
2022-03-28 20:10:56
73
原创 阿里云天池python训练营任务四
数据读取训练和验证集的划分划分训练和验证集的原因是为了在线下验证模型参数的好坏,为了完全模拟测试集,我们这里就在训练集中抽取部分用户的所有信息来作为验证集。提前做训练验证集划分的好处就是可以分解制作排序特征时的压力,一次性做整个数据集的排序特征可能时间会比较长。1# all_click_df指的是训练集2# sample_user_nums 采样作为验证集的用户数量3def trn_val_split(all_click_df, sample_user_nums):4a...
2022-03-28 19:42:05
51
原创 阿里云天池python训练营任务三
函数函数的定义还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如: 参数是函数、返回值是函数。我们首先来介绍函数的定义。函数以def关键词开头,后接函数名和圆括号()。函数执行的代码以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。def functionname (parameters):"函数文档字符串"...
2022-03-28 19:40:25
73
原创 阿里云天池python训练营任务二
列表简单数据类型整型<class 'int'>浮点型<class 'float'>布尔型<class 'bool'>容器数据类型列表<class 'list'>元组<class 'tuple'>字典<class 'dict'>集合<class 'set'>字符串<class 'str'>1. 列表的定义列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对象,语法为[.
2022-03-28 19:37:36
462
原创 阿里云天池python训练营任务一
变量、运算符与数据类型1. 注释在 Python 中,#表示注释,作用于整行。【例子】单行注释1# 这是一个注释2print("Hello world")34# Hello worldHello world''' '''或者""" """表示区间注释,在三引号之间的所有内容被注释【例子】多行注释1'''2这是多行注释,用三个单引号3这是多行注释,用三个单引号4这是多行注释,用三个单引号5'''6print("Hello china")7# ...
2022-03-28 19:24:38
54
原创 阿里云天池python训练营任务四
数据读取训练和验证集的划分划分训练和验证集的原因是为了在线下验证模型参数的好坏,为了完全模拟测试集,我们这里就在训练集中抽取部分用户的所有信息来作为验证集。提前做训练验证集划分的好处就是可以分解制作排序特征时的压力,一次性做整个数据集的排序特征可能时间会比较长。1# all_click_df指的是训练集2# sample_user_nums 采样作为验证集的用户数量3def trn_val_split(all_click_df, sample_user_nums):4a...
2022-03-24 12:54:35
110
原创 阿里云天池python训练营任务三
函数函数的定义还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如: 参数是函数、返回值是函数。我们首先来介绍函数的定义。函数以def关键词开头,后接函数名和圆括号()。函数执行的代码以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。def functionname (parameters):"函数文档字符串"...
2022-03-24 12:50:56
40
原创 阿里云天池python训练营任务二
列表简单数据类型整型<class 'int'>浮点型<class 'float'>布尔型<class 'bool'>容器数据类型列表<class 'list'>元组<class 'tuple'>字典<class 'dict'>集合<class 'set'>字符串<class 'str'>1. 列表的定义列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对象,语法为[.
2022-03-24 12:47:45
748
原创 阿里云天池python训练营任务一
变量、运算符与数据类型1. 注释在 Python 中,#表示注释,作用于整行。【例子】单行注释1# 这是一个注释2print("Hello world")34# Hello worldHello world''' '''或者""" """表示区间注释,在三引号之间的所有内容被注释【例子】多行注释1'''2这是多行注释,用三个单引号3这是多行注释,用三个单引号4这是多行注释,用三个单引号5'''6print("Hello china")7# ...
2022-03-24 12:30:10
86
原创 数据读取训练
数据读取训练和验证集的划分划分训练和验证集的原因是为了在线下验证模型参数的好坏,为了完全模拟测试集,我们这里就在训练集中抽取部分用户的所有信息来作为验证集。提前做训练验证集划分的好处就是可以分解制作排序特征时的压力,一次性做整个数据集的排序特征可能时间会比较长。1# all_click_df指的是训练集2# sample_user_nums 采样作为验证集的用户数量3def trn_val_split(all_click_df, sample_user...
2022-03-23 16:43:41
54
原创 函数的定义
函数函数的定义还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如: 参数是函数、返回值是函数。我们首先来介绍函数的定义。函数以def关键词开头,后接函数名和圆括号()。函数执行的代码以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。def functionname (parameters): "函数文档字符串"...
2022-03-23 16:43:07
94
原创 简单数据类型
列表简单数据类型整型<class 'int'>浮点型<class 'float'>布尔型<class 'bool'>容器数据类型列表<class 'list'>元组<class 'tuple'>字典<class 'dict'>集合<class 'set'>字符串<class 'str'>1. 列表的定义列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Pyt
2022-03-23 16:42:38
79
原创 变量运算符
变量、运算符与数据类型1. 注释在 Python 中,#表示注释,作用于整行。【例子】单行注释1# 这是一个注释2print("Hello world")34# Hello worldHello world''' '''或者""" """表示区间注释,在三引号之间的所有内容被注释【例子】多行注释1'''2这是多行注释,用三个单引号3这是多行注释,用三个单引号4这是多行注释,用三个单引号5'''6...
2022-03-23 16:41:54
48
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人