自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 XGBOOST

在XGBoost里,每棵树是一个一个往里面加的,每加一个都是希望效果能够提升,下图就是XGBoost这个集成的表示(核心) 一开始树是0,然后往里面加树,相当于多了一个函数,再加第二棵树,相当于又多了一个函数...等等,这里需要保证加入新的函数能够提升整体对表达效果。提升表达效果的意思就是说加上新的树之后,目标函数(就是损失)的值会下降。 如果叶子结点的个数太多,那么过拟合的风险会越...

2019-07-27 15:40:34 122

原创 算法记录

面试算法汇总: 快速排序 :单链表实现 非递归实现二叉树中序遍历 冒泡排序 单链表反转 算法最长递增子序列的个数 最长公共子串 背包问题 TOPK 二叉树序列化和反序列化 二叉树知道前序遍历和中序遍历构造还原 LRU算法实现不许用现成的数据结构 单链表归并 单链表奇数位递增 偶数位递减进行排序 一个矩阵从左到右增从上到下增查找某个数 单例设计模式(双重锁) 二叉树...

2019-07-19 15:53:41 313

原创 spark Sql

读取和存数据: hivre 中读取直接就可以写SQL,逻辑类似在hive 中一样,但从其他数据源中读取数据时,需要先用registerTempTable命表名 ,再进行查询。这些数据也可以使用rdd操作函数 #从hive中读取: from pyspark import HiveContext from pyspark import SparkContext from pyspark imp...

2019-07-10 21:45:43 134

原创 pyspark 语法总结

导入pyspark # coding:utf-8 #使用pyspark from pyspark import SparkConf, SparkContext import pyspark from pyspark import SparkContext as sc from pyspark import SparkConf conf=SparkConf().setAppName("mini...

2019-07-08 17:23:55 1792

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除