自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

法相的博客

活到老学到老

  • 博客(3)
  • 资源 (7)
  • 收藏
  • 关注

原创 SparkSQL注册自定义函数

SparkSql可以方便地使用sql来处理数据,实际中经常会大量使用。在处理复杂逻辑时,为了避免写出又长又难以理解的SQL,可以实现自定义函数,再将其注册后,供sql调用。不仅减少sql的复杂度,还增加了代码的重用。下面就实现一个例子来说明,目的是以15分钟为统计周期,统计订单量。

2017-05-26 23:26:29 2968

原创 spark数据导入、处理实例

当项目中遇到所要分析的数据量较大情况时,本地python直接处理或导入数据库等普通的处理方式显然并不合适,不仅效率低下,且容易引起数据库崩溃。用spark将本地数据上传hdfs,写入hive,会更加高效。

2017-05-24 22:58:13 3619

原创 apriori算法实现挖掘商品关联规则(python)

数据挖掘有个常见的应用场景,即顾客在购买一件商品时,商家可以趁机了解他们还想买什么,以便把多数顾客愿意同时购买的商品放到一起销售以提升销售额。当商家收集到足够多的数据时,就可以对其进行亲和性分析,以确定哪些商品适合放在一起出售。

2017-05-23 23:32:47 7776 7

Model Builder.zip

风控建模工具,经常用来建决策树模型;比如用模型分与变量进行融合,建立稳定的决策树模型,并导出模型sql等

2020-08-12

windows下xgboost安装包最简易

windows下最简易xgboost安装

2017-06-23

统计学习基础:数据挖掘、推理与预测.pdf

统计学习基础:数据挖掘、推理与预测.pdf

2017-05-24

Django Web开发指南.pdf

Django Web开发指南.pdf

2017-05-24

推荐系统实践

内容简介:, 随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代 。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。

2017-05-23

Stanford 教授 Andrew Ng 的 Deep Learning 教程

Stanford 教授 Andrew Ng 的 Deep Learning 教程,包含最全人脸库,支持向量机通俗导论(理解SVM的三层境界)带完整书签版本.pdf,深度学习的基本理论与方法.pptx,BP神经网络的基本原理等

2017-05-23

常用数据挖掘数据集

常用数据挖掘数据集,包含阿里部分天池竞赛数据集

2017-05-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除