自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

三分地

单纯明快。

  • 博客(1)
  • 资源 (20)
  • 收藏
  • 关注

原创 使用Spark SQL 探索“全国失信人数据”

“全国法院失信被执行人名单”,网址:http://shixin.court.gov.cn/,可供查询,用于惩罚失信人员。数据量有100多万,也算是大数据了。其中身份证号已被处理,并不能直接看到全部号码。本人承诺不将此数据用于非法用途和不正当用途,仅作为个人学习数据处理分析的数据源,不针对任何个人和组织。数据字段如下: 被执行人姓名/名称 性别 年龄 身份证号码/组织机构代码

2015-09-04 15:06:34 2694

实时分析-分析和可视化流数据的技术

Real-Time Analytics: Techniques to Analyze and Visualize Streaming Data 实时分析-分析和可视化流数据的技术.pdf 包括Storm、samza、kafaka、flume等技术.

2015-02-09

spark apache日志分析、流数据处理教程

Databricks Spark Reference Applications spar日志分析、流数据处理 java8代码

2015-02-06

Spark大数据处理:技术、应用与性能优化(全)

Spark大数据处理:技术、应用与性能优化(全).mobi 可在kindle和PC上看.

2015-02-02

Functional Design Patterns

Functional Design Patterns.pdf 函数式编程模式

2015-02-01

Python数据可视化手册.pdf

Python Data Visualization Cookbook.pdf

2015-01-18

Scala编程.pdf

Scala编程.pdf

2015-01-18

SQL语言艺术.pdf

SQL语言艺术.pdf

2015-01-18

高级MySQL性能优化

UC2005-Advanced-MySQL-Performance-Optimization 高级MySQL性能优化.pdf

2015-01-18

数据仓库工具箱:维度建模的完全指南·第二版.pdf

数据仓库工具箱:维度建模的完全指南·第二版.pdf

2015-01-18

Cassandra权威指南【中文版】.pdf

Cassandra权威指南【中文版】-1 (1).pdf

2014-12-07

快学Scala》完整版书籍.pdf

快学Scala》完整版书籍.pdf

2014-11-26

利用python进行数据分析(Python For Data Analysis.pdf)

利用Python进行数据分析,文字清晰完整,有目录,python数据分析必读。

2014-11-26

自然语言处理语料

语料。对应博客的语料资源。欢迎下载分析。http://blog.csdn.net/laozhaokun/article/details/32333667

2014-06-20

水木清华社区招聘信息定时抓取,部署于新浪云

水木清华社区招聘信息抓取并存入数据库,每一小时自动更新一次。 水木的招聘信息更新频繁,但是访问速度实在是很慢,于是就想不如把数据抓下来。 后面可能添加别的招聘网站的数据。 使用了Jsoup抓取和解析页面数据,MySQL存储数据。 可以部署在SAE上面,具体可移步至:huntinfo.sinaapp.com

2014-06-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除