自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

三分地

单纯明快。

  • 博客(4)
  • 资源 (20)
  • 收藏
  • 关注

原创 Hive自定义函数的使用——useragent解析

想要从日志数据中分析一下操作系统、浏览器、版本使用情况,但是hive中的函数不能直接解析useragent,于是可以写一个UDF来解析。useragent用于表示用户的当前操作系统,浏览器版本信息,形如:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 S

2014-10-30 16:56:34 6804 2

原创 LeetCode——N-Queens II

Follow up for N-Queens problem.Now, instead outputting board configurations, return the total number of distinct solutions.原题链接:https://oj.leetcode.com/problems/n-queens-ii/题目:求有多少个独立的解决方案

2014-10-29 11:16:04 2055

原创 LeetCode--N-Queens

The n-queens puzzle is the problem of placing n queens on an n×n chessboard such that no two queens attack each other.Given an integer n, return all distinct solutions to the n-queens puzzle.

2014-10-28 19:28:29 2186

原创 在Hadoop监控页面如何查看Hive的完整SQL

如图,这里只能看到简单的一段SQL,几乎看不出具体在执行什么任务。此时可以点开一个application,点击Tracking URL:ApplicationMaster进入到MapReduce Job job_1409xxxx,Job页面点击左侧的Configuration这里有此Job对应的所有参数,在 右上角的搜索框中输入string,其中key为 hive.

2014-10-13 11:31:03 7119

实时分析-分析和可视化流数据的技术

Real-Time Analytics: Techniques to Analyze and Visualize Streaming Data 实时分析-分析和可视化流数据的技术.pdf 包括Storm、samza、kafaka、flume等技术.

2015-02-09

Spark开发指南

Spark开发指南.pdf 本书参考Spark官方文档和源码,通过本书你将精通Spark的安装、配置、开发、监控和调优。

2015-02-06

spark apache日志分析、流数据处理教程

Databricks Spark Reference Applications spar日志分析、流数据处理 java8代码

2015-02-06

Spark大数据处理:技术、应用与性能优化(全)

Spark大数据处理:技术、应用与性能优化(全).mobi 可在kindle和PC上看.

2015-02-02

Functional Design Patterns

Functional Design Patterns.pdf 函数式编程模式

2015-02-01

wireshark中文手册.pdf

wireshark中文手册.pdf

2015-02-01

Python数据可视化手册.pdf

Python Data Visualization Cookbook.pdf

2015-01-18

Scala编程.pdf

Scala编程.pdf

2015-01-18

SQL语言艺术.pdf

SQL语言艺术.pdf

2015-01-18

高级MySQL性能优化

UC2005-Advanced-MySQL-Performance-Optimization 高级MySQL性能优化.pdf

2015-01-18

数据仓库工具箱:维度建模的完全指南·第二版.pdf

数据仓库工具箱:维度建模的完全指南·第二版.pdf

2015-01-18

Cassandra权威指南【中文版】.pdf

Cassandra权威指南【中文版】-1 (1).pdf

2014-12-07

快学Scala》完整版书籍.pdf

快学Scala》完整版书籍.pdf

2014-11-26

利用python进行数据分析(Python For Data Analysis.pdf)

利用Python进行数据分析,文字清晰完整,有目录,python数据分析必读。

2014-11-26

自然语言处理语料

语料。对应博客的语料资源。欢迎下载分析。http://blog.csdn.net/laozhaokun/article/details/32333667

2014-06-20

水木清华社区招聘信息定时抓取,部署于新浪云

水木清华社区招聘信息抓取并存入数据库,每一小时自动更新一次。 水木的招聘信息更新频繁,但是访问速度实在是很慢,于是就想不如把数据抓下来。 后面可能添加别的招聘网站的数据。 使用了Jsoup抓取和解析页面数据,MySQL存储数据。 可以部署在SAE上面,具体可移步至:huntinfo.sinaapp.com

2014-06-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除