java
文章平均质量分 78
a_step_further
这个作者很懒,什么都没留下…
展开
-
hadoop UDF-获取前N周的日期时间点
应用场景:获取前N周的日期,且需要指定星期值(如周一、周二)。例如,获取前面第N个星期三当天的日期 输入:1. 初始化日期,即从哪个日期值开始往前查询(支持 yyyyMMdd, yyyy-MM-dd, yyyy-MM-dd hh:mi:ss);2. 周区间的个数;3. 指定星期值(仅限于缩写 "SUN","MON","TUE","WED","THU","FRI","SAT") 输出:日期值,格原创 2017-07-10 16:56:19 · 798 阅读 · 0 评论 -
从爬取到展示,数据科学工具串联练手 第2篇
书接上回(文章 http://blog.csdn.net/a_step_further/article/details/79360613 使用了python去爬取微博评论消息,再使用spark做预处理,用R做可视化),这次再换个姿势练习一下,思路是相近的,换换工具练手的目标仍然是活跃下思维。任务说明爬取新浪微博消息;这一次使用java处理中文文本预处理,这次的聚焦点在于文本中姓名的提取;这一次使...原创 2018-02-27 08:32:38 · 332 阅读 · 0 评论