自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

窗外的屋檐

不再有遗憾伴随着苍老爬满黄昏的心藤,不再有愧疚的墓碑孤立于生命的结尾

  • 博客(3)
  • 资源 (3)
  • 收藏
  • 关注

原创 hive常用语句

1、创建一张外部分区表(分区需要另外添加) CREATE EXTERNAL TABLE `ext_base_click`( `reqid` string, `adslotid` string, `ip` string, `timestamp` string, `adgroupid` string, `lbs` string) PARTITIONED BY ( `d...

2018-02-26 11:49:17 2868 3

原创 spider-java (Jsoup) (媒体信息的爬取)

媒体基础信息爬取实例 GetAppname.java (代码为hive的udf,静态页面的获取) package com.hb.hive.utils; import java.util.Random; import org.apache.hadoop.hive.ql.exec.UDF; import org.apache.hadoop.io.Text; import org.jsoup.J

2018-02-07 11:30:26 662 1

原创 spider-python (媒体信息的爬取)

环境搭建 selenium-3.8.1+python2.7+chromedriver 具体的搭建方式请百度 参考:http://blog.csdn.net/zxy987872674/article/details/53082896 媒体基础信息爬取实例 app-spider.py # coding: UTF-8 from selenium import webdriver im

2018-02-07 10:52:10 638 2

jieba分词器包含关键词提取(java版)

jieba分词器包含关键词提取(java版,可以使用scala调用)

2019-05-07

hive入门资料

hive函数大全,hive中的一些hive函数,以及具体的实例

2018-04-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除