- 博客(8)
- 资源 (1)
- 收藏
- 关注
原创 Elasticsearch数据重新索引
https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-reindex.htmlPOST _reindex { "source": { "index": "twitter" }, "dest": { "index": "new_twitter", "op_type": "create
2017-05-31 14:57:00 2544
原创 Spark中的一些概念
一次action操作会触发RDD的延迟计算,我们把这样的一次计算称作一个Job。 窄依赖指的是:每个parent RDD 的 partition 最多被 child RDD的一个partition使用 宽依赖指的是:每个parent RDD 的 partition 被多个 child RDD的partition使用 窄依赖每个child RDD 的partition的生成操作都是可以并行的
2017-05-31 14:54:38 364
原创 spark读取hdfs文件的路径使用正则表达式
spark.read.json("/flume/product/160/raw1/2017/05/23/*[1-9]")读取文件,文件以数字结尾.
2017-05-23 18:26:07 4223
原创 通过url删除ES中的数据
curl -XDELETE "http://test-hostname:9200/product*_201704*"
2017-05-18 14:10:07 6244 1
原创 linux中vi的使用
在编辑模式中,采用:r命令读取文件内容到当前缓冲区 文本替换:1,5 s/Spark/spark/g :% s/\<the\>/The/g
2017-05-04 14:45:02 333
原创 在vim中移动光标
1.移动到某个特定字符 采用fx命令进行字符定位,例如fs可以定位到同一行s下一次现出的位置。 采用Fx命令,可以将光标定位到x字符在同一行上一次出现的位置 2.按word进行移动 使用w或nw将光标向前移动。其中n为数字。 使用b或nb将光标向后移动。其中n为数字。 3.新行输入 o表示在当行下的下方创建一个新行,O表示在当前行的上方打开一个新行//O在光标所在行的上方插入新行 【
2017-05-03 18:47:37 440
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人