Jaming R
码龄10年
关注
提问 私信
  • 博客:87,219
    问答:6,449
    93,668
    总访问量
  • 20
    原创
  • 57,132
    排名
  • 7
    粉丝
  • 0
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2014-09-24
博客简介:

yixiaoqi2010的专栏

查看详细资料
  • 原力等级
    成就
    当前等级
    1
    当前总分
    37
    当月
    1
个人成就
  • 获得19次点赞
  • 内容获得7次评论
  • 获得25次收藏
创作历程
  • 1篇
    2024年
  • 2篇
    2023年
  • 3篇
    2020年
  • 2篇
    2019年
  • 6篇
    2018年
  • 6篇
    2017年
成就勋章
TA的专栏
  • flink
    2篇
  • hbase
    1篇
  • java
    2篇
  • scala
    1篇
  • spark
    7篇
  • elasticsearch
    4篇
  • python
    1篇
兴趣领域 设置
  • 大数据
    hadoophivesparketl
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

357人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

使用datax从mysql导入数据到taosdb中

3、编译后的tdengine30writer 目录放到/root/datax/plugin/writer 中,与其他插件放一起。*******注意:taos 字段是小写,如果mysql字段有大写的话,写不进去。taos安装不用说了,下载个rpm包,直接安装。根据业务规则,创建超级表,子表。4、编写job.json。2、下载插件源码,编译。1、data下载地址。
原创
发布博客 2024.09.06 ·
378 阅读 ·
8 点赞 ·
0 评论 ·
4 收藏

elasticsearch5 wildcard 模糊搜索查不出结果问题

1、搜索messagecount* 或者messagecount.do* 都能出来。2、搜索logmessage/messagecount.do*没有结果。字段message类型默认分词,text类型。
原创
发布博客 2023.11.01 ·
1282 阅读 ·
1 点赞 ·
1 评论 ·
0 收藏

rsyslog服务端接收不到日志问题排查步骤

3、systemctl status rsyslog查看状态是否报错。4、查看配置文件udp、tcp模块是否打开。2、telnet查看ip端口是否通。1、查看日志输出目录是否提前创建。
原创
发布博客 2023.10.27 ·
1340 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

spark on yarn 时,使用rest api 查看job的信息,然而看官方文档,没有明确告诉url到底是什么

首先,打开sparkstreaming的web页面,按F12打开控制台,点击Executors,发现有一个allexecutors请求,暴露出了rest api的地址http://ip:8088/proxy/application_1591406335661_0005/api/v1/applications/application_1591406335661_0005/allexecutors...
原创
发布博客 2020.06.06 ·
1060 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

flink 关于何时编写分配watermark

我的电脑是8线程,当我运行下面这段代码时,可以输出结果,但是当把并行度注释掉时,就不输出结果了,这是为什么呢?输入数据一样,watermark应该都是一样的啊输入数据为:1585721697000,xiao,81585721700000,xiao,101585721705000,xiao,41585721715000,xiao,9case class Line(id:Long,n...
原创
发布博客 2020.04.02 ·
205 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

flink 并行度导致输出控制台结果问题

发布问题 2020.04.01 ·
2 回答

flink 在idea中编写的wordcount 重新启动后没有从检查点恢复之前的数据,为什么?

启用了检查点和状态后端,看hdfs目录确实有内容,然而重新启动后并没有从检查点恢复数据,这是为什么??object kafkatest { def main(args: Array[String]) { val env = StreamExecutionEnvironment.getExecutionEnvironment val properties = new Pro...
原创
发布博客 2020.03.07 ·
975 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

redhat6服务器上java进程突然全部消失是什么原因

发布问题 2020.01.07 ·
1 回答

请问谁能看懂这个代码里面到底是读取了什么格式的数据?

答:

后端你就需要啥写啥,爱写啥写啥

回答问题 2019.04.03

Elasticsearch只入数据不查询时,会把什么数据放到内存呢

发布问题 2019.04.03 ·
1 回答

kafka消费者报错:Class org.apache.kafka.common.serialization.StringDeserializer could not be found.

org.apache.kafka.common.config.ConfigException: Invalid value org.apache.kafka.common.serialization.StringDeserializer for configuration key.deserializer: Class org.apache.kafka.common.serialization.S...
原创
发布博客 2019.04.03 ·
14373 阅读 ·
3 点赞 ·
1 评论 ·
3 收藏

java自定义注解,在反射时获取字段的注解为空

发布问题 2019.03.28 ·
2 回答

spark2.0 读取本地json数据到Elasticsearch时,过滤非法json

package esimport net.minidev.json.parser.JSONParserimport org.apache.spark.SparkConfimport org.apache.spark.rdd.RDDimport org.apache.spark.sql.{Dataset, SparkSession}import scala.collection.Map...
原创
发布博客 2019.03.18 ·
591 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

spark restful api 启动任务,运行完之后到historyserver

首先1、 spark-env.sh中添加export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18080 -Dspark.history.retainedApplications=3 -Dspark.history.fs.logDirectory=hdfs://xiaoqi0:9000/sparkeventlog"2、spark-defaults.c...
原创
发布博客 2018.04.11 ·
2593 阅读 ·
1 点赞 ·
2 评论 ·
0 收藏

python 插入mysql数据库字符串中含有单引号或双引号报错

可以使用pymysql.escape_string(str_content)转换一下
原创
发布博客 2018.03.14 ·
8036 阅读 ·
3 点赞 ·
1 评论 ·
2 收藏

Hbase 查询语句记录

1.1.1 查询前几条数据scan 'logs',{LIMIT=>1}1.1.2 3查询表的总条数count 'logs'1.1.3 4删除表数据truncate 't1'1.1.4 5查看过滤器 show_filters1.1.1 6行键过滤器scan 'logs',{FILTER=>"RowFilter(=,'substring:2017-12-27')"}1.1.2 例子:  h...
原创
发布博客 2018.03.01 ·
25858 阅读 ·
0 点赞 ·
0 评论 ·
13 收藏

spring batch 并行执行任务

@RequestMapping("/startall") @ResponseBody String startall() throws ParseException { if (TimeFlag.getJobRun()) { System.out.println("Cron Start All Data Rsync Job. But Job Running."); return "Job...
原创
发布博客 2018.02.24 ·
2585 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

快学scala 记录

用scala的ArrayBuffer 调用java方法要导入隐式转换import scala.collection.JavaConversions.bufferAsJavaListimport scala.collection.mutable.ArrayBufferval command =ArrayBuffer("ls","-al","/home/cay")val pb = new Proces...
原创
发布博客 2018.01.31 ·
179 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

sparkmllib交替最小二乘法

http://spark.apache.org/docs/2.2.0/ml-collaborative-filtering.html不需要用户和商品属性的信息,这类算法通常称为协同过滤算法例子:根据两个用户的年龄相同来判断他们可能有相似的偏好,这不叫协同过滤。相反,根据两个用户播放过许多相同歌曲来判断他们可能都喜欢某首歌,这才叫协同过滤。SparkMLlib 的ALS算法 要求用户和产品ID必须是...
原创
发布博客 2018.01.17 ·
488 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

elasticsearch 内存溢出

ES在做聚合的时候,容易发生内存溢出https://www.elastic.co/guide/cn/elasticsearch/guide/current/_limiting_memory_usage.html
原创
发布博客 2017.12.22 ·
7032 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多