Jason不在家
码龄8年
关注
提问 私信
  • 博客:52,235
    动态:26
    52,261
    总访问量
  • 22
    原创
  • 41,006
    排名
  • 8
    粉丝
  • 0
    铁粉

个人简介:没有简述

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2017-02-23
博客简介:

Jason不在家的博客

博客描述:
随便写写,随便看看
查看详细资料
  • 原力等级
    当前等级
    1
    当前总分
    77
    当月
    10
个人成就
  • 获得27次点赞
  • 内容获得10次评论
  • 获得22次收藏
创作历程
  • 1篇
    2025年
  • 2篇
    2024年
  • 7篇
    2023年
  • 1篇
    2022年
  • 2篇
    2020年
  • 1篇
    2019年
  • 6篇
    2018年
  • 2篇
    2017年
成就勋章
TA的专栏
  • java
    2篇
  • hadoop
    1篇
  • spark
    4篇
  • Hbase
    1篇
  • kudu
    2篇
  • impala
    2篇
  • kafka
    1篇
  • ElasticSearch
    1篇
  • scala
    2篇
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Flink 写入 Doris 常见报错和问题

一些特殊字符,可能也会报字段数量长度不对之类的,但其实如果不对早就报了,大概率是默认 csv 导入,特殊字符导致的问题。这种也是运行一会报错,报错中没有链接,光说 see more in null 的。可以调整一下写入方式,改为json,sink—doris 加个参数。task 一启动就会有明确的报错,直接调整即可。可以通过链接访问拿到报错日志,里面有错误信息。长度之类的问题,自己调整字段长度,或者过滤。一般都是主键、分区键有问题。
原创
发布博客 2025.01.10 ·
423 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

Flink 本地 idea 调试开启 WebUI

Flink 本地 idea 调试开启 WebUI
原创
发布博客 2024.09.29 ·
500 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

docker push jfrog Upload failed, retrying: unknown: Not Found

此类错误是找不到对应仓库导致的。
原创
发布博客 2024.03.20 ·
247 阅读 ·
2 点赞 ·
1 评论 ·
0 收藏

python 线程池/AIO(异步非阻塞)发送http请求示例

分别测试了 多线程、线城市、aio 等模式。AIO 效率最高,详见代码。AIO异步非阻塞IO。
原创
发布博客 2023.10.25 ·
498 阅读 ·
2 点赞 ·
1 评论 ·
1 收藏

MySQL 备份与恢复脚本

【代码】MySQL 备份与恢复脚本。
原创
发布博客 2023.09.15 ·
171 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

wsl docker login error

删除 wsl 内的配置文件。
原创
发布博客 2023.08.25 ·
300 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

三分钟搭建在线文件管理器 FileBrowser

【代码】三分钟搭建在线文件管理器 FileBrowser。
原创
发布博客 2023.08.25 ·
418 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

python 中类似 scala CaseClass 的能力

python 3.7 以后可以使用 dataclass。python 3.7 以前使用 namedtuple。
原创
发布博客 2023.07.07 ·
647 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

Airflow 2+ 版本 airlfow.cfg 中特殊字符问题

其中 %40 是 @ 的urlencode ,最前面的 % 是对第二个 % 的转义。airflow 的配置文件中需要写MySQL、MQ的连接信息,很可能出现特殊字符。就以 sql_alchemy 的配置为例吧。
原创
发布博客 2023.04.24 ·
281 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

spark on k8s 部署的一点理解

提交后driver后,driver 需要创建pod的权限,这里可以使用的是 serviceAccout 的权限,创建权限以及如何指定serviceAccount 参考 官网RBAC部分。spark on k8s 并不会启动一个常驻的集群,而是再 submit 提交任务时启动对应的pod作为driver 和 executor,任务结束后,这些pod 都会被释放。本地spark-submit 进程 创建pod时会将本地的spark配置作为configMap挂在到pod中。5. 实时任务则一直执行。
原创
发布博客 2023.04.24 ·
747 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

IDEA service/DashBoard 不显示 Spring Boot 服务端口号

IDEA service/DashBoard 不显示 Spring Boot 服务端口号的一种可能性
原创
发布博客 2022.11.18 ·
1980 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

https://gitee.com/dotnetchina/DBCHM 分享一个数据库表结构导出 Excel、MD 工具,数据库文档生成工具,支持 MySQL、Oracle、sqlServer

发布动态 2021.08.19

Wind行业分类标准-20170301.xls

发布资源 2020.04.30 ·
xls

spark sql json AnalysisException: Found duplicate column(s) in the data schema

spark sql 读取 json 文件 json 中存在 date 和 Date 字段下面的配置默认 False 解析查询不区分大小写,改为 True 之后就可以区分大小写,不报错了spark.conf.set(“spark.sql.caseSensitive”, “true”)...
原创
发布博客 2020.03.30 ·
3414 阅读 ·
4 点赞 ·
1 评论 ·
3 收藏

Java对URL中的中文进行UrlEncode

Java / Scala对URL中的中文进行UrlEncode有些中文或者有空格的URL需要 encode 方能进行请求使用 java.net.URLEncoder 会把所有特殊字符都编码 不可行import java.net.{URL, URLEncoder}val url = "http://www.baidu.com/s=你好"URLEncoder.encode(url, St...
原创
发布博客 2020.01.03 ·
4699 阅读 ·
3 点赞 ·
0 评论 ·
2 收藏

Failed to execute user defined function(anonfun$2: (array<double>) => double)

报错信息:org.apache.spark.SparkException: Failed to execute user defined function(anonfun$2: (array&lt;double&gt;) =&gt; double)Caused by: java.lang.ClassCastException: scala.collection.mutable.WrappedA...
原创
发布博客 2019.02.12 ·
6063 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

spark 连接 ES java.net.SocketTimeoutException 异常

INFO - Subtask: INFO - Exception in thread &quot;main&quot; java.net.SocketTimeoutExceptionINFO - Subtask: INFO - at org.apache.http.nio.protocol.HttpAsyncRequestExecutor.timeout(HttpAsyncRequestExecutor.java:...
原创
发布博客 2018.11.29 ·
2842 阅读 ·
3 点赞 ·
2 评论 ·
0 收藏

34个省份简称映射的sql文件

发布资源 2018.10.30 ·
sql

kudu 使用杂记

Kudu 是一个基于 Raft 的分布式存储系统,它致力于融合低延迟写入和高性能分析这两种场景Kudu 提供了 table 的概念。用户可以建立多个 table,每个 table 都有一个预先定义好的 schema。Schema 里面定义了这个 table 多个 column,每个 column 都有名字,类型,是否允许 null 等。一些 columns 组成了 primary key。...
原创
发布博客 2018.08.10 ·
3902 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

【笔记】kafka权威指南-常用配置和要点记录

Kafka 的应用场景消息队列 Kafka有更好的吞吐量,内置的分区,冗余及容错性,这让Kafka成为了一个很好的大规模消息处理应用的解决方案。 行为跟踪和日志收集。 敏感操作和日志,都可以写到 kafka 里进行统一,分情况的监控、和分析流式处理,比如,kafka 和 storm 的对接,来实现流式处理 还有其他的需要面向业务需求和场景来具体分析,主要就是利...
原创
发布博客 2018.05.29 ·
602 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多