- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 cdh版hue+oozie调度,部署后时区的修改且解决Bundle异常问题
hue修改时区时区修改为: Asia/Chongqingoozie修改时区值为:oozie.processing.timezoneGMT+0800不过oozie修改这个参数之后,有个坑爹地方,那就是不能通过hue提交Bundle,会报以下错误,目前还没有解决这个问题。Error submitting bundle My Bundle: E1310: Bundle Job submission Error: [E1301: Could not read the bundle job de.
2020-12-28 20:27:26 587
原创 kafka配置内外网访问
listeners: 学名叫监听器,其实就是告诉外部连接者要通过什么协议访问指定主机名和端口开放的 Kafka 服务。advertised.listeners:和 listeners 相比多了个 advertised。Advertised 的含义表示宣称的、公布的,就是说这组监听器是 Broker 用于对外发布的。如下是我们的测试配置:listeners=PRIVATE://192.198.10.01:9092,PUBLIC://192.198.10.01:9093advertised.listen
2020-12-22 19:19:28 1749
原创 hive对分区表全量count(1)出现错误ArrayIndexOutOfBoundsException
hive查询orc格式分区表全量count(1)出现如下报错:原因及解决方法如下:这个表中途修改过字段信息,造成旧分区的信息和新分区的信息不一致。CDH5 中 hive1.1 版本,当修改表格的元数据信息后,使用ORC格式的文件与Hive的矢量化特性不兼容 ,需要先设置矢量化为falseset hive.vectorized.execution.enabled=false;set hive.vectorized.execution.reduce.enabled=false;...
2020-12-17 10:33:48 1017
原创 WARN Received a PartitionLeaderEpoch assignment for an epoch < latestEpoch
Topic 处于 under replicated 状态.server.log 充满:[2020-11-30 19:00:00,006] WARN Received a PartitionLeaderEpoch assignment for an epoch < latestEpoch. This implies messages have arrived out of order. New: {epoch:0, offset:17990690}, Current: {epoch:4, offse
2020-12-07 11:42:28 2919 2
转载 python 用逐步回归筛选变量
在回归分析中,影响因变量y的因素很多,而有些自变量的对目标变量y的影响程度不同,为了建立一个相对最优的回归方程,我们需要筛选掉对目标变量y影响不大的变量,这就涉及到了变量选择问题。逐步回归是通过假设检验的方法来筛选强特征,但如果直接用特征变量和结果变量做回归,看系数的正负和大小来判断变量的相关性,其实也是合理的,但是为了考虑变量间的相互作用在回归模型中对结果的影响,通常还是应用逐步回归的方法。在逐步回归中,提取哪些变量主要基于的假设是:在线性条件下,哪些变量组合能够更显著的影响因变量,则将其保留。保留
2020-12-02 14:00:43 4047 1
wordVectors.npy,wordsList.npy,idsMatrix.npy
2020-09-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人