LHboboo-CSDN博客

原创 python连接kerberos认证的kafka，踩坑（NoBrokersAvailable）

然后再看源码，吐了一口老血，其实在2.0.2的版本里面，是有自动获取版本的操作的，只有连接失败的情况之后才会使用手动设置版本，本来就已经连不上了，设置版本对我这里来说，压根不是根本原因啊。因为原先对kerberos不太熟，疯狂看资料之后，发现自己漏了一个操作，就是kerberos里面有个kinit操作，需要我们在自己机器里面手动kinit，然后才能连接。接着，最不靠谱的地方出现了，全网铺天盖地的出现了加一个api_version =(xxx版本)参数，然后就可以使用了。对应python的库是。...

2022-08-26 16:15:25 3096 4

原创 pyspark 连接远程hive集群配置

今天本地spark连接远程hive集群，参考了网上各种教程，可以使用show 命令，不能使用select，最后直接把配置导入进去，本地直接应用远程环境，竟然可以了步骤：3. 将mysql-connector-java-5.1.32-bin.jar 文件放入spark/jars目录下4. 然后启动spark-shell 测试5. 然后在代码里面测试：好了，快速结束

2022-06-02 10:33:28 1582

原创本地pyspark 通过kerberos认证，请求kudu(本地不需要下载kerberos，不用使用shell打开kinit)，连接服务器hive

你当然需要在本地装好spark，hadoop，java等环境，保证线上不使用kerberos认证的时候，你的pyspark是可用的。如果不行，请参考我的另一篇文章，当然同样先保证你的环境是OK的，并且环境变量这些都配置好了，同时hosts中的路由也配好了。至于环境变量怎么配置，如何安装，自己查资料吧，我懒得写了写这篇文章主要是百度的可用资料太少，然后这几天刚好碰上我google用不了，再则资料太散乱了，我自己调通之后，就分享出来了。第二步：1. 将hosts中的路由配置好，具体的配置规则问hive小伙伴要2

2022-06-02 10:20:20 1124 3

u013153465的博客

原创 python连接kerberos认证的kafka，踩坑（NoBrokersAvailable）

原创 pyspark 连接远程hive集群配置

原创本地pyspark 通过kerberos认证，请求kudu(本地不需要下载kerberos，不用使用shell打开kinit)，连接服务器hive

原创优化TextRank文本摘要，自定义关键词增加句子的权重

原创 anaconda(conda)清华源下载大文件包经常断

原创 Pytorch.Dataloader 详细深度解读和微修改源代码心得

原创 ubuntu 教你如何10分钟搭建深度学习环境

原创 FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated; in a future version

原创 6.0 —随机森林原理（RF）和集成学习（Bagging和Pasting）

原创 6.0——决策树原理DecisionTree（信息熵，基尼系数），决策树解决回归问题，决策树局限性

原创 5.0-机器学习——SVM支撑向量机原理之线性可分数据

原创 5.1-机器学习——SVM支撑向量机原理之（核函数，RBF，SVM解决回归问题）

原创机器学习之如何评价分类算法(混淆矩阵(confusion Matrix)，精准率，召回率，F1 score，PR曲线，ROC曲线，评价多分类算法)

原创 3.0-逻辑回归原理和学习（LR）LogisticRegression（决策边界，多项式逻辑回归，逻辑回归解决多分类问题）

原创 2.6-模型正则化（Regularization）-限制参数的大小

原创解决过拟合的方法，列个标题

原创第五篇 2.3PCA和梯度上升法

原创第四篇 2.2-线性回归中使用梯度下降法及原理

原创第三篇 2.1-线性回归原理，推导，衡量线性回归的指标（MSE，RMSE，MAE,R^2）

原创第二篇：1.2 ——KNN中数据归一化原理,附数学推导

原创第一篇：1.1-KNN的学习记录—K近邻算法原理和超参数（KNeighborsClassifier）

ocr.yaml 下载cuda9.0

空空如也