【无标题】

最新推荐文章于 2024-04-24 10:48:12 发布

m0_68133654

最新推荐文章于 2024-04-24 10:48:12 发布

阅读量691

点赞数 1

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_68133654/article/details/129180307

版权

1. 使用 Python 编程，将一个数据集 X={4,8,15,21,21,24,25,28,34}，采用基

于平均值的等高分箱方法对其进行平滑处理，得到新的数据集

{9,9,9,22,22,22,29,29,29}。

2．把 JSON 格式数据放入 Kafka 发送出去，然后，再从 Kafka 中获取到 JSON 格
式数据，对其进行解析并写入到 MySQL 数据库。
{ "sno":"95001","name":"John","sex":"M","age":23}

3．在特定目录下的文件（比如“C:\mylog\log1.txt”），会不断发生更新，

每当文件被更新时，就需要把更新的数据采集到 HDFS 中去。

根据需求，首先定义以下 3 大要素：

Source：因为要监控文件内容，所以 Souce 的类型是 exec；

Sink：因为要把文件采集到 HDFS 中，所以，Sink 的类型是 hdfs；

Channel：Channel 的类型可以设置为 memory。

在 Flume 安装目录的 conf 子目录下，编写一个配置文件 exec_hdfs.conf，在

HDFS 的 WEB 管理页面中（http://localhost:9870）查看生成的文件及其内容。

4．使用 Python 语言完成下列操作过程：
（1）由["Python","C","Scala","Java","GO","Scala","SQL","PHP","Python"]
创建一个变量名为 language 的 Series；
（2）创建一个由随机整型组成的 Series，要求长度与 language 相同，变量名
为 score；
（3）根据 language 和 score 创建一个 DataFrame；
（4）输出该 DataFrame 的前 4 行数据；
（5）输出该 DataFrame 中 language 字段为 Python 的行；
（6）将 DataFrame 按照 score 字段的值进行升序排序。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【无标题】

1. 使用 Python 编程，将一个数据集 X={4,8,15,21,21,24,25,28,34}，采用基于平均值的等高分箱方法对其进行平滑处理，得到新的数据集{9,9,9,22,22,22,29,29,29}。2．把 JSON 格式数据放入 Kafka 发送出去，然后，再从 Kafka 中获取到 JSON 格式数据，对其进行解析并写入到 MySQL 数据库。{ "sno":"95001","name":"John","sex"
复制链接

扫一扫

m0_68133654 CSDN认证博客专家 CSDN认证企业博客

码龄2年

1: 原创

171万+: 周排名

138万+: 总排名

690: 访问

: 等级

14: 积分

1: 粉丝

1: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

【无标题】 691

最新评论

【无标题】
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。