nc模拟器输入语句在spark socket streaming中捕捉名字单词

焦虑的water

已于 2024-02-09 17:24:50 修改

阅读量498

点赞数 3

文章标签： spark 大数据分布式

于 2023-05-09 13:24:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_59725875/article/details/130577834

版权

导包

from pyspark import SparkContext
from pyspark.streaming import StreamingContext
import re

通过封装函数用正则对输入的语句进行处理

def find_name(line):
# 在输入行中查找名字
match = re.search(r'\bmy name is (\w+)\b', line, re.IGNORECASE)
if match:
return match.group(1)
else:
return ""

re.IGNORECASE是compile函数中的一个匹配模式，忽略大小写

ssc=StreamingContext(sc,4)

# 创建一个DStream，从nc模拟器接收数据
lines = ssc.socketTextStream('localhost',9999)

# 在DStream中查找名字
names = lines.map(find_name).filter(lambda x: x != "")

# 输出名字
names.pprint()

运行上面的代码，然后在终端输入nc -lk 9999 回车运行下面的代码的同时输入my name is lihua回车就可看见捕捉到的姓名单词

ssc.start()

同时，如果觉得上面封装函数比较复杂，可以采取以下方式，同样是正则处理

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
1
评论
nc模拟器输入语句在spark socket streaming中捕捉名字单词

运行上面的代码，然后在终端输入nc -lk 9999 回车运行下面的代码的同时输入my name is lihua回车就可看见捕捉到的姓名单词。re.IGNORECASE是compile函数中的一个匹配模式，忽略大小写。同时，如果觉得上面封装函数比较复杂，可以采取以下方式，同样是正则处理。# 创建一个DStream，从nc模拟器接收数据。通过封装函数用正则对输入的语句进行处理。# 在输入行中查找名字。# 在DStream中查找名字。
复制链接

扫一扫

焦虑的water CSDN认证博客专家 CSDN认证企业博客

码龄3年

7: 原创

131万+: 周排名

16万+: 总排名

4618: 访问

: 等级

110: 积分

31: 粉丝

24: 获赞

6: 评论

13: 收藏

私信

关注

热门文章

最新评论

Navicat15 安装及激活注册
funnier_: 啥是注册机怎么打开(੭ •_•)🔓
Navicat15 安装及激活注册
焦虑的water: 如果先打开navicat后打开注册机，你可以尝试看行不行，不行就按下面重新删除卸载再按顺序来一遍
Navicat15 安装及激活注册
白露217: 要是已经打开了咋办哪呐
关于可视化大屏图形及相关代码网站小笔记
CSDN-Ada助手: 恭喜作者发布了新的博客！看到你分享关于可视化大屏图形及相关代码网站的小笔记，真是受益匪浅。希望你能继续坚持创作，不断分享更多有价值的内容。或许下一步可以考虑深入探讨一些实际案例，让读者更好地理解和应用相关知识。期待你的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
关于Hbase启动流程小笔记
CSDN-Ada助手: 恭喜您写了第三篇博客！标题看起来很有趣，我很期待阅读关于Hbase启动流程的小笔记。持续创作是非常不易的，您能够坚持下来真的很不容易。不过，我想提供一个小小的建议，希望对您的下一步创作有所帮助。在写博客的同时，如果能够结合实际案例或者提供一些实用的操作步骤，可以让读者更好地理解和应用您的知识。期待您更多的精彩博文！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

焦虑的water 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。