[root@master pyflink]# cat k102.py
from pyflink.datastream import StreamExecutionEnvironment
# 创建 StreamExecutionEnvironment 对象
env = StreamExecutionEnvironment.get_execution_environment()
# 读取文件,创建 DataStream 对象
data_stream = env.read_text_file('/root/pyflink/test.log')
# 对每行数据添加字符串 'aaaa'
new_stream = data_stream.map(lambda x: 'aaaa->'+x)
# 输出到控制台
new_stream.print()
# 执行任务
env.execute('Add "aaaa" to each line')
[root@master pyflink]# python k102.py
4> aaaa->3333333333333333,ccccccccccccc
2> aaaa->222222233333333,hhhhhhhhhhhhh
3> aaaa->1111111111111111,aaaaaaaaaaaaaa
1> aaaa->4444444444444444,eeeeeeeeeeeee
4> aaaa->1111111111111111,ddddddddddddd
1> aaaa->111111122222222,ffffffffffffff
3> aaaa->2222222222222222,bbbbbbbbbbbbbb
[root@master pyflink]# cat test.log
1111111111111111,aaaaaaaaaaaaaa
2222222222222222,bbbbbbbbbbbbbb
3333333333333333,ccccccccccccc
1111111111111111,ddddddddddddd
4444444444444444,eeeeeeeeeeeee
111111122222222,ffffffffffffff
222222233333333,hhhhhhhhhhhhh
[root@master pyflink]# python k102.py
2> aaaa->1111111111111111,aaaaaaaaaaaaaa
2> aaaa->2222222222222222,bbbbbbbbbbbbbb
3> aaaa->3333333333333333,ccccccccccccc
3> aaaa->1111111111111111,ddddddddddddd
4> aaaa->4444444444444444,eeeeeeeeeeeee
4> aaaa->111111122222222,ffffffffffffff
1> aaaa->222222233333333,hhhhhhhhhhhhh
在上述代码中,map() 函数接受一个 lambda 表达式作为参数,用于对每行数据进行处理。lambda 表达式中的
x 变量表示每行数据,x + 'aaaa' 表示将每行数据末尾添加字符串 'aaaa'。
最后通过 print() 方法将处理后的数据输出到控制台。
对数据流应用映射转换。转换调用的MapFunction
数据流的每个元素。每个MapFunction调用只返回一个元素。