大数据技术与应用实训心得_周总结1大数据采集技术与应用（徳拓）五次实验总结...

最新推荐文章于 2023-02-10 18:38:27 发布

weixin_39801465

最新推荐文章于 2023-02-10 18:38:27 发布

阅读量2k

点赞数

文章标签：大数据技术与应用实训心得

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39801465/article/details/111962930

版权

实验一：大数据同步技术datax的使用

目的:利用datax将.csv文件中的数据同步导入mysql中(乱码问题可通过输入命令 CHCP 65001解决)

1.Navicat里面建立数据表

2.仿照datax\job中的job.json进行修改，新建立job_yq.json文件

reader中修改输入源

index 对应数据表三个字段 0 1 2

3.修改输出源用户名及密码

4.输出源中添加数据表对应字段

5.连接数据表修改表名

附上我的json文件可以参考修改

{"job": {"setting": {"speed": {"channel": 3}

},"content": [

{"reader": {"name": "txtfilereader","parameter": {"path":["D:/Projects/phython/pycharm/PythonEX/learn_six/疫情省.csv"],"encoding":"GBK","column": [

{"index":0,"type":"string"},

{"index":1,"type": "string"},

{"index":2,"type": "string"}

],"fieldDelimiter":","}

},"writer": {"name": "mysqlwriter","parameter": {"username":"root","password":"root","column": ["riqi","pro","que_num"],"preSql": ["truncate table yq_province"],"connection": [

{"jdbcUrl":"jdbc:mysql://localhost:3306/demo","table":["yq_province"]

}

]

}

}

}

]

}

}

View Code

到此配置好后直接运行命令： python datax json目录即可，这里需要在datax/bin目录下运行此命令。

例如：python datax.py E:\xitong\major\datax\job\job_yq.json

易错点：这里路径一定要用/ 反斜杠会出错

实验二：大数据清洗技术kettle的使用

待更新

实验三：大数据日志采集技术Logstash

待更新

实验四：大数据实时采集技术Kafka

待更新

实验五：动态感知舆情热点大数据采集技术

待更新

weixin_39801465

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据技术与应用实训心得_周总结1大数据采集技术与应用（徳拓）五次实验总结...

实验一：大数据同步技术datax的使用目的:利用datax将.csv文件中的数据同步导入mysql中(乱码问题可通过输入命令CHCP 65001解决)1.Navicat里面建立数据表2.仿照datax\job中的job.json进行修改，新建立job_yq.json文件reader中修改输入源index 对应数据表三个字段 0 1 23.修改输出源用户名及密码4.输出源中添加数据表对应字段5....
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。