- 博客(2)
- 收藏
- 关注
原创 使用DataX进行数据同步
DataX 是一个异构数据源离线同步工具,可以实现数据源之间的数据同步。 ODPSWriter插件适合于TB,GB数量级的数据传输,如果需要传输PB量级的数据,可以选择dt task工具 ;工具下载下载DataX wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz解压DataX tar ...
2018-07-17 18:30:26 8526
原创 Pandas修改csv文件某一列的值
将本来存为 省名 城市名 的字段修改为只有城市名 1. 通过pandas读取csv文件 2. 获取某一列的值并进行类型转换 3. 通过apply方法中的匿名函数进行数据的处理 4. 输出到原始文件中import pandas as pddata = pd.read_csv('price.csv',encoding='utf-8', )data[u...
2018-07-11 16:52:27 51092 5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人