- 博客(3)
- 资源 (1)
- 问答 (4)
- 收藏
- 关注
原创 spark rdd根据某一列去重
比如一个rdd有两列 name age name有重复的,现在要根据name来去重 m = rdd.map(lambda r:(r[0],r)) r = m.reduceByKey(lambda x,y:x)首先先生成一个以该列为标准去重的key,该行为value,然后调用reduceByKey就可以啦
2016-12-29 12:01:25 17810
原创 解决Excel另存为csv文件在linux上乱码问题
首先excel另存为的时候,选择保存为csv文件类型,有个工具的选项,编码那里选择unicode,保存。 这样在linux上面还是乱码的,要用文本编辑器打开刚刚保存的csv文件,然后另存为,编码方式选择utf-8. 这样就不会乱码啦!
2016-12-28 17:49:25 9004
原创 python2.x与Python2.3遇到的坑
#有时候用2.x,有时候用3.x,所以偶尔会遇到一些不明的报错,感觉明明是对的啊,为什么一直报错呢? #所以以后遇到类似的问题,都记录下。 csv_file_object = csv.reader(open("../input/train.csv")) header = csv_file_object.__next__()#3.x要这样写,2.x直接.next()就行了 Ports = lis
2016-12-27 09:28:50 687
jquery mobile changePage 后目标页面的外部css不执行
2015-06-29
关于js闭包的疑问,求大神帮忙
2015-05-14
IE 6中怎样用原生js获的select中选择的那个文本值
2015-05-13
javascript输出结果全是false
2015-05-06
TA创建的收藏夹 TA关注的收藏夹
TA关注的人