- 博客(5)
- 资源 (6)
- 收藏
- 关注
原创 python点滴:读取和整合文件夹下的所有文件
当我们想读取一个文件夹下的多个文件,并且将所有文件的内容整合成一个文件,应该怎么做?基本的思路是:写一个专门的函数实现以上两个功能。主要用到的命令包括os.listdir()、codecs.open(),其中前者可以获取指定路径下所有的文件名,后者可以用指定编码打开或者创建文件。
2016-07-14 19:32:02 3851
原创 python点滴:判断字符串是否为合法json格式
在一些情况下,我们需要判断字符串是否为合法json格式。思路很简单:尝试对字符串使用json.loads(),如果不是合法json格式,则会抛出ValueError异常。
2016-07-13 20:00:22 27697 2
原创 HIVE点滴:选择两个字段时distinct位置的影响
当选择两个字段时,例如:"select XX1, XX2 from tb; ",那么将distinct放在前一个字段XX1之前和放在后一个字段XX2之前,结果有什么不同呢?先说结论:如果将distinct放在前一个字段之前,则会返回对两个字段的组合去重后的结果;而如果将distinct放在后一个字段之前,则会报错。
2016-07-12 19:37:44 15128
原创 HIVE点滴:group by和distinct语句的执行顺序
同一条语句之中,如果同时有group by和distinct语句,是先group by后distinct,还是先distinct后group by呢?先说结论:先group by后distinct。
2016-07-11 20:01:44 5453 1
R语言与网站分析:数据集样例及分类算法实现
2016-02-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人