- 博客(4)
- 收藏
- 关注
原创 那些年我们在Python掉进的坑——清除不想要的字符
起因,在spark运行的时候出现了这个错误打开ipython用pandas检查的时候发现后面几条是这个样子In [1]: import pandas as pdIn [2]: df = pd.read_csv("name_address.csv",sep=',',encoding='utf8')In [3]: df.keys()Out[3]:
2017-07-26 15:03:00 12411
原创 分治算法小结
对于分治算法来说,其算法设计策略主要分为三个步骤:1.我们要讲一个大问题分解成一些列规模大小基本相同的子问题2.解决这些子问题(这里通常会用到一些递归法)3.最后将其结果合并。这种策略可用的主要基础来自其工作量的平衡性。典型情况下,它能帮我们讲一个复杂度平方级别的运算降低到线性级别。我们所介绍的归并排序,快速排序以及集合中的最近点怼问题都是这方面的重要例子。在某些情况下(例如在
2017-07-24 10:08:15 392
原创 贪心算法和哈夫曼算法
贪心算法的特征:将每一个配对集看成一个局部解决方案1.先列出可能的配对方案,并将其合拍度按降序排列。2.从该列表中,选出第一个没有被使用过的配对方案3.检查该配对方案中的人是否已经被占用了,是的话放弃,否则就予以采纳4.检查列表中是否还有更多的配对方案,如果是,返回2哈夫曼算法哈弗曼算法属于贪心法的一种,其基本思路是:编码以字符出现的频率作为权重,每次选权重最小的两个节
2017-07-22 14:41:05 1642
原创 那些年我们在python掉进的坑系列之一pandas的to_sql
在目前大数据和人工智能的大趋势下,越来越多的人开始学习python作为自己入手数据和AI的第一门语言,笔者也是如此。很多人在接触python的第一步都是学习pandas,主要是这个框架是最接近于R和Matlab学习起来轻松易懂。但是在pandas的使用中,有很多问题和很多人因为对编程和计算机概念不理解,导致很多很多的坑,笔者在此开一个系列博文,不定期更新中会将自己遇到的坑介绍给大家。p
2017-06-07 09:29:54 33439 17
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人