Python
文章平均质量分 80
天岚锦辰
还没有定方向的研究生
展开
-
65条最常用正则表达式,你要的都在这里了
很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求。所以我最近把开发中常用的一些正则表达式整理了一下,在这里分享一下。给自己留个底,也给朋友们做个参考。 一、校验数字的表达式 1 数字:^[0-9]*$ 2 n位的数字:^\d{n}$ 3 至少n位的数字:^\d{n,}$ 4 m-n位的数字:^\d{m,n}$ 5 零转载 2017-03-08 22:14:03 · 247 阅读 · 0 评论 -
一步一步学网络爬虫(从python到scrapy)
转自:http://blog.csdn.net/sunnyxiaohu/article/details/50787430 大概花了一个星期的时间,学习了一下网络爬虫的知识,现在使用scrapy能爬一些基本的网页,图片,解决网页编码兼容问题,基础的模拟登陆。对于有些模拟登陆,由于其提交的表单要经过js进行处理后提交;更难的其网页也是经js渲染的,要学会一步步去分析,没有太多的去深入,但我会提到转载 2017-03-06 12:27:12 · 484 阅读 · 0 评论 -
python列表的简单使用
python列表是一个很好用的工具,他就像C语言中的数组,但是又可以混杂不同类型的数据。 1.列表的创建movies=["The Holy Grail","The Life of Brain","The Meaning of Life"] print(movies) print(movies[1]) 列表可以按数组的形式来读取想要的字符串或者其他类型的数据 2.列表的插入与删除 movie原创 2017-03-08 08:40:48 · 186 阅读 · 0 评论 -
[这段代码很Pythonic]相见恨晚的itertools库
转自忆先 前言 最近事情不是很多,想写一些技术文章分享给大家,同时也对自己一段时间来碎片化接受的知识进行一下梳理,所谓写清楚才能说清楚,说清楚才能想清楚,就是这个道理了。 很多人都致力于把Python代码写得更Pythonic,一来更符合规范且容易阅读,二来一般Pythonic的代码在执行上也更有效率。今天就先给大家介绍一下Python的系统库itertools。转载 2017-03-15 11:36:46 · 245 阅读 · 0 评论 -
常用查找数据结构及算法(Python实现)
转自银河系1234 目录 一、基本概念 二、无序表查找 三、有序表查找 3.1 二分查找(Binary Search) 3.2 插值查找 3.3 斐波那契查找 四、线性索引查找 4.1 稠密索引 4.2 分块索引 4.3 倒排索引 五、二叉排序树 六、 平衡二叉树 七、多路查找树(B树) 7.1 2-3树 7.2 2-3-4树 7.转载 2017-03-15 11:43:12 · 385 阅读 · 0 评论 -
基于python的七种经典排序算法
转自银河系1234 参考书目:《大话数据结构》 一、排序的基本概念和分类 所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。排序算法,就是如何使得记录按照要求排列的方法。 排序的稳定性: 经过某种排序后,如果两个记录序号同等,且两者在原无序记录中的先后秩序依然保持不变,则称所使用的排序方法是稳定的,反之是不稳定的。 内排序和转载 2017-03-15 11:44:24 · 302 阅读 · 0 评论 -
scrapy学习——xpath的学习
定位 1.依靠自己属性,文本定位 //td[text()='xxx'] //div[contains(@class,'xxx')] //div[@class='xxx' and @type='xxx'] 2.依靠父节点定位 //div[@class='xxx']/div //div[@id='xxx']/div 3.依靠子节点定位 //div[div[@id='转载 2017-03-31 20:13:30 · 430 阅读 · 0 评论 -
机器学习之K-近邻算法
上学期险些挂了孙大圣的PRML(pattern recognition and machine learning)课之后,决定本学期重新学一遍机器学习的经典算法,为接下来的寻找论文方向铺路,经过2个礼拜的颓废之后,终于写下了这篇knn算法,虽然此类文章已经在网上烂大街了,不过还是决定重新梳理一下自己的思路。 首先定义一下K-邻近算法,它的工作原理是:存在一个样本数据集合,也称作数据集...原创 2018-03-22 21:04:35 · 183 阅读 · 0 评论