python
unteny
这个作者很懒,什么都没留下…
展开
-
python爬虫初遇(win10)基础概念
网络爬虫运行原理分为通用网络爬虫和聚焦网络爬虫通用网络爬虫对某一站点(url)进行不重复抓取并记录,直到找到满足条件的url。聚焦网络爬虫对定义的item对某一站点爬取并过滤,留下需要的url列表,计算权重后继续爬直到满足条件。信息提取表达式正则表达式、Xpath表达式等用来对信息进行提取筛选,找出我们需要的表达式。正则表达式原子原子是正则表达式中最基本的组成单位,...原创 2019-08-04 14:12:48 · 176 阅读 · 0 评论 -
python爬虫基础知识2及简单爬虫(csdn)
贪婪模式尽可能多的匹配懒惰模式尽可能少的匹配正则表达式函数match 从头开始匹配search 从左到右第一个全局匹配函数 所有匹配的格式re.sub() 替换实例匹配 匹配.com 和.cn网址匹配电话号码抓取豆瓣阅读出版社信息读取...原创 2019-08-04 16:33:00 · 120 阅读 · 0 评论 -
puthon安装geany文本编辑器的报错
安装python后安装文本编辑器时报错。编辑器没有找到python的位置需要我们自己进行设置,打开geany生成--设置生成命令;编译命令:地址+空格±m py_compile “%f”执行命令:地址+空格+"%f"然后设置编译命令(Compile)和执行命令(执行)的路径:"C:\Program Files (x86)\Microsoft Visual Studio\S...原创 2019-07-27 18:04:03 · 386 阅读 · 0 评论 -
python学习基础知识1
python之禅()《python之禅》,提姆·彼得斯著美胜于丑。显式优于隐式。简单胜于复杂。复杂总比费解好。平的比嵌套的好。稀疏胜于稠密。可读性计数。特殊情况不足以打破规则。实用性胜过纯洁性。错误永远不会悄悄地过去。除非明确沉默。面对歧义,拒绝猜测的诱惑。应该有一种——最好只有一种——显而易见的方法来做到这一点。不过,如果不是荷兰人的话,这种方式一开始可能并不...原创 2019-07-28 11:31:43 · 124 阅读 · 0 评论