- 博客(4)
- 资源 (2)
- 收藏
- 关注
原创 python小技巧-动态进度条
有时候我们需要使用print打印工作进度,正常使用print函数会导致刷屏的现象,举个最简单的例子,从1打印到10,每次停顿0.1秒这样看起来很麻烦,有没有办法实现动态的进度显示呢?我们可以使用'\r',这个命令可以使光标重新返回头部,之后设置end='',取消python的打印自动换行的功能import timefor i in range(10): print('\r比例' ,i/...
2018-05-23 15:39:11 4418
原创 python爬虫实战-爬取猫眼电影榜单top100
猫眼电影是静态网页,并且不需要验证码,非常适合爬虫的入门练习,流程如下-通过url连接获取html内容,在html中通过正则表达式,我们提取排名,名称,主演,上映时间等信息,格式如下["9", "魂断蓝桥", "主演:费雯·丽,罗伯特·泰勒,露塞尔·沃特森", "上映时间:1940-05-17(美国)"]import requestsimport refrom bs4 import Beaut...
2018-05-22 16:34:29 2808
原创 正则表达式re库在python3的应用
正则表达式可以从目标文本中快速查找,匹配,替换设置的模式,举个例子py,pyy,pyyy,pyyyy...这个模式就是一个p和一个以上的y组成,常规办法不能穷尽,而且非常麻烦,正则表达式里面直接使用py+就可以表达出来,非常方便.比较常见的表达方式如下:模式描述^匹配字符串的开头$匹配字符串的末尾。.匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。[.....
2018-05-18 16:09:06 598
原创 python3爬虫-中国最好大学排名
使用python的requests和BeautifulSoup爬取前20个中国最好的大学,内容来源于最好大学这个网站,不需要登陆,直接可以访问静态网页内容,网页如下:直接可以提取信息,非常适合练习requests和BeautifulSoup功能.主程序需要几个部分组成首先载入必要的包import requestsfrom bs4 import BeautifulSoupimport bs4ge...
2018-05-16 16:48:35 3088 1
数据挖掘 概念与技术
2017-10-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人