
----Python
syrdbt
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python 对字符串进行简单切片
# python3str = 'hello world!'# 获得字符串前5个字符: helloprint(str[:5]) # 等同于 print(str[0:5])# 获得字符串 [2,5) 一共三个字符: lloprint(str[2:5])# 获得字符串[6,len(str))之后的字符: world!(一共6个字符)print(str[6:])# 下标从最右边以...原创 2018-07-26 11:58:35 · 2485 阅读 · 0 评论 -
爬取博客信息的简单爬虫
调用 getOneBlogDetails( ) 函数可以获取目标网页的博主姓名, 个人主页网址,原创文章、粉丝、喜欢、评论数量, 等级、访问量、积分、排名。#!/usr/lib/python3.6#encoding = utf-8#爬取一个博客的基本信息#本爬虫仅用于学习,纯属爱好,虽然本爬虫很简单,但还是请大家不要滥用import requestsfrom bs...原创 2018-08-05 22:05:07 · 1299 阅读 · 0 评论 -
爬取安居客上住房信息的简单爬虫 ,并存储为表格文件
代码如下,有注释进行介绍:#本爬虫仅用于学习,纯属爱好,虽然本爬虫很简单,但还是请大家不要滥用#python3, Firefox浏览器import requestsfrom bs4 import BeautifulSoupimport timeimport csv# 定制请求头,请求头在浏览器中查看,具体方法见附录一headers = { 'User-Agent':...原创 2018-07-26 11:15:02 · 3716 阅读 · 6 评论 -
获取一篇新浪文章信息的简单爬虫
具体代码如下,有详细的注释:# 本爬虫仅用于学习,纯属爱好,虽然本爬虫很简单,但还是请大家不要滥用# python3# 主要采用的 requests库,BeautifulSoup库import requestsfrom bs4 import BeautifulSoup#将要爬取的新浪文章的网址url = "http://news.sina.com.cn/c/xl/2018-07...原创 2018-07-26 10:22:25 · 718 阅读 · 0 评论