----Python
syrdbt
这个作者很懒,什么都没留下…
展开
-
python 对字符串进行简单切片
# python3 str = 'hello world!' # 获得字符串前5个字符: hello print(str[:5]) # 等同于 print(str[0:5]) # 获得字符串 [2,5) 一共三个字符: llo print(str[2:5]) # 获得字符串[6,len(str))之后的字符: world!(一共6个字符) print(str[6:]) # 下标从最右边以...原创 2018-07-26 11:58:35 · 2365 阅读 · 0 评论 -
爬取博客信息的简单爬虫
调用 getOneBlogDetails( ) 函数可以获取目标网页的博主姓名, 个人主页网址,原创文章、粉丝、喜欢、评论数量, 等级、访问量、积分、排名。 #!/usr/lib/python3.6 #encoding = utf-8 #爬取一个博客的基本信息 #本爬虫仅用于学习,纯属爱好,虽然本爬虫很简单,但还是请大家不要滥用 import requests from bs...原创 2018-08-05 22:05:07 · 1236 阅读 · 0 评论 -
爬取安居客上住房信息的简单爬虫 ,并存储为表格文件
代码如下,有注释进行介绍: #本爬虫仅用于学习,纯属爱好,虽然本爬虫很简单,但还是请大家不要滥用 #python3, Firefox浏览器 import requests from bs4 import BeautifulSoup import time import csv # 定制请求头,请求头在浏览器中查看,具体方法见附录一 headers = { 'User-Agent':...原创 2018-07-26 11:15:02 · 3634 阅读 · 6 评论 -
获取一篇新浪文章信息的简单爬虫
具体代码如下,有详细的注释: # 本爬虫仅用于学习,纯属爱好,虽然本爬虫很简单,但还是请大家不要滥用 # python3 # 主要采用的 requests库,BeautifulSoup库 import requests from bs4 import BeautifulSoup #将要爬取的新浪文章的网址 url = "http://news.sina.com.cn/c/xl/2018-07...原创 2018-07-26 10:22:25 · 656 阅读 · 0 评论