利用python 实现简单爬虫

最新推荐文章于 2022-07-03 21:00:32 发布

一朵红杏

最新推荐文章于 2022-07-03 21:00:32 发布

阅读量725

点赞数

分类专栏： python 文章标签： python 爬虫 utf-8 pickle

本文链接：https://blog.csdn.net/java_goodstudy/article/details/54024905

版权

python 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

# coding:utf-8
import re
import requests
# 获取网页内容

import pickle

r = requests.get('http://www.163.com')
data = r.text

serialInfo = '';

# 利用正则查找所有连接
link_list =re.findall(r"(?<=content=\").+?(?=\")|(?<=content=\').+?(?=\')" ,data)
for url in link_list:
    serialInfo += url+'----';
    print url

f=open('demo.txt','wb',0)


pickle.dump(serialInfo,f)

obj2 = pickle.load(open("demo.txt", "r"))


print '-------->'
print obj2

f.close()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一朵红杏

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
利用python 实现简单爬虫

# coding:utf-8import reimport requests# 获取网页内容import pickler = requests.get('http://www.163.com')data = r.textserialInfo = '';# 利用正则查找所有连接link_list =re.findall(r"(?<=content=\").+?(?=\")|(?<=conte
复制链接

扫一扫