爬虫获取问答内容

最新推荐文章于 2022-04-18 18:26:43 发布

huibif

最新推荐文章于 2022-04-18 18:26:43 发布

阅读量389

点赞数

分类专栏：学习笔记文章标签： python 数据挖掘爬虫

本文链接：https://blog.csdn.net/xlionsky/article/details/111682987

版权

房产知识问答.
思路分析:
1.利用requests获取html文件
2.利用BeautifulSoup解析文件,获取问题和答案的字段
3.保存问答信息到本地文件

import requests
from bs4 import BeautifulSoup
import os

headers = {
   'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}

def getHTMLtext(url):
	try:
		r = requests.get(url,headers = headers,timeout = 30)
		r.raise_for_status()
		r.encoding = r.apparent_encoding

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

huibif

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
爬虫获取问答内容

房产知识问答.思路分析:1.利用requests获取html文件2.利用BeautifulSoup解析文件,获取问题和答案的字段3.保存问答信息到本地文件import requestsfrom bs4 import BeautifulSoupimport osheaders = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809
复制链接

扫一扫