爬虫代码部分补充

最新推荐文章于 2024-07-12 16:42:46 发布

指望贾泓钰写博客?

最新推荐文章于 2024-07-12 16:42:46 发布

阅读量113

点赞数

分类专栏：爬虫文章标签：爬虫

本文链接：https://blog.csdn.net/qq_39629908/article/details/103320527

版权

爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

import io
import requests
import sys
from bs4 import BeautifulSoup
#获取百度html信息
sys.stdout= io.TextIOWrapper(sys.stdout.buffer,encoding='utf-8')
print(sys.getdefaultencoding())
url = 'http://www.baidu.com'
html = requests.get(url)
print(html.encoding)
html = html.text
html = html.encode('ISO-8859-1')
html = html.decode('utf-8')
#print(html)
soup = BeautifulSoup(html,'html.parser')
#print(soup)
#data = soup.select('#u1 > a')
def get_str_btw(s,f,b):
    par = s.partition(f)
    return (par[2].partition(b))[0][:]
a="123455asdjhfs99"
#for link in soup.select('#u1 > a'):
print(get_str_btw(a,"123","99"))

48
49
50
51
``

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

指望贾泓钰写博客?

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫代码部分补充

import ioimport requestsimport sysfrom bs4 import BeautifulSoup#获取百度html信息sys.stdout= io.TextIOWrapper(sys.stdout.buffer,encoding='utf-8')print(sys.getdefaultencoding())url = 'http://www.baidu....
复制链接

扫一扫