中财网内容页爬虫

最新推荐文章于 2023-03-21 22:00:02 发布

强延飞

最新推荐文章于 2023-03-21 22:00:02 发布

阅读量243

点赞数

文章标签： python

本文链接：https://blog.csdn.net/weixin_44146481/article/details/115724282

版权

爬取中财网内容页
一部分内容页，新闻主题部分的内容unicode编码替换了
例如

http://industry.cfi.cn/p20210415000078.html

代码：

import requests
from bs4 import BeautifulSoup
import re
import time
import json
import urllib.parse

# url = 'http://industry.cfi.cn/p20210415000078.html'
# url = 'http://industry.cfi.cn/p20210415000413.html'
url = 'http://industry.cfi.cn/p20210411000066.html'
r = requests.get(url,)
html = r.text
# print(html)
if '</div><script>var'

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

强延飞

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
中财网内容页爬虫

爬取中财网内容页一部分内容页，新闻主题部分的内容unicode编码替换了例如http://industry.cfi.cn/p20210415000078.html代码：import requestsfrom bs4 import BeautifulSoupimport reimport timeimport jsonimport urllib.parse# url = 'http://industry.cfi.cn/p20210415000078.html'# url = 'htt
复制链接

扫一扫