最近公司搞图文编辑器,已经差不多了。还差一个一键发布到微信,这个功能本身简单,微信接口都有,只有一个要将图片上传到微信然后替换里面图片的链接有点麻烦。当然说这个麻烦是指不用Beautiful Soup的话。
先安装,使用pip直接安装,建议安装beautifulsoup4。
安装完后直接搞起:
from bs4 import BeautifulSoup
html_doc = '''
<html>
<head>
</head>
<body>
<p class="z_p" style="margin-top: 5px; margin-bottom: 5px; line-height: 2em;">
我是正文。。。。。。
<img class="z_img" src="http://qn.media.xxx.com/1.png" style="width: 100%; "/>
</p>
<p class="z_p" style="margin-top: 5px; margin-bottom: 5px; line-height: 2em;">
<img class="z_img" src="http://qn.media.xxx.com/2.png" style="width: 100%;"/>
</p>
</body>
</html>
'''
soup = BeautifulSoup(html_doc)
# 查看soup内容
print soup.prettify()
# 查出所有img标签,得到一个数组
imgs = soup.find_all('img')
[<img class="z_img" src="http://qn.media.xxx.com/1.png" style="width: 100%; "/>, <img class="z_img" src="http://qn.media.xxx.com/2.png" style="width: 100%;"/>]
# 循环替换src, upload_weixin()函数为我自己定义函数,你可以简单做个替换
def upload_weixin(src):
return 'weixin_uri%s' % src
for img in imgs:
src = img.attrs.get('src')
res = upload_weixin(src)
img.attrs['src'] = res.get('url')
print soup.prettify()
是否img标签内的src被替换了呢?
参考:
https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html
http://mp.weixin.qq.com/wiki/10/10ea5a44870f53d79449290dfd43d006.html