python项目代码分析_一个简单的github 500+赞的python项目分析

最新推荐文章于 2022-12-31 21:12:59 发布

weixin_39757122

最新推荐文章于 2022-12-31 21:12:59 发布

阅读量78

点赞数

文章标签： python项目代码分析

简洁而具有创意。让我们来学习一下。

7917cd1311c0

Donald Trump wearing a suit and tie

图像描述效果

7917cd1311c0

痛点

我们知道，在编写网页(html)时，对图片(img)标签的文本描述(alt)属性的填写总是让人觉得麻烦（实现更好的SEO），有没有什么办法解决这个烦恼呢？有没有可能让它不烦人，自动化完成呢？

解决

Altify 以两百行不到的python代码实现了对html文件中的图片的alt属性的自动生成。主要是运用了微软提供的深度学习图像识别API来产生图片相应的描述性语言，然后利用该描述性语言自动填充待处理的html文件中的图片属性。整个步骤一个命令就可以完成，且描述效果很好。

效果

7917cd1311c0

分析

用BeautifulSoup分析要处理的html文件

找到所有的图片标签

使用uploads.im网站的API上传图片，得到图片的url，然后使用该url向微软的API请求，得到图片的描述性语言。（对于图片宽度小于200px的不予处理）

填写html中所有图片的alt属性

将编辑后的html文件保存在原html文件旁边

整个代码主要是三个函数：

def apply(html_file, api_key)

利用BeautifulSoup分析html文件，修改html中的图片标签的属性，将修改后的html保存

apply 调用 upload 和 caption 函数

def upload(image_address)

上传图片得到图片的url和宽度

def caption(image_src, api_key)

请求微软的api获取描述性文本

主要使用库：

BeautifulSoup 爬虫常用的简便好使的html处理库。

requests httplib urllib 网络请求常用库。实际上只用requests就够了。

argparse 命令行参数解析库。

其原理简单，逻辑清晰，没有大难点。

启发

把合适的工具组合起来用于合适的情景中就能产生很好的效果。

利用现成的API和python简便的网络请求功能以及广泛的第三方库，可以实现很有用的功能。

Python简洁强大的特性在自动化方面具有很大的优势。

适用Py3 - 微软API访问修改

import json

import requests

api_url = 'http://api.projectoxford.ai/vision/v1.0/describe'

api_key = "d0a6afa1311e4baabd6666692762eaea"

image_src = "http://h.hiphotos.baidu.com/image/h%3D200/sign=9d91b09b6f63f624035d3e03b745eb32/b90e7bec54e736d140a0b7aa9f504fc2d46269e4.jpg"

# 测试图片

headers = {

# Request headers

'Content-Type': 'application/json',

'Ocp-Apim-Subscription-Key': api_key,

}

data = {

# Request parameters

'maxCandidates': '1',

"Url": image_src,

}

data = json.dumps(data, separators=(',',':'))

r = requests.post(api_url, data = data, headers = headers)

captioned_data = r.json()['description']['captions'][0]["text"]

# 测试返回为 'a dog sitting in the grass'

# 此外用py3的话，源码中的BeautifulSoup函数删掉第二个参数，并且去掉一些冗余的引用库

返回数据

7917cd1311c0

其它

源码中使用的Uploads.im 是一个简单快速提供图片上传服务的网站，功能类似国内的七牛云。

7917cd1311c0

获取一个免费的微软机器视觉服务的 API Key。使用微软账户登录该网址后就能获取到Key了。如下图，在Computer Vision栏里。

7917cd1311c0

7917cd1311c0

此外可以学习的地方

res = 0

# Use this loop to see if a file with the same name exits. If ti does, add a suffix.

while os.path.exists(os.path.dirname(html_file) + "/altify" + str(res) +".html"):

res+=1

parsed_html = BeautifulSoup(html_data)

parsed_html.prettify()

# 将修改后的html美化后保存

weixin_39757122

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python项目代码分析_一个简单的github 500+赞的python项目分析

简洁而具有创意。让我们来学习一下。Donald Trump wearing a suit and tie图像描述效果痛点我们知道，在编写网页(html)时，对图片(img)标签的文本描述(alt)属性的填写总是让人觉得麻烦（实现更好的SEO），有没有什么办法解决这个烦恼呢？有没有可能让它不烦人，自动化完成呢？解决Altify 以两百行不到的python代码实现了对html文件中的图片的alt属性的...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。