【python 爬虫】识别网站所用技术

有一个十分有用的工具可以检查网站构建的技术类型——builtwith 模块(只支持python2环境,python3环境报错)。

pip install builtwith

该模块将 URL 作为参数,下载该 URL 并对其进行分析,然后返回该网站使用的技术。

举个例子:

>>> import builtwith
>>> builtwith.parse('http://xxxxxxxxxxxxxxxxxx')
{u'javascript-frameworks': [u'jQuery', u'Moment.js'], u'web-frameworks': [u'Flask', u'Twitter Bootstrap'], u'programming-languages': [u'Python'], u'web-servers': [u'Python']}
>>> 

用的python flask框架写的。

再来看下csdn用的什么技术。(lua语言写的)

>>> builtwith.parse('http://blog.csdn.net/')
{u'javascript-frameworks': [u'jQuery'], u'font-scripts': [u'Font Awesome'], u'web-frameworks': [u'Twitter Bootstrap'], u'programming-languages': [u'Lua'], u'web-servers': [u'OpenResty', u'Nginx']}
>>> 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

东华果汁哥

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值