python简单爬虫 指定汉字的笔画动图下载

python简单爬虫

指定汉字的笔画动图下载

分析过程
  1. 打开网址首页http://www.hanzi5.com
    汉字屋网站首页

  2. 选择一个字,比如“虐”
    虐字

  3. 查看该汉字动图地址

    右键该汉字动图,选择在新标签页打开在这里插入图片描述
    得到该图片的地址
    https://www.hanzi5.com/assets/bishun/animation/8650-bishun.gif
    在这里插入图片描述
    这里也可以查看网页代码来得到汉字动图地址
    右键汉字动图,选择检查
    在这里插入图片描述
    在这里插入图片描述
    右侧控制台,显示
    在这里插入图片描述
    同样得到汉字动图地址

  4. 多查看几个动图的地址
    “掠”https://www.hanzi5.com/assets/bishun/animation/63a0-bishun.gif
    “扁”https://www.hanzi5.com/assets/bishun/animation/6241-bishun.gif
    “龙”https://www.hanzi5.com/assets/bishun/animation/9f99-bishun.gif
    猜测不同的部分应该是汉字对应的编码

  5. 确定动图地址不同的部分是什么编码类型(utf-8,unicode,gbk16进制字符)
    在控制台js环境输入 ‘\u9f99’ 得到 ,说明是Unicode编码
    在这里插入图片描述

  6. 接下来对汉字进行编码,得到所需编码
    在这里插入图片描述
    9f99提取出来
    在这里插入图片描述
    再将字节型转换为字符型
    在这里插入图片描述

  7. 将得到的所需编码填入到动图地址中更换,即可得到任意汉字的动图地址

  8. 根据动图地址将图片下载即可

代码实现
import requests

def get_gif(word):
    url="https://www.hanzi5.com/assets/bishun/animation/"
    gif_name=word.encode('unicode_escape')[-4:].decode('ascii')+"-bishun.gif"
    r=requests.get(url+gif_name)
    print("正在下载"+word+"的笔画动图")
    with open("D:/{0}.gif".format(word),'wb') as f:
        f.write(r.content)
        
if __name__=='__main__':
    word_list='你好骚啊'
    for word in word_list:
        get_gif(word)
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值