爬取安居客租房数字乱码求解决

最新推荐文章于 2021-03-26 18:16:05 发布

嘿，小胖墩

最新推荐文章于 2021-03-26 18:16:05 发布

阅读量1.1k

点赞数 1

分类专栏： Python爬虫文章标签：乱码 xpath

本文链接：https://blog.csdn.net/zql200008/article/details/103973085

版权

博主在尝试爬取安居客租房信息时，遭遇数字显示为乱码的困扰，经过一下午的努力，虽然解决了乱码问题，但发现所获取的数字均为虚假数据。现寻求社区高手帮助，分享解决此类问题的方案。附上代码，期待即时解答。

摘要由CSDN通过智能技术生成

弄一下午的爬虫好不容易把数字的乱码解决了却发现里面的数字全部都是假的，大佬们看到能帮我解决一下嘛在线等啊下面是我写的代码

import requests
from lxml import etree
import time
import json
import random
import base64
from fontTools.ttLib import TTFont
import re
from io import BytesIO
name = input('请输入城市（拼音）:')
urlt = 'https://'+name+'.zu.anjuke.com'
res = requests.get(urlt)
bs64_str = re.findall("charset=utf-8;base64,(.*?)'\)", res.text)[0]


def get_page_show_ret(string):
    font = TTFont(BytesIO(base64.decodebytes(bs64_str.encode())))
    c = font.getBestCmap()
    ret_list = []
    for char in string:
        decode_num = ord(char)
        if decode_num in c:
            num = c[decode_num]
            num = int(num[-2

最低0.47元/天解锁文章

嘿，小胖墩

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
爬取安居客租房数字乱码求解决

弄一下午的爬虫好不容易把数字的乱码解决了却发现里面的数字全部都是假的，大佬们看到能帮我解决一下嘛在线等啊下面是我写的代码import requestsfrom lxml import etreeimport timeimport jsonimport randomimport base64from fontTools.ttLib import TTFontimport refro...
复制链接

扫一扫

专栏目录