大众点评加密评论的抓取

问题:

在评论中用csv图片来代替显示文字

(查看图片建议右键-新标签打开链接)

解决办法:

  整体思路:

    1、找到这个<span class="tfagoa"></span> 表情的类名"tfagoa"和显示的字的对应关系,比如 tfagoa =》 "谢",tfatx8=》"范"

  处理细节:

重点一:首先我们看到这个<span class="tfagoa"></span> 的css发现它的"width:14px;"background:-364px,-1218px"

(查看图片建议右键-新标签打开链接)

    

 

重点二:我们在链接http://s3plus.meituan.net/v1/mss_0a06a471f9514fc79c981b5466f56b91/svgtextcss/b97c31d7f34ed17de04fd2c38a11e064.css找到了所有的加密字className的css样式值

(查看图片建议右键-新标签打开链接)

重点三:我们在链接http://s3plus.meituan.net/v1/mss_0a06a471f9514fc79c981b5466f56b91/svgtextcss/e90664f2dc11c63fff7ee3d5f0b190c8.svg找到了所有的加密的文字,

特别注意text的y属性的值

 

 小结:

  到此我们找到了所有的加密的文字,加密的文字的className和css属性值

  下一步:我们要把className和文字的对应关系匹配上

匹配规则:

  还拿上文的这个来举例<span class="tfagoa"></span> 的css发现它的"width:14px;"background:-364px,-1218px"

   1、background的x -364取正值364/14(width的值)为26  即 abs(-364)/14=26

   2、background的y -1218取正值和上文text的y值比较   1203<1218 <1241 所以取 1241

        所以className 为tfagoa 对应<text xmlns="http://www.w3.org/2000/svg" x="0" y="1241">写塞蜡少捉当唱攀酷赛腰啄参即绑咱派户喊管登胸蚂懒字衫谢萄路样必内斜谨稠洽授谣赖恒速壮</text>这行文字的第26个(从0开始数),也就是刚好是""字

按照这种方式就可以把所有的加密文字的className和所显示的字对应起来,做成字典,下次就可以直接通过className来获取文字了

参考链接:https://blog.csdn.net/sinat_32651363/article/details/85123876

转载于:https://www.cnblogs.com/7749ha/p/10594800.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
***欢迎的美食点评网站,同时也提供了旅游评论的功能。如果你想爬取大众点评的旅游评论数据,你可以遵循以下步骤: 1. 确定你要爬取的旅游评论的URL,可以根据地区和分类来筛选你感兴趣的评论。 2. 由于大众点评有较严格的防爬虫机制,你需要在请求时携带正确的cookie信息,并且控制你的爬取速度,避免过快的访问频率,以免被封禁IP。这样可以确保你的爬虫能够稳定地获取数据。 3. 大众点评的数据大部分都是经过加密的,你可能需要解密这些数据才能获取到可见的评论内容。 4. 在爬取评论数据时,你可以将数据存储到数据库中,以便后续进行分析和处理。 需要注意的是,在进行数据爬取时,请确保你遵守相关的法律法规,并且尊重网站的使用规定。另外,建议在爬取前先与网站进行授权和沟通,以免违反相关政策引发纠纷。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [python爬取大众点评某城市美食类数据](https://blog.csdn.net/weixin_41259961/article/details/117524921)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [dazhong:大众点评评论爬取](https://download.csdn.net/download/weixin_42110362/19277387)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值