Python带你把长生修仙获取保存成txt文本,随时随地观看

前言

嗨喽,大家好呀~这里是爱看美女的茜茜呐

知识点:

  1. 爬虫基本流程

  2. 文本内容爬取

  3. requests模块的使用

开发环境:

  • python3.8 解释器版本

  • pycharm 代码编辑器

  • requests 第三方模块 工具 写爬虫工具

安装方法:

win + R 输入cmd 输入安装命令 pip install 模块名

(如果你觉得安装速度比较慢, 你可以切换国内镜像源)

本次 采集目标:长生修仙


👇 👇 👇 更多精彩机密、教程,尽在下方,赶紧点击了解吧~

素材、视频教程、完整代码、插件安装教程我都准备好了,直接在文末名片自取就可


代码展示

导入模块

import re

import requests     # 第三方模块 额外安装
import subprocess
from functools import partial

处理execjs编码报错问题, 需在 import execjs之前

subprocess.Popen = partial(subprocess.Popen, encoding="utf-8")
import execjs

模拟伪装

headers = {
    'cookie': '_yep_uuid=91105a3f-2138-b178-0916-0a719337d542; newstatisticUUID=1676386777_1569780922; _csrfToken=xUEjYQKU38aGlwuxlHidLNQt9RyYav6g1BLMV9zL; fu=1328880709; qdrs=0%7C3%7C0%7C0%7C1; showSectionCommentGuide=1; qdgd=1; gender=male; _ga_D20NXNVDG2=GS1.1.1676438921.1.0.1676438926.0.0.0; _ga_VMQL7235X0=GS1.1.1676438921.1.0.1676438926.0.0.0; supportWebp=true; supportwebp=true; rcr=1031940621%2C1035342339%2C1036092585%2C1031914361%2C1033218910%2C1033906963; navWelfareTime=1684584927335; traffic_utm_referer=; _gid=GA1.2.1036518770.1687867584; trkf=1; tgw_l7_route=958e321d4c24e87a429866baadaae8a2; Hm_lvt_f00f67093ce2f38f215010b699629083=1687088594,1687867583,1687871867; ftt=1035614679; ywguid=3421355804; ywkey=ywRKsfLj5trD; ywopenid=D68B802379E8A832FDD247C653C87918; Hm_lpvt_f00f67093ce2f38f215010b699629083=1687872354; _ga_PFYW0QLV3P=GS1.1.1687871840.17.1.1687872354.0.0.0; _ga_FZMMH98S83=GS1.1.1687871840.17.1.1687872354.0.0.0; _ga=GA1.2.429471767.1676386779',

}
ctx = execjs.compile(open('起点.js', mode='r', encoding='utf-8').read())
  1. 发送请求
url = 'https://******/chapter/1035614679/755998264/'
response = requests.get(url=url, headers=headers)
  1. 获取数据
html_data = response.text
# print(html_data)
  1. 提取数据
# "content":".*?","riskInfo"
arg1 = re.findall('"content":"(.*?)"', html_data)[0]
arg2 = url.split('/')[-2]
# arg2 = '740010775'
arg3 = '0'
arg4 = re.findall('"fkp":"(.*?)"', html_data)[0]
# arg4 = 'd2luZG93Lm9ua2V5Zm9jdXMoIlcwM0NHU1pzbEhrVERKSy9tcW0yd2JNUS9MemdtQWdRN2hSWEpBd01ZMklocG5DbHRrNU1abW5LN2h3eEFiTnFsQWFOSGJzRElkMVZ2YlZZVENzUUdJMTVvTlM5WHdjNURFb2xiZFp0dGJwa3ZyVlUxRTU0NVlsNG12VStmV1c1OU44aVZlajhEd1NFRjhITlhhemQyNnl0aGlDYlgvbFk4UUVnakw3RGNJNEIraUdNd2l5Uk91aUgrYnhrc0FLK2ZvSlJzaFNTMTNEOUN3S04vQ3NFNS8xRUdmYUJpQm55bTk3MEdHQzdSaUk9IiwgMTYzNTc1NzQyMSk=';
arg5 = '1'
result = ctx.call('sdk', arg1, arg2, arg3, arg4, arg5)
print(result)

# text = re.findall('"content":"(.*?)","riskInfo"', html_data)[0]
# text = text.replace('\\u003cp>', '\n')
  1. 保存数据
# f = open('1.txt', mode='w', encoding='utf-8')
# f.write(text)

尾语

感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值