python re获取a便签中的文本_python获取电影下载链接

最新推荐文章于 2023-10-30 15:45:35 发布

weixin_39759881

最新推荐文章于 2023-10-30 15:45:35 发布

阅读量676

点赞数

文章标签： python re获取a便签中的文本

本文链接：https://blog.csdn.net/weixin_39759881/article/details/111614014

版权

回复关键字，获取下载链接。软件关键字已汇总在“软件目录”栏。

环境python3

适用网站:https://www.993dy.com/

如下，访问路径https://www.993dy.com/vod-detail-id-36378.html

要将里面的链接，一个一个复制黏贴到剪切板，费时费力，这时可用python直接获取

代码

# 适用网站https://www.993dy.com/import requestsimport refrom bs4 import BeautifulSoupfrom lxml import etreeimport sysdef movie(url):  s = requests.Session()  #会话保持  response = s.get(url)  #r = requests.get(url)  '''  #beautifulesoup获取script内容  #soup = BeautifulSoup(response.text, "html.parser")  pattern = re.compile(r'var downurls="(.*?)";',re.MULTILINE | re.DOTALL)  #DOTALL正则中的点(.)能够匹配换行符(\n)  script = soup.find("script",text=pattern)  script = str(script)  '''  strscript = re.findall(r'var downurls="(.*?)";',str(response.text))[0].split('#')  # xpath获取标题  html = etree.HTML(response.text)  # 获取文本r.content  title = html.xpath('/html/body/div[4]/div[3]/div[1]/div[2]/h1/text()')[0] #xpath后添加/text()可获取文本  # 写入txt  print(title)  f = open("move.txt","a+", encoding = "utf-8")  f.write(title + '\n')  f.flush()  # 刷新缓冲区,就是立即写入文件，不写刷新就是关闭才能写入文件  '''  with open("move.txt", "a+", encoding = "utf-8") as f:    f.write(title)    f.write('\n')  '''  #strscript.pop() #弹出最后一个元素，因为用#分割完后最后一个元素为空  for i in strscript[:-1]:    try:      print(i.split('$')[1])      f.write(i.split('$')[1] + '\n')      f.flush()    except:      pass  f.write('\n')  f.close()  print("Finish！")if __name__ == "__main__":  if len(sys.argv)!=2:    print("Usage: python " + sys.argv[0] + " URL")  else:    movie(sys.argv[1])

演示

python movie.py https://www.993dy.com/vod-detail-id-36378.html

此时在当前目录会生成movie.txt的文件

因本人学识浅薄，文章若有存在的问题，请不吝赐教，笔者会万分感激并积极改进。

》》》持续更新ing 》》》

weixin_39759881

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫