python表情包斗图_Python爬取斗图表情，让你成为斗图大佬

最新推荐文章于 2022-08-24 23:22:12 发布

weixin_39720865

最新推荐文章于 2022-08-24 23:22:12 发布

阅读量236

点赞数 1

文章标签： python表情包斗图

话不多说，上结果(只爬了10页内容)

上代码：(可直接运行) 用到Xpath

#encoding:utf-8

# __author__ = 'donghao'

# __time__ = 2018/12/24 15:20

import requests

import urllib.request

import urllib3

import os

import re

import time

from lxml import etree

def parse_page(url):

headers = {

'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:57.0) Gecko/20100101 Firefox/57.0'

}

resp = requests.get(url=url,headers=headers)

text = resp.text

html = etree.HTML(text)

imgs = html.xpath("//div[@class='page-content text-center']//img[@class!='gif']")

for img in imgs:

#获取图片url

img_url = img.get('data-original')

#获取图片Url的后缀名

end = os.path.splitext(img_url)[1]

#替换掉url中特殊字符

end = re.sub(r'[，。?？,/\\·]','',end)

# 获取图片描述,并加上后缀

name = img.get('alt')+end

#文件名为

#下载到本地文件夹

urllib.request.urlretrieve(img_url,'images/'+name)

def main():

#爬取10页

for x in range(1,10):

url = 'http://www.doutula.com/photo/list/?page=%d'%x

parse_page(url)

if __name__ == '__main__':

start = time.time()

main()

end = time.time()

print('耗时：%0.002fs' % (end - start))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39720865

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python爬虫入门教程15：音乐网站数据的爬取

2401_84689803的博客

04-29

1065

PS：如有需要 Python学习资料以及解答的小伙伴可以加点击下方链接自行获取基本开发环境💨Python 3.6Pycharm相关模块的使用💨import os安装Python并添加到环境变量，pip安装需要的相关模块即可。一、💥明确需求爬取某音乐网站的排行榜歌曲。二、💥网页数据分析1、F12或者鼠标右键点击检查打开开发者工具，点击播放音乐，下面会加载出音乐数据。

热门推荐

Yhen的博客

04-12

1万+

以下内容为本人原创，欢迎大家观看学习，禁止用于商业用途，转载请说明出处，谢谢合作！大噶好！我是python练习时长一个月的Yhen，今天向大家分享的是爬取去哪儿网旅游信息，特别感谢六星教育python学院，我就是在这里学的，老师讲的挺好挺仔细的，以下内容都是基于我在课堂上学到的，大家有兴趣可以到腾讯课堂报名听课，都是免费的。我的前两篇博客有讲到如何怕小说和爬知乎大佬的文...

参与评论您还未登录，请先登录后发表或查看评论

python 简单爬虫爬斗图

05-10

python 简单爬虫爬斗图直接运行就行，改变关键字，python3.6

python无敌了_斗图神器——python让你斗图无敌

weixin_39638859的博客

12-19

151

[Python] 纯文本查看复制代码from os import mkdirimport requests,resession=requests.session()def bqb(title):header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:62.0) Gecko/20100101 Firefox/62.0','Ho...

Python爬取斗图表情，让你成为斗图大佬

qq_42239520的博客

12-24

290

话不多说，上结果（只爬了10页内容）上代码：（可直接运行）用到Xpath #encoding:utf-8 # __author__ = 'donghao' # __time__ = 2018/12/24 15:20 import requests import urllib.request import urllib3 import os import re import ti...

python爬虫练手之斗图啦

围巾的ACM博客

05-13

1648

互联网时代，难免会和别人在线上聊天，而现在的年轻人呐！一言不合就开始斗图！我难道就默默看着别人装逼吗？NO!拒绝！所以呢借此机会我们找个表情网站，爬一波图片啦斗图网链接： https://www.doutula.com由于网站结构比较简单，没有异步加载，直接从html就能查找信息啦，所以就不做详细分析~#coding:utf-8 import requests import os fr

用python爬取斗图啦图片

lmdsq的专栏

12-29

2113

一、代码部分# -*- coding:utf-8 -*- ''' 0、用Python编写爬取斗图啦网站图片 1、python版本 python3.6 2、IDE PyCharm 2017.3 ''' import requests import urllib.request import re #获取每一个主页面中的分类条目url链接 def get_page(num): html =

斗图斗不过小伙伴？python多线程爬取斗图网表情包，助你成为斗图帝！

01-20

最近python基础课讲到了多线程，老师让交个多线程的实例练习。于是来试试多线程爬虫，正好复习一下mooc上自学的嵩天男神的爬虫知识。想法很美好，过程却很心酸，从早上开始写，每次出现各种奇怪问题，到现在晚上了...

[牢饭吃到饱？]制作爬取某网站表情包下载器

m0_51981443的博客

12-14

265

刚学一个月py，一个多星期爬虫，单纯分享记录下作业，… 爬取相关图片比较简单，也没有反爬就不解释。软件效果图：分享下代码： '''Powered By kkinn''' import re,requests,os,random,datetime def Download(): count = 0 url_list=[] want=int(input('*您想要大约多少张随机表情包？')) cunfang=input('*想给表情包文件夹命什么名呢？') K=T

30个数据科学工作中必备的Python包！

Python宋宋的专栏

08-19

546

Python 可以说是最容易入门的编程语言，在numpy，scipy等基础包的帮助下，对于数据的处理和机器学习来说Python可以说是目前最好的语言，在各位大佬和热心贡献者的帮助下Python拥有一个庞大的社区支持技术发展，开发两个各种 Python 包来帮助数据人员的工作。如果想要了解当前的网络趋势或与我们的关键字相关的趋势时，该软件包非常有用。Fairlearn API 有一个 selection_rate 函数，可以使用它来检测组模型预测之间的分数差异，以便我们可以看到结果的偏差。

微信小程序demo：斗图神器(源代码+截图)

06-19

图战（微信，qq互相斗图）

01-17

图战（微信，qq互相斗图）让你斗图是游刃有余，绝对战胜

Python | 自动生成表情包，从此斗图无敌手！

Python专栏

08-31

2350

来源：CSDNID：CSDnews作为一个数据分析师，应该信奉一句话——"一图胜千言"。不过这里要说的并不是数据可视化，而是一款全民向的产品形态——表情包！！！！表情包不...

用Python斗图，再配上个机器人，Monster Kill ！

Python专栏

01-26

382

...

手持Python，斗图不输！

Pythoncxy的博客

07-17

219

本文以抓取“斗图啦”（http://www.doutula.com/）中的图片为例来介绍如何使用python和正则表达式完成最基本的爬虫和文件下载工作。进入网站后，点击最新表情，并点击第二页，网页的url（http://www.doutula.com/photo/list/?page=2）同样发生了变化。不难发现，此网页的请求方式为最简单的get请求。 Python资源共享群：4840...

100行代码教你爬取斗图网(Python多线程队列)

melody_sy博客

08-16

1102

100行代码教你爬取斗图网(Python多线程队列) 前言根据之前写的两篇文章，想必大家对多线程和队列有了一个初步的了解，今天这篇文章就来实战一下，用多线程 + 队列爬取斗图网的全网图片。你还在为斗图找图片而烦恼吗？快来跟我一起 happy 吧！ PS：本文目的是抱以学习心态而分享，禁止用于非法以及商业途径，如有风险，一切后果自己承担！成果演示先来看看最后的成果：启动程序后，可以...

什么？十行代码实现了斗图？

你羡慕的生活都是你没熬过的苦。

08-24

1760

你好呀，我是小邹。评论区能斗图就好了。

程序员之间的斗图大作战! 代码可乱, 斗图不能输

C语言C++学习俱乐部：765860056

10-11

1204

每天面对一堆堆复杂的代码我相信许多热爱编程的小伙伴也一样顶不住枯燥吧！那么小编今天就放一些有关程序员的一些有趣的趣图，给大家解解闷吧！另外如果你想更好的提升你的编程能力，学好C语言C++编程！弯道超车，快人一步！笔者这里或许可以帮到你~ UP在主页上传了一些学习C/C++编程的视频教程，有兴趣或者正在学习的小伙伴一定要去看一看哦！会对你有帮助的~ 分享（源码、项目实战视频、项目笔记，基础入门教程）欢迎转行和学习编程的伙伴，利用更多的资料学

python制作斗图生成器

谭小谭的专栏

12-04

1153

网上各种带文字的表情图片都被大家玩坏了，今天就和大家一起用 python 亲自做一个带字表情图片生成器。不知道大家有没有看到网上有很多人都在说 "人生苦短，我用 python"，这句话我之前也不是很理解，觉得人生苦短和用python貌似并没有什么关系，后来算是对这句话慢慢有了自己的理解，我觉得一个重要的原因就是 python 有非常多的库，而且功能很强大，很多功能都不再需要自己造轮子...

python爬取表情包代码

最新发布

09-13

### 回答1：我可以回答这个问题。Python 爬取表情包的代码可以使用 requests 库和 BeautifulSoup 库来实现。首先，使用 requests 库发送 HTTP 请求获取表情包网站的 HTML 页面，然后使用 BeautifulSoup 库解析 HTML 页面，提取出表情包的图片链接，最后使用 requests 库下载图片并保存到本地即可。 ### 回答2： Python爬取表情包代码具体步骤如下： 1. 首先，导入所需要的库，包括requests和bs4。 ```python import requests from bs4 import BeautifulSoup ``` 2. 通过requests库发送一个GET请求，获取目标网页的内容。 ```python url = "目标网页的URL" response = requests.get(url) ``` 3. 使用BeautifulSoup库对获取到的网页内容进行解析，以便后续提取所需要的信息。 ```python soup = BeautifulSoup(response.text, "html.parser") ``` 4. 找到表情包所在的位置，通常是通过查看网页元素或者查看网页源代码来确定。使用BeautifulSoup库的find_all()方法或者select()方法提取所需的标签信息。 ```python images = soup.find_all("img") ``` 5. 遍历提取到的标签信息，获取表情包的URL，并进行下载保存。 ```python for img in images: img_url = img["src"] # 下载图片并保存 response = requests.get(img_url) with open("表情包.jpg", "wb") as f: f.write(response.content) ``` 6. 完成爬取后，关闭文件流等资源。 ```python f.close() ``` 需要注意的是，为了成功进行表情包的爬取，需要对目标网站进行适当的处理，如处理反爬机制、处理动态加载等。 ### 回答3： Python爬取表情包的代码主要分为以下几个步骤： 1. 引入所需模块：首先需要引入一些Python的库，例如requests库用于发送HTTP请求，beautifulsoup库用于解析HTML网页等。 2. 发送HTTP请求：使用requests库发送GET请求，获取表情包所在的网页内容。通常可以通过URL链接来访问表情包网页。 3. 解析HTML网页：使用beautifulsoup库解析网页内容，提取出表情包所在的页面元素，如图片链接、表情包标题等。可以利用beautifulsoup提供的选择器来定位特定的页面元素。 4. 下载表情包：通过提取到的图片链接，使用requests库发送GET请求，并保存图片到本地。下面是一个示例代码： ```python import requests from bs4 import BeautifulSoup def crawl_emoticons(): # 发送HTTP请求，获取表情包所在的网页内容 url = "https://www.example.com/emoticons" response = requests.get(url) # 解析HTML网页，提取表情包的图片链接 soup = BeautifulSoup(response.content, 'html.parser') emoticon_elements = soup.select('.emoticon img') emoticon_urls = [elem['src'] for elem in emoticon_elements] # 下载表情包图片并保存到本地 for i, url in enumerate(emoticon_urls): image_response = requests.get(url) with open(f"emoticon_{i}.jpg", 'wb') as f: f.write(image_response.content) crawl_emoticons() ``` 以上代码仅为示例，具体的实现方式可能因网页结构和需求而有所差异。

python表情包斗图_Python爬取 斗图表情，让你成为斗图大佬

python表情包斗图_Python爬取斗图表情，让你成为斗图大佬