自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 【Python】django 解决跨域问题

【代码】【Python】django 解决跨域问题。

2023-10-07 13:22:03 167

原创 【Windows】下载 Chrome 离线安装包

下载 Windows 64位 Chrome 离线安装包

2023-10-06 14:56:47 255

原创 【Linux】Host key verification failed 解决办法

在使用终端通过ssh连接Linux服务器时,可能会出现无法连接的情况,提示:Host key verification failed.这种情况可能是因为通过ssh连接过这个服务器之后,服务器又进行了重装。如下图:这时,只需要输入ssh-keygen -R + 要连接的设备的IP地址就能解决这个问题了。如下图:...

2021-03-09 00:17:11 2591 1

原创 【Python基础】使用 pip 安装第三方库失败的解决方案

使用 pip 安装第三方库时,经常会出现安装失败的现象,表现是安装过程中出现红色字样,这表示安装过程中出现错误。进入之后,下划可以看到许多第三方库,选择合适的 .whl 文件下载,并放到一个合适的目录。,进入目录之后,直接 pip 安装即可,输入。下载第三方库的链接为。

2020-05-21 17:08:22 716 1

原创 【Python爬虫】爬取知乎推荐问题(含模拟登陆)

其中,为了实现模拟登陆,需要在浏览器完成登录之后,手动复制 Cookie 并代替代码中的 Cookie。以下代码可以爬取知乎推荐阅读内容的问题,并存储在D:\ \zhihu.txt 中。【Python爬虫】爬取知乎推荐问题(含模拟登陆)

2020-05-17 10:33:13 636

原创 【Python爬虫】爬取 LOL 全英雄全皮肤图片

以下代码可以爬取 LOL 官方网站资料库中英雄的全部皮肤的图片,图片存放在 D:\ \LOL 目录下。其中,876是当前英雄id的最大值。如果需要,可以改成最新值。【Python爬虫】爬取 LOL 全英雄全皮肤图片。

2020-05-17 10:25:41 560

原创 【Python爬虫】彼岸桌面 1080P 壁纸爬虫

【Python爬虫】彼岸桌面 1080P 壁纸爬虫以下代码可以爬取彼岸桌面几乎全部 1080P 壁纸共两万张左右,为了减小网站的压力,我设置了 time.sleep() 。下载后的壁纸会存放在 D:\bizhi 目录下,鉴于前几年的壁纸内容质量低,建议把代码中6146改成20000左右的数字。from requests_html import HTMLSessionimport reimport timeos.mkdir('D:\\bizhi')session = HTMLSession()

2020-05-17 10:13:29 523

原创 【Python爬虫】爬取京东商品图片

from requests_html import HTMLSessionimport reimport osimport timesession = HTMLSession()for j in range(1,30): #睡眠两秒钟 time.sleep(2) #改变下一行中的‘python’,例如‘手机’、‘零食’就可以爬取对应内容 url = 'https://search.jd.com/Search?keyword=python&wq=pytho

2020-05-12 20:47:47 800

原创 【Python基础】re 正则表达式

【Python基础】re 正则表达式文章目录【Python基础】re 正则表达式re.match() 方法re.sreach() 方法re.sub() 方法re.compile() 方法findall()re.finditer() 方法re.split() 方法修饰符:正则表达式模式实例re.match() 方法#语法:re.match(pattern,string,flags=0)#举例:print(re.match('www','www.abc.com'))#<re.Match o

2020-05-12 16:59:16 215

原创 【Python爬虫】Beautiful Soup 文档

【Python爬虫】Beautiful Soup 文档文章目录【Python爬虫】Beautiful Soup 文档快速开始安装 Beautiful Soup安装解析器如何使用对象的种类Tag搜索文档树字符串正则表达式列表Truefind_all()find()CSS选择器Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库。快速开始手动定义一个网页文件,供后续使用。html_doc = """<html><head><title&

2020-05-12 11:22:26 499

原创 【Python爬虫】利用python自动翻译文本

【Python爬虫】利用python自动翻译文本首先,打开 google 翻译网站。https://translate.google.cn/https://translate.google.cn/ https://translate.google.cn/然后,让我们试着翻译几个单词,看一下网址会有什么变化。翻译模式翻译内容对应网址自动检测---->中文hellohttps://translate.google.cn/#view=home&op=trans

2020-05-10 21:04:46 1014

原创 【Python爬虫】如何用Python爬取异步加载的网页?以京东商品评论为例。

如何用python爬取异步加载的网页?以京东商品评论为例。在用python爬取网页时,会遇到网页不是一次性全部加载的情况,这种网页会在某种操作后,才加载对应的部分,拿京东来说,点进商品页面,并不会直接加载评论部分内容,而是在点击“评论”标签后才会加载第一页评论的内容,点击“下一页”之后,才会加载第二页评论的内容。对于这些异步加载的内容,直接爬取的方式是行不通的,所以要通过找到异步加载内容的ur...

2020-05-07 17:02:42 1238

原创 【Python爬虫】新浪微博热搜爬虫

新浪微博热搜爬虫第一步:进入新浪热搜完整榜单页面,记录页面网址。第二步:按F12,打开开发者工具。(使用Chorme浏览器)第三步:点击开发者工具左上角图标,然后点选热搜榜中的文字,就可以找出热搜榜中的每一个在网页中的具体位置。第四步:在开发者工具中的蓝色部分右击鼠标,依次选择Copy–Copy selector,就可以获得到这个热搜位置的selector。第五步:依次复制前几个...

2020-05-07 11:09:59 2148

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除