自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (1)
  • 收藏
  • 关注

原创 关于win10桌面图标位置错乱的原因及解决办法

(1)任务管理器–详细信息–explorer.exe–右击–结束任务(这时没有桌面了)(2)快捷键Win+R, 运行:regedit–定位到:HKEY_CURRENT_USER\Software\Microsoft\Windows\Shell\Bags\1\Desktop找到右侧的 IconLayouts 和 Sort, 都删除掉!(3)按Ctrl+Alt+Del,注销。(4)重新登录后,你会发现桌面图标变回默认状态了,这时你可以手工排列图标,排好之后,再注销一次。(5)再重新登录后,桌面图标正常

2022-04-11 18:45:40 8007

原创 IP地址查询接口

http://ip-api.com/json/  # 国际化英文显示http://ip-api.com/json/?lang=zh-CN  # 中文显示http://ip-api.com/json/115.191.200.34?lang=zh-CN  # 查询某个ip的信息

2021-02-28 18:13:42 1177

原创 猿人学题目2:提取全部5页发布日热度的值,计算所有值的加和,并提交答案

import execjsimport requestsjs="""var document={};var location={};function $c(k) { var B = function () { var Y = true; return function (Z, a0) { var a1 = Y ? function () { if (a0) { var a2 = a0["apply"](Z, arguments)

2021-02-23 20:39:58 219

原创 猿人学任务4:采集这5页的全部数字,计算加和并提交结果

import execjsimport requestsimport hashlibimport base64import reheaders = { 'User-Agent': 'yuanrenxue.project',}def get_sum(page): url = 'http://match.yuanrenxue.com/api/match/4?page=%s' %page response = requests.get(url,headers=header

2021-02-21 19:40:27 1893

原创 猿人学任务3:抓取下列5页商标的数据,并将出现频率最高的申请号填入答案中

import requestsurl = "http://match.yuanrenxue.com/logo"HEADERS={ 'Host': 'match.yuanrenxue.com', 'Connection': 'keep-alive', 'Content-Length': '0', 'User-Agent': 'yuanrenxue.project', 'Accept': '*/*', 'Ori

2021-02-15 21:50:53 227

原创 猿人学题目1:抓取所有(5页)机票的价格,并计算所有机票价格的平均值,填入答案。

import requestsimport execjsjs = """var hexcase = 0;var b64pad = "";var chrsz = 16;function hex_md5(a) { return binl2hex(core_md5(str2binl(a), a.length * chrsz));}function b64_md5(a) { return binl2b64(core_md5(str2binl(a), a.length * chrsz

2021-02-14 19:37:25 347

原创 贝壳二手房爬虫

import requestsimport refrom fake_useragent import UserAgenturl = 'https://bj.ke.com/ershoufang/'headers = { 'User-Agent': UserAgent().random}response = requests.get(url,headers=headers)page = response.texttitle = r'<a class="VIEWDATA CLIC

2021-02-12 18:22:53 593 1

原创 酷狗音乐爬虫

import requestsimport reimport timeimport randomfrom fake_useragent import UserAgentsongs = input("请输入歌曲名:")url = 'https://songsearch.kugou.com/song_search_v2?callback=jQuery112409090559630919017_1585358668138&keyword=%s&page=1&pagesize=

2021-02-10 19:14:36 278

原创 正则表达式表示任意字符包括换行符

正则表达式匹配规则:([\s\S]*)注:[\s]表示,只要出现空白就匹配[\S]表示,非空白就匹配

2021-02-07 19:43:45 385

原创 Python解决使用requests请求网页乱码问题

url = 'https://zhidao.baidu.com/search?lm=0&rn=10&pn=0&fr=search&ie=gbk&word=%B8%D6%CB%BF%C9%FE'res = requests.get(url)print(res.encoding)print(res.apparent_encoding)res.text.encode(res.encoding).decode(res.apparent_encoding)

2021-02-03 13:54:48 53667 1

原创 2021-2-2有道翻译在线翻译爬虫

#encoding=utf-8#hashlib MD5加密import requests,fake_useragent,hashlib,timeclass youdao(object): def __init__(self,e): self.url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule' self.headers = {

2021-02-02 21:28:50 183

原创 mangabz漫画网鬼灭之刃漫画爬虫

mangabz漫画爬虫遇到的问题1:多线程导致内存溢出2:下载不全需执行多次3:日志打印混乱import requestsimport fake_useragentimport timefrom lxml import etreeimport osfrom selenium import webdriverfrom selenium.webdriver.support import waitfrom selenium.webdriver.support import expected

2021-01-27 09:54:59 8522

原创 CrawlSpider全站数据爬取

CrawlSpider的使用:1.创建一个工程scrapy startproject 项目名称2.cd 至项目路径3.创建爬虫文件(CrawlSpider) :scrapy genspider -t crawl 爬虫名称 www . XXXx. com#allow 用正则匹配规则注意.要转义 #callback 回调函数#follow 是否全站爬取 rules = ( Rule(LinkExtractor(allow=r'wallpaper_0_0_10_\d+\.html

2021-01-02 19:04:27 184 1

原创 scrapy图片爬取ImagesPipeline

只需将spider类解析到的src地址 yield itempipelines.py写法from itemadapter import ItemAdapterfrom scrapy.pipelines.images import ImagesPipelineimport scrapyclass ImgPipeline(ImagesPipeline):#根据图片的src进行图片数据请求def get_media_requests(self,item,info): yield scrap

2020-12-28 20:22:23 97

原创 selenium规避被检测识别

现在不少大网站有对selenium采取了监测机制。比如正常情况下我们用浏览器访问淘宝等网站的window.navigator.webdriver的值为undefined。而使用selenium访问则该值为true。那么如何解决这个问题呢?只需要设置Chromedriver的启动参数即可解决问题。在启动Chromedriver之前,为Chrome开启实验性功能参数excludeSwitches,它的值为[‘enable-automation'],完整代码如下∶from selenium.webdriver

2020-12-21 18:26:03 1615

原创 selenium 谷歌无头浏览器,实现无可视化操作

from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsimport time#创建一个参数对象,用来控制chrome以无界面模式打开chrome_options = Options ()chrome_options.add_argument( '--headless ' )chrome_options.add_argument ( ' --disable-gpu ' )#驱动路径

2020-12-21 18:16:54 327

原创 beautifulsoup怎样获取标签间文本内容

以a标签为例<a href="/u/"> user</a>用 beautifulsoupfrom bs4 import BeautifulSoup#res.content 为爬取到的网页内容soup = BeautifulSoup(res.content, ‘html.parser’)#获取所有的a标签a_lists = soup.select(‘a’)a...

2019-10-19 16:09:13 11906 1

原创 django创建一个简单的APP应用

django创建一个简单的APP应用在pycharm的terminal窗口创建APPpython manage.py startapp app01在配置文件INSTALLED_APPS中加入’app01’,INSTALLED_APPS = [ 'django.contrib.admin', 'django.contrib.auth', 'django.contri...

2019-10-04 09:54:09 334

Microsoft ActiveSync 4.5 简体中文版.zip

Microsoft ActiveSync 4.5是微软智能手机系统PPC手机的同步软件,支持xp、win7、vista等操作系统,新版本的ActiveSync 4.5已经更名为windows mobile设备中心4.5。

2020-08-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除