自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 简历爬取

import requestsfrom lxml import etreeimport osurl='https://sc.chinaz.com/jianli/daxuesheng.html'headers={ 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:85.0) Gecko/20100101 Firefox/85.0'}if not os.path.exists('./简历'): os.mkdir(

2021-03-28 00:47:41 608

原创 爬取mm图片

上网址:https://pic.netbian.com/4kmeinv/前面几步其实都一样,导入模块,指定url和headers,发起请求,获得请求数据import requestsfrom lxml import etreeimport os# if not os.path.exists('./meinv'):# os.mkdir('./meinv')url='https://pic.netbian.com/4kmeinv/'headers={ 'User-Agent':

2021-03-27 00:34:33 1034 2

原创 xpath

xpath里面的 / / 与 . / 和 .//xpath定位元素的时候有//和./方式,//方式是定位整个页面文档中所有符合的元素,而 ./ 是在当前节点下面进行选择, .//方式也会将操作限制到当前节点基础详解https://blog.csdn.net/qq_44619675/article/details/113938171...

2021-03-25 01:10:53 93

原创 用xpath爬取58同城二手房信息

网址https://bj.58.com/ershoufang/直接对网页进行分析,可以看到,section class=list这个里面包含了所有我们想要的信息。再往下分析,下面div下面都存储了单个二手房的所有讯息,再往下走会发现h3标签就是我们要爬取的标题信息。开始1.将整张页面爬取2.将爬下来的页面树化3.通过树化的内容找到我们需要的标题内容import requestsfrom lxml import etreeurl='https://bj.58.com/ershoufan

2021-03-25 01:08:41 1322 7

原创 利用正则表达式爬取糗事百科

网站 https://www.qiushibaike.com/imgrank/爬取页面中指定内容的步骤(实际上就多了一步数据解析)指定url发请求获得响应数据数据解析持久化存储开始实战:首先进行老几步import requests既然是利用正则表达式就要 import re正则表达式的具体用法我会单独出一个文章然后指定url和headers,因为不是动态加载就不需要指定其他参数url = 'https://www.qiushibaike.com/imgrank/page/%d/

2021-03-23 01:02:55 181

原创 json.dump()与json_dumps()区别

json 模块提供了一种很简单的方式来编码和解码JSON数据。 其中两个主要的函数是 json.dumps() 和 json.loads()。1.json.dumps将一个Python数据结构转换为JSON:import jsondata = { 'name' : 'myname', 'age' : 100,}json_str = json.dumps(data)2.json.loads将一个JSON编码的字符串转换回一个Python数据结构:data = json.load

2021-03-21 23:49:28 197

原创 1773. 统计匹配检索规则的物品数量

刚开始的思路是分类,如果是类型的话就遍历一遍,颜色在遍历一遍等,但是太复杂了,相同的东西写了好几遍,直接找一个标志的值就好,还有就是数组中有数组直接get().get()就可以遍历了。class Solution { public int countMatches(List<List<String>> items, String ruleKey, String ruleValue) { int a=-1; int count=0; .

2021-03-21 00:06:41 71

原创 1769. 移动所有球到每个盒子所需的最小操作数

题目的意思是,如果其他箱子有球就计算移到第i个盒子需要走的步数。第一个只需要考虑右边的元素,从第二个开始,就需要考虑左边的元素了,比如第二个元素需要在第一个元素leaft是0的条件下加一,相应的,当i一直后移就需要加相应数目左边元素为1的数目,左边同理,i每次加一,可以看为right全部向左移动一次,需要用原来的count减right的值。class Solution { public int[] minOperations(String boxes) { int right=.

2021-03-20 00:59:18 109

原创 修改文件夹中文件的名字

系列文章目录之前好多python文件没有加.py一个一个加太慢了,把他们加到一个文件夹下一起重命名,但是正则表达式还是不会用。文章目录系列文章目录python 中re.sub,replace(),strip()的区别if __name__ == "__main__"os._exit(1) :python有两种退出方式代码python 中re.sub,replace(),strip()的区别1.strip():str.strip([chars]);去除字符串前面和后面的所有设置的字符串,默

2021-03-15 00:05:24 426

原创 append、extend、insert、add

https://blog.csdn.net/qq_22613769/article/details/107749024

2021-03-14 19:46:31 176

原创 2021-03-10

matplotlib.pyplot.tick_params参数:axis : 可选{‘x’, ‘y’, ‘both’} ,选择对哪个轴操作,默认是’both’reset : bool,如果为True,则在处理其他参数之前将所有参数设置为默认值。 它的默认值为False。which : 可选{‘major’, ‘minor’, ‘both’} 选择对主or副坐标轴进行操作direction/tickdir : 可选{‘in’, ‘out’, ‘inout’}刻度线的方向size/length :

2021-03-10 23:57:16 55

原创 力扣21 合并两个有序链表

如果l1,l2为空时则返回另一个链表即可。当其不为空,当l1的值小于l2的值,则比较l1.next与l2的大小同时返回l1当前值,L2同理```java/** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode() {} * ListNode(int val) { this.val = val; } * .

2021-03-06 11:00:08 54

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除