- 博客(21)
- 资源 (43)
- 收藏
- 关注
原创 day6刷题之二分搜索1
二分查找代码class Solution { public int searchInsert(int[] nums, int target) { int left = 0, right = nums.length-1; //注意循环条件 while (left <= right) { //求mid int mid = left + ((right - left ) >> 1);
2021-02-23 15:01:19 207
原创 day7刷题之二分搜索2
33. 搜索旋转排序数组难度中等1187收藏分享切换为英文接收动态反馈升序排列的整数数组nums在预先未知的某个点上进行了旋转(例如,[0,1,2,4,5,6,7]经旋转后可能变为[4,5,6,7,0,1,2])。请你在数组中搜索target,如果数组中存在这个目标值,则返回它的索引,否则返回-1。示例 1:输入:nums = [4,5,6,7,0,1,2], target = 0输出:4输入:nums = [4,5,6,7,0,1,2], target...
2021-02-20 10:48:40 105
原创 day5刷题之 删除排序数组中的重复项 II
80. 删除排序数组中的重复项 II难度中等361给定一个增序排列数组nums,你需要在原地删除重复出现的元素,使得每个元素最多出现两次,返回移除后数组的新长度。不要使用额外的数组空间,你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。示例 1:输入:nums = [1,1,1,2,2,3]输出:5, nums = [1,1,2,2,3]解释:函数应返回新长度 length = 5, 并且原数组的前五个元素被修改为 1, 1, 2, 2, 3 。 你不...
2021-02-20 09:54:31 139
原创 爬虫中国天气网数据并可视化
中国天气网爬虫数据可视化 爬虫功能 网页分析 以华北地区为例分析网页源代码 1.以谷歌浏览器为例分析 2. 提取特征标签 3.分析源代码 利用requests库获取目标网页源代码 利用BeautifulSoup库提取天气信息 港澳台地区代码分析 分析数据 数据可视化 结果展示 全部代码 分析部分见https://blog.csdn.net/weixin_44586452/article/details/11375
2021-02-18 22:40:31 3672 2
原创 爬虫之BeautifulSoup4库详解
BeautifulSoup4库和 lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。lxml 只会局部遍历,而Beautiful Soup 是基于HTML DOM(Document Object Model)的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml。BeautifulSoup 用来解析 HTML 比较简单,API非常人性化,支持CSS选择器、Python标准库中的HT
2021-02-18 20:28:43 332
原创 day4数组之 删除排序数组中的重复项
26删除排序数组中的重复项给定一个排序数组,你需要在 原地 删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度。不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用 O(1) 额外空间的条件下完成。示例1:给定数组 nums = [1,1,2],函数应该返回新的长度 2, 并且原数组 nums 的前两个元素被修改为 1, 2。你不需要考虑数组中超出新长度后面的元素。示例2:给定 nums = [0,0,1,1,1,2,2,3,3,4],...
2021-02-18 15:26:23 130
原创 使用requests和xpath爬取电影天堂
import requestsfrom lxml import etreefrom openpyxl import Workbook# URL = 'https://dytt8.net/html/gndy/dyzz/list_23_1.html'headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0....
2021-02-16 13:37:09 941
原创 刷题之sum-closest
给定一个包括n 个整数的数组nums和 一个目标值target。找出nums中的三个整数,使得它们的和与target最接近。返回这三个数的和。假定每组输入只存在唯一答案。示例:输入:nums = [-1,2,1,-4], target = 1输出:2解释:与 target 最接近的和是 2 (-1 + 2 + 1 = 2) 。来源:力扣(LeetCode)链接:https://leetcode-cn.com/problems/3sum-closest著作权归领扣网络所有...
2021-02-14 21:47:09 133 2
原创 day3三数之和
给你一个包含 n 个整数的数组nums,判断nums中是否存在三个元素 a,b,c ,使得a + b + c = 0 ?请你找出所有和为 0 且不重复的三元组。注意:答案中不可以包含重复的三元组。示例 1:输入:nums = [-1,0,1,2,-1,-4]输出:[[-1,-1,2],[-1,0,1]]示例 2:输入:nums = []输出:[]示例 3:输入:nums = [0]输出:[]来源:力扣(LeetCode)链接:https://leetcode-c...
2021-02-14 16:46:35 186 1
原创 爬虫之数据的提取 使用XPath 及lxml 初学者必备
一、XPATH是什么?干什么用的?xpath(XML Path Language)是一门在XML和HTML文档中查找信息的语言,可用来在XML和HTML文档中对元素和属性进行遍历,用来确定XML文档中某部分位置的语言。目前浏览器都有对应的xpath扩展程序Chrome插件XPath Helper。 Firefox插件Try XPath。安装插件chrome浏览器的扩展程序下载需要翻墙,因此我寻找了另外一个安装方法,如下具体见https://www.cnblogs.com/ubuntu1.
2021-02-14 13:32:25 687 1
原创 python爬虫之request库
发送get请求1.最简单的发送get请求就是通过requests.get来调用:response = requests.get("URL")import requestsresponse=requests.get("http://www.baidu.com/")#查看响应内容 response.text返回的是Unicode格式的数据#print(response.text)#查看响应内容,response.content返阿的字节滤数据print(response.content)
2021-02-14 09:02:02 781 2
原创 python爬虫之cookie
python爬虫之cookie什么是cookie:在网站中,http请求是无状态的。也就是说即使第一次和服务器连接后并且登录成功后,第二次请求服务器依然不能知道当前请求是哪个用户。cookie的出现就是为了解决这个问题,第一次登录后服务器返回一些数据(cookie)给浏览器,然后浏览器保存在本地,当该用户发送第二次请求的时候,就会自动的把上次请求存储的cookie 数据自动的携带给服务器,服务器通过浏览器携带的数据就能判断当前用户是哪个了。cookie存储的数据量有限,不同的浏览器有不同的存储大小
2021-02-13 19:34:29 981 1
原创 爬虫练习之了解反爬虫机制
没学习之前我理解字面意思就是你爬虫网站,然后该网站顺着你的ip等会对你的网络电脑等造成损失爬虫—— 使用任何技术手段批量获取网站信息的一种方式,关键在批量。 反爬虫—— 使用任何技术手段,阻止别人批量获取自己网站信息的一种方式。关键也在于批量最简单的是你爬网站获取不到正确的信息案例 爬取拉勾网python职位的薪资等我们可以看到一般代码并不能获取到需要的信息请求头验证。浏览器访问网站的时候除了会发送url,参数等内容外,还会给服务器端传递一些额外的请求头(request ..
2021-02-13 17:15:23 328
原创 python爬虫之urllib库学习
urllib库urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。urllib库是python内置的一个http请求库,不需要额外的安装。只需要关注请求的链接,参数,提供了强大的解析。urllib库提供了如下功能:网页请求 响应获取 代理和cookie设置 异常处理 URL解析爬虫所需要的功能,基本上在urllib中都能找到,学习这个标准库,可以更加深入的理解后面更加便利的requests库。url
2021-02-13 13:54:32 388 1
原创 python爬虫入门之http协议和 Chrome 浏览器抓包工具
在浏览器中发送一个http请求的过程:1.当用户在浏览器的地址栏中输入一个URL并按回车键之后,浏览器会向HTTP服务器发送HTTP请求。HTTP请求主要分为“Get"和“Post"两种方法。⒉当我们在浏览器输入URLhttps://www.baidu.com/的时候,浏览器发送一个Request请求去获取https://www.baidu.com/的html文件,服务器把Response文件对象发送回给浏览器。3.浏览器分析Response中的HTML,发现其中引用了很多其他文件,比如加mage
2021-02-13 10:31:14 964
原创 day2两数相加
给你两个非空 的链表,表示两个非负的整数。它们每位数字都是按照逆序的方式存储的,并且每个节点只能存储一位数字。请你将两个数相加,并以相同形式返回一个表示和的链表。你可以假设除了数字 0 之外,这两个数都不会以 0开头。示例 1:来源:力扣(LeetCode)链接:https://leetcode-cn.com/problems/add-two-numbersclass ListNode: def __init__(self, x): ...
2021-02-12 17:59:51 219
原创 Python刷题之两数之和
给定一个整数数组 nums和一个整数目标值 target,请你在该数组中找出 和为目标值 的那两个整数,并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。你可以按任意顺序返回答案。示例 1:输入:nums = [2,7,11,15], target = 9输出:[0,1]解释:因为 nums[0] + nums[1] == 9 ,返回 [0, 1] 。示例 2:输入:nums = [3,2,4], target = 6输出:[1...
2021-02-11 16:12:16 345
原创 爬虫学习之下载图片
首先找到网页的图片地址如网址为:https://i0.hdslb.com/bfs/face/03525d094e0e2a142d08181532d729615c18ec92.jpg找到了这个网址, 我们就能开始下载了. 为了下载到一个特定的文件夹, 我们先建立一个文件夹吧. 并且规定这个图片下载地址.import osos.makedirs('./img/', exist_ok=True)IMAGE_URL = "https://i0.hdslb.com/bfs/face/03525
2021-02-07 11:22:32 1384
原创 简单爬虫入门
来源莫烦爬虫https://mofanpy.com/tutorials/data-manipulation/scraping/understand-website/爬网页流程选着要爬的网址 (url) 使用 python 登录上这个网址 (urlopen等) 读取网页信息 (read() 出来) 将读取的信息放入 BeautifulSoup 使用 BeautifulSoup 选取 tag 信息等 (代替正则表达式)1.使用 Python 来登录这个网页, 并打印出这个网页 HTML 的
2021-02-07 10:46:29 238
原创 数据可视化之 Matplotlib
可参考https://mofanpy.com/tutorials/data-manipulation/plt/基本用法# set new sticksnew_ticks = np.linspace(-1, 2, 5)print(new_ticks)plt.xticks(new_ticks)# set tick labelsplt.yticks([-2, -1.8, -1, 1.22, 3], [r'$really\ bad$', r'$bad$', r'$n
2021-02-05 14:05:18 326
原创 正则表达式
正则表达式这一篇就够了,记录学习方便回来查找文章来源https://mofanpy.com/tutorials/python-basic/basic/regular-expression/https://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html正则式表达,使用特殊的 pattern 来灵活匹配需要找的文字.如果需要找到潜在的多个可能性文字, 我们可以使用[]将可能的字符囊括进来. 比如[ab]就说明我想要找的字符可以...
2021-02-02 17:35:04 169 2
《计算机应用基础(Windows 7+Office 2010)》课件
2023-04-04
计算机应用基础高等教育自学考试00018,00019备考知识点
2023-04-04
华中师范大学硕士论文模板(2023)
2023-03-27
数字图像处理lab6.zip matlib频域图像处理
2021-01-21
lab5new.zip
2020-12-03
heart-disease.names
2020-11-22
口红-data.xlsx
2020-11-22
心脏病的预测 原始数据 cleveland.data
2020-11-22
混凝土的强度预测 原始数据
2020-11-21
题目4 基于基站定位数据的商圈分析.zip
2020-11-20
题目5 基于水色图像的水质评价 原始数据
2020-11-20
题目3 电商产品评论数据情感分析.zip
2020-11-20
题目2 电子商务网站用户行为分析及服务推荐 数据
2020-11-20
数据挖掘课程设计 原始数据包
2020-11-20
研究生学术英语听说教程 听力资料.txt
2020-09-16
9散列表(源程序+文档+说明+总结)
2020-06-17
8、停车场管理数据结构课程设计(源程序+文档+说明+总结)
2020-06-17
7文本编辑数据结构课程设计 (源程序+文档+说明+总结)
2020-06-17
6、模拟计算器.算术表达式的求解(源程序+文档+说明+总结)
2020-06-17
5、校园导游程序(源程序+文档+说明+总结)
2020-06-17
4、哈夫曼编译码器问题
2020-06-17
药店的药品销售统计系统(排序应用)(源程序+文档+说明+总结)
2020-06-17
1运动会分数统计问题(源程序+文档+说明+总结)
2020-06-17
学生成绩管理系统(源程序+文档+说明+总结)
2020-06-17
《多媒体集成课程设计》.zip
2020-05-27
2020考研复试口语常考话题.docx
2020-05-20
常见人脸识别数据库(YALE人脸数据库+YALE人脸数据库b)
2020-04-14
lfw人脸数据集-人脸识别的常用测试集
2020-04-14
dlib-19.7.0-cp36-cp36m-win_amd64.whl
2020-04-02
FVC2004指纹数据集DB1-4.zip
2020-03-23
6数据结构模拟计算器.zip
2020-02-03
数据结构1.zip 完整文档+代码
2020-02-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人