- 博客(38)
- 收藏
- 关注
原创 运用Python去除“使用了LaTeX的Beamer类创建的保留动画效果的PDF演示文稿”的重复页面
D:\Anaconda3\python.exe C:\Users\和谐号\PycharmProjects\pythonProject\2023-09-18-pdf页面提取\getRealPageNumbers.py。进程已结束,退出代码为 0。这样就方便阅读多了。
2023-09-18 15:40:09 120
原创 MathType学习笔记
因为这个mathtype的章节号与word的级别列表不同步如果不是从第一章开始,可以修改章节起点mathtype章节号显示和隐藏 - 哔哩哔哩 (bilibili.com)
2023-08-27 22:44:20 1069
原创 pycharm中几个快捷键
2.ctrl+alt+T:添加环绕(if、while、try等等)1.Tab:缩进,shift+Tab:反缩进。6.Alter+insert:生成代码。5.ctrl+shift+J:合并行。7.ctrl+Alt+M:生成函数。8.ctrl+Alt+V:生成变量。9.ctrl+Alt+P:生成参数。3.Alt+鼠标左键:光标分身。4.Alt+shift:框选。
2023-08-26 15:54:42 707
原创 Python爬虫模板(v3.0版本)与使用示例
一、简介对于一个爬虫项目,在观察好目标网站后,对其实施爬虫一般要分为三个步骤:数据获取→数据解析→数据保存1.数据获取:(1)本模板可以在主程序crawler中选择使用Urllib、Requests、Cloudscraper三种库其中urllib是最经典的,requests比urllib性能好(可以传json型和非json型两种表单),cloudscraper可以绕过一些验证码。程序默认配置使用requests。
2023-08-26 15:05:14 1736
原创 三个Excel技巧
(1)类似java里的substringshang(2)类似Python里:(3)用法:MID(字符串, 起始位置, 子串长度)注意:Excel中的第一个字符下标为1。
2023-08-26 14:07:01 49
原创 Python的xlwt包:写入数据到xls文件
worksheet=workbook.add_sheet(表单名)分为四个步骤:创建文件对象→创建sheet表→写数据→保存。worksheet.write(行,列,内容)workbook.save(文件名)导入包import xlws。练习:写99乘法表到xls。二、创建sheet表。
2023-08-26 09:24:57 185
原创 Python爬虫之数据解析——BeautifulSoup亮汤模块(二):搜索(再接上文,2023美赛春季赛帆船数据解析sailboatdata.com)
运行结果如上,它找出了所有标签中包含t的tag:html,title,meta,meta,每个meta,table,tbody,每个tr,每个tr中的每个td.应用正则表达式,来获取整个html所有navigableString(包含comment)中的所有符合正则条件的完整内容。当然,直接这样用没用什么意义,返回的值与我们传入的值看起来是一样的。查找所有匹配的tag,返回一个包含元素类型为tag的list。找出了所有标签中包含name属性的tag。通过标签来找,直接找,并获取内容。通过类名来找,加.号。
2023-08-24 09:58:55 214
原创 Python爬虫之数据解析——BeautifulSoup亮汤模块(一):基础与遍历(接上文,2023美赛春季赛帆船数据解析sailboatdata.com)
首先,我们要明确我们需要的数据,并在html中找到它们的位置。1.帆船名称:11 METER事实上,还可以获取更多帆船数据,但因为与Sailboat Specifications的过程基本相同,这里省略。观察结构,它是由一个head和body组成,head中有一些meta、link。
2023-08-24 07:36:58 901
原创 Python爬虫获取数据实战:2023数学建模美赛春季赛帆船数据网站sailboatdata.com(状态码403forbidden→使用cloudscraper绕过cloudflare)
当我们爬取到一个html文件时,一般篇幅很长,我们需要对其做文档解析。
2023-08-23 13:28:40 1046
原创 Python的json.loads() 方法与json.dumps()方法
是 Python 标准库中的一个方法,用于将 JSON 格式的字符串解析为 Python 数据结构。:根据 JSON 字符串的内容,构建相应的 Python 数据结构。例如,JSON 对象将被解析为 Python 字典,JSON 数组将被解析为 Python 列表。是一个非常有用的方法,它允许你在处理 JSON 数据时,将其转换为 Python 数据类型,以便于在代码中进行操作和处理。方法的作用是将 JSON 格式的字符串解析为 Python 中的字典、列表等数据类型,以便在代码中进行处理和操作。
2023-08-22 09:10:39 3399
原创 Python上下文管理语句with
这是一个在 Python 中处理资源(如文件、网络连接等)时常用的模式,可以有效地避免资源泄漏,并提供更清晰的代码结构。总之,使用上下文管理器的方式更具有推荐性,因为它可以简化代码,并提供更稳定的资源管理和异常处理。:上下文管理器能够处理异常情况,确保在出现异常时资源会被正确地关闭,避免出现不稳定的状态。当然,你也可以使用等号(=)来赋值,但是在处理网络连接、文件等资源时,使用上下文管理器(:使用上下文管理器可以将打开和关闭资源的代码组织在一起,使代码更易于阅读和维护。以上内容来自ChatGPT。
2023-08-22 09:05:00 130
原创 基于Python爬虫的项目构想——DHU选课-查分助手
或者开启邮箱提醒功能,一旦有剩余名额,程序立刻发邮件给用户。其它一些备选课程有名额时,将采取邮件提醒,用户接受邮件后手动选课。退课监控具有时间长的特点,从第二次选课到选课结束,以及补退选都可以用,这就要解决好cookie过期的问题,解决模拟用户登录问题。第二次选课时的自动抢课功能:在抢课开始之前,用户设置好待抢的课的抢课请求,程序将在相应时间自动抢课。用于判断是否有课程出成绩,监控绩点变化情况,对于隐式出分的情况,程序自动计算分数,避免有两门课同时隐式出分,导致我们无法反推成绩的情况。
2023-08-21 10:15:03 600
原创 回溯法+Python爬虫:找出DHU所有以21开头的学号
3.对于专业,有些学院从00开始编号,有些学院从01开始编号,且不一定具有连续性(例如00,01,05,20,65,66,95,96这样编号,代表8个不同专业。但是一定具有连续性,即有没有1班,就不会有2,3,4..班,有6班就至少有1-6班。5.个人,同上,对于i>00,如果i没有,那么i+1也不会有,如果00没有,01可能会有。4.班级,对于i>0,如果i班没有,那么i+1班也没有,如果0班没有,1班可能会有。1-2位:表示年级,例如20级就是20开头,21级就是21开头。1.年级设定为21级。
2023-08-21 06:50:00 212
原创 Python的urllib库
访问请求:urlopen(url)方法获取解码:响应对象.read().decode(“utf-8”) #注意可能会编码报错,在文件编码里调一下418,就意味着我们没有伪装,被人家发现我们是爬虫了。
2023-08-18 01:37:13 51 1
原创 Python爬虫基础概念
爬虫就是根据用户的需求,模拟浏览器(伪装)自动抓取信息的行为为什么叫爬虫(网络蜘蛛),HTML里有很多超链接,然后跳转超链接就像虫在爬。
2023-08-17 23:48:34 491 1
原创 Python异常处理
File "C:\Users\和谐号\PycharmProjects\pythonProject\2023-08-14-crawler\demo3.py", line 133。except (错误类型,...) as res: #异常类型要一致,最大的是Exception。2.try-except-finall嵌套。
2023-08-17 15:20:55 56 1
原创 Python文件操作
(1)两种常用的访问模式①r模式(默认,只读),文件不存在时报错②w模式(写模式),文件不存在时新建,文件存在时覆盖(2)打开f=open(文件名,模式)(3)关闭f.close()(4)写f.write()(5)读①按字符数读取:f.read(字符数) #指针后移②读取一行:f.readline()#指针后移③一次性读取全部文件至list:f.readlines()④seek函数重新定位指针1人生苦短,1人生苦短,我学Python2人生苦短,我学Python。
2023-08-17 01:09:18 52 1
原创 Python函数(局部变量与全局变量)与Java比较(实例(成员)/静态的方法/变量)以及基本数据类型和引用数据类型在函数调用上的区别
不能除以0(2, 1)值得注意的是,与java的不同之处在于,python的函数调用要写在定义之后,否则会报错。
2023-08-16 22:17:49 172 1
原创 Python字典(定义、访问、增、删、改、查)
字符串、数字、不含可变类型的元组可以,可变类型:列表、字典、集合不行。(1)字典名[键名] 直接访问,但是访问了不存在的键会直接报错。这应该是Python的一个特性,多变量赋值,MATLAB里也有。键值对,key-value,键必须唯一且为不可变类型。(1)del 字典名[键名] #删除键值对。定义时可以重复,不报错,但相当于覆盖更新。②默认返回值为None,也可以手动设置。(2)clear方法 #清空。①访问了不存在的键至少不报错。(3)由其它数据类型转化。(2)多变量填充赋值。
2023-08-16 19:09:22 71 1
原创 python列表基础(访、增、删、改、查、排)
a aangha oiahnqa Shaa a(3)循环遍历0 aa1 bb2 cc3 dd0 aa1 bb2 cc3 dd0 aa1 bb2 cc3 dd。
2023-08-15 23:34:11 30 1
原创 python字符串学习
字符串可以用单引号、双引号、三引号表示三引号内可以写多行语句,保留格式但不常用ok单引号内在遇到"双引号"时不用转义,遇到单引号i'm a student要转义双引号也是"同理",但一般用双引号特别地,在一\串字符串前加r,这串"字符串'中的所有转义字符不会被转义\t特别\r地,在一\\串字符串前加r,这串\"字符串\'中的所有转义字符\n不会被转义。
2023-08-15 21:54:03 31 1
原创 python中的几种循环以及与MATLAB语言切片不同之处
左含右不含,步长在最后。range(起点,终点,步长)左右均含,步长在中间。1.计算1+2+...+100。
2023-08-15 11:00:00 84 1
原创 Python学习笔记
Python可以在命令提示符cmd中运行,输入Python即可进入,还能看到当前Python版本,退出时输入exit(),或者使用。设置→编译器→文件和代码模板→Python Script。的方式即可(可以使用tab键快速补全)
2023-08-14 22:51:35 25
空空如也
Python中能否写一个函数,修改传入参数的值?
2023-08-16
TA创建的收藏夹 TA关注的收藏夹
TA关注的人