- 博客(68)
- 收藏
- 关注
原创 Oracle:在plsql中设置快捷输入
然后保存在某目录下即可,这样在以后输入时就可以自动替换文本了,不过使用的时候尽量不要与字段和其他关键字冲突。会出现一个文本框,按如下方法输入:(可以自己定义)点击编辑器,里面的自动替换。
2023-08-18 10:18:13
3890
原创 Python的文件操作——IO
解释:一个类对象实现了__enter__()与__exit__()方法,则这个类对象遵守了上下文协议,该类的实例对象就是上下文管理器,如下图的 open() 就是上下文管理器,with 缩进内的都为 with 语句体。Python解释器在运行.py文件时用到操作系统(OS)及其资源,.py文件里的代码就是通过调用才做系统操作磁盘上的文件(及读写磁盘里的文件)首先是将原文件读取,写入到目标文件,有28万多条数据,就需要创建15个文件进行写入,这可以通过循环是实现。创建:将数据写入新文件(程序->文件)
2023-08-15 15:56:07
476
原创 Python中的类和对象
一般规范:类名的每个单词首字母大写其余小写这里说明类开辟了内存空间,是class类型,也有value值,说明 class 在 Python 里是对象。
2023-08-14 10:46:15
80
原创 Python爬虫:获得某网站的一个视频+防盗链+代理
现在我想获得某网站的这个视频:这个视频储存在这个标签里,一般是可以直接通过这个链接获得该视频的但在页面源代码中搜索,并未获得结果,说明开发者工具的 HTML 与页面源代码有偏差的,于是在 NETWORK 的 XHR 里面有个 vedio 的信息,里面的链接理应是视频的播放链接但是通过这个链接,并无法访问视频对比两组URL可以看出一些端倪,实际可播放的URL与视频信息的srcURL并不一致显然,将下面准确的字段替换上去,就可以得到正确的视频链接了。
2023-08-10 17:04:45
540
原创 使用Python连接SqlServer
我目前的需求只是使用 Python 连接数据库写查询语句就好了,所以没有详细学习,只看了看几个需要用到的相关方法并记录下来。通过 execute 方法执行 sql 语句。
2023-07-31 16:15:15
2057
原创 python爬虫:使用xpath基础+实例
Xpath 是高效简单,在XML文档中搜索内容的一门语言,最初是用来搜寻 XML 文档的,但是HTML语言是XML的一个子集,它同样适用于 HTML 文档的搜索。在Python爬虫中,我们经常通过安装lxml库,利用xpath解析这种高效便捷的方式来提取信息。
2023-07-31 13:31:00
9563
1
原创 Python爬虫:正则的应用——批量获取网站图片
本文是按照改文章思路实现的,多亏博主终于令我找到了合适的网站能够实操了TTpython正则表达式实战——获取图片_正则方式提取图片是什么_爱吃饼干的小白鼠的博客-CSDN博客。
2023-07-25 16:48:40
1387
原创 Python爬虫学习:requests的使用,及两个实例
代码已经完成,运行成功,通过更改 “start” 与 “limit” 参数可以获取排行榜单上某段排名的电影数据。参数的意思:start:从库中的第几部电影取;打开抓包工具定位 Network 中的 XHR选项卡当中,拖动滚轮,到底部后新增了一个请求。因此,只要对该URL发起一个 get 请求并令其携带五个参数即可得到一组 json 类型的响应数据。后面的就是该网页的参数)将网页参数复制过来。该返回结果是一个列表类型的对象,因此使用 list_obj 接收。打开豆瓣电影的网站,选择排行榜,定位到喜剧类型。
2023-07-20 14:04:53
1188
原创 Python爬虫:输入单词获取百度翻译的翻译结果
在学习 UA 伪装过后,我仍只知道如何通过 Python 爬虫访问某个网页,但如果我想获取百度翻译网站上某些具体内容又该如何操作呢?先打开百度翻译页面,只有某一块这才是我想要的内容,我想通过输入单词获得对应的翻译结果,该怎么做呢观察发现,在输入cat之后,URL 最后结尾会多一个 cat 单词,而当前页面会进行一个局部的刷新:打开抓包工具定位 Network 中的 XHR选项卡当中,这里有 Ajax 请求对应数据包。
2023-07-19 17:46:34
3950
2
原创 Python爬虫:UA伪装
若检测到载体身份标识为某款浏览器,说明该请求是个正常请求。若不是,则表示该请求为不正常的请求(即爬虫,请求载体要么是基于浏览器要么是基于爬虫),服务器可能会拒绝该次请求。正因为服务器可能会拒绝请求,所以在第2步发起请求时,将请求头信息伪装为 header,再进行 get() 请求。打开网页按F12,Ctrl+R,点击网络,请求标头中有个User-Agent,表示请求载体的身份标识。打开一个网页,利用上面的链接作为 URL,这里只需要用到。将这里我们浏览器的标识赋值给 header,是请求载体的身份标识。
2023-07-18 17:48:50
2840
2
原创 可视化日记:使用Matplotlib进行一个简单绘图(直方图)
因为 matplotlib 的功能实在过于强大,甚至可以自定义一套属于自己的绘图风格,所以在了解其一些基本概念后决定从实际需求出发来熟悉这个库。
2023-07-14 15:42:30
1726
1
原创 初识matplotlib——主要概念及两种编码
轴设置刻度和上下限,并且生成刻度(ticks,轴上的标记)和刻度标签(ticklabels,标记刻度的字符串)ticks位置由定位器(Locator)确定,ticklabel 字符串由格式器(Formatter)设置。所有画板上可视的元素都是Artist(如上面的轴和轴域),绝大多数Artist和轴域相关并绑定,不能共享或直接移动,如上面的标题、轴标签、刻度等组成图形的所有元素都是Artist对象的实例。),或者是可以被传递给 numpy.asarray 的数据(用于转换为array)。
2023-06-20 18:07:47
1050
原创 GIT的分支及操作
GIT会默认创建一个master分支,在创建多个分支后,每个分支有各自最新的代码,在各自完成作业后合并特性分支即只为实现某单一目标或属性的分支,日常开发会有数个特性分支,此外还需要保留一个随时可以发布软件的稳定分支。通常由 master分支担当。如上述的 featur-A 分支除了实现 A 不再进行任何作业,开发中的Bug也是在新的分支李修正的。基于特定主题的作业在特性分支中进行,各主题完成后再与 master 分支进行 merge 合并。
2023-06-09 17:41:54
900
原创 pandas中DataFrame的数据堆叠、连接、重塑
A B v1 v2# 内连接print(df3)解析:on=['A','B'] 即将 A、B 列作为连接键,当这个组合键相同时,进行连接,上面的 df1 和 df2 只有索引为2的一行数据是相同的,为 [B,b],因此,在有多列时,需要满足这几列都相同的数据才会进行连接此外,由于merge需指定连接的列,在两个 df没有相同列需要用到索引时(见下方基于索引),应指定left_on、right_on 参数,否则会报错merge亦可进行纵向的列拼接,但一般来说我们有更好的方法2.基于索引。
2023-06-09 13:54:03
5429
原创 DataFrame数据的筛选和排序
索引主要用于行列的筛选,在之前的一篇文章中有涉及到DataFrame的切片和筛选,在文章里面 DataFrame 的索引部分,
2023-05-30 11:19:39
5887
1
原创 DataFrame对于行列的增加、修改和删除
默认False,添加的DataFrame中有相同的行索引时,可以保留原结果。append方法可以添加多行,相当于添加一个dataframe,如果两个DataFrame的形状不一样,取并集,另一个df没有的列,其值为NaN。可以将某列修改为定值,或利用 list/array 进行修改,以及Series和DataFrame可以修改,但。修改单个值可以通过定位修改,或筛选满足条件的行进行修改,日常使用大批量的数据直接删除后拼接就好了。若修改为True,结果的行索引会被重设为从0开始的整数索引。
2023-05-19 11:17:40
14188
1
原创 对DataFrame插入新列数据时的Error
错误翻译:所选的真值不明确,建议用xxx方法判断原因:由于日期是一个Series序列,所以出现了多个值与某值比较,于是加上每行的索引,同时数据类型的问题也可能会报这个错误且[i]不能该放在['日期']的后面,否则会导致报错,显示Timestamp类型的数据没有 .df 属性,用不了这个取月份的方法。
2023-05-18 09:33:13
332
1
原创 使用pandas库读取数据
现尝试自己用pandas读取所需数据,记录步骤和错误pandas库本身的安装可以在settings的python编译器里搜索安装包进行安装,也可以找镜像源在终端通过pip管理工具安装,因为已经安装好,直接开始导入在pandas的文档里有这样一个表图片,它体现了pandas能够读取哪些数据,也提供了方法,即在读取时可以用,并通过进行文件格式的转换(此处的xx均为文件格式,如 excel、csv、html、sql、json 等等)
2023-05-15 14:17:02
1972
1
原创 git的几个基本操作命令
因此,只要对 Git 的工作树或仓库进行操作,git status命令的显示结果就会发生变化,在 Git 操作过程中时常用 git status命令查看当前状态。commit(提交):记录工作树中所有文件的当前状态,没有可提交的内容就是说当前建立的这个仓库中尚未记录任何文件的任何状态。假如要将文件恢复到某时候的状态,可以从仓库中调取之前的快照,在工作树中打开。在以 #(井号)标为注释的 Changes to be committed(要提交的更改)栏中,可以查看本次提交中包含的文件。
2023-04-19 17:57:48
240
1
原创 学习笔记:编写代码上传至GitHub
2.此时查状态,除了未被追踪文件,提交时没有要添加的内容,因为hello-world没有被添加至Git仓库。提交至仓库,这个文件就进入了版本管理系统的管理之下。今后的更改管理交由 Git。1.在该仓库用touch命令创建了一个hello-world文件并写上。hello_word文件。(将文件放入暂存区)
2023-04-18 15:07:09
187
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅