自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 补充sqlite3的知识

这里写目录标题链接数据库查看数据库结构建表插入数据查询数据链接数据库sqlite3.connect(“要连接的数据库”)会默认检测有没有数据库,如果没有的话就会建立一个。查看数据库结构点击pycharm右侧的database,可以点击加号选择Data Source中的SQLite进行添加,然后在弹出的对话框中可以指定要填加的数据库。点击File右侧的+号,找到文件所在的文件夹进行添加即可。可能出现的问题:在第一次使用的时候,可能会出现红色下划线,在添加之前点击Test Connection即

2022-03-04 19:48:42 1933

原创 关于re的补充知识

目录正则表达式常用的正则表达式操作符对re库的常见操作创建对象模式匹配不创建对象模式的匹配findall()方法替换sub小Taps正则表达式字符串模式,判断字符串是否满足某一规则。常用的正则表达式操作符. 表示任一字符[ ] 表示括号中范围的任一字符[^ ] 表示除了括号中范围的任一字符*表示0个或多个字符+表示1个或多个字符?表示0个或多个字符|表示从左右表达式中任选一个{m} 表示前边的字符会出现m次{m,n} 表示前边的字符会出现m次到n次^ 表示以什么字符串开头$ 表示

2022-02-23 14:18:39 152

原创 BeautifulSoup的补充知识

目录四种类型1.Tag标签NavigableString 标签中的内容(字符串)BeautifulSoup表示整个文档Comment也是输出内容,但是不显示注释对文档的遍历对文档的搜索第一种方式:find_all字符串过滤,匹配与字符串完全一样的内容正则表达式搜索方法:自定义函数进行搜索第二种:kwargs 参数第三种:text参数第四种:limit参数css选择器四种类型在导入一个html文档后,可以通过BeautifulSoop进行解析,并将解析后的内容进行打印输出。基本思路:引入bs4然后打

2022-02-21 17:04:32 479

原创 获取数据部分

目录整体思路代码编写整体思路首先要确定要访问的网址,通过打开网页可以获得。同时在网页中按Fn+F12进入开发者模式界面,选择Network,进行刷新网页,可以记录网页的请求,将小红点按灭,表示停止记录。点击下方的请求,可以看到打开的douban网页,点击douban会出现详细信息。下来列表,在最后能看到User-Agent,这是我们需要的头部信息,需要保存下拉,用这个身份我们可以伪装成浏览器进行服务器访问。然后通过urllib.request.Request()对我们的信息进行封装,括号中需

2022-02-20 14:52:45 465

原创 搭建爬虫架构

目录爬虫基本思路补充urllib获取get请求可能遇到的问题使用post方法延时处理响应状态和头打印状态码打印头部信息可以只选择打印某一信息访问豆瓣get方法post方法爬虫基本思路第一步:爬取网页第二步:解析数据第三步:保存数据具体操作:第一步:在获取网页的时候,我们要有一个baseurl作为访问对象。baseurl = “网页地址”datalist = getData(baseurl)第三步:保存数据需要有保存路径savapathsavepath = “.\存储位置.xls” 加

2022-02-19 21:30:06 1332

原创 爬虫的前期准备

目录关于程序的入口关于引入引入自定义模块引用系统模块安装第三方库时遇到的困难关于程序的入口方法:if name == “main”:调用函数之前不写这个方法的时候同样可以正常运行程序,但是由于是顺序执行,开始执行的位置不明确,而写上这句之后,可以明确的找到程序的入口,从这里开始执行。关于引入引入自定义模块可以自己写一个函数,然后在另一个文件中对他进行调用。右键项目名,New一个Directory命名为test1,在里面新建一个文件为t1,用同样的方法创建一个test2和t2.在t1中,

2022-02-18 15:44:25 79

原创 错误与异常的处理

目录产生错误和异常捕获异常使用方法:不同的异常类型可能同时存在多种异常类型打印异常信息一次捕获所有异常try...finally和嵌套练习:写文件和复制文件产生错误和异常用文件的读取举例,在用r模式打开文件的时候,如果文件不存在,程序就会报错,说明此时出现了问题。可以看出,第一行打印正常输出,而第二行却没有,错误提示说FileNotFoundError没有找到文件名。捕获异常对可能发生问题的地方,可以通过捕获异常来保证程序不中断。使用方法:try:可能出现问题的代码except 错误类型

2022-02-17 15:01:26 477

原创 文件的基础知识

目录打开和关闭文件打开文件关闭文件写文件读取文件按规定的字符数读取每次读一行读全部内容对文件进行重命名打开和关闭文件打开文件f = open(“文件名”,“打开方式”)打开方式包括只读(r)、只写(w)、二进制读(rb)、二进制写(wb)在只读模式下,如果文件不存在,会报错。在只写模式下,如果文件不存在,会自动创建;如果文件存在,会被覆盖。在建文件的时候,结果框不会出现内容,旁边的文件框会自动增加一个文件。只读模式读到没有建立的文件:关闭文件f.close()直接关闭。打开和关闭

2022-02-16 14:22:19 798

原创 对函数的学习QAQ

目录函数的定义和调用带参数的函数带返回值的函数多个返回值的函数小练习打印单线条打印自定义条数线条三个数求和求平均值局部变量和全局变量局部变量全局变量全局变量和局部变量使用相同的变量名函数要修改全局变量的值函数的定义和调用定义:利用def 函数名():的格式对于函数的调用,直接写函数名()即可。带参数的函数直接在函数名的括号中写即可。带返回值的函数return可以直接打印输出,也可以用一个变量接收,在进行打印输出。多个返回值的函数在return之后可以写多个返回值,在接收返回值的时候

2022-02-15 14:53:27 57

原创 字典和集合的基础知识

目录字典的创建字典的访问访问不存在的键对字典的操作增加删除清空修改查找集合SET列表、元组、字典、集合的区别字典的创建字典存储键值对格式:info = {"":"","":""}标志:花括号、每个键值对之间用逗号分隔。字典中的key值不能修改,且唯一,value可以修改。字典的访问不是通过下标访问,而是直接在中括号中填入key的值。访问不存在的键直接访问不存在的键会报错可以通过get方法来来判断要查找的key在不在字典中,如果不在,默认返回None。也可以设置找不到时返回的值。

2022-02-14 14:49:49 300

原创 元组的基础知识

目录元组的定义对元组元素的访问对元组的基本操作增加删除修改查找其他操作元组的定义元组:tuple如果要创建一个空元组,就括号中什么都不用写。如果元组中只有一个数据,那么一点要记得加上逗号。如果元组中有多个数据,数据之间用逗号隔开,最后一个数据后面不需要加逗号。对元组元素的访问对元组中元素的访问与list一样,可以通过下标进行访问。在中括号中填入-1表示访问最后一个数据,list中也一样。list和元组都可以切片访问。括号中写[起始下标:终止下标(但不包含):步进值]。对元组的基本操作

2022-02-13 17:00:00 679

原创 列表的基础知识

目录定义列表遍历列表列表的常规操作增加删除修改查统计要找的值在列表中的个数排序和反转列表嵌套例子:为教师分配办公室练习:打印商品信息定义列表namelist = [ ] 定义空列表。可以在列表添加内容,并根据下标进行检索输出。同一个列表中可以定义不同类型的数据,比如可以同时添加整型和字符串类型可以利用type()函数打印输出元素的类型。遍历列表列表的遍历可以用for循环,也可以用while。在使用while时,可以用len()测试列表的长度,然后设置一个变量计数通过他的自增来结束循环。

2022-02-12 14:52:04 739

原创 字符串的学习

这里写目录标题字符串写法三种方式单引号和双引号的区别双引号也可以转义字符串的截取简写格式字符串的连接取消转义常见的字符串函数字符串写法三种方式单引号:用来写一个单词双引号:用来写一个句子三引号:用来写一段话最好还是写双引号单引号和双引号的区别在写一个句子的时候,可能会遇到缩写之类的单引号,如果采用单引号做字符串的话,遇到单引号就会自动认为匹配为一组,会报错,这时可以用反斜线做转义符,保证符号的正常输出。双引号也可以转义如果需要输出反斜线,也需要用反斜线进行转义,即直接写两个反斜线就

2022-02-10 19:58:25 65

原创 循环的写法

for循环第一种写法:range里表示i的范围直接遍历5次,从0开始到4结束。第二种写法:括号中表示i的范围,从0开始到10,每次自增3。同样可以写负数。第三种写法:可以遍历字符串,i的范围直接写字符串的名字即可。第四种写法:可以对列表进行遍历,可以将i的范围设置为列表的长度,每次遍历第i个位置上的值。while循环while循坏要注意写变量的自增,否则会陷入死循环。同时,while可以和else一起用例子:从1到100求和while写法:for写法:注意i

2022-02-09 20:12:51 5413

原创 if判断语句

这里写目录标题基础知识判断分数小例子引入库练习题基础知识在if语句中,True用任意非零值和非空值表示,Flase用0或者None表示。if与else为一对,期间可以添加任意个elif在写代码时,if语句和平时不同的是,他不需要加括号,直接书写条件表达式,然后在表达式结束后加一个冒号冒号必须加注意同一层级的缩进要保证一致,可以用Tab键控制缩进在进行嵌套时,注意每个层级的缩进是否一致判断分数小例子产生一个分数,用if语句判断成绩的等级当成绩为57时,会判断在E等级当分数为87时会

2022-02-05 21:19:02 1587

原创 pycharm的学习

使用pycharm建立项目在创建项目时,可以选择项目存储的位置,我会选择将代码存储在固定的文件夹中,方便查看和管理。可以选择为新建的项目起一个独立的空间在创建好项目之后,可以进行内容的编写,右键选择创建Python File创建之后,会弹出窗口为内容起一个名字点击回车进入程序编写界面。修改一些设置在进入应用界面后,首先点击File进行一些设置修改,点击settings会弹出一个窗口,首先选择Font先修改一下字体,可以选择Mono,保证中文不会乱码,同时调节一下字号大小,方便查看代

2022-02-01 14:53:56 943

原创 我的Python第一课

开文用于记录学习爬虫的一些知识

2022-01-28 22:22:35 1173

原创 计算机体系结构知识汇总

一、处理器体系结构相关定义处理器到底是什么:程序员眼中的计算机组织方法体系结构要素:指令集和操作数的组织方式(内存、寄存器)指令集就是计算机体系结构开的处方,指定计算机需要的能力。指令集应该对机器语言程序员可见。指令集是区分不同处理器的关键标志。操作数是参加某种功能操作的数据。双操作数:利用两个操作数进行工作来产生一个结果。三操作数:两个源操作数和一个目的操作数。ALU:算术/逻辑单元,进行ADD、SUB、AND、OR等运算、寄存器(Register):在处理器内部,靠近ALU,速度极快,

2021-07-08 11:20:44 1221

原创 判断一个数组是否排好序

#include <iostream>using namespace std;int main(){ int a[100],j=1,s=0; int n; cin>>n; for(int i=0; i<n; i++) cin>>a[i]; while((j<n)&&(a[j-1]<=a[j])) { j+=1; if(j==n)

2020-12-18 19:39:40 1509 1

原创 畅通问题

Description某省调查乡村交通状况,得到的统计表中列出了任意两村庄间的距离。省政府“畅通工程”的目标是使全省任何两个村庄间都可以实现公路交通(但不一定有直接的公路相连,只要能间接通过公路可达即可),并要求铺设的公路总长度为最小。请计算最小的公路总长度。Input测试输入包含若干测试用例。每个测试用例的第1行给出村庄数目N ( < 100 );随后的N(N-1)/2行对应村庄间的距离,每行给出一对正整数,分别是两个村庄的编号,以及此两村庄间的距离。为简单起见,村庄从1到N编号。当N为0时

2020-11-27 13:34:57 437

原创 背包问题(旅游记得带零钱)

Description卖方:这件商品14元买方:给你20元卖方:不好意思,我的零钱不够买方:好吧,这是15元,剩的当小费当到一个地方旅游时,如果你买东西的地方不支持信用,带零钱还是非常有用的。特别是有时候卖方没有零钱,如果你没有刚好的钱,你需要支付比卖价多一点。当然你想付尽量少的钱(至少是商品价值的钱)。并且,当支付最少钱的时候,也最好是支付的硬币的数量最少。Input第一行包含一个整数表示测试数据的组数。每组测试数据每一行包含一个整数,表示你需要付的钱数,钱数不超过10000元。接下来包含

2020-11-17 14:07:03 420

原创 线性时间选择问题(找第k大的数)

**线性时间选择问题Description给定线性序集中n个元素和一个整数k,n<=2000000,1<=k<=n,要求找出这n个元素中第k小的数。Input第一行有两个正整数n,k.接下来是n个整数(0<=ai<=1e9)。Output输出第k小的数Sample Input6 31 3 5 2 4 6Sample Output3基本思路定义数组a存放数据,由于数据较多,用scanf进行输入。数组从0开始存入数据,所以第k大的数是排好序后的数组中的

2020-11-14 12:54:50 520

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除