自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 Java基础语法

学到Java核心类开头字符串部分,感觉有点枯燥,又弃之。又遇到老熟人-韩顺平哈哈哈哈,先学一会吧。讲到Java代理部分看不懂遂弃之。换教程–老熟人廖雪峰。

2023-10-12 20:56:26 55

原创 基础练习 Huffuman树

文章目录题目思路完整代码题目问题描述  Huffman树在编码中有着广泛的应用。在这里,我们只关心Huffman树的构造过程。  给出一列数{pi}={p0, p1, …, pn-1},用这列数构造Huffman树的过程如下:  1. 找到{pi}中最小的两个数,设为pa和pb,将pa和pb从{pi}中删除掉,然后将它们的和加入到{pi}中。这个过程的费用记为pa + pb。  2. 重复步骤1,直到{pi}中只剩下一个数。  在上面的操作过程中,把所有的费用相加,就得到了构造Huffman树

2022-02-05 16:03:50 170

原创 基础练习 高精度加法 蓝桥杯

文章目录题目解题思路具体代码题目资源限制时间限制:1.0s 内存限制:512.0MB问题描述  输入两个整数a和b,输出这两个整数的和。a和b都不超过100位。算法描述  由于a和b都比较大,所以不能直接使用语言中的标准数据类型来存储。对于这种问题,一般使用数组来处理。  定义一个数组A,A[0]用于存储a的个位,A[1]用于存储a的十位,依此类推。同样可以用一个数组B来存储b。  计算c = a + b的时候,首先将A[0]与B[0]相加,如果有进位产生,则把进位(即和的十位数)存入

2022-01-24 16:02:10 106

原创 pandas读取csv数据处理缺失值转换为torch张量

文章目录创建数据集pandas读取数据集处理缺失值转换为张量创建数据集import os#在当前路径下创建data目录,exist_ok表示只在目录不存在时创建,目录已存在不报错os.makedirs(os.path.join('..','data'),exist_ok=True)data_file=os.path.join('..','data','house_tiny.csv')with open(data_file,'w') as f: f.write('NumRooms,Alle

2021-08-06 16:48:09 562

原创 numpy浅拷贝与深拷贝

import numpy as np# 浅拷贝,直接关联数据指向同一个内存地址a=np.array([[2,3],[2,1]])b=ab[1][0]=8print(a)# 深拷贝,开辟新的空间进行复制c=a.copy()print(c)c[1][0]=22print(a)

2021-08-03 17:15:23 225

原创 numpy分割与合并矩阵

import numpy as npa = np.array([1, 1, 1])[:, np.newaxis] # 增加一个列的维度,b = np.array([2, 2, 2])[:, np.newaxis]c = np.array([3, 3, 3])[:, np.newaxis]print(np.vstack((a, b, c))) # 上下合并矩阵print(np.hstack((a, b, c))) # 左右合并矩阵#数组分割print(np.vsplit(a,3))#将数

2021-08-03 16:53:15 219

原创 numpy索引(取出矩阵中的元素)

import numpy as npa = np.arange(3, 13).reshape((2, 5))print(a)print(a[1]) # 取出矩阵中的第一行print(a[0][2]) # 取出矩阵中第0行第二列的数print(a[0, 2]) # 取出矩阵中第0行第二列的数print(a[1, 1:3]) # 取出矩阵中第一行 第1列到第3列(前闭后开)的数据print(a[:, 2]) # :表示所有# 按行遍历矩阵for row in a: print

2021-08-03 15:16:19 3002

原创 numpy生成与基础运算

文章目录生成矩阵算术运算三角函数矩阵乘法随机生成求平均数生成矩阵import numpy as npa=np.array([2,3,4])print(a)a=np.arange(2,10,1)#在2到10的前闭后开区间内以1为步长生成矩阵print(a)a=np.zeros(12).reshape(3,4)print(a)a=np.empty(12).reshape(3,4)#分配空间没有内容print(a)a=np.linspace(2,4,9)#生成线段,在2到4区间间隔相同步长生

2021-08-02 17:45:42 123

原创 torch简单数据操作

文章目录生成张量(数组)的几种方式运算生成张量(数组)的几种方式import torchx=torch.arange(12)# print(x)# print(x.shape)# print(x.numel())#number of elememtx=x.reshape(3,4)# print(x)x=x.reshape(-1,3)#放置-1可以让张量自动推断维度# print(x)y=torch.zeros((2,3,4))#生成全0矩阵# print(y)y=torch.one

2021-07-26 14:04:41 977

原创 《Python深度学习》读书笔记(一)

文章目录2.2张量1、0D张量——标量:仅包含一个数字的张量叫做标量。2、1D张量——向量:一个轴3、2D张量——矩阵:两个轴行和列4、3D张量与更高维张量5、关键属性2.2张量张量(tensor):矩阵是二维张量,张量是矩阵任意维度上的推广。1、0D张量——标量:仅包含一个数字的张量叫做标量。import numpy as np x=np.array(12)print(x.ndim)#numpy数组的ndim属性可以查看张量轴的个数2、1D张量——向量:一个轴import numpy a

2021-04-05 16:57:37 118

原创 pymysql包使用(python操纵mysql)

文章目录1、连接到数据库2、创建数据库和表3、插入数据用字典实现数据插入4、更新数据5、删除数据1、连接到数据库import pymysqldb=pymysql.connect(host='localhost',user='root',password='123',port=3306)cursor=db.cursor()#cursor()方法获取mysql操纵游标,用于执行sql语句cursor.execute('select version()')#执行sql语句data=cursor.fet

2021-03-16 19:22:00 261

原创 vscode使用chromedriver闪退(非版本号的问题)

问题描述:vscode使用chromedriver闪退解决方案:1、网上找到的基本都说是版本号的问题,多次卸载重装各个版本的chromedriver都无法解决闪退问题。2、以为是以前装的插件与chromedriver产生冲突,卸载重装chrome依旧无法解决闪退问题。3、以为是代码的写的有问题,复制网上大佬各种各样的代码也都无法解决闪退4、在cmd中运行代码发现没有报错,这才理解到是vscode的问题。百度发现在代码后加time.sleep()防止闪退。或者在运行时不用f5而是右键在终端中运行p

2021-03-14 14:16:39 1356 4

原创 爬取豆瓣电影(ajax)

抓取加载页面,分析url每刷新一次url的page_start=0,20,40,…import requestsfrom fake_useragent import UserAgentdef getInfo(page): baseurl = r'https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&p

2021-03-12 21:02:37 187

原创 爬取糗事百科热图

完整代码import requestsimport refrom fake_useragent import UserAgentimport osif not os.path.exists('./qiutu'): os.mkdir('./qiutu')baseurl = 'https://www.qiushibaike.com/imgrank/page/'headers = { 'User-Agent': UserAgent().random}findImgSrc = r'

2021-03-11 17:34:57 159

原创 xpath基本使用方法

文章目录解析节点//*表示匹配所有节点查找父节点属性匹配文本获取获取属性值属性多值匹配多属性匹配位序选择节点轴选择解析节点在from lxml import etreetext ='''<div><ul><li class="item-o"><a href="link1.html">first item</a></li><li class="item-1"><a href="link2.html">se

2021-03-09 18:54:57 214

原创 爬取猫眼电影Top100榜

文章目录1、分析要抓取的内容2、抓取首页,正则匹配需要的内容猫眼电影网址1、分析要抓取的内容2、抓取首页,正则匹配需要的内容

2021-03-09 14:06:44 412 3

原创 re库实现正则匹配

match()函数match(正则表达式,要匹配的字符串)可以检测这个正则表达式是否匹配字符串。匹配返回的对象有狗肉group()和span()两个方法group()输出匹配到的内容span()输出匹配的范围import re content=r'docker run -p 80:80 kennethreitz/httpbin'result=re.match(r'docker run .*\d+.*ken',content)print(result.group())print(result

2021-03-03 14:24:00 304

原创 Prepared Request实现requests像urllib一样对请求进行封装

1、导包from requests import Request, Sessionfrom fake_useragent import UserAgent2、创建参数baseurl = 'http://httpbin.org/post'headers = { 'User-Agent': UserAgent().random}data = { 'name': 'Gauit'}3、创建session对象,用Request将baseurl,data,headers构造Requ

2021-03-02 17:07:11 326

原创 requests处理cookies

respones.cookies调用成功即可获得cookie再用items方法将字典处理成一个个元组输出即可```import requestsfrom fake_useragent import UserAgentbaseurl = 'http://www.baidu.com'headers={ 'User-Agent':UserAgent().random}respones=requests.get(baseurl,headers=headers)print(respones.c

2021-03-02 15:27:20 145

原创 requests实现简单文件上传

requests实现简单文件上传import requestsfrom fake_useragent import UserAgentbaseurl = 'http://httpbin.org/post'headers={ 'User-Agent':UserAgent().random}files ={'file':open('E:\\spider\\requests\\history.py','rb')}respones=requests.post(baseurl,files=fil

2021-03-02 15:05:20 138

原创 ‘gbk’ codec can’t encode character

‘gbk’ codec can’t encode character# print(str(html_bytes))# f=open(filename,'w')# txt=str(html_bytes,encoding='utf-8')# f.write(txt)# f.close()本来打算这样写入文件但是一直报错,多处尝试encoding=‘utf-8’都无法解决。最后百度知道在windows下新文件是以gbk写入。with open(filename,'w',encoding='utf

2021-02-04 20:47:31 150

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除