自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 蓝桥常用算法模版

接下一个正整数 m,再接下来有 m行,表示m个询问。每个询问的第一个整教表示询问代号,询问代号1表示增加,后面的两个数…和 A表示给位置X 上的数值增加 A询问代号 2 表示区间求和,后面两个整数表示a和b,表示要求a,6 之间的区间和。输入文件第一行为一个整数 N,接下来一行包含 ” 个整数,表示格子中原来的整数。提问:求某一个特定的子区间「a,Ы中所有元素的和;共 m 行,每行一个整数,表示每个提问的答案。行 N 个方格,开始每个格子里都有一个整数。现在要求你能对每个提问作出正确的回答。

2024-03-21 22:44:53 208

原创 K-近邻算法原理详解

kNN算法是机器学习中一个比较简单的算法,原理以及实现过程都比较简单,并且不涉及训练数据,只有对数据的预处理,具有精度高,对异常值不敏感,无数据输入假定的有点;但是其中设计欧式距离等的计算,并且对于n个样本数据数据集,m个测试数据就要进行n * m次距离计算,其计算复杂度和空间复杂度较高,但可以进行多分类任务,该算法适用于数值型和标称型的分类任务。【免费】knn实现中约会网站的数据集_约会特征数据集下载资源-CSDN文库【免费】手写识别系统数据集,knn的实现中可用_手写识别系统数据集资源-CSDN文库。

2023-10-16 22:54:06 669

原创 python——pandas的时间序列分析详解

某分店按天统计了2017年全年的销售数据,现在总经理想抽查分店8月28日(七夕)的销售情况,如果只是单独拎出来当天的数据,则这个数据比较绝对,无法很好地反映出这个日期前后销售的整体情况。可以指定偏移量创建时间序列,同时,创建14天10小时的偏移量,可以换算为两周零十个小时,其中“周”使用Week类型表示的,“小时”使用Hour类型表示,它们之间可以使用加号连接。这个区间就是窗口,它的单位长度为10,数据是按天统计的,所以统计的是10天的平均指标,这样显得更加合理,可以很好地反映了七夕活动的整体情况。

2023-07-29 17:12:57 2063

原创 Python——使用pandas库处理文件

在python中,读写excel数据方法很多,比如xlrdxlwt和openpyxl,实际上限制比较多,不是很方便。比如openpyxl也不支持csv格式。更好的方法可以使用pandas,虽然pandas不是专门处理excel数据,但处理excel数据更方便。在进行pandas操作前,可以先设置pandas显示的行和列:#显示所有列#显示所有行#设置value的显示长度为100,默认为50。

2023-07-28 19:48:41 235

原创 python对csv和excel文件的操作详解

在openpyxl中,每个Worksheet对象都有一个freeze_panes属性,该属性可以设置为一个Cell对象或一个单元格坐标的字符串,需要注意的是,单元格上边的所有行和左边的所有列都会冻结,但单元格所在行和列不会冻结。得到sheet对象后,可以按照名字访问Cell对象,Cell对象的value包含这个单元格的值,row属性是这个单元格的行数,column是这个单元格的列数,行和列都是从1开始。在python中,其操作方法和往excel中写入数据一样,以某个单元格为键值,输入相应的公式。

2023-07-28 01:43:52 1229

原创 python——matplotlib绘图详解大全

Matplotlib中有多种定义颜色的方法,常见的方法包括:三元组 (Triplets):颜色可以描述为一个实数三元组,即颜色的红、蓝、绿分量,其中每个分量在[0,1]区间内。因此,表示纯红色,而则表示粉色。四元组 ():它们前三个元素与三元组定义相同,第四个元素定义透明度值。此值也在[0,1]区间内。将图形渲染到图片文件中时,使用透明颜色可以使绘制图形与背景进行混合。Matplotlib将标准HTML颜色名称解释为实际颜色。例如,字符串red即可表示为红色。

2023-07-25 19:55:58 18518 3

原创 python——matplotlib的用法详解

Matplotlib是Python生态系统的一个重要组成部分,是用于可视化的绘图库,它提供了一整套和matlab相似的命令API和可视化界面,可以生成出版质量级别的精美图形,Matplotlib使绘图变得非常简单,在易用性和性能间取得了优异的平衡。安装成功后,即可以在Python中像使用其它库一样导入和使用Matplotlib,而无需更多文件的配置,通常我们将其导入后使用别名mplMatplotlib的配置更多的用于修改绘制图形的默认样式,Matplotlib。

2023-07-25 02:05:15 19071 1

原创 python——pandas用法详解

Python本身的数据分析功能并不强,需要安装一些第三方的扩展库来增强它的能力。其中,针对结构化数据(可简单理解为二维表数据,或我们常用的Excel表格数据)分析能力最强的第三方扩展库就是Pandas。Pandas 是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来的,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具。

2023-07-24 20:57:48 7541

原创 numpy随机抽样字模块

计算机系统生成的随机数都是伪随机数,NumPy 自然也不例外,但它的 random 随机抽样子模块提供了很多便捷的函数,可以满足绝大多数的应用需求。

2023-07-21 20:59:09 47

原创 numpy矩阵的操作

对于矩阵来说,不管是使用星号相乘还是使用np.dot()函数相乘,结果都是np.dot( )函数相乘的结果,因为矩阵没有对应元素相乘这个概念。在数学上,矩阵(Matrix)是一个按照矩形阵列排列的复数或实数集合,但在NumPy中,矩阵np.matrix是数组np.ndarray的派生类。首先,矩阵是二维的,不能像数组一样幻化成任意维度,即使展开或切片,返回也是二维的;其次,矩阵和矩阵、矩阵和数组都可以做加减乘除运算,运算结果总是返回矩阵;矩阵有几个特有的属性,如转置矩阵、逆矩阵、共轭矩阵、共轭转置矩阵等。

2023-07-21 20:35:51 227

原创 numpy对掩码数组的操作详解

numpy.ma子模块通过引入掩码数组提供了一种解决数据缺失或无效问题的安全、便捷的方法。numpy.ma子模块的主体是MaskedArray类,它是numpy.ndarray的派生类,可以把numpy.ma子模块当作ndarray来用,且无须考虑数组的无效值是否会给操作带来无法预知的意外。

2023-07-21 19:21:07 775

原创 numpy常用函数

广播是NumPy最具特色的特性之一,几乎所有的NumPy函数都可以通过广播特性将操作映射到数组的每一个元素上。然而NumPy函数并不能完成所有的工作,有些工作还需要我们自己来定义函数。如何让我们自己定义的函数也可以广播到数组的每一个元素上,就是自定义广播函数要做的事情。return 0elif x&(x-1) == 0 and y&(y-1) == 0: # x和y都是2的整数次幂elif x&(x-1) == 0: # 仅有x等于2的整数次幂return x。

2023-07-21 01:25:55 278

原创 python操控——MongoDB数据库

其中MongoDB是由C++语言编写的非关系型数据库,是一个基于分布式文件存储的开源数据库系统,其内容的储存形式类似JSON对象,它的字段值可以包含其他文档,数组及文档数组,非常灵活。$text: 文本查询 {'$text':{'$search':'Mike'}} text类型的属性中包含Mike的字符串。$regex: 匹配正则表达式 {'name':{'$regex':'^M.*'}} 匹配name以M开头。$type: 类型判断 {'age':{'$type':'int'}} age的类型为int。

2023-07-20 21:09:58 339

原创 python操控MySQL储存

关系型数据库是基于关系模型的数据库,而关系模型是通过二维表来保存的,所以关系型数据库中的数据的储存方式就是行列组成的表,每一列代表一个字段、每一行代表一条记录。关系型数据库有多种,例如SQLite,MySQL,Oracle,SQL Server, DB2等。

2023-07-20 02:13:40 140

原创 JSON和CSV文件操作

r : 以只读方式打开一个文件,意思是只能读取文件内容,而不能写入。这也是默认的方式rb:以二进制只读文件打开一个文件,通常用于打开二进制文件,例如音频,图片,视频等。r+: 以读写方式打开一个文件,既可以读文件,也可以写文件。rb+: 以二进制读写方式打开一个文件,同样既可以读取文件,又可以写文件,只不过读取和写入的都是二进制文件。w : 以写入方式打开一个文件,如果该文件已经存在,则将其覆盖,如果该文件不存在,则创建新文件。

2023-07-19 21:37:01 489

原创 numpy——数组的操作方法

在机器学习算法模型的例子中,海量的训练数据通常都是从数据文件中读出来的,而数据文件一般是csv格式,NumPy 自带的csv文件读写函数,可以很方便的读写csv格式的数据文件。NumPy仍然保留了append() 方法,只不过这个方法不再是NumPy数组的方法,而是是升级到最外层的NumPy命名空间,并且该方法的功能不再是追加元素,而是合并数组。NumPy数组的存储顺序和数组的视图是相互独立的,因此改变数组的维度是非常便捷的操作,这一类操作不会改变所操作的数组本身的存储顺序, resize() 除外。

2023-07-18 22:24:40 123

原创 numpy——数组

创建数组的方法,分成了创建简单数组和构造复杂数组两大类。其实简单数组和复杂数组并没有严格的分界线,大致上,无中生有创造出来的数组称为简单数组,通过移花接木、举一反三创造出来的数组称为复杂数组。

2023-07-17 22:51:37 49

原创 python——numpy简介和用法

NumPy是Python科学计算的基础软件包,提供多了维数组对象,多种派生对象(掩码数组、矩阵等)以及用于快速操作数组的函数及API,它包括数学、逻辑、数组形状变换、排序、选择、I/O 、离散傅立叶变换、基本线性代数、基本统计运算、随机模拟等。NumPy是SciPy家族的成员之一。SciPy家族是一个专门应用于数学、科学和工程领域的开源Python生态圈,SciPy家族的核心成员为Matplotlib、SciPy和NumPy,可以概括为MSN这三个字母。

2023-07-16 15:39:50 254

原创 爬虫知识库详解和案例实操

request是最基本的HTTP请求模块,可以模拟请求的发送,其过程与在浏览器中输入网址1然后回车一样,只要给库方法传入URL以及额外的参数,就可以模拟实现发送请求的过程。requests中的get(),post(),put(),delete(),patch()方法可以实现GET,POST,PUT,DELETE,PATCH请求。logging 模块是 Python 内置的标准模块,主要用于输出运行日志,可以设置输出日志的等级、日志保存路径、日志文件回滚等;

2023-07-15 20:13:37 1060

原创 爬虫——urllib库的基本使用

导入ProxyHandler模块,利用该模块实例化一个HTTP代理对象,其参数是一个字典,键名是一个协议类型,键值是代理连接,设置IP地址和端口号,可以添加多个代理连接。要获取一个网站的Cookie,必须声明一个CookieJar对象,在利用HTTPCookieProcessor构建一个Handler,再构建Opener对象利用open方法打开链接,再输出Cookie的条目的名称和值。即代理服务器,伪装一个IP,代理用户取得网络信息,可以理解为网络信息的一个中转站,隐藏真实的IP。

2023-03-28 00:09:05 425 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除