自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 labelme json_to_dataset批量处理生成mask

labelme json_to_dataset批量处理生成mask

2022-09-26 12:14:43 1469 5

原创 python小白之路:第十八章 集成学习与随机森林

集成学习将多个学习模块的结果统一成一个最终的成果机器学习方法。其中每个单独的分类器称为基分类器。Voting模型根据基分类器的结果进行投票作为最终预测结果代码from sklearn.ensemble import VotingClassifierfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn.tree import DecisionTreeClassifiervoting_clf = VotingCla

2020-10-14 17:38:56 216

原创 python小白之路:第十七章 决策树模型

决策树1 什么是决策树生活中我们经常会遇到需要进行决策的事情,而在得到最终决定的过程中,我们通过一些策略或方法来进行判断,并不断思考,最终得到一个判断或结论。决策树是一种树形结构,可以把我们进行决策的过程直观表示出来。从根结点出发,自上而下,对样本数据进行分类,其中内部结点表示一个特征或属性,叶结点代表着最终样本被归到的某一个类别。1.1 栗子假设HR筛选简历以年龄(中年、青年)、学历(本科、研究生、博士)、工作经验(无、0~3年、3年以上)、写代码(会、不会)来决定是否面试。根据以上这个假设,

2020-10-14 17:37:38 261

原创 python小白之路:第十六章 逻辑回归模型(二)

分类模型的评估指标在构建完模型后,还会存在着参数的设定、特征的选取或者算法的优劣等带来的问题,进而影响模型的效果。同时,由于我们构建模型的目的和需求不同,有时候不能简单的以一个方面去评估模型的好坏,因此,存在着评价模型的一系列指标,这些指标从不同方面评估模型。1 混淆矩阵(Confusion Matrix)混淆矩阵能够比较全面的反映模型的性能,由它能够得到一些指标。二分类结果混淆矩阵如下所示:右测为真实情况,下面为预测结果正例(Positive)反例(Negative)正例

2020-10-14 17:35:14 360

原创 python小白之路:第十六章 逻辑回归模型(一)

逻辑回归 Logistic Regression1 原理1.1 分类问题目标是面对某种事物,估计它的可能性,判断属于哪种已知的样本类,比如买不买某种东西、是不是垃圾邮件等。类别的数量可以有很多,所以按数量可以分为二分类(binary classification)和多元分类(multiclass classification)。但是对于多分类问题也可以通过OvR、OvO等一些策略方法转为二分类问题。1.1.1 OvR(One vs Rest)一对剩余的所有,也可能叫OvA。总之思路就是假如有四个类

2020-10-14 17:34:09 321

原创 python小白之路:第十五章 线性回归模型-K折交叉验证

K-fold Cross Validation K折交叉验证1.思路假设有n个观测值,即训练集数据为n,将其均分为K组。其中,K-1组子集作为训练集来训练模型,用剩余的那一组子集作为验证集来计算预测误差。重复以上过程,直到每个子集都做过一次验证集,即得到了K次的预测误差。将K次的预测误差取平均得到一个交叉验证误差,用K个模型最终的验证集的分类准确率的平均数作为此次K-CV下分类器的性能指标。2.目的2.1 拟合(fitting)我们希望能够把数据点用光滑曲线连接起来,找到合适的函数表示曲线。2.

2020-10-14 17:30:27 3603

原创 python小白之路:第十九章 Boosting模型(二)

提升树模型(Boosting Decision Tree,BDT)以决策树为基函数的提升方法。对于分类问题的决策树是二叉分类树;对于回归问题是二叉回归树。一个根结点直接连两个叶结点的简单决策树称为决策树桩。1 算法前向分步算法+加法模型针对不同问题,损失函数有所不同第m步模型:fm(x)=fm−1(x)+T(xi;Θm)f_m(x)=f_{m-1}(x)+T(x_i;\Theta_m)fm​(x)=fm−1​(x)+T(xi​;Θm​)参数Θm\Theta_mΘm​:Θ^m=

2020-10-14 17:20:49 366

原创 python小白之路:第十九章 Boosting模型(一)

Boosting(提升)集成学习的一种方法。相比于bagging的并行式,boosting是序列式或者串行的方式,各个基分类器间有依赖关系。类似于我们人类的学习方式。在学习一些知识的过程中,通过某种方式比如月考期中期末考试,有些知识点我们确认已经较为掌握,可有的知识点我们通过测验发现做错了,自己掌握的并不好,因此,会着重去练习犯错的知识点,以期降低错误率。对于原始训练集,第一次我们训练了一个弱学习器1,统计了错误的情况,即这次训练的效果。根据这次的效果,给予犯错误的样本更高的权重,得到第二次训练的数

2020-10-14 16:42:27 623

原创 python小白之路:第五章 模块、包与库 第五节 异常处理

异常处理非正常,没有达到预期目标;是一个事件,并且这个事件在我们程序的运行过程中出现,会影响程序的正常运行。两种: 1.语法错误导致的异常; 2.逻辑错误导致的异常常见异常类 : 网上都有如何处理:如果错误发生的情况可以预知,那么就可以使用流程控制进行预防处理如果错误发生的情况不可预知,那么可以用try…except…在错误发生时进行处理tey except用法1.不指定错误类型,只要发生就进入except: try: # 可能发生异常错误的代码

2020-06-29 16:44:41 173

原创 python小白之路:第五章 模块、包与库 第四节 第三方库和虚拟环境初识

第三方库的管理 pippip就是python的包管理工具,可以方便的管理第三方库(包)使用:pip install 包名(库名)注:如果有多个python环境的情况下,可能需要使用pip3虚拟环境 venv在当前的系统环境中,去配置另外一个python的运行环境,可以创建多个不同的虚拟环境,相互独立,互不影响可以在没有权限的情况下安装新的库不同的应用可以使用不同的库或版本虚拟环境中的库升级也不影响其他环境可以作为一个项目的专有环境,在需要部署时,一键导出项目的所需

2020-06-29 16:39:15 142

原创 python小白之路:第五章 模块、包与库 第三节 模块与包

自定义模块的使用自己创建一个python脚本,定义一些类或方法,供别的脚本导入后使用自定义包和使用1.包可以理解为一个文件夹,里面包含了多个python文件2.包的结构> 包(文件夹) |---------__init__.py 包的标志性文件,可以有内容也可以没有 |---------a.py a模块(文件) |---------子包 文件夹中的文件夹 这么理解 |---------|---

2020-06-29 16:38:10 161

原创 python小白之路:第五章 模块、包与库 第二节 内置模块

序列化可以把python中的数据,以文本或二进制的方式进行转换,并且还能反序列化为原来的数据。1.二进制序列化模块pickle import pickle一些函数:pickle.dumps()序列化,可以把一个python的任意对象序列化成为一个二进制pickle.loads()反序列化,可以把一个序列化后的二进制数据反序列化为python的对象pickle.dump(vars,file=)序列化,可以把一个数据对象进行序列化并写入到文件中pickle.load(

2020-06-29 16:32:43 163

原创 python小白之路:第五章 模块、包与库 第一节 文件

基础操作file : 存储在磁盘中,针对磁盘中的文件的读写操作步骤:打开文件open()、读写文件read/write()、关闭文件close()open()打开文件1.语法open(文件的路径,打开的方式,[字符集])文件的路径:URL 统一资源定位符 a.相对路径:给别人指路,有参照物 :’./‘ 当前目录; ’../‘ 当前目录上一级目录 b.绝对路径:收货地址,无参照物直接给地址信息打开的方式:基础模式 w r x a 扩展模式 b + w

2020-06-29 16:20:02 147

原创 python小白之路:第四章数据类型第五节集合

集合的基本操作和常规操作1.定义确定的一组无序的数据的集合,值不能重复语法:{}、set()、集合推导式False和0只能存在一个,True和1只能存在一个列表放不进去2.冰冻集合v = frozenset()一旦定义不能修改,只能做运算本身就是一个强制转换类的函数,可以把其他任何容器类型的数据转为冰冻集合3.集合推导式 # 普通推导式 varset ={1,2,3,4} newset = {i<<1 for i in varset}

2020-06-15 22:58:59 153

原创 python小白之路:第四章数据类型第四节字典

字典相关函数len()返回列表元素个数。vard = {'a':1,'b':2}print(len(vard))# 2str() & type()强制转换为字符串查询数据类型 vard = {'a': 1 ,'b':2} res = str(vard) print(res,type(res)) # {'a': 1, 'b': 2} <class 'str'>dict.clear()用于删除字典内所有元素。 vard =

2020-06-15 22:54:42 135

原创 python小白之路:第四章数据类型第三节元组

元组函数:len()返回元组元素个数。res = 1,2,3print(len(res))# 3max() & min()返回元组元素中最大和最小值res = 1,2,3print(max(res))print(min(res))# 3# 1tuple()转换为元组res = tuple('123')print(res)# ('1', '2', '3')元组推导式:语法 : (变量运算 for in 容器)返回的是生成器生成器

2020-06-15 22:52:36 147

原创 python小白之路:第四章数据类型第二节列表

len()重点记忆返回列表元素个数。varl = [1,2,3]print(len(varl))# 3max()返回列表元素中的最大值。varl = [1,2,3]print(max(varl))# 3min()返回列表元素中的最小值。varl = [1,2,3]print(min(varl))# 1list()重点记忆用于将元组或字符串转换为列表。str = '123'vart = (1,2,3)print(list(str))

2020-06-15 22:50:01 174

原创 python小白之路:第四章数据类型第一节详解字符串

capitalize()返回原字符串的副本,将字符串的第一个字母变成大写,其他字母变小写str = 'hello word'print(str.capitalize())# Hello wordcenter(width[,fillchar])返回一个指定的宽度width居中的字符串,fillchar为填充的字符,默认为空格。 str = 'hello word' print(str.center(15,'%')) # %%%hello word%%ljust(

2020-06-15 22:47:34 319

原创 python小白之路:第三章函数第三节

内置函数range():功能 :能够生成一个指定的数列参数 :start 开始的值,默认为0stop 结束的值step 可选,步进值,默认为1返回值 :可迭代的对象,数字序列zip() :功能 :可以接收多个可迭代的对象,然后把每个可迭代对象中的第i个元素组合在一起成为一个元组,这些元组形成一个新的迭代器参数 :*iterables 任意个的可迭代对象返回值 :返回一个元组的迭代器栗子 :

2020-05-29 12:32:20 205

原创 python小白之路:第三章函数第二节

高阶函数递归函数 :定义了一个函数。然后在函数内。自己调用了自己这个函数。递归函数内必须要有结束,不然会一直调用下去一层一层的进入,再一层一层的返回 def digui(num) : print(num) if num>0: digui(num-1) print(num) 结果: 3 2 1 0 0 1 2

2020-05-29 12:28:01 135

原创 python小白之路:第三章函数第一节

变量的作用域定义 :当前起作用,可用的范围区域,也就是变量的有效范围全局变量 :在定义或引用时,global + 关键字在函数内外都可以使用的变量局部变量 :在函数内部可以使用的变量,在函数内定义后,外部不能直接用,会报错在多层函数里时,nonlocal + 关键字来调用上层的局部变量可变数据类型的变量 :在函数外定义的变量,在函数内可以使用或操作list dict不可变数据的变量 :在函数外定义的变量,在函数内只可以访问除上面2种之外的数据

2020-05-29 12:21:18 188

原创 python小白之路:第三章函数第一节(一)

认识函数模块化编程 :把程序进行封装函数 :一个具有特定功能的代码块作用 :把代码进行封装,以提高代码的重用性,提高开发效率,并且降低了后期的维护成本。定义函数 :def 函数名([参数列表]) :当前函数的具体功能的代码调用:函数名()一些特征 :定义后,不调用不执行;先定义再调用;调用不受次数影响;注意名不要冲突,会被覆盖。关于函数的参数 :类型:普通参数、默认参数、收集参数、命名关键字参数、关键字收集参数普通参数 :顺

2020-05-29 12:17:44 202

原创 python小白之路:第二章python流程控制

一些豆知识‘.调用操作’和用函数的区别:e.g. : s = ‘123456’, s.后面出现的一些可选操作针对该数据类型,而像len(s)函数这样的针对不止s的数据类型,所以s.length会报错新学的一些操作:sum()求和len()求长度取指定长度的字符串: s = '123456' k = 2 print(s[k:]) print(s[:k]) 结果:3456 12

2020-05-29 12:13:04 184

原创 python小白之路:第二章python流程控制(一)

第二章 python流程控制顺序结构、分支结构、循环结构分支结构单向分支 :如果判断表达式的结果成立,就执行代码区间;反之,则不执行 > if 表达式 : 代码区间双向分支 :如果判断表达式的结果成立,就执行代码区间;反之,则执行假区间 > if 表达式 : 代码区间 else : 代码区间多向分支 :判断多个,会执行其中符合条件的一个 > if 表达式 : 代码区间 if 表达式 :

2020-05-29 12:08:05 201

原创 python小白之路:运算符和进制

python运算符算术运算符比较(关系)赋值运算符逻辑运算符位运算符成员运算符身份运算符数字系统定义了如何用独特的符号来表示一个数字位置化数字系统:十进制、二进制、十六进制、八进制十进制(decimal):底为10,用10个符号表示一个数,S = {0,1,2,3,4,5,6,7,8,9}552.23 = +(552.23)10(10为下角标格式)整数: 224 = + 2 * 10 ** 2 + 2 * 10 ** 1 + 4 * 10 ** 0实数: 24.1

2020-05-29 12:03:36 277

原创 python小白之路:第一章 初识python

基本概念1.脚本或程序:编写python程序的文件,后缀为.py2.函数:为了完成某些功能3.注释:进行说明,解释,调试,不会被运行;格式为“#”开头或者“三引号”开头结尾4.变量:用一个英文字符串来记录一些数据,并且这个被标记的数据是可以变化的5.数据类型:数据的表现形式string字符串:你好,i love you,大字符串(字数很多,里面可以直接换行)number数字类型:1.int整型 没有小数点,正负数都可,进制类型也可2.float浮点型:有小数点3.complex复数:5

2020-05-29 11:55:19 237

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除