- 博客(14)
- 收藏
- 关注
原创 数据预处理
数据预处理归一化当数据(x)按照最小值中心化后,再按极差(最大值 - 最小值)缩放,数据移动了最小值个单位,并且会被收敛到[0,1]之间,而这个过程,就叫做数据归一化(Normalization,又称Min-Max Scaling)。注意,Normalization是归一化,不是正则化,真正的正则化是regularization,不是数据预处理的一种手段。标准化当数据(x)按均值(μ)中心化后,再按标准差(σ)缩放,数据就会服从为均值为0,方差为1的正态分布(即标准正态分布),而这个过程,就
2022-05-05 15:50:00 219
原创 2随机森林
集成算法本身不是一种单独的机器学习算法,而是通过在数据上构建多个模型,继承所有模型的建模结果,以此来获取比单个模型更好的效果。通常有三类继承算法,袋装法(Bagging),提升法(Boosting),Stacking袋装法是构建互相独立的评估器,对其预测进行平均或多数表决的原则来决定最终的结果。提升法中,基评估器是相关的,是按顺序一一构建的,其思想是结合弱评估器的力量一次次对难评估的对象进行提升,如梯度提升。n_estimators森林中决策树的数量,值越高,模型效果往往越好,但是达
2022-05-02 13:13:31 136
原创 sklearn 决策树
# 决策树## 决策树参数:### criterion:entropy:信息熵\gini:基尼系数二者没有太大的的区别,但在十几应用中,信息熵对不纯度更加敏感,计算也更缓慢(涉及对数),但决策树生长也会更加精细。因此对于高维数据或者噪音很多的数据,因此信息熵非常容易发生过拟合的现象(高维度数据、噪音很多的数据),不是绝对的。criterion如何影响模型:是确定不纯度的方法、帮忙找出最佳节点和最佳分枝,不纯度越低,决策树的拟合越好。### 决策树基本流程
2022-04-27 21:56:02 359
原创 python基础知识 Chapter11
Day20 python基础知识模块化程序设计理念程序越来越复杂——同一个功能的语句封装到函数中——函数诞生函数和变量多了——同一类型对象的数据和行为统一管理、调用——“类”诞生函数和类多了——类似功能的函数和类统统放到一个模块中——模块诞生python程序由模块组成,一个模块对应一个.py文件标准库模块标准库提供了系统操作、网络通信、文本处理、文件处理、数学运算等基本功能如random math time file os sys 等另外还提供海量第三方模块模块化
2021-11-11 22:01:37 526
原创 2021-11-08
Day18 python基础知识文件操作技术(IO)数据存放在数据库中,而数据库的底层仍是IO技术文件分为文本文件和二进制文件两种1.文本文件储存字符,可以用记事本打开,默认为unicode(两个字节表示一个字符)字符集(注,word这种软件编辑的文档不是文本文件)2.二进制文件把数据内容用字节存储,无法用记事本打开,必须使用专用软件解码,如Mp4、doc等文件相关模块操作创建文件对象open()基本语法格式如下:open(文件名[,打开方式])如果只
2021-11-08 15:50:15 92
原创 python基础知识Chapter9
Day17 python基础知识异常的本质_调试核心理念异常指程序软件运行过程中出现的不正常现象,例如用户输入错误、除数为零、需要处理的文件不存在、数组下标越界等。异常处理,指程序在出现问题时依然可以正确执行剩余的程序,而不会因为异常而终止程序执行。python中引进了很多用来描述和处理异常的类BaseException——Exception——NameError、ValueError、AttributeError遇到异常:1.定位错误2.百度并查看十个相关帖子,尝试解决
2021-11-04 22:44:46 314
原创 pyhton基础知识Chapter8
Day15 python基础知识方法没有重载在其他语言中,可以定义多个重名的方法,只保证方法签名唯一即可,方法签名包含:方法名、参数数量、参数类型python中,方法的参数没有类型(调用时确定类型),参数的数量也可以由可变参数控制。因此,Python中的方法是没有重载的若定义了多个重名的方法,只有最后一个生效方法的动态性python是动态语言,可以动态地给类添加新方法,或修改类已有方法。(方法、函数也是对象,一切都是对象)私有属性和私有方法(实现封装)python中对于类
2021-11-02 22:28:26 98
原创 Python基础知识 Chapter7
Day13 python基础知识嵌套函数在函数内部定义的函数,出了函数范围无法调用功能:1.封装-数据隐藏,外部无法访问2.贯彻DRY,降低重复代码Nonlocal关键字nonlocal 用来声明外层的全局变量global 声明模块中的全局变量LEGB规则python在查找”名称“时,是按照LEGB规则查找的:Local-->Enclosed-->Global-->Built inLocal指函数或者类的方法内部Enclosed指的是嵌套
2021-10-31 21:16:19 122
原创 Python基础知识Chapter6
函数内存底层分析函数也是对象运行def后,会在堆里创建一个函数对象(参数、函数名等),栈中保存了一个函数名对象,值为该函数的地址函数名+括号(),表示调用。创建一次后可以多次调用。def test01()>>>c=test01赋值后c也拥有test01函数的地址可以直接调用,如c(),且print(type(c))=function变量的作用域变量起作用的范围称作作用域,分为全局变量和局部变量全局变量需要用(global)声明,尽量不使用,二者冲突时
2021-10-16 17:10:49 117
原创 Python基础知识Chapter 5
Day8 python基础知识嵌套循环for x in range(5): for y in range(5): print(x,end="\t") print("\n")打印99乘法表for m in range(1,10): for n in range(1,m+1): print("{0}*{1}={2}".format(m,n,(m*n)),end="\t") print()break 语句break用于结束...
2021-10-08 22:22:56 433
原创 Python基础知识Chapter4
字典字典是"键值对"的无序可变序列,字典中的每一个元素都是一个'键值对',包含"键对象"和"值对象"字典通过"键对象"找到对应的"值对象",键是任意不可变数据:数字、字符串、元组,但列表、字典、集合这些可变对象不能作为键。键不可重复字典的创建1.花括号{}如a={"name":"gaoqi","age":"18"}a={} 空的字典对象2.dict() 空的字典对象b=dict(name='gaoqi',age='18')3.dict[]a=dict[("na
2021-09-27 21:37:14 217
原创 python基础知识Day5
python基础知识Day5序列序列是一种数据存储方式,用来存放一系列的数据。常用的序列结构有L字符串、列表、元组、字典、集合列表:用于存储任意数目、任意类型的数据集合如:a=[10,20,‘abc','True']常用方法:list.append(x) 增加元素list.extend(aList)将alist所有元素增加list.insert(index,x)在index处插入元素xlist.remove(x)删除首次出现的xlist.clear()清楚列表内容
2021-09-24 22:24:44 303
原创 Python基础知识.Chapter2
python基础知识Day3链式赋值用于同一个对象赋值给多个变量x=y=123 即 x=123;y=123系列解包赋值系列数据赋值给对应相同个数的变量(个数必须一致)a,b,c=4,5,6即:a=4;b=5;c=6使用系列解包赋值实现变量交换a,b=1,2a,b=b,aprint(a,b)常量Python不支持常量,只能通过逻辑控制内置数据类型整形浮点型(小数)布尔型(TRUE,FALSE)字符串型数字运算加减乘除(+-*/)
2021-09-23 21:45:53 191
原创 Python基础知识.Chapter1
Day1 Python基础知识IDE——integrated develop environment 进入:命令行——python 推出:Ctrl+Z回车/quit()命令/关闭窗口 中断程序执行:Ctrl+C 运行:F5/run moduel 注意缩进,避免中文标点程序基本格式1.注意缩进,严格遵守缩进规则2.区分大小写3.注释:行注释#+stuff段注释三个单引号’‘’Day2 Python基础如何学习守破离建立体系,不要追求之前的基础完美才敢往后学.
2021-09-18 22:53:32 151
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人