自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 朴素贝叶斯分类器

BernoulliNB 假定输入数据为二分类数据,MultinomialNB 假定输入数据为计数数据(即每个特征代表某个对象的整数计数,比如一个单词在句子里出现的次数)。朴素贝叶斯分类器是与线性模型非常相似的一种分类器,但它的训练速度往往更快。这种高效率所付出的代价是,朴素贝叶斯模型的泛化能力要比线性分类器(如LogisticRegression 和 LinearSVC)稍差。朴素贝叶斯模型如此高效的原因在于,它通过单独查看每个特征来学习参数,并从每个特征中收集简单的类别统计数据。

2023-10-29 19:37:41 50

原创 机器学习(九)

BP算法是由学习过程由信号的正向传播与误差的反向传播两个过程组成。由于多层前馈网络的训练经常采用误差反向传播算法,人们也常把将多层前馈网络直接称为BP网络。

2023-10-22 19:40:03 36

原创 机器学习(八)

与、或、非问题都是线性可分的问题,若两类问题是线性可分的,即存在一个线性超平面能将它们分开,则感知机一定会收敛而求得适当的权向量w,否则感知机学习过程将会发生振荡,w难以稳定下来。在这个模型中,神经元接收到来自n个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接(connection)进行传递,神经元接收到总输入值将与神经元的阈值进行比较,然后通过“激活函数”(activation function)处理以产生神经元的输出。要解决非线性问题,需考虑使用多层功能神经元。

2023-10-22 19:15:09 35 1

原创 机器学习(七)

【注:特征值化是为了计算机更好地去理解数据。

2023-10-15 19:26:39 47 1

原创 机器学习(六)

决策树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树。常用剪枝方法:

2023-10-14 20:58:08 44 1

原创 机器学习(五)

目录逻辑回归逻辑回归api分类评估方法ROC曲线绘制逻辑回归逻辑回归api分类评估方法ROC曲线绘制

2023-10-08 17:18:11 27 1

原创 机器学习(四)

【代码】机器学习(四)

2023-10-08 00:03:46 27 1

原创 机器学习(三)

预处理是对特征值进行处理,不需要对目标值处理。

2023-10-01 20:14:51 42

原创 机器学习(二)

k近邻法最简单的实现是线性扫描(穷举搜索),即要计算输入实例与每一个训练实例的距离,计算并存储好以后,再查找k近邻,当训练集很大时,计算非常耗时。为了提高KNN搜索效率,可以使用kd树训练数据,以减少计算距离的次数。

2023-10-01 10:12:38 38

原创 机器学习(一)

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。一行数据称为一个样本一列数据称为一个特征有些数据有目标值(标签值),有些则没有一:特征值+目标值(目标值是连续的和离散的)二:只有特征值,没有目标值机器学习一般的数据集会划分两个部分:训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效。划分比例:训练集:70% ~ 80%测试集:20% ~ 30%

2023-09-24 19:37:56 40 1

原创 Matplotlib

plt.xlabel(‘sin’, fontsize = 11, rotation = 45, ha = ‘right’) # rotation设置倾斜角度,ha设置对齐方式。plt.grid(ls = ‘–’, lw = 0.5, c = ‘r’, axis = ‘x’) # axis设置显示垂直哪个轴的线,默认垂直xy轴的都显示。plt.figure(figsize = (5, 3), dpi = 200, facecolor = ‘red’) # (5,3)指宽高比例。

2023-09-22 23:41:34 33

原创 pandas2

传入method='ffill’表示向上填充,将上面的值填充到nan,再传入axis=1表示向左填充,method='backfill’表示向下填充,将下面的值填充到nan,再传入axis=1表示向右填充。all():必须全部为True的行或列,这行或列才会是True,类似and,作用是尽量找到没有空值的行或列。默认是找列,传入axis = 1则可找行。默认是找列,传入axis = 1则可找行。ts.resample(‘3M’).sum().cumsum() # 以3个月为单位进行汇总,求和,进行累加。

2023-09-17 22:29:32 51 1

原创 pandas1

DataFrame是一个【表格型】的数据结构,可以看做是【由Series组成的字典】(共有同一个索引)。DataFrame既有行索引,也有列索引。可以使用中括号取单个索引(此时返回的是元素类型),或者中括号里一个列表取多个索引(此时返回的仍然是一个Series类型)。分为显式索引和隐式索引。如果有多列名称相同,则多列数据都要相同才能合并,或者通过on指定一列作为连接的字段,可以使用suffixs指定冲突列名。当左右两边的key都不相等时使用left_on和right_on指定左右两边的列作为key。

2023-09-10 20:21:57 51 1

原创 Numpy

ndarray.sort():改变原数组,不多占内存空间。ndarray广播机制的两条规则。np.sort():不改变原数组。

2023-09-09 23:29:44 31 1

原创 面向对象三大特性

注:多继承条件下,如果使用同名成员,使用super()调用父类成员,优先匹配先继承的父类成员。注意使用父类名称调用成员方法时要记得加上self。pass关键字是普通的占位语句,用来补全语法保证函数方法或者类定义的完整性,防止报错,其本身表示为空,无内容。注:super()和父类名称都是用于子类内部调用父类成员的方法,在类外不能直接使用。私有成员只能内部使用,放在外部也就是类对象这里是没办法直接调用的。

2023-09-03 20:09:08 28

原创 类和对象

注:当只有><号时会报错。le是用来重载<=运算符的,如果要重载>=运算符,需要使用ge,仍用le会使结果相反。注:当相等时会报错。lt是用来重载<运算符的,如果要重载>运算符,需要使用gt,仍用lt会使结果相反。注:成员变量的定义可不写,构造方法里通过self进行赋值既有定义成员变量的作用又有赋值的作用。前后都有两个下划线的方法都能叫做魔术方法。it,le,eq则为定义类的大小比较规则。str即为定义打印规则。

2023-09-03 16:55:29 30

原创 可视化

将ensure_ascii设置为False表明不使用ASCII码表转换它,而是直接将内容输出,如果为Ture,中文就会转为unicode的字符。1.配置图表标题 2.配置图例 3. 配置鼠标移动效果 4. 配置工具栏等整体配置项。将python转换为json时,如果想让中文正确显示,可增加一个传入参数。针对某个具体参数进行配置,可前往pyecharts官网查看。可用来对json数据进行格式化分析。注:使用前要记得导包。

2023-08-30 20:43:49 31

原创 文件异常模块包

新建一个py文件,在里面写函数,在其他文件要使用时导入模块名即可。模块名要符合标识符命名规则。注意事项:当导入多个模块且模块内有同名功能时,调用这个同名功能调用的是后面导入的模块的功能(后导入的会覆盖先导入的)。测试模块开发人员编写完一个模块后,为了能让模块能够在项目中达到想要的效果,会在py文件中添加一些测试信息(如示例中的test(1,1))。test(1, 1)无论是当前文件还是其他已经导入该模块的文件,在运行时都会自动执行test函数的调用。test(1, 1)

2023-08-27 01:13:29 38

原创 数据容器

注:元组和集合转列表只是换了个括号,字符串转列表是将字符串内的每一个字符取出作为列表的每一个元素,字典转列表会将value抛弃,只剩下key。:基于ASCLL码表的码值大小按位进行比较,一位位进行比较,其中一位大,后面就无需比较了。注:同转换为列表类似,括号为大括号,由于集合无序不重复的特性,转换结果会进行去重。注:列表存储的多个数据的数据类型没有任何限制,可以为不同的数据类型,支持嵌套。(列表,元组,字符串都是序列)注:value值可以重复,key值不能重复,若重复,后面的会将前面的覆盖。

2023-08-25 07:05:46 66

原创 函数

"""格式:def 函数名(传入参数):函数体return 返回值"""参数和返回值可以省略。函数必须先定义再使用。

2023-08-25 06:55:04 22

原创 输入、if、循环

通过type()语句可以知道:无论键盘输入什么类型的数据,获取到的数据永远都是字符串类型。如果要得到想要的类型,需进行数据类型转换。while循环的循环条件是自定义的,自行控制循环条件,而for循环是一种”轮询“机制,是对一批内容进行逐个处理。while循环也可以进行嵌套,需注意条件的控制,避免无限循环,多层嵌套通过空格缩进确定层次关系。归属于if判断的代码语句块需在前方填充4个空格缩进,python通过缩进判断代码块的归属关系。注:continue和break作用的都是本身所在的循环,对上层循环没影响。

2023-08-20 13:03:59 73 1

原创 基础语法

单引号定义法:name = '你好‘双引号定义法:name = "你好“三引号定义法:name = “”“你好”“”双引号内可以写单引号,单引号内也可以写双引号;可使用转义字符 \ 解除引号的作用。

2023-08-18 13:20:02 57 1

CaptureVideoOptions.js

CaptureVideoOptions.js

2022-10-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除