- 博客(9)
- 资源 (1)
- 收藏
- 关注
原创 时间复杂度为O(n^2)的排序算法
基础算法冒泡排序冒泡排序的三种方式(不断优化)看个小例题选择排序插入排序冒泡排序冒泡排序的三种方式(不断优化)/*常规冒泡*/public static void bubbleSort(int[] arr) { for (int i = 0; i < arr.length - 1; i++) { for (int j = 0; j < arr.length - 1 - i; j++) { if (arr[j] > arr[j + 1]
2021-03-23 15:47:42 455
原创 推荐系统--矩阵分解(matrix factorization)
矩阵分解初级代码根据输入信息,随机生成矩阵,后查看结果后续会更新代码import numpy as npdef matrix_factorization(R, P, Q, K, steps=5000, alpha=0.0003, beta=0.03): Q = Q.T cnt = 0 mse = 0 for step in range(steps): stp = step for i in range(len(R)): .
2021-03-17 21:19:35 273
原创 Overfitting--过拟合
什么是underfitting?一般是模型太简单了,训练和测试的错误都非常的大。什么是overfitting?一般由于模型太过复杂,或者太特殊,训练时错误很低,但是测试时错误很多。造成overfitting的原因?1 .训练集太小了,太局限2 .模型过于复杂模型的选择在建立模型时执行。将训练数据分成两个部分training set : 用于训练模型validation set: 估计泛化错误,不等同于测试集缺点:不能保证有足够的数据用于训练模型。目的是..
2021-03-07 12:46:33 145
原创 熵(entropy)相关
直接看几个例子吧。P(C1) = 0/6 = 0 P(C2) = 6/6 = 1Entropy = – 0 log 0 – 1 log 1 = – 0 – 0 = 0P(C1) = 1/6 P(C2) = 5/6Entropy = – (1/6) log2 (1/6) – (5/6) log2 (1/6) = 0.65P(C1) = 2/6 P(C2) = 4/6Entropy = – (2/6) log2 (2/6) – (4/6) log2.
2021-03-07 11:37:24 207
原创 GINI Index-基尼指数
给定节点t:这里的Pi(t) 是 类i的概率,c是所有类的总数。最大值:1-1/c 当每个记录平分时,是收益最小的分类最小值:0 当所有记录都是属于同一个类时,是最大收益下面给出一个例子方便理解:计算单个节点基尼系数:对于第一组:P(C1) = 0/6 = 0 P(C2) = 6/6 = 1Gini = 1 – P(C1)2 – P(C2)2 = 1 – 0 – 1 = 0对于第二组:P(C1) = 1/6 P(C2) = 5/6Gini = 1 –
2021-03-07 11:21:00 2127
原创 机器学习03-训练与损失函数
何为训练一个模型?通过对有标签的样本进行学习,来确定所有权重和偏差的理想值(w1和b)在监督式学习中,机器学习算法通过以下方式构建模型:检查多个样本并尝试找出可最大限度地减少损失的模型;这一过程称为经验风险最小化(empirical risk minimization)。何为损失?损失是对糟糕预测的惩罚。也就是说,损失是一个数值,表示对于单个样本而言模型预测的准确程度。如果模型的预测完全准确,则损失为零,否则损失会较大。训练模型的目标是从所有样本中找到一组平均损失“较小”的权重和偏差。红色表示.
2021-03-06 20:19:49 1150
原创 机器学习02-线性回归
本文采用一个常见的例子:蟋蟀的叫声与气温之间的联系:上图就是叫声和温度之间最直观的表示图,有图可知,随着温度的上升,蟋蟀也会更加躁动。(横坐标叫声,纵坐标是温度,摄氏度为单位)。上图显示,你可以直观的绘制一条近似的直线来匹配这样的关系。仔细观察发现,并不是所有点都被直线穿过。但是该直线确实反映了这两者之间的联系。使用方程式可以表示为:y=mx+by即使需要表示的温度m为直线的斜率x就是每分钟叫的次数,就是我们需要输入的特征、b就是y轴的截距,有的地方用w0表示按照机器学习的惯
2021-03-06 15:24:33 176 1
原创 机器学习01-基本概念
机器学习笔记机器学习主要术语labelsFeaturesExamplesModelsRegression vs. classificationQ&A机器学习主要术语什么是(监督)机器学习?简而言之,它是以下内容:机器学习系统学习如何组合输入以对从未见过的数据产生有用的预测。接下来看一些基本的机器学习术语。labels标签(labels):标签是我们预测的东西——简单线性回归中的y变量。标签可能是小麦的未来价格,图片中显示的动物种类,音频剪辑的含义或几乎任何东西。Featur
2021-03-06 14:40:36 472 3
7种排序算法的效率比较
2020-12-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人