ml
机器学习三贱客
这个作者很懒,什么都没留下…
展开
-
深度学习损失函数 分类损失回归损失
损失函数是用于衡量模型所作出的预测离真实值(Ground Truth)之间的偏离程度。通常,我们都会最小化目标函数,最常用的算法便是“梯度下降法”(Gradient Descent)。损失函数大致可分为两种:回归损失(针对连续型变量)和分类损失(针对离散型变量)。一、回归损失(Regression Loss)L1 Loss(绝对值损失函数)也称为Mean Absolute Error,即平均绝对误差(MAE),它衡量的是预测值与真实值之间距离的平均误差幅度,作用范围为0到正无穷。优点: 对离群点(Out原创 2022-06-22 21:10:46 · 6873 阅读 · 1 评论 -
transformer
transformer原创 2021-10-24 17:51:03 · 149 阅读 · 0 评论 -
单样本学习
单样本学习Zero-shot learning 指的是我们之前没有这个类别的训练样本。但是我们可以学习到一个映射X->Y。如果这个映射足够好的话,我们就可以处理没有看到的类了。 比如,我们在训练时没有看见过狮子的图像,但是我们可以用这个映射得到狮子的特征。一个好的狮子特征,可能就和猫,老虎等等比较接近,和汽车,飞机比较远离。One-shot learning 指的是我们在训练样本很少,甚至只有一个的情况下,依旧能做预测。如何做到呢?可以在一个大数据集上学到general knowledge(具体转载 2021-01-15 10:52:11 · 1048 阅读 · 0 评论 -
pandas 读取文本时,使用engine=python和c时间差了1倍
pandas 读取文本时,使用engine=python和c时间差了1倍尽量使用engine=c而不是python,5g的文本,c很快读出来了,python用了超过1小时原创 2019-06-19 09:54:43 · 4584 阅读 · 0 评论 -
加载cifar_10数据集
import os import pickleimport numpy as np def load_CIFAR10(ROOT): """ load all of cifar """ xs = [] ys = [] for b in range(1,6): f = os.path.join(ROOT, 'data_batch_%d' % (b, )) X, ...原创 2019-05-05 14:22:54 · 1954 阅读 · 0 评论 -
过拟合问题
过拟合(over-fitting)的问题,会导致我们回归效果很差。使用正则化(regularization)的技术,提升效果。如何处理过拟合问题?丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征,或者使用一些模型选择的算法来帮忙(例如 PCA)正则化。 保留所有的特征,但是减少参数的大小(magnitude)啊,过完年了,重新开始学习,今天就到这里吧。。。...原创 2019-02-17 22:05:18 · 143 阅读 · 0 评论 -
ml100days-serialize-3
‘2019/Jan/16/Wed 11:24:34’机器学习100天——第3天:多元线性回归(Multiple Linear Regression)第1步:数据预处理导入库import pandas as pdimport numpy as np导入数据集dataset = pd.read_csv('../datasets/50_Startups.csv')X = datas...原创 2019-01-16 14:30:15 · 163 阅读 · 0 评论 -
ml100days-serialize-7 KNN
2019/Jan/20/Sun 22:28:02原创 2019-01-20 22:56:45 · 145 阅读 · 0 评论 -
ml100days-serialize-2
‘2019/Jan/15/Tue 09:24:50’机器学习100天——第二天:简单线性回归第一步:数据预处理import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdatasets = pd.read_csv("…/datasets/studentscores.csv")datasets.head(...原创 2019-01-15 09:45:59 · 154 阅读 · 0 评论 -
ml100days-serialize-6 线性代数回顾(Linear Algebra Review)
2019/Jan/19/Sat 23:00:02’机器学习100天——第6天:线性代数回顾(Linear Algebra Review)矩阵乘法:原创 2019-01-19 23:16:07 · 198 阅读 · 0 评论 -
ml100days-serialize-1
‘2019/Jan/14/Mon 11:24:29’In [3]:import time;time.strftime("%Y/%b/%d/%a %X")Out[3]:'2019/Jan/14/Mon 16:41:12'第一步: 导入库In [4]:import numpy as npimport pandas as pd第二步:导入数据集数据集通常是.csv格式。CSV...原创 2019-01-14 18:32:08 · 172 阅读 · 0 评论 -
ml100days-serialize-5
‘2019/Jan/18/Fri 17:48:26’机器学习100天——第5天:梯度下降(Gradient descent)求最优解的一个过程梯度下降是一个用来求函数最小值的算法,我们将使用梯度下降算法来求出代价函数原创 2019-01-18 18:58:20 · 132 阅读 · 0 评论 -
ml100days-serialize-4
‘2019/Jan/17/Thu 09:27:49’机器学习100天——第4天:逻辑回归(Linear Regression)第1步:数据预处理导入库import numpy as npimport matplotlib.pyplot as pltimport pandas as pd导入数据集这里获取数据集dataset = pd.read_csv('../dataset...原创 2019-01-17 19:00:41 · 194 阅读 · 0 评论