![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
yimenglin
这个作者很懒,什么都没留下…
展开
-
令人头疼的pytorch安装
tensorflow 刚刚会写基础的模块了,今天找到研究方向的代码是pytorch实现的总是看到这句话,人生苦短,我用pytorch看来pytorch应该比tensorflow好学,但是!! pytorch的安装,也太让人头秃了,接下来讲讲我是如何艰辛的安装上pytorch 1.pychram 直接搜索安装(×)点击+号,在跳出的窗口中输入torch,点击install package没过多久,会出现下面的错误,安装失败2.官网pip 语句安装(×)查看资料,有同学指...转载 2020-05-26 11:06:07 · 615 阅读 · 0 评论 -
距离计算方式
距离计算方式欧氏距离 (L2)内积 (IP)杰卡德距离谷本距离汉明距离超结构子结构距离计算方式Milvus 基于不同的距离计算方式比较向量间的距离。选择合适的距离计算方式能极大地提高数据分类和聚类性能。以下表格列出了 Milvus 目前支持的距离计算方式与数据格式、索引类型之间的兼容关系。数据格式距离计算方式索引类型浮点型欧氏距离(L2)、内积(IP)FLAT, IVFLAT, IVFSQ8, IVFSQ8H, IVFPQ, RNSG, ...转载 2020-05-10 17:20:45 · 2780 阅读 · 1 评论 -
机器/深度学习Milvus、Annoy、Vearch、sk-dist介绍
以下为你介绍的机器学习/深度学习软件都可用在Linux系统上:Milvus(向量搜索引擎)、Annoy(求近似最近邻的库)、Vearch(分布式向量搜索系统)、sk-dist(PySpark中的分布式scikit-learn元估计器)。 1、Milvus(向量搜索引擎) Milvus,为海量特征向量的近似最近邻搜索(ANNS)而设计。相比 Faiss 和 SPTAG 这样的算子...转载 2020-04-07 10:46:29 · 1920 阅读 · 0 评论 -
条件随机场(CRF)
作者:Scofield链接:https://www.zhihu.com/question/35866596/answer/236886066来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 so far till now, 我还没见到过将CRF讲的个明明白白的...转载 2020-03-30 10:43:02 · 613 阅读 · 0 评论 -
文本分类实战(一)—— word2vec预训练词向量
1 大纲概述 文本分类这个系列将会有十篇左右,包括基于word2vec预训练的文本分类,与及基于最新的预训练模型(ELMo,BERT等)的文本分类。总共有以下系列: word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention 模型 RCNN 模型 Adversarial LSTM ...转载 2019-12-20 10:36:54 · 1224 阅读 · 0 评论 -
基于梯度的优化算法
梯度下降优化算法大多数学习算法都涉及到优化,优化是指改变 x 以最小化或者最大化某个函数 f(x) 的过程。通常我们所说的优化算法都是指最小化的过程,因此,最大化的过程可以通过最小化 -f(x) 来实现。导数是指某个函数 f(x) 在某一点上的斜率,它可以表明如何缩放输入的小变化才能在输出上获得相应的变化...转载 2019-10-29 11:49:02 · 729 阅读 · 0 评论 -
不平衡学习(Imbalanced learning)
数据不平衡在很多真实场景下,数据集往往是不平衡的。也就是说,在数据集中,有一类含有的数据要远远多于其他类的数据(类别分布不平衡)。在这里,我们主要介绍二分类中的类别不平衡问题,对于多类别的不平衡只做简单的介绍。考虑一个简单的例子,假设我们有一个关于医院患者的数据集(里面包含很多患者的图片),我们把其中患有...转载 2019-10-29 11:47:00 · 1273 阅读 · 0 评论 -
特征选择(Feature Selection)
主要内容:为什么要进行特征选择?什么是特征选择?怎么进行特征选择特征选择: 在现实生活中,一个对象往往具有很多属性(以下称为特征),这些特征大致可以被分成三种主要的类型:相关特征:对于学习任务(例如分类问题)有帮助,可以提升学习算法的效果;无关特征:对于我们的算法...转载 2019-10-29 11:42:35 · 2514 阅读 · 0 评论 -
极大似然估计的理解与应用
极大似然估计是概率论中一个很常用的估计方法,在机器学习中的逻辑回归中就是基于它计算的损失函数,因此还是很有必要复习一下它的相关概念的。背景先来看看几个小例子:猎人师傅和徒弟一同去打猎,遇到一只兔子,师傅和徒弟同时放枪,兔子被击中一枪,那么是师傅打中的,还是徒弟打中的?一个袋子中总共有黑白两种颜色100个球,其中一种颜色90个,随机取出一个球,发现是黑球。那么是黑色球90个?...转载 2019-10-29 11:35:59 · 574 阅读 · 0 评论 -
机器学习常用性能指标总结
序言在机器学习中,性能指标(Metrics)是衡量一个模型好坏的关键,通过衡量模型输出y_predict 和 y_true之间的某种"距离"得出的。性能指标往往是我们做模型时的最终目标,如准确率,召回率,敏感度等等,但是性能指标常常因为不可微分,无法作为优化的loss函数,因此采用如cross-entropy, rmse等“距离”可微函数作为优化目标,以期待在loss函数降低的时候,...转载 2019-10-29 11:08:13 · 1427 阅读 · 0 评论