自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 kubectl 常用命令总结

0、kubectl 命令帮助 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 ...

2020-02-15 12:15:13 800

原创 go test 执行单元测试文件时 提示未定义的问题

之前遇到一个问题,在写go test 测试文件时,有2个文件simple.go和simple_test.go,在同一目录下,其中simple_test.go调用simple.go种的方法,调用时编辑器没有报错,但是执行go test -v -run simple_test.go是报错了:# command-line-arguments [command-line-arguments.test]...

2019-08-10 10:20:41 2655

原创 name_scope与variable_scope对于Variable和get_variable的作用

name_scope 对 get_variable新建变量的name属性无影响;对variable新建变量的name属性增加了“范围”标识。 variable_scope对get_variable新建变量的name属性和variable新建变量的name属性都增加了“范围”标识。 get_variable新建变量如果遇见重复的name则会因为重复而报错。 variable新建的变量如果遇见...

2019-04-19 11:51:55 162

转载 CRF

原文:https://blog.csdn.net/u013378306/article/details/55213029隐马尔科夫模型(HMM):图1. 隐马尔科夫模型隐马尔科夫模型的缺点: 1、HMM只依赖于每一个状态和它对应的观察对象: 序列标注问题不仅和单个词相关,而且和观察序列的长度,单词的上下文,等等相关。...

2019-04-07 10:54:07 221

原创 文本相似度代码

看了一些关于文本相似度的理论,于是根据tfidf模型实践了一下文本相似度的代码。# -- encoding:utf-8 --"""Create by on 2019/3/30根据tfidf模型的相似度"""import jiebafrom gensim import corpora,models,similaritiesdoc0 = "我不喜欢上海"doc1 = "上海是一...

2019-03-30 19:57:54 1177

转载 计算文本相似度方法大全-简单说(汇总)

原文:https://blog.csdn.net/chinafire525/article/details/78686876本编文章是方法论-主要给大家介绍原理思路简单讲解基于关键词的空间向量模型的算法,将用户的喜好以文档描述并转换成向量模型,对商品也是这么处理,然后再通过计算商品文档和用户偏好文档的余弦相似度。文本相似度计算在信息检索、数据挖掘、机器翻译、文档复制检测等领域有着...

2019-03-30 18:53:40 1703

原创 小知识点

词嵌入(word embeddings)常用于计算两个词语之间的语义相似性,或者找出与目标词语最相似的词语。word2vec和GloVe等词嵌入已经成为寻找单词间语义相似度的标准方法。分布式向量或词嵌入向量基本上遵循分布式假设,即具有相似语义的词倾向于具有相似的上下文词,因此这些词向量尝试捕获邻近词的特征。分布式词向量的主要优点在于它们能捕获单词之间的相似性,使用余弦相似性等度量方法评估词向量之间...

2019-03-30 18:13:22 133

原创 编辑距离(Edit Distance)

概述编辑距离(Minimum Edit Distance,MED),由俄罗斯科学家 Vladimir Levenshtein 在1965年提出,也因此而得名 Levenshtein Distance。在信息论、语言学和计算机科学领域,Levenshtein Distance 是用来度量两个序列相似程度的指标。通俗地来讲,编辑距离指的是在两个单词之间,由其中一个单词转换为另一个单词所需要的最少单...

2019-03-30 17:54:34 700

转载 DenseNet 学习笔记

这两天在学习DenseNet,过程中感受到了DenseNet设计之妙,遂做点笔记。文章大部分是:https://blog.csdn.net/u014380165/article/details/75142664和https://blog.csdn.net/zchang81/article/details/76155291 来的笔记论文:Densely Connected Convoluti...

2019-03-11 14:28:31 199

转载 [转载]True(False) Positives (Negatives) 的含义和翻译

True Positive (真正, TP)被模型预测为正的正样本;可以称作判断为真的正确率True Negative(真负 , TN)被模型预测为负的负样本 ;可以称作判断为假的正确率False Positive (假正, FP)被模型预测为正的负样本;可以称作误报率False Negative(假负 , FN)被模型预测为负的正样本;可以称作漏报率True Positive Rate(...

2019-03-09 11:31:20 328

原创 关于安装tensorflow 过程“Consider using the `--user` option or check the permissions”的报错

错误如图上,解决步骤如下:1.pip uninstall tensorflow2.pip install tensorflow==1.7 --user完美搞定!

2019-03-08 11:48:50 21474

原创 Matplotlib报non-GUI backend的错误解决方式

标题在做目标检测的时候遇到这个问题,一开始懵逼了,后来百度了知道是matplotlib默认使用的模式是agg,需要手动设置为TkAgg在导完所有的包以后 加 matplotlib.use('TkAgg')就行了 这样的话可以弹出来。有些说 顺序要如下import matplotlib as mplmpl.use('TkAgg')import matplotlib.py...

2019-03-05 11:56:55 4471 1

转载 pandas.read_csv参数整理

## pandas.read_csv参数整理 读取CSV(逗号分割)文件到DataFrame也支持文件的部分导入和选择迭代更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html参数:**filepath_or_buffer** : str,pathlib。str, pathlib.Path, py._path.local....

2018-11-30 11:20:27 99

原创 【机器学习八】决策数

111111

2018-11-30 11:14:10 113

原创 matplotlib的几个图形

在收集到数据的时候,常常需要用图形的形式显示出来,matplotlib提供了强大的功能。下面自己总结几个图形的用法,已备后面查看。折线图import numpy as npimport matplotlib.pyplot as plt%matplotlib inline #用于jupyter 中显示图形用的import matplotlib as mplmpl.rcParams['...

2018-11-30 11:13:41 107

原创 前言

pandas.read_csv参数整理读取CSV(逗号分割)文件到DataFrame也支持文件的部分导入和选择迭代更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html参数:filepath_or_buffer : str,pathlib。str, pathlib.Path, py._path.local.LocalPath ...

2018-11-30 11:12:58 138

原创 【机器学习七】利用K-means压缩图片

在学习机器的过程中,发现了K-means的一种应用,遂那这个例子,练练手,增加对K-means的理解。 # -- encoding:utf-8 --"""Create by yexm on 2018/11/24"""# coding:utf-8import matplotlib.pyplot as pltimport numpy as npfrom sklearn.clust...

2018-11-30 07:23:11 197

原创 【机器学习六】贝叶斯NB

代码先贴上,后续总结from numpy import *# 过滤网站的恶意留言 侮辱性:1 非侮辱性:0# 创建一个实验样本def loadDataSet(): postingList = [['my','dog','has','flea','problems','help','please'], ['maybe','not','take','him','to...

2018-11-30 00:05:19 156

原创 【机器学习五】KNN

代码如下,其中数据集trainingDigits可以从我的 网盘.上下载,提取码:cbun 永久有效#手写识别 32x32from numpy import *import operatorimport timefrom os import listdirdef createDataSet(): group = array([[1.0,1.1], [1.0,1.0], [0...

2018-11-30 00:01:10 273

原创 【机器学习一】梯度下降法

1.用SGD 的时候样本方差不能大,大的话很可能不收敛,但是BGD则一定收敛2.SGD收敛速度快 BGD慢点 计算量大

2018-11-29 23:47:42 84

原创 【机器学习四】SVM

机器学习中一般用的比较多的是集成学习算法如bagging和boosting,以及SVM。这2个算法的效果好。且对数据的分布没有啥要求。今天要讲的是SVM即支持向量机。SVM的定义支持向量机(Support Vecor Machine, SVM)本身是一个二元分类算法,是对感知器算法模型的一种扩展,现在的SVM算法支持线性分类和非线性分类的分类应用,并且也能够直接将SVM应用于回归应用中,同...

2018-11-28 23:46:07 416

原创 【机器学习三】梯度下降法K-means优化算法

K-means算法延伸对于之前的一篇文章中说过K-means虽然效果可以,但是对给定的K值敏感,簇中心位置敏感以及计算量大。所以针对以上两点有了一些优化的方法。对于给定的K值偏大或者偏小都将影响聚类效果。而由于对于需要聚类的数据本身没有一个y值即分类值,这正是需要算法最后得出的。所以一般对于不给定K值的话,可以通过canopy 算法来确定K值。Canopy算法Canopy算法属于一种“粗”...

2018-11-26 22:47:58 1484

原创 【机器学习二】梯度下降法KMeans

KMeans聚类的思想:给定一个有M个对象的数据集,构建一个具有k个簇的模型,其中k<=M。满足以下条件:• 每个簇至少包含一个对象• 每个对象属于且仅属于一个簇• 将满足上述条件的k个簇成为一个合理的聚类划分• 基本思想:对于给定的类别数目k,首先给定初始划分,通过迭代改变样本和簇的隶属关系,使的每次处理后得到的划分方式比上一次的好(总的数据集之间的距离和变小了)K-me...

2018-11-25 09:22:25 1303

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除