自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据挖掘SparkExpert的博客

大数据智能相关理论、技术与工具的学习、理解和精通掌握过程集合

  • 博客(4)
  • 收藏
  • 关注

原创 facebook Faiss的基本使用示例(逐步深入)

针对上一篇文章,安装完毕之后,可以对faiss进行基本的案例学习,具体步骤如下:step1:构造实验数据step2:为向量集构建IndexFlatL2索引,它是最简单的索引类型,只执行强力L2距离搜索step3:进行简单的k-近邻搜索结果如下: NOTE: 1.程序输出为查询向量的最近邻的4个向量的索引

2017-03-31 10:34:19 26591 4

原创 facebook faiss的安装测试

Faiss 是由 Facebook AI Research(FAIR)开发的一个用于有效的相似性搜索(similarity search)和稠密矢量聚类(clustering of dense vectors)的库。它包含了在任何大小的向量集合里进行搜索的算法,向量集合的大小甚至可以达到装不进 RAM。它还包含了用于评估和参数调优的支持代码。Faiss 是用 C ++编写的,带有 Python

2017-03-31 10:21:10 8715 4

原创 使用word2vec训练wiki中文语料

实验环境:Ubuntu + eclipse + python3.5首先(1)下载最新中文wiki语料库:wget https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2(2)由于下载之后,语料库上的编码格式会有不同,因此需要进行处理一下:借鉴了这篇文章。ht

2017-03-31 09:47:28 5133 1

原创 C#语音播放引擎cscore及其播放器

最近在找一个C#语音播放器的时候,才发现这个几乎很难找到,当然也存在自己找资料不太全的问题。但是至少这个是存在的,常见的还是Naudio的东西。但是说实话,除非XAML的WPF东西,不然Naudio做出来的界面化东西还真不怎样。不过幸运的是,Naudio平台也出来了一个界面化渲染的东西,也支持多种渲染方式。试验了下,效果还是不错,只是没有将播放与控制放在一起,很多操作还是不

2017-03-09 20:22:58 3089

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除