- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 求海量文本中两两相似文本的快速算法
问题描述这个问题的输入是一个文本语料库,输出是语料库中相似度大于某个阈值的所有文本对,阈值可以是0.9或者0.8. 举个例子,比如我的输入是下面的语料库,我的阈值是0.6,我的相似度度量用的是文本中以字为单位的jaccard相似度1. 福禄很可爱2. 福禄真可爱3. 福禄是可爱4. 阿里巴巴牛逼5. 阿里巴巴很牛逼 我的输出是:文档ID 文
2017-02-26 09:26:03 4891 4
原创 centos 6.8docker安装
刚买了个ecs服务器,并且装了个docker参考下面这个帖子,轻松搞定http://www.cnblogs.com/baolong/p/5743420.html
2017-02-23 22:08:31 471
原创 tensorflow安装的坑
最近想装tensorflow,网上一搜,全是16年的帖子,按照帖子中提供的安装链接,都不靠谱,总是报下面的错误:Collecting tensorflow==0.9.0 from https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-0.9.0-cp27-none-linux_x86_64.whl Retrying
2017-02-16 11:06:41 8947
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人