- 博客(3)
- 资源 (2)
- 问答 (1)
- 收藏
- 关注
转载 python_如何拆分含有多种分隔符的字符串?
案例: 把某个字符串依据分隔符拆分,该字符包含不同的多种分隔符,如下 s = '12;;7.osjd;.jshdjdknx+' 其中 ; . + 是分隔符有哪些解决方案? 方法1:通过str.split()方法,每次处理一个分隔符12345
2017-11-23 17:25:09 1364
转载 fastText 源码分析
https://heleifz.github.io/14732610572844.html介绍fastText 是 facebook 近期开源的一个词向量计算以及文本分类工具,该工具的理论基础是以下两篇论文:Enriching Word Vectors with Subword Information这篇论文提出了用 word n-gram 的向量之和来代替
2017-11-13 16:29:12 949
原创 一种快速在向量空间中寻找k紧邻的算法——annoy index
几个需要关注的点:1.这是一个精确度换速度的算法,找到的k紧邻不能保证是全局的k紧邻(例如在分割平面附近的点),所以如果要找exact的k紧邻的话并不合适,还是得做全局的搜索2.可以通过设置tree的数量来balance精度和速度3.每次对同一份数据建立索引是不同的,所以两次计算结果可能也会不同4.github:https://github.com/spotify/annoy最近工作中使用了一下a...
2017-11-09 16:19:46 8416 1
ML step by step
2017-09-21
python 正则表达式 findall和search的问题
2015-09-23
TA创建的收藏夹 TA关注的收藏夹
TA关注的人