- 博客(4)
- 收藏
- 关注
转载 Python文章相关性分析---金庸武侠小说分析-2018.1.16
最近常听同事提及相关性分析,正巧看到这个google的开源库,并把相关操作与调试结果记录下来。输出结果: 比较有意思的巧合是黄蓉使出打狗棒,郭靖就用了降龙十八掌,再后测试了名词的解析。小说集可以百度《金庸小说全集 14部》全(TXT)作者:金庸 下载下来。需要整理好格式,门派和武功名称之间需要有换行符,留意删除掉最后一行的空白区域。下载完成后可以用自己习惯的工具或程序做相应调整,...
2018-01-16 18:46:00
283
转载 Python文章相关性分析---金庸武侠小说分析
最近常听同事提及相关性分析,正巧看到这个google的开源库,并把相关操作与调试结果记录下来。小说集可以百度《金庸小说全集 14部》全(TXT)作者:金庸 下载下来。需要整理好格式,门派和武功名称之间需要有换行符,留意删除掉最后一行的空白区域。下载完成后可以用自己习惯的工具或程序做相应调整,因语料内容太长,博客里面不允许"堆砌",所以没复制上来,有需要的可以再联系。wit...
2018-01-16 18:01:00
537
转载 (已实现)相似度到大数据查找之Mysql 文章匹配的一些思路与提高查询速度
当时只理解到这个层面,是想从园子里删除的,没删成功。所以重新整理了下。 需求,最近实现了文章的原创度检测功能,处理思路一是分词之后做搜索引擎匹配飘红,另一方面是量化词组,按文章、段落、句子做数据库查询,功能基本满足实际需求。接下来,还需要在海量大数据中快速的查找到与一句或者一段话最相关的文章、段落。上一篇随笔里记录有当时的一些想法,今天下午按想法具体实现并测试了一次,速...
2017-05-28 22:50:00
751
转载 第一次接触人工智能,一个谷歌的开源学习系统
前几天安装好乌邦图之后,想体验下Tensorflow,捣鼓很久终于还是装好了。$ sudo apt-get install python-dev安装的时候有提示说需要更新,照做后没事了。$ pip install https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-0.5.0-cp27-none-lin...
2016-07-10 22:05:00
117
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人