自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

转载 Python文章相关性分析---金庸武侠小说分析-2018.1.16

最近常听同事提及相关性分析,正巧看到这个google的开源库,并把相关操作与调试结果记录下来。输出结果: 比较有意思的巧合是黄蓉使出打狗棒,郭靖就用了降龙十八掌,再后测试了名词的解析。小说集可以百度《金庸小说全集 14部》全(TXT)作者:金庸 下载下来。需要整理好格式,门派和武功名称之间需要有换行符,留意删除掉最后一行的空白区域。下载完成后可以用自己习惯的工具或程序做相应调整,...

2018-01-16 18:46:00 283

转载 Python文章相关性分析---金庸武侠小说分析

最近常听同事提及相关性分析,正巧看到这个google的开源库,并把相关操作与调试结果记录下来。小说集可以百度《金庸小说全集 14部》全(TXT)作者:金庸 下载下来。需要整理好格式,门派和武功名称之间需要有换行符,留意删除掉最后一行的空白区域。下载完成后可以用自己习惯的工具或程序做相应调整,因语料内容太长,博客里面不允许"堆砌",所以没复制上来,有需要的可以再联系。wit...

2018-01-16 18:01:00 537

转载 (已实现)相似度到大数据查找之Mysql 文章匹配的一些思路与提高查询速度

当时只理解到这个层面,是想从园子里删除的,没删成功。所以重新整理了下。 需求,最近实现了文章的原创度检测功能,处理思路一是分词之后做搜索引擎匹配飘红,另一方面是量化词组,按文章、段落、句子做数据库查询,功能基本满足实际需求。接下来,还需要在海量大数据中快速的查找到与一句或者一段话最相关的文章、段落。上一篇随笔里记录有当时的一些想法,今天下午按想法具体实现并测试了一次,速...

2017-05-28 22:50:00 751

转载 第一次接触人工智能,一个谷歌的开源学习系统

前几天安装好乌邦图之后,想体验下Tensorflow,捣鼓很久终于还是装好了。$ sudo apt-get install python-dev安装的时候有提示说需要更新,照做后没事了。$ pip install https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-0.5.0-cp27-none-lin...

2016-07-10 22:05:00 117

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除