python
小崔崔啊
生命在于运动,技术在于折腾
展开
-
在Centos7下安装Anaconda3
下载Anaconda方式一:官方网站方式二:清华大学开源软件镜像站可以下载到本地,然后通过xftp上传到Contos上然后bash Anaconda3-4.4.0-Linux-x86_64.sh该按enter按,该yes|no的yes。然后source ~/.bashrc。然后重启终端,然后输入python若期间遇到以下问题请先删除 anacon...原创 2018-08-01 22:03:37 · 6472 阅读 · 0 评论 -
学习笔记--NLP文本相似度之TF-IDF
余弦计算相似度度量相似度度量(Similarity),即计算个体间的相似程度,相似度度量的值越小,说明个体间相似度越小,相似度的值越大说明个体差异越大。 文本相似度计算的处理流程是: (1)找出两篇文章的关键词; (2)每篇文章各取出若干个关键词,合并成一个集合,计算每篇文章对于这个集合中的词的词频 (3)生成两篇文章各自的词频向量; (4)计算两个向量的余弦...原创 2018-10-19 18:44:55 · 1256 阅读 · 0 评论 -
学习笔记--NLP文本相似度之LCS(最长公共子序列)
最长公共子序列一个序列S任意删除若干个字符得到的新序列T,则T叫做S的子序列两个序列X和Y的公共子序列中,长度最长的那个,定义为X和Y的最长公共子序列 例如: --字符串12455与245576的最长公共子序列为2455 --字符串acdfg与adfc的最长公共子序列为adf --字符串ABCBDAB与BDCABA的最长公共子序列为BCAB或B...原创 2018-10-19 18:45:12 · 5521 阅读 · 0 评论