自然语言处理
杨文欣欣
这个作者很懒,什么都没留下…
展开
-
基于词向量计算文本相似度(完整代码+测试数据)
基于词向量计算文本的余弦相似度1.测试数据:链接:https://pan.baidu.com/s/19gUVDOYS2-yfH4N6rVUWBA提取码:zfv22.实验代码:import mathimport osimport pandas as pdimport numpy as np# 计算两个向量的余弦相似度def cos_similarity(vec_dim, vector_1, vector_2): # 输入两个向量 # 计算两个向量的点积 x = 0原创 2020-08-26 10:53:35 · 5823 阅读 · 7 评论 -
安装TensorFlow-gpu2.1.0(stable)超简单的配置!!!
按照TensorFlow-gpu2.1.0(stable)1.创建虚拟环境2.安装3.测试4.应用1.创建虚拟环境方法一:conda create -n tf_2g python=3.7(速度可能有点慢,需要多试几次),选择yes进入该环境:conda activate tf_2g方法二:使用virtualenv创建新的虚拟环境。优点:在pycharm中创建环境,可以继承全局的安装包。这样,安装模块的时候,就不用总是切换到该环境下,再安装一遍。而且,可以随意使用conda或pip安装的包,不用原创 2020-05-30 23:01:40 · 1779 阅读 · 1 评论 -
爬虫——request的使用与优化
1.为什么设置headers?requests是python实现的简单易用的HTTP库。headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站。2.如何查看headers的设置?谷歌或者火狐浏览器,在网页面上点击:右键–>检查–>剩余步骤如图所示,...原创 2020-04-22 21:16:37 · 663 阅读 · 0 评论 -
命名实体识别——CRF++0.58的安装与使用
1.下载下载地址:(1)官网:https://taku910.github.io/crfpp/#download(似乎被墙了)(2)https://sourceforge.net/projects/crfpp/(3)网盘下载: https://pan.baidu.com/s/1fkx258xBaXr-egRc3RDXHQ (提取码:o6kv)版本选择:Windows选择zip压缩包,L...原创 2020-04-22 18:32:42 · 1598 阅读 · 1 评论