自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 uwsgi loading shared libraries:libicui18n.so.58 异常处理

背景:用nginx + uwsgi + flask搭建python应用环境 python使用anaconda3(python 3.6) 依赖包安装完毕,但是执行uwsgi的时候出现如下异常(py3) [root@localhost ~]# uwsgiuwsgi: error while loading shared libraries: libicui18n.so.58: cann...

2019-01-30 16:01:51 4125 4

转载 图解Transformer

原文标题:The Illustrated Transformer原文链接:https://jalammar.github.io/illustrated-transformer/论文地址:https://arxiv.org/abs/1706.03762前言Attention这种机制最开始应用于机器翻译的任务中,并且取得了巨大的成就,因而在最近的深度学习模型中受到了大量的关注。在这...

2019-01-29 11:35:40 786

转载 图解BERT及ELMo

原文链接:The Illustrated BERT, ELMo, and co. (How NLP Cracked Transfer Learning)BERT论文地址:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 前言 2018年可谓是自然语言处理(NLP)的元年,...

2019-01-28 15:10:28 3027

转载 文本相似度-bm25算法原理及实现

原理BM25算法,通常用来作搜索相关性平分。一句话概况其主要思想:对Query进行语素解析,生成语素qi;然后,对于每个搜索结果D,计算每个语素qi与D的相关性得分,最后,将qi相对于D的相关性得分进行加权求和,从而得到Query与D的相关性得分。BM25算法的一般性公式如下:  其中,Q表示Query,qi表示Q解析之后的一个语素(对中文而言,我们可以把对Query的分词作为语...

2019-01-07 17:32:34 933

转载 使用SimHash进行海量文本去重

1.SimHash与传统hash函数的区别传统的Hash算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上仅相当于伪随机数产生算法。传统的hash算法产生的两个签名,如果原始内容在一定概率下是相等的;如果不相等,除了说明原始内容不相等外,不再提供任何信息,因为即使原始内容只相差一个字节,所产生的签名也很可能差别很大。所以传统的Hash是无法在签名的维度上来衡量原内容的相似度,而SimH...

2018-12-26 18:13:29 510

原创 windows安装xgboost(填坑)

尝试了该博客下的教程自己编译安装,一步步下来没有任何问题,全部执行完毕,当import的时候出现如下错误:winError 127。尝试了各种,比如:下载vcomp140.dll,下载libgomp-1.dll,放在相应的C:\Windows\System32的路径下,但是还是报错。最后黄天不负有心人,终于找到了解决方案,完美了解决了xgboost的安装问题。这就在该链接下的教程,...

2018-11-28 20:04:10 2650 5

原创 Ubuntu:基于Anaconda安装Tensorflow(cpu版本)

安装环境:Ubuntu 16.04LTS一、安装Anaconda1.下载    到官网https://www.anaconda.com.download/,根据系统下载相应版本的anaconda    可以通过该链接下载:https://repo.anaconda.com/archive/Anaconda3-5.1.0-Linux-x86_64.sh2.进入下载目录,打开终端,根据版本输入安装命令...

2018-06-05 18:22:34 2091

转载 搜索引擎和知识图谱那些事

这是一篇基础性文章,主要介绍搜索引擎和知识图谱的一些原理、发展经历和应用等知识。希望文章对你有所帮助~如果有错误或不足之处,还请海涵。(参考资料见后)一. 搜索引擎(一).搜索引擎的四个时代        根据张俊林大神的《这就是搜索引擎》这本书中描述(推荐大家阅读),搜索引擎从采取的技术划分为4个时代:        1.史前时代:分类目录的一代        这个时代成为“导航时代”,Yaho...

2018-05-29 16:07:28 1364 1

转载 pyhton中__pycache__文件夹的产生与作用

源起用python编写了一个工程,但在第一次运行后,发现工程根目录下生成了一个__pycache__文件夹,里面是和py文件同名的各种以 .cpython-35.pyc 结尾的文件。先解释下cpython-35,cpython代表的是c语言实现的Python解释器,-35代表的是版本为3.5版。 至于pyc,先来了解一下模块的调用。模块的调用Python中导入模块时,实际上会把被导入的模块执行一遍...

2018-05-22 18:26:51 1448

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除