- 博客(12)
- 资源 (32)
- 收藏
- 关注
原创 MachineLP的CV与NLP
深度学习这些坑你都遇到过吗?(1)检测Faster RCNN:RPN,anchor,sliding windowsDL杂记:YOLOV3之禅(2)识别tf40:图像检索(triplet_loss)之Conditional Similarity Networks(3)OCROCR综述OCR工程git:https://github.com/MachineLP/OCR_repo1.tf20: CNN—识别字符验证码2.身份证识别——生成身份证号和汉字...
2020-05-17 11:07:03 1791
原创 [TextMatch框架] Run examples
TextMatchTextMatch is a semantic matching model library for QA & text search … It’s easy to train models and to export representation vectors.Let’s Run examples !下面先来简单的运行一个样例:git clone https://github.com/MachineLP/TextMatchcdTextMatch...
2020-05-17 22:40:51 327
原创 [文本语义相似] 基于bm25算法
文本相似在问答系统中有很重要的应用,如基于知识的问答系统(Knowledge-based QA),基于文档的问答系统(Documen-based QA),以及基于FAQ的问答系统(Community-QA)等。像对于问题的内容,需要进行相似度匹配,从而选择出与问题最接近,同时最合理的答案。本节介绍基于bm25算法。代码如下:import mathimport jiebafrom utils import utils# 测试文本text = '''自然语言处理是计算机科学领域...
2020-05-17 22:37:24 1346 1
原创 [文本语义相似] 基于simhash相似度
文本相似在问答系统中有很重要的应用,如基于知识的问答系统(Knowledge-based QA),基于文档的问答系统(Documen-based QA),以及基于FAQ的问答系统(Community-QA)等。像对于问题的内容,需要进行相似度匹配,从而选择出与问题最接近,同时最合理的答案。本节介绍基于simhash相似度。算法描述:先计算两句子的simhash二进制编码,然后使用海明距...
2020-05-07 10:35:32 702
原创 [文本语义相似] 基于编辑距离相似度
文本相似在问答系统中有很重要的应用,如基于知识的问答系统(Knowledge-based QA),基于文档的问答系统(Documen-based QA),以及基于FAQ的问答系统(Community-QA)等。像对于问题的内容,需要进行相似度匹配,从而选择出与问题最接近,同时最合理的答案。本节介绍基于编辑距离相似度。import Levenshtein # 第三方库实现def...
2020-05-07 10:31:23 578
原创 [文本语义相似] 基于Jaccard相似度
文本相似在问答系统中有很重要的应用,如基于知识的问答系统(Knowledge-based QA),基于文档的问答系统(Documen-based QA),以及基于FAQ的问答系统(Community-QA)等。像对于问题的内容,需要进行相似度匹配,从而选择出与问题最接近,同时最合理的答案。本节介绍基于Jaccard相似度。import osimport jiebaimport ...
2020-05-07 10:09:20 950
原创 [文本语义相似] 基于bert的余弦距离(bert4keras实现)
文本相似在问答系统中有很重要的应用,如基于知识的问答系统(Knowledge-based QA),基于文档的问答系统(Documen-based QA),以及基于FAQ的问答系统(Community-QA)等。像对于问题的内容,需要进行相似度匹配,从而选择出与问题最接近,同时最合理的答案。本节介绍基于bert的余弦距离计算相似度。...
2020-05-04 12:25:29 3936 1
原创 [图灵联邦] 视频点击预测大赛
比赛链接及其数据下载:https://www.turingtopia.com/competitionnew/detail/e4880352b6ef4f9f8f28e8f98498dbc4/sketchTop1:https://github.com/ouc16020021031/video-click-TOP1分享两份代码:(1)# This Python 3 envi...
2020-05-04 10:23:30 602
原创 [天池比赛] Multimodalities Recall
比赛链接及其数据下载:https://tianchi.aliyun.com/competition/entrance/231786/informationbase model:(该base是Do大哥一小时搞定的,感谢)不finetune bert是0.55左右,finetunebert应该是0.60左右。import base64import argparsef...
2020-05-04 09:43:53 509
原创 [文本语义相似] 基于ngram-tf-idf的余弦距离(gensim实现)
文本相似在问答系统中有很重要的应用,如基于知识的问答系统(Knowledge-based QA),基于文档的问答系统(Documen-based QA),以及基于FAQ的问答系统(Community-QA)等。像对于问题的内容,需要进行相似度匹配,从而选择出与问题最接近,同时最合理的答案。本节介绍基于bow的余弦距离计算相似度。基于gensim的方式如下:import os...
2020-05-04 09:31:30 556
原创 [文本语义相似] 基于tf-idf的余弦距离(gensim实现)
文本相似在问答系统中有很重要的应用,如基于知识的问答系统(Knowledge-based QA),基于文档的问答系统(Documen-based QA),以及基于FAQ的问答系统(Community-QA)等。像对于问题的内容,需要进行相似度匹配,从而选择出与问题最接近,同时最合理的答案。本节介绍基于bow的余弦距离计算相似度。基于gensim的方式如下:import osi...
2020-05-04 09:25:23 677
原创 [文本语义相似] 基于bow的余弦距离(gensim实现)
文本相似在问答系统中有很重要的应用,如基于知识的问答系统(Knowledge-based QA),基于文档的问答系统(Documen-based QA),以及基于FAQ的问答系统(Community-QA)等。像对于问题的内容,需要进行相似度匹配,从而选择出与问题最接近,同时最合理的答案。本节介绍基于bow的余弦距离计算相似度。基于gensim的方式如下:import osi...
2020-05-04 09:18:53 576
Face Recognition(face_recognition) Using Hadoop Streaming API
2017-10-08
caffe深度学习薛开宇笔记实例-基于卷积神经网络的声音识别
2016-12-27
Deep Learning textbook
2016-12-09
训练xml文件时,产生info.txt文件
2016-11-01
斯坦福大学机器学习课程个人笔记完整版
2016-04-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人