深度学习
文章平均质量分 52
wxl781227
生命如昙花一现,愿每一段行程象如歌的行板,灿烂而又真实!
展开
-
销售话术对成单有啥影响
我们通过一个神经网络来拟合这么个关系,即需要用数据去训练一个神经网络模型(成单概率模型),我们可以使用MLP来实现,MLP是一个多层感知器,能够轻松的模拟输入(坐席说的话)和输出(成单)之间的非线性关系(复杂关系)。坐席说了哪些话对成单有影响?咱们通常认为客户不需要时,坐席说了一些话会影响成单,那么我们就把这些话和成单之间建立一个映射关系。print(x, '成单概率:', clf.predict_proba([xx])[0][1])target_names = ['不成单', '成单']原创 2024-02-18 15:46:51 · 527 阅读 · 0 评论 -
基于语义搜索的意图识别
向量搜索使用faiss来进行,搜索的结果通过设置相似度的阈值来判断是否属于某个意图,为了减少输出结果的错误率,建议把阈值尽量设置高一些,避免乱推荐/乱弹,但也不是越高越好,太高了就不出结果了,在严肃场景,当然也是可以不出结果的,这个需要根据具体的意图来进行设置。print(time.strftime('%Y-%m-%d %H:%M:%S', time.localtime()), query, '搜索top_k={}用时: {}'.format(k,round(time.time()-t,4)))原创 2024-02-05 14:52:12 · 471 阅读 · 0 评论 -
文本数据增强-回译尝试
方法一:使用百度翻译apiimport requestsimport randomimport jsonfrom hashlib import md5def cntoen(query): # Set your own appid/appkey. appid = 'x' appkey = 'x' # For list of language codes, please refer to `https://api.fanyi.baidu.com/doc/21..原创 2021-11-10 09:50:53 · 1087 阅读 · 0 评论 -
Win11+WSL2+Ubuntu-20.04+GPU+TensorFlow+Jupyter
目标:在Win10/11的WSL2子系统Ubuntu-20.04环境下使用GPU进行机器学习及cuda开发。1)前提:升级到Win10 20150版本或Win11版本。(否则即使安装了cuda及cudnn,也是各种错误导致nvida-smi无法使用,各种百度也抓狂。)2)在Win10/Win11环境中安装Docker-Desktop3) 在Ubuntu-20.04环境下安装Docker4) 在Ubuntu-20.04下使用Docker运行gpu-tensorflow-py...原创 2021-11-02 21:47:46 · 2194 阅读 · 4 评论 -
领域命名实体NER实现:Bert+BiLSTM+CRF
以前通过模板规则的方式进行命名实体的提取,优点是提取速度非常高,但模板规则存在冲突的情况,尝试过使用百度LAC通过词性模板规则进行命名实体的提取,好处是少量规则可以覆盖大部分情况,但也存在规则冲突的情况。本文尝试采用Bert+BiLSTM+CRF的方式进行命名实体的提取。使用Bert的好处是能够学习到语料的语义特征,BiLSTM能学习到词之间较长的上下文关系,CRF能纠正BiLSTM预测的顺序错误。Bert的好处是准确率非常高,缺点也很明显,推理速度低,可以通过部署的方式来提升推理性能,如:使用ONNX..原创 2021-05-08 10:00:10 · 2462 阅读 · 6 评论 -
使用TensorFlow2.0中Keras进行迁移学习识别验证码
网上有很多文章介绍过迁移学习,但TensorFlow2.0的较少,有TensorFlow2.0的,但能说清楚明白的更少。验证码的样本需要自行标记,本文使用的样本大概2000左右。训练集1500,测试集500。本次迁移学习选择的预训练模型为:Xception,是个比较优秀的CNN模型。验证码的特征是带空心字符、有大小写且粘连的验证码。环境使用的是MX350 2G的GPU(使用GPU训练很快)。主要步骤分为四步:1)将Xception预训练模型作为特征抽取器,即去掉头部的输出层(默认是1000分类)..原创 2021-04-15 16:37:18 · 3033 阅读 · 1 评论