![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
stay_foolish12
本科统计学,研究生计算机应用技术。可以【接 】大学计算机课程设计、课程大作业,C++\C\JAVA\汇编\Golang\PHP等相关语言,MySQL\SQLServer等数据库,Linux操作系统,人工智能、数据挖掘、数据分析、自然语言处理等相关课程均可
展开
-
chatglm常用参数 :Top-k, Top-p, Temperature
这种采样引入的随机性有助于在很多情况下生成的质量。top-k 参数设置为 3意味着选择前三个tokens。用于调整随机从生成模型中抽样的程度,因此每次点击“生成”时,相同的提示可能会产生不同的输出。温度为 0 将始终产生相同的输出。温度越高随机性越大!动态设置tokens候选列表的大小。将可能性之和不超过特定值的top tokens列入候选名单。Top p 通常设置为较高的值(如 0.75),目的是限制可能被采样的低概率 token 的长度。将如果 k 和 p 都启用,则 p 在 k 之后起作用。原创 2023-06-30 16:02:02 · 6350 阅读 · 0 评论 -
中文文本分类 lstm模型实现
【代码】中文文本分类 lstm模型实现。原创 2022-11-23 17:15:40 · 803 阅读 · 0 评论 -
吴恩达:机器学习的六个核心算法
60 年后,他的同胞 Jacques Hadamard 独立开发了它来描述薄而灵活的物体(如地毯)的变形,这可能会使膝盖向下徒步更容易。他的思想是理性的而不是非理性的。而神经网络的灵感来自大脑的结构:一层层相互连接的神经元,每个神经元根据其相邻状态来计算自己的输出,由此产生的一连串活动形成了一个想法——或识别出一张猫的照片。例如,带有正则化的线性回归(也称为「岭回归」,ridge regression)鼓励线性回归模型不要过多地依赖于任何一个变量,或者更确切地说,均匀地依赖于最重要的变量。转载 2022-08-24 09:24:21 · 209 阅读 · 0 评论 -
python计算中文文本相似度神器 sentence_transformer、text2vec
python计算中文文本相似度神器import sysfrom sentence_transformers.util import cos_simfrom sentence_transformers import SentenceTransformer as SBertmodel = SBert('paraphrase-multilingual-MiniLM-L12-v2')model = SBert("C:\\Users\xxxx\Downloads\\paraphrase-multilin原创 2022-05-12 10:51:02 · 3404 阅读 · 0 评论 -
paddlenlp的taskflow学习笔记
原创 2022-05-07 11:13:12 · 665 阅读 · 0 评论 -
飞浆在深度学习的应用
原创 2022-05-06 15:25:34 · 520 阅读 · 0 评论 -
深度学习平台实践
****原创 2022-05-06 15:03:00 · 216 阅读 · 0 评论 -
一种单独适配于NER的数据增强方法:DAGA
链接:http://www.elecfans.com/d/1468784.html本文首先介绍传统的数据增强在NER任务中的表现,然后介绍一种单独适配于NER的数据增强方法,这种方法生成的数据更具丰富性、数据质量更高。 0 前言 在NLP中有哪些数据增强技术?这一定是当今NLP面试中的必考题了吧。在《标注样本少怎么办?》(链接:https://zhuanlan.zhihu.com/p/146777068)一文中也详细总结过这个问题。 但是,目前来看:大多数「数据增强」方法通常被用于文本分类转载 2021-07-15 10:36:58 · 689 阅读 · 0 评论 -
文本数据增强+NER
CMU & MILA & 谷歌 | 三家巨头发布史上最干文本增强总结https://mp.weixin.qq.com/s/DFGLI25OV4vDnezxPxYIvQ打开你的脑洞:NER如何进行数据增强 ?https://zhuanlan.zhihu.com/p/342032812竞赛总结:天池中医药实体识别https://mp.weixin.qq.com/s/FkkLFddkWLtZ9SHX8a1tFA基于数据增强的中文医疗命名实体识别https://www.doc88.co原创 2021-07-14 10:17:20 · 609 阅读 · 0 评论 -
智能工单处理,达观数据助力运营商实现业务流程智能化改造
智能工单处理,达观数据助力运营商实现业务流程智能化改造https://m.sohu.com/a/466386308_383123智能工单处理,达观数据助力运营商实现业务流程智能化改造达观数据05-14 14:04订阅运营商一线业务运营亟待智能化改造近几年,运营商领域的生产运营工作的内外部环境发生了深刻变革,加快向标准化、系统化、自动化、智能化的新模式转型势在必行。运营商领域的工单处理是与客户体验息息相关的重要工作,要求处理人员具有丰富的运营商一线业务知识和很强的综合分析能力,因而它是一项经验密转载 2021-07-09 09:50:33 · 648 阅读 · 0 评论 -
用训练好的paddlepaddle模型继续训练模型和验证数据ckpt
# 模型加载model = hub.Module(name='ernie', task='seq-cls', num_classes=14)tokenizer = model.get_tokenizer()# 实例化数据集train_dataset = ThuNews(tokenizer, mode='train')dev_dataset = ThuNews(tokenizer, mode='dev')# 模型训练optimizer = paddle.optimizer.Adam(lea原创 2021-07-08 16:17:49 · 1918 阅读 · 0 评论 -
大话知识图谱--构建知识图谱第一步定义数据模型
大话知识图谱–构建知识图谱第一步定义数据模型 https://mp.weixin.qq.com/s/t7F9GDEsn0wmqwZ-eh-Ypg原创 2021-07-06 13:59:15 · 587 阅读 · 0 评论 -
基于知识图谱的智能问答方案
基于知识图谱的智能问答方案:https://cloud.tencent.com/developer/article/1661504 基于知识图谱的智能问答方案 2020-07-142020-07-14 15:57:50阅读 9950三个角度理解知识图谱2012年谷歌首次提出“知识图谱”这个词,由此知识图谱在工业界也出现得越来越多,对于知识图谱以及相关概念的理解确实也是比较绕。自己在研究大数据独角兽Palantir之后开始接触知识图谱,也算对其有了一定了解,这里从三个角度总结一下怎么去理解知识图谱。几个基本转载 2021-06-30 14:17:13 · 4887 阅读 · 0 评论 -
百度任务型对话系统小记
意图扩展阅读:古月哲亭:AAAI 2021 | 清华提出深度对齐聚类用于新意图发现:https://mp.weixin.qq.com/s/9dNs8TTERPdxmrVc3tF1zw 相关项目地址:https://github.com/thuiar/OKD-Reading-List古月哲亭:意图知识图谱的构建与应用:https://mp.weixin.qq.com/s/aolSP8HGWz2yMWHbkc76OQ 这篇文章讨论了通过意图知识图谱去做一些政府治理的工作。...原创 2021-06-24 11:56:04 · 179 阅读 · 0 评论 -
百度机器同传技术及应用小记
原创 2021-06-24 09:56:38 · 105 阅读 · 0 评论 -
机器翻译小记
神经网络翻译面临的挑战原创 2021-06-21 17:20:34 · 75 阅读 · 0 评论 -
什么是深度学习
原文链接:https://aistudio.baidu.com/aistudio/projectdetail/2052554什么是深度学习?大家好,欢迎来到新手入门课程,在这里我会带领大家从一个完全不懂深度学习的小白,通过学习本课程后,能够了解基本的深度学习概念,熟悉必备的数序基础知识,学会常见的编程工具Python,并掌握实用的深度学习框架PaddlePaddle。可能看到本课程的你并不了解什么是深度学习,那么就让我们从第一课开始把——什么是深度学习?一、深度学习的发展历程1.1 Turing转载 2021-06-08 17:12:54 · 1842 阅读 · 0 评论 -
阿里云开源EasyTransfer:业界首个面向NLP场景深度迁移学习框架
阿里云开源EasyTransfer:业界首个面向NLP场景深度迁移学习框架原文链接:https://zhuanlan.zhihu.com/p/267392773阿里云正式开源了深度迁移学习框架 EasyTransfer,本文详细介绍了 EasyTransfer 框架的核心功能。机器之心发布,机器之心编辑部。近日,阿里云正式开源了深度迁移学习框架 EasyTransfer,这是业界首个面向 NLP 场景的深度迁移学习框架。开源链接:https://github.com/alibaba/EasyTrans.转载 2021-01-15 14:29:20 · 511 阅读 · 0 评论 -
字节跳动破局联邦学习:开源Fedlearner框架,广告投放增效209%
本文介绍了字节跳动联邦学习技术团队自研的联邦学习平台 Fedlearner ,分享了该平台的技术实现与落地应用体验,向读者展示了字节跳动如何联邦学习落地难题的突破点。作为分布式的机器学习范式,联邦学习能够有效解决数据孤岛问题,让参与方在不共享数据的基础上联合建模,挖掘数据价值。近两年,联邦学习技术发展迅速,阿里、腾讯、百度、京东、蚂蚁金服、微众银行等一众互联网大厂、金融科技公司皆涉足其中。前不久,字节跳动联邦学习技术团队也开源了自研的联邦学习平台 Fedlearner 。据介绍,字节跳动联邦学习平台 Fed转载 2020-11-06 10:29:35 · 3896 阅读 · 2 评论 -
谷歌大改Transformer注意力,速度、内存利用率都提上去了-新的 Transformer 架构——Performer
原文地址:https://www.jiqizhixin.com/articles/2020-10-28-10Transformer 有着巨大的内存和算力需求,因为它构造了一个注意力矩阵,需求与输入呈平方关系。谷歌大脑 Krzysztof Choromanski 等人最近提出的 Performer 模型因为随机正正交特性为注意力矩阵构建了一个无偏的估计量,可以获得线性增长的资源需求量。这一方法超越了注意力机制,甚至可以说为下一代深度学习架构打开了思路。自面世以来,Transformer 模型已经在多个领域取转载 2020-11-06 10:14:49 · 788 阅读 · 0 评论 -
服务器部署docker
服务器部署docker docker简介##可以把docker是一个容器,可以让开发者将自己的项目部署到这个容器中,最常用的场景是将自己的后端项目部署到服务器的时候会将其打入docker镜像中,可以理解为一个开销更小的虚拟机。docker好处##可以轻易地让几十个服务在docker中跑起来,没有谁敢说能在自己的电脑上跑几十个虚拟机吧,docker可以让开发者更加贴近生产环境,即便于测试,而且同一...转载 2020-11-05 20:25:52 · 1493 阅读 · 0 评论 -
仅使用numpy从头开始实现神经网络,包括反向传播公式推导过程
仅使用numpy从头开始实现神经网络,包括反向传播公式推导过程:https://www.ctolib.com/yizt-numpy_neural_network.html原创 2020-11-04 16:38:29 · 208 阅读 · 0 评论 -
自然语言处理系列篇——关键词智能提取
自然语言处理系列篇——关键词智能提取:https://zhuanlan.zhihu.com/p/25889937原创 2020-08-20 11:27:43 · 576 阅读 · 0 评论 -
pkuseg:一个多领域中文分词工具包
pkuseg简单易用,支持细分领域分词,有效提升了分词准确度。目录主要亮点编译和安装各类分词工具包的性能对比使用方式相关论文作者常见问题及解答主要亮点pkuseg具有如下几个特点:多领域分词。不同于以往的通用中文分词工具,此工具包同时致力于为不同领域的数据提供个性化的预训练模型。根据待分词文本的领域特点,...转载 2020-08-19 19:48:19 · 606 阅读 · 0 评论 -
基于TextRank算法的文本摘要(附Python代码)
基于TextRank算法的文本摘要(附Python代码):https://www.jiqizhixin.com/articles/2018-12-28-18原创 2020-08-19 17:21:26 · 695 阅读 · 0 评论 -
268G+训练好的word2vec模型(中文词向量)
268G+训练好的word2vec模型( 从网上了解到,很多人缺少大语料训练的word2vec模型,在此分享下使用268G+语料训练好的word2vec模型。训练语料:百度百科800w+条,26G+搜狐新闻400w+条,13G+小说:229G+image.png模型参数:window=5min_count=10size=128hs=1negative=0iter=5ps:其它参数见gensim库,执行代码为:gensim.models.Word2Vec(sen原创 2020-08-19 12:31:54 · 4552 阅读 · 8 评论 -
文本摘要综述-bertsum、BottleSum、TextRANk
BottleSum——文本摘要论文系列解读/:https://zhuanlan.zhihu.com/p/84730122主题关键词信息融合的中文生成式自动摘要研究:http://www.aas.net.cn/fileZDHXB/journal/article/zdhxb/2019/3/PDF/zdhxb-45-3-530.pdfCode for paper Fine-tune BERT for 抽取式文本摘要:https://github.com/nlpyang/BertSum【ACL2019】文本摘原创 2020-08-18 17:30:45 · 1797 阅读 · 0 评论 -
Windows下基于python3使用word2vec训练中文维基百科语料资料汇总
Windows下基于python3使用word2vec训练中文维基百科语料(一):https://www.cnblogs.com/gaofighting/p/9055674.htmlWindows下基于python3使用word2vec训练中文维基百科语料(二):https://www.cnblogs.com/gaofighting/p/9105614.htmlWindows下基于python3使用word2vec训练中文维基百科语料(三):https://www.cnblogs.com/gaofig原创 2020-08-18 14:25:08 · 128 阅读 · 0 评论 -
清华CrossWOZ,助你徒手搭建任务导向对话系统
原文链接:https://blog.csdn.net/AITIME_HY/article/details/107502771原创 2020-08-13 17:02:39 · 331 阅读 · 0 评论 -
图解gpt-2
原文链接:https://www.sohu.com/a/336262203_129720 完全图解GPT-2:看完这篇就够了(一) 2019-08-25 12:47转载 2020-08-13 14:40:04 · 232 阅读 · 0 评论 -
transformer xl在文本生成上面的应用
Transformer_xl相关介绍:https://zhuanlan.zhihu.com/p/84159401从文本生成看Seq2Seq模型:https://zhuanlan.zhihu.com/p/29967933transformer xl在中文文本生成上的尝试(效果意外的好,可写小说、古诗):https://github.com/AnShengqiang/transformer-xl-chinese...原创 2020-08-13 13:51:35 · 578 阅读 · 0 评论 -
用户模拟器
最新综述:对话系统之用户模拟器https://mp.weixin.qq.com/s/eb0GcjdwO18-_0T9z3KdlA原创 2020-08-12 11:02:50 · 266 阅读 · 0 评论 -
空洞卷积相关理解
多标签文本分类:基于语义单元的空洞卷积:https://zhuanlan.zhihu.com/p/50231229?utm_source=weibo原文链接:https://www.jianshu.com/p/f743bd9041b3扩展阅读:https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/79825597?utm_source=blogxgwz8空洞卷积(dilated convolution)理解Dilated/Atrous Conv转载 2020-08-12 11:00:37 · 628 阅读 · 1 评论 -
《ACL 2020丨哈工大多领域端到端任务型对话系统》
原文链接:https://www.cnblogs.com/cx2016/p/13471731.html 分享一个基于动态聚合网络的多领域端到端任务型对话系统 覃立波,哈尔滨工业大学社会计算与信息检索研究中心(SCIR)在读博士生,导师车万翔教授,研究兴趣为任务型对话系统,相应研究成果发表在ACL、EMNLP、AAAI上 更多关于ACL 2020的系列视频:可到https://mooc.yanxishe.com/open?from=bilibili观看 &转载 2020-08-11 12:54:52 · 282 阅读 · 0 评论 -
使用numpy实现神经网络模块
class Network(object): def __init__(self, num_of_weights): # 随机产生w的初始值 # 为了保持程序每次运行结果的一致性,此处设置固定的随机数种子 np.random.seed(0) self.w = np.random.randn(num_of_weights, 1) self.b = 0. def forward(self, x):原创 2020-08-07 16:52:35 · 558 阅读 · 0 评论 -
开源作者在行动:疫情防控相关开源项目推荐
开源作者在行动:疫情防控相关开源项目推荐:https://blog.gitee.com/2020/02/03/ncov-open-source-project/原创 2020-08-07 10:46:23 · 390 阅读 · 0 评论 -
中文摘要生成 综述
GPT2-中文摘要生成青空栀浅:https://zhuanlan.zhihu.com/p/113869509IJCAI 2018 | 腾讯知文等提出新型生成式摘要模型:结合主题信息和强化训练生成更优摘要:https://www.jiqizhixin.com/articles/IJCAI2018-Tencent-Model-for-Abstractive-Text-SummarizationICML 2020 | Google提出最强生成式摘要预训练模型——天马https://blog.csdn.net原创 2020-08-07 10:04:21 · 1048 阅读 · 0 评论 -
PaddlePaddle预训练模型大合集
PaddlePaddle预训练模型大合集,还有官方使用说明书添加链接描述https://blog.csdn.net/paddlepaddle/article/details/93858863原创 2020-08-06 17:10:37 · 2077 阅读 · 0 评论 -
清华团队CrossWOZ: 这篇顶会,助你徒手搭建任务导向对话系统
这篇顶会,助你徒手搭建任务导向对话系统https://www.aminer.cn/research_report/5f178da221d8d82f52e5a305?download=false&from=homepage原创 2020-08-06 16:26:46 · 477 阅读 · 0 评论 -
中文任务型对话系统中的领域分类
本论文为2019年第九届“华为杯”中国大学生智能设计竞赛实际参赛作品,获得国家三等奖。参赛队员: 西北大学吴旭东、重庆邮电大学王鹏、西北大学李洋在这里,将论文...转载 2020-08-06 15:25:14 · 479 阅读 · 0 评论