自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (7)
  • 收藏
  • 关注

原创 根据输入的文件夹名称和两个txt文件名和输入的比例,将文件夹中的某类文件按比例输入到两个文件中

前不久在学习过程中遇到一学生问我这样一个问题,如下: 描述:     在工作过程中,我们有一个图片文件夹以及标签文件夹,我们需要使用标签文件夹生成两个txt文件,txt文件中存放的是被打乱后的标签文件的文件名(不包括后缀),两个txt中的文件名的数量按照一定比例来,要保证两个文件中的文件名数量和是标签文件夹中文件的数量。 输入:     标签文件夹名,两个txt名称,其中一个txt所含

2018-01-10 16:48:31 381 1

唐宇迪word2vec的系列代码自然语言处理

B站的唐宇迪深度学习项目实战附带的自然语言处理word2vec代码。Word2vec,是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。训练完成之后,word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络之隐藏层。

2020-07-25

LCQMC数据集.tar.gz

LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问题语义匹配数据集,其目标是判断两个问题的语义是否相同。构建的方式是先针对不同的领域从百度问答中抽取高频的相关问题,然后通过Wasserstein distance进行初步筛选,最后人工进行标注。数据集一共有260068对标注结果,分为三部分,238766训练集、8802验证集和12500测试集。

2020-04-24

平安人寿谢舒翼-智能问答系统的探索与实践.pdf

3月14日,由平安寿险AI团队在Paper Weekly直播间进行的主题为「智能问答系统」的技术分享,由资深算法工程师谢舒翼主讲,其内容分5个部分:寿险的智能问答系统整体框架介绍;问句预处理核心技术; 检索和深度语义匹配技术;基于深度学习的问答排序算法介绍;算法效果评估方案.

2020-04-09

ATIS_dataset.zip

在ATIS数据集中,训练集共有4978条句子,测试集共有893条,标注有对应槽位,word2id,以及槽位id。完全是纯净数据集。

2020-01-08

软件设计师近五年考试案例分析真题及答案解析

近五年软件设计师案例分析真题及答案解析,其中软件设计师指的是能根据软件开发项目管理和软件工程的要求,按照系统总体设计规格说明书进行软件设计,编写程序设计规格说明书等相应的文档的实用性人才。

2018-07-04

python实现逻辑回归与梯度下降策略

逻辑回归是在线性回归的基础上,增加一个转化函数,能够将预测值映射到【0,1】之间,以0.5为分界线,从而达到分类的目的。其中经常用到的转化函数是sigmoid:

2018-04-26

手写数字识别代码加mnist数据集

手写识别(HandWriting Recognition)是指将在手写设备上书写时产生的有序轨迹信息化转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程,是人机交互最自然、最方便的手段之一。直接可用

2018-04-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除