自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (7)
  • 收藏
  • 关注

原创 神经网络机器学习(一)学习笔记整理

    接触人工智能工作差不多半年时间了,现在就了解到的知识做简要回顾与总结。似乎毫无章法,但是基础知识。很多只有点,容我慢慢进行完善。    神经网络可以处理图像语音文本等数据,可以用在自动驾驶、语音助手、新闻媒体等方面。1、激活函数:作用在提高规模化的非线性化能力,模拟被激化的能力        sigmoid函数:整个区间可导、非中心对称、数据后期变化不大,趋向于1学习效率降低。...

2018-06-27 20:53:10 289 1

原创 你会爬虫吗,我来教你爬海关蜀黍

爬虫是近年来一直比较流行的,今天无聊就来和你聊聊爬虫.在例子中讲解,让你学会使用爬虫.并将自己爬取的数据保存在excel中,首先来看看网站页面就是下面这样,不得不说这个页面做的还是比较好看的    现在进入正题,首先的导入利用到的库咯  re,正则表达式;bs4,request和对excel文件夹进行操作的xlwt库.import refrom bs4 import BeautifulSoup...

2018-06-08 16:23:21 4340 8

唐宇迪word2vec的系列代码自然语言处理

B站的唐宇迪深度学习项目实战附带的自然语言处理word2vec代码。Word2vec,是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。训练完成之后,word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络之隐藏层。

2020-07-25

LCQMC数据集.tar.gz

LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问题语义匹配数据集,其目标是判断两个问题的语义是否相同。构建的方式是先针对不同的领域从百度问答中抽取高频的相关问题,然后通过Wasserstein distance进行初步筛选,最后人工进行标注。数据集一共有260068对标注结果,分为三部分,238766训练集、8802验证集和12500测试集。

2020-04-24

平安人寿谢舒翼-智能问答系统的探索与实践.pdf

3月14日,由平安寿险AI团队在Paper Weekly直播间进行的主题为「智能问答系统」的技术分享,由资深算法工程师谢舒翼主讲,其内容分5个部分:寿险的智能问答系统整体框架介绍;问句预处理核心技术; 检索和深度语义匹配技术;基于深度学习的问答排序算法介绍;算法效果评估方案.

2020-04-09

ATIS_dataset.zip

在ATIS数据集中,训练集共有4978条句子,测试集共有893条,标注有对应槽位,word2id,以及槽位id。完全是纯净数据集。

2020-01-08

软件设计师近五年考试案例分析真题及答案解析

近五年软件设计师案例分析真题及答案解析,其中软件设计师指的是能根据软件开发项目管理和软件工程的要求,按照系统总体设计规格说明书进行软件设计,编写程序设计规格说明书等相应的文档的实用性人才。

2018-07-04

python实现逻辑回归与梯度下降策略

逻辑回归是在线性回归的基础上,增加一个转化函数,能够将预测值映射到【0,1】之间,以0.5为分界线,从而达到分类的目的。其中经常用到的转化函数是sigmoid:

2018-04-26

手写数字识别代码加mnist数据集

手写识别(HandWriting Recognition)是指将在手写设备上书写时产生的有序轨迹信息化转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程,是人机交互最自然、最方便的手段之一。直接可用

2018-04-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除