自然语言处理项目
记录实战项目的思路
qq_36646531
这个作者很懒,什么都没留下…
展开
-
知识抽取-理论知识
知识抽取-理论知识前言参考连接涉及技术应用关系抽取技术基于规则监督学习 (多分类问题)准备:特征工程(关键)分类算法半监督(有部分标注) & 无监督学习 前言 最近接到两个NLP的项目任务,都涉及到从非结构化文本数据转化为结构化数据插入结构化数据库的任务,可以理解为知识抽取(Information Extraction)任务,本文参考网络文章和视频课程,并做一个简要总结。 参考连接 知识抽取(一) 信息抽取——关系抽取 涉及技术 命名实体识别 抽取实体关系 实体统一 指代消歧 应用 问答系统原创 2020-08-03 11:25:51 · 568 阅读 · 0 评论 -
项目中tensorflow的使用总结
说明: 之前我多用的pytorch,现项目原有代码为tensorflow1.x的版本,今就代码中涉及的函数方法,边学习,边整理记录 版本: tensorflow 1.12 教材: https://www.w3cschool.cn/ c语言编程网 官方API 函数方法 引入模块 import tensorflow as tf 定义变量与图层 tf.placeholder :占位符 tf.shape:返回张量形状 tf.variable: 变量节点. 有与tf.get_variabl原创 2020-07-29 14:06:46 · 193 阅读 · 1 评论 -
从零开始 NLP:使用字符级 RNN 生成名字
从零开始 NLP:使用字符级 RNN 生成名字 pytorch官方例子学习心得 具体任务: 根据语言生成名字 官方项目连接 项目流程: 数据预处理 原始数据 构建模型 训练网络 可视化结果 ...原创 2020-05-11 16:19:46 · 490 阅读 · 0 评论 -
从零开始 NLP:使用字符级 RNN 分类名字
从零开始 NLP:使用字符级 RNN 分类名字 pytorch官方例子学习心得 具体任务: 我们将对来自18种语言的几千个姓氏进行训练,并根据拼写预测名字来自哪种语言 项目连接 项目流程: 数据预处理 原始数据 构建模型 训练网络 可视化结果 ...原创 2020-05-11 16:19:02 · 388 阅读 · 0 评论 -
从零开始 NLP:使用序列到序列网络和注意力实现翻译
pytorch官方例子学习心得 1、具体任务: 法语和英语互翻 2、官方项目连接 3、项目流程: 数据预处理 准备原始数据:读取下载好的数据 读取下载好的数据,读取为一行 lines 数据类型:<class 'list'> 数据量 :135842 数据举例:lines[:2] = ['Go.\tVa !', 'Run!\tCours\u202f!'] 列表里面一个元素为原文中的一行,英语和法语通过空格(\t )分开 标准化处理读入的数据(lines)—&原创 2020-05-11 10:28:33 · 357 阅读 · 0 评论