NLP
数据库练兵场
博主简介,本科毕业于北京交通大学,研究生毕业于中国人民大学。现就职于蚂蚁集团Oceanbase团队,花名-靖顺,专注于OceanBase数据库故障根因分析,性能调优。
展开
-
【自然语言处理】——特征工程知识体系总结
一、前言 维基百科中给特征工程做出了简单定义:特征工程是利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程。简而言之,特征工程就是一个把原始数据转变成特征的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优(或者接近最佳性能)。从数学的角度来看,特征工程就是去设计输入变量X。二、特征工程知识框架三、特征清洗...原创 2019-04-23 10:22:41 · 2470 阅读 · 0 评论 -
【自然语言处理】——分类的评价指标
一、四个基本概念 TP、True Positive真阳性:预测为正,实际也为正 FP、False Positive假阳性:预测为正,实际为负 FN、False Negative 假阴性:预测与负、实际为正 TN、True Negative 真阴性:预测为负、实际也为负。 【一致判真假,预测判...原创 2019-04-24 14:56:59 · 1448 阅读 · 0 评论 -
【NLP竞赛】——在线评论的细粒度分析(含代码)
一、前言 在线评论的细粒度情感分析对于深刻理解商家和用户、挖掘用户情感等方面有至关重要的价值,并且在互联网行业有极其广泛的应用,主要用于个性化推荐、智能搜索、产品反馈、业务安全等。此次博文所述的数据集,共包含6大类20个细粒度要素的情感倾向。根据标注的细粒度要素的情感倾向建立算法,对用户评论进行情感挖掘。AI挑战赛简介二、数据集 1、下载地址:https://pan.b...原创 2019-06-17 23:47:00 · 2924 阅读 · 1 评论 -
【自然语言处理】——模型总结
一、前言 自然语言处理这几年发展迅猛,模型更新迭代太快。特此在这做一个记录,我会持续更新内容。二、NLP知识体系三、NLP模型总结朴素贝叶斯 在所有的机器学习分类算法中,朴素贝叶斯和其他绝大多数的分类算法都不同。对于大多数的分类算法,比如决策树,KNN,逻辑回归,支持向量机等,他们都是判别方法,也就是直接学习出特征输出Y和特征X之间的关系,要么是决策函数...原创 2019-05-23 00:35:26 · 5048 阅读 · 0 评论 -
【知识图谱】——美团大脑的构建(知识图谱落地应用)
一、前言 先放一张师兄回实验室讲课照片镇楼,膜拜师兄。 主讲者:王仲远,博士,美团AI平台部NLP中心负责人,点评搜索智能中心负责人。在国际顶级学术会议发表论文30余篇,获得ICDE 2015最佳论文奖,并是ACL 2016 Tutorial “Understanding Short Texts”主讲人,出版学术专著3部,获得美国专利5项。此前,博士曾担任微软亚洲研究...原创 2019-05-23 23:45:05 · 5024 阅读 · 0 评论