自然语言处理
文章平均质量分 91
shiter
CSDN博客专家,人工智能与大数据领域优秀创作者,累计近500W人次访问。 熟悉自然语言处理(NLP)、大数据(Spark 、Elasticsearch)、数据分析(Scala,Python),计算机视觉(OpenCV、立体匹配)等领域的研发工作。世界500强,高级算法工程师, 曾参与并负责国家级大数据项目,负责大健康平台相关开发与管理工作,负责金融行业AI与大数据平台产品设计、开发与落地。编程不仅仅是技术,还是艺术!talk is cheap,show me the code!
展开
-
简单NLP分析套路(2)----分词,词频,命名实体识别与关键词抽取
先说点闲话,google 近期发布了颠覆性的NLP模型–BERT ,大家有空可以了解一下,这是张俊林博士写的科普文章:https://mp.weixin.qq.com/s/EPEsVzbkOdz9GovrAM-p7g上一篇文章讲讲解了,如何使用爬虫积累三种类型的语料库,我就针对自己的博客进行一些简单的分析工作。...原创 2018-11-25 23:26:29 · 12065 阅读 · 0 评论 -
简单NLP分析套路(3)---- 可视化展现初步
文章大纲可视化词云主题模型行业语料库保险行业语料库医学健康类语料库可视化词云主题模型行业语料库保险行业语料库https://github.com/Samurais/insuranceqa-corpus-zh/wiki医学健康类语料库中国疾病知识图谱http://med.ckcest.cn/knowledgeGraph.jsp疾病科学数据库:http://med.ckces...原创 2018-12-09 01:44:34 · 5552 阅读 · 5 评论 -
简单NLP分析套路(1)----语料库积累之3种简单爬虫方式应对大部分网站
目录近期听课的思考博客的爬虫新的改变近期听课的思考自然语言处理之AI深度学习顶级实战课程为什么微软称NLP 为人工智能“皇冠上的明珠”?----认知智能深度学习在自然语言处理的通用步骤论文的阅读,最新算法的研究算法的大概方向的评估训练和确定训练数据的收集,清洗以及数据的预处理算法实现,系统设计,参数调优,模型升级模型效果评估与部署博客的爬虫新的改变...原创 2018-10-28 23:13:24 · 5173 阅读 · 3 评论 -
自然语言处理简介(1)---- 服务梳理与传统汉语分词
1.Nlp技术体系简介1.1 基础技术1.2 Nlp 核心技术1.3 NlP+(高端技术)2.知名NLP 服务系统简介2.1汉语分词系统ICTCLAS2.2 哈工大语言云(Language Technology Platform,LTP)2.3 Amazon Comprehend2.4 阿里云NLP2.5 腾讯云NLP2.6 百度语言处理基础技术2.6.1 功能丰富且...原创 2019-11-21 13:44:26 · 6380 阅读 · 0 评论 -
做项目一定用得到的NLP资源
原文链接:https://github.com/fighting41love/funNLP最近需要从文本中抽取结构化信息,用到了很多github上的包,遂整理了一下,后续会不断更新。涉及内容包括:中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文...转载 2020-05-23 01:27:53 · 4079 阅读 · 0 评论 -
NLU(Natural Language Understanding)太难了
原文链接:https://github.com/fighting41love/hardNLUNLU is hard!!!一直关注刘群老师的微博,常常看见他分享的一些好玩的#自然语言理解太难了#。遂整理了NLU实在是太难了系列语句,大家一笑无妨。这里列举了一些关于分词、实体识别、知识图谱相关的语句,按照难度从低到高排列,最高难度的放在了最后(需要强大的知识图谱哦,欢迎大家把答案开在issue...转载 2019-03-07 12:27:11 · 3072 阅读 · 2 评论 -
《自然语言处理实战入门》---- 第1课:自然语言处理简介
大家好,今天开始和大家分享,我在自然语言处理(Natural Language Processing,NLP)的一些学习经验和心得体会。随着人工智能的快速发展,自然语言处理和机器学习技术的应用愈加广泛。为使大家对该领域整体概况有一个系统、明晰的认识,同时入门一些工程实践,也借CSDN为NLP的学习,开发者们搭建一个交流的平台。原创 2019-11-21 13:41:48 · 4875 阅读 · 1 评论 -
一文详解中英文在NLP上的10大差异点
作者 | 达观数据创始人 陈运文人类经过漫长的历史发展,在世界各地形成了很多不同的语言分支,其中汉藏语系和印欧语系是使用人数最多的两支。英语是印欧语系的代表,而汉语则是汉藏语系的代表。中英文语言的差异十分鲜明,英语以表音(字音)构成,汉语以表义(字形)构成,印欧和汉藏两大语系有很大的区别。尽管全世界语言多达5600种,但大部数人类使用的语言集中在图中的前15种(覆盖全球90%以上人群)。其中...转载 2019-04-02 21:23:54 · 5922 阅读 · 5 评论 -
《自然语言处理实战入门》 ---- 第5课 :分词评测及语料库简介
语料收集文章大纲语料收集语料库汉语标注语料库网络收集资料合集清华大学北京大学语料库在线(教育部语言文字应用研究所计算语言学研究室)大规模中文自然语言处理语料搜狗实验室中英文NLP 差异公开数据集语料库(Corpus,负数为Corpora或Corpuses)被定义为:为语言研究和应用而收集的,在计算机中存储的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。一...原创 2019-07-13 19:00:30 · 1446 阅读 · 0 评论