文本分析
shiter
CSDN博客专家,人工智能与大数据领域优秀创作者,累计近500W人次访问。 熟悉自然语言处理(NLP)、大数据(Spark 、Elasticsearch)、数据分析(Scala,Python),计算机视觉(OpenCV、立体匹配)等领域的研发工作。世界500强,高级算法工程师, 曾参与并负责国家级大数据项目,负责大健康平台相关开发与管理工作,负责金融行业AI与大数据平台产品设计、开发与落地。编程不仅仅是技术,还是艺术!talk is cheap,show me the code!
展开
-
短文本分析----基于python的TF-IDF特征词标签自动化提取
绪论最近做课题,需要分析短文本的标签,在短时间内学习了自然语言处理,社会标签推荐等非常时髦的技术。我们的需求非常类似于从大量短文本中获取关键词(融合社会标签和时间属性)进行用户画像。这一切的基础就是特征词提取技术了,本文主要围绕关键词提取这个主题进行介绍(英文)。不同版本python混用(官方用法)Python2 和python3 是一个神一般的存在,如何让他们共存呢,直到我用了pycharm我才知原创 2016-11-23 22:29:26 · 14365 阅读 · 0 评论 -
自然语言处理简介(1)---- 服务梳理与传统汉语分词
1.Nlp技术体系简介 1.1 基础技术 1.2 Nlp 核心技术 1.3 NlP+(高端技术) 2.知名NLP 服务系统简介 2.1汉语分词系统ICTCLAS 2.2 哈工大语言云(Language Technology Platform,LTP) 2.3 Amazon Comprehend 2.4 阿里云NLP 2.5 腾讯云NLP 2.6 百度语言处理基础技术 2.6.1 功能丰富且...原创 2019-11-21 13:44:26 · 6363 阅读 · 0 评论 -
简单NLP分析套路(2)----分词,词频,命名实体识别与关键词抽取
先说点闲话,google 近期发布了颠覆性的NLP模型–BERT ,大家有空可以了解一下, 这是张俊林博士写的科普文章: https://mp.weixin.qq.com/s/EPEsVzbkOdz9GovrAM-p7g 上一篇文章讲讲解了,如何使用爬虫积累三种类型的语料库,我就针对自己的博客进行一些简单的分析工作。 ...原创 2018-11-25 23:26:29 · 12029 阅读 · 0 评论