14周总结

14周

(周一)文本经过卷积层的描述。
文本经过卷积层的描述
这个图解释了文本从最开始的字符变成向量再经过卷积神经网络的一个过程。最开始把文本表示成向量矩阵,然后把向量矩阵通过不同个数,不同大小的卷积核进行特征提取,然后经过池化把最重要的特征提取出来,最后把每个池化的结果全连接起来,然后再把全连接的特征用于分类。

(周二)
今天把代码看了,师姐那个代码也运行出来了,代码流程是知道了,还是有很多函数不知道,希望自己没事的时候多看看代码。这样才能更接近实际。今天还重新在网上找了一个贝叶斯文本分类方法,感觉自己在找一些路径错误啊,读取数据出错这些有一丢丢经验了。而且看了别人视频后,还是又弥补了很多知识的。在看视频过程中,会发现,之前看过的,现在看到又是一个新的理解了。
我们可以将自然语言处理技术与模糊逻辑技术相结合,基于手动创建的模糊情感词典,对新闻故事和电影评论进行情感分析。定义情感种类,在模糊情感词典中标注情感类别及其强度。每个词语可以属于多个情感类别。在实验中,可以对比采用词频、与长度相关的特征、语义倾向、情感PMI—IR、强调词和特殊符号等不同特征时的结果。最后对文章的主动性/被动性和积极/消极性进行了判断。

(周三)N-gram语言模型
人工智能的主流方向:

在这里插入图片描述

基于N-gram语言模型的分词方法:
就是在很多分词结果中选出可能性最大的那种分词结果。

在这里插入图片描述

(周四)国内文本情感分析相关的人和项目。
(1)语料库
(2)现在文本情感分析落地的项目或者系统
(3)BERT
(4)现在研究文本情感分析较多的国内专家:秦兵。
情感分析(Sentiment Analysis)是自然语言处理与人工智能领域的研究热点和难点,情感分析技术在社会媒体的舆情分析、消费意图识别,电子商务的评论分析以及对话机器人等领域具有广泛的应用前景。近年来,随着社交媒体和电子商务平台大数据的爆发以及深度学习技术的兴盛,情感分析技术在研究和应用上均取得了明显进展,成为推动人工智能研究进步和产业发展的重要驱动力之一。
秦兵教授针对情感分析任务,介绍了不同粒度文本(如词语、句子、篇章)的表示学习算法,包括融合文本情感分析信息的词向量学习算法、基于Attention的句子表示学习算法和融合用户偏好的篇章级层次化表示学习算法等,并在此基础上进行情感元素识别、对象级/句子级/篇章级情感分类。同时,秦老师还介绍了我中心基于情感分析在社交媒体的应用——《情绪地图》系统。结合该系统,在纪念中国人民抗日战争暨世界反法西斯战争胜利70周年大阅兵活动期间,我研究中心还联合人民网和新浪微博,推出基于相关情感分析技术的阅兵大数据“网民情绪展示”平台。此外,我研究中心还在SemEval2014 Twitter情感分类任务上斩获了45支参赛队伍的第2名。相关的情感分析研究工作发表在ACL、EMNLP、IJCAI、IEEE TKDE等国际重要会议及期刊上。
情感分析的用处:通过以上过程分析可知,当政府出台新的有利于灾区救 援工作的政策,媒体报道了关于网友为消防人员而作的画, 或者政府领导亲自到灾区探望受灾群众时,网民的情感走势出现波峰,说明政府工作良好有序地开展对舆情有积极的影响。当检察机关公布事故的责任认定,其他地区类似爆炸案的发生、当一些特殊的纪念日到来或者特殊事件发生时,网民情感走势会出现波谷,说明媒体的报道对舆情的影响至关
重要。同时,我们发现网民群体由于其情绪的高度不稳定性必然导致其行动方向的极度不确定性,独立思考能力和意志力薄弱的网民更容易受到集群效应的影响。虽然整个微博讨论过程中积极和消极情绪交替上涨,但安全事故突发事件中
消极情绪始终占据主流。因此,为了避免集群行为在极端情绪的感染下走向“极化”,政府部门应尊重网络民意,及时把握网络舆论关注的社会问题;正面处理网络舆情事件,把握网络集群演变趋势;同时,应该加强对微博网络的监督,完善对造谣者、滋事者言论的监测和清理机制,充分利用微博平台建立政务信息平台。

(周五)一些文本方面的应用和技术

医学文本结构化

在这里插入图片描述
在这里插入图片描述


我觉得这个可以用来检查大家提交的作业是否重复(电子档)或者是语文阅读理解答案与作业匹配度,或者一些有标准答案的核对,这样可以省去大量人工的成本(哈哈,突然觉得自己好有才啊)。不知道现在有没有一种技术(有,图片转文字。OCR),可以读取学生们的电子档作业,然后再用神经网络给作业打分,可以让老师多多休息,哈哈。待会去查看一下。哦豁,这个想法不行,因为学生的手写字千奇百怪,估计计算机识别不了。所以这个还是只能用于使用键盘输入的一些文本的识别或者一些标准文本照片的识别。这个相似度不单单是文字上的相似,还有语义上的相似。比如:

短文本相似度比较
在这里插入图片描述

现在自媒体行业这么发达,但是自媒体人如果在发布信息后不看大家对他的评论,那么很有可能,他就会被淘汰,但是大部分自媒体人都是一些个体,对自己的评论还是采用浏览的方式来看,所以我们很有必要对自媒体评论的文本进行一个综合提取。使得自媒体人可以对自己的作品实时掌握。从而采取正确的措施。
正向里面出现频率较高的词语。
评论观点抽取,也就是评论标签化。
进行评论分析的时候,可以结合表情,看看有没有人用深度学习结合表情来进行文本评论点的情感分析的。
文本处理应用技术
NLP的一些应用

文本审核
文本纠错
情感倾向性分析
评论观点抽取
对话情绪识别
文章标签
文章分类
新闻摘要

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值