2024年最全[NLP]如何进行情感分析,2024年最新android自定义控件面试

《960全网最全Android开发笔记》

《379页Android开发面试宝典》

《507页Android开发相关源码解析》

因为文件太多,全部展示会影响篇幅,暂时就先列举这些部分截图

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!




那么如何统计 p(w) p(w)和 p(w1,w2) p(w\_1,w\_2)的呢?  

p(w) p(w)通过 (词出现的文档数)/(总文档数) (词出现的文档数)/(总文档数)计算得到。  

p(w1,w2) p(w\_1,w\_2)通过 (w1,w2共同出现的文档数)/(总文档数) (w\_1,w\_2共同出现的文档数)/(总文档数)计算得到。



### 1.3 PMI



PMI(Pointwise Mutual Information),中文称为互信息,描述的是两个事件在概率分布上的近似度量。计算公式如下:  



pmi(w1,w2)\=log(p(w1,w2)p(w1)∗p(w2))



pmi(w\_1,w\_2)=log(\\frac{p(w\_1,w\_2)}{p(w\_1)\*p(w\_2)})  

如果 w1 w\_1和 w2 w\_2分布是相互独立的,那么 p(w1,w2)\=p(w1)∗p(w2) p(w\_1,w\_2)=p(w\_1)\*p(w\_2), pmi(w1,w2)\=log1\=0 pmi(w\_1,w\_2)=log1=0。  

相反,如果 w1 w\_1和 w2 w\_2的分布不是相互独立的,那么 p(w1,w2)\>p(w1)∗p(w2) p(w\_1,w\_2)>p(w\_1)\*p(w\_2),并且相关性越强pmi的值越大,说明 w1 w\_1和 w2 w\_2共现携带的讯息越多。这个也很好理解,比如美国和川普是经常一起出现的,因为美国的总统是川普。相反,川普和我的名字大概率是不会共现的,因为我两根本没啥关系。



### 1.4 情感分析



我们给每一个句子都给出一个得分score,得分通过 ∑(待测短语的正面情感词的PMI)−∑(待测短语的负面情感词PMI) \\sum(待测短语的正面情感词的PMI)-\\sum(待测短语的负面情感词PMI)得到。  

对于socre:



score>0表示正面情感

score=0表示中性情感

socre<0表示负面情感




2.编码

----



有了上文的准备工作就可以进行编码了,代码逻辑为:



*   1.统计和保存 p(w) p(w)和 p(w1,w2) p(w\_1,w\_2)

*   2.统计和保存pmi(w\_1,w\_2)矩阵

*   3.分别计算待测短语中词与正面情感词库所有词的PMI,将得到的PMI相加得到 ∑pmi(wi,wp) \\sum pmi(w\_i,w\_p)

*   4.分别计算待测短语中词与负面情感词库所有词的PMI,将得到的PMI相加得到 ∑pmi(wi,wn) \\sum pmi(w\_i,w\_n)

*   5.计算情感倾向总得分 score\=∑pmi(wi,wp)−∑pmi(wi,wn) score=\\sum pmi(w\_i,w\_p)-\\sum pmi(w\_i,w\_n)



3.总结

----



本文介绍的只是简单的情感分析方法,实际的工作并不是这么简单。本文介绍的方法也有很多不足的地方:



*   需要的人工参与量大

*   模型效果对语料库依赖度高

*   某些修饰词和否定词的作用被忽略,比如不伟大,不开心



这些都是需要后续改进的地方。



* * *



另外新申请了个个人公众号,分享关于学习AI的经历,欢迎关注!  

![这里写图片描述](https://img-blog.csdn.net/20171012040312528?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYW5kcm9pZF9ydWJlbg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)



version\_1\_20171008



 



### 总结

最后为了帮助大家深刻理解Android相关知识点的原理以及面试相关知识,这里放上相关的我搜集整理的14套腾讯、字节跳动、阿里、百度等2021面试真题解析,我把技术点整理成了视频和PDF(实际上比预期多花了不少精力),包知识脉络 + 诸多细节。

![2020面试真题解析](https://img-blog.csdnimg.cn/img_convert/9d8cb242594797f930fabb4e102f9b2c.webp?x-oss-process=image/format,png)
![腾讯面试真题解析](https://img-blog.csdnimg.cn/img_convert/ebcd24aa9be557065c394c3bcd969a74.webp?x-oss-process=image/format,png)

![阿里巴巴面试真题解析](https://img-blog.csdnimg.cn/img_convert/a2dca76b885412e0e68d48982a29e641.webp?x-oss-process=image/format,png)

![字节跳动面试真题解析](https://img-blog.csdnimg.cn/img_convert/46a40e46dc78fb6c1e73ecf50f28c50b.webp?x-oss-process=image/format,png)
网上学习 Android的资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。希望这份系统化的技术体系对大家有一个方向参考。

![](https://img-blog.csdnimg.cn/img_convert/14ec5649868084214ea2be5986426a21.webp?x-oss-process=image/format,png)




**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**[需要这份系统化学习资料的朋友,可以戳这里获取](https://bbs.csdn.net/topics/618156601)**

**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**

系统化学习资料的朋友,可以戳这里获取](https://bbs.csdn.net/topics/618156601)**

**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值