《960全网最全Android开发笔记》
《379页Android开发面试宝典》
《507页Android开发相关源码解析》
因为文件太多,全部展示会影响篇幅,暂时就先列举这些部分截图
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
那么如何统计 p(w) p(w)和 p(w1,w2) p(w\_1,w\_2)的呢?
p(w) p(w)通过 (词出现的文档数)/(总文档数) (词出现的文档数)/(总文档数)计算得到。
p(w1,w2) p(w\_1,w\_2)通过 (w1,w2共同出现的文档数)/(总文档数) (w\_1,w\_2共同出现的文档数)/(总文档数)计算得到。
### 1.3 PMI
PMI(Pointwise Mutual Information),中文称为互信息,描述的是两个事件在概率分布上的近似度量。计算公式如下:
pmi(w1,w2)\=log(p(w1,w2)p(w1)∗p(w2))
pmi(w\_1,w\_2)=log(\\frac{p(w\_1,w\_2)}{p(w\_1)\*p(w\_2)})
如果 w1 w\_1和 w2 w\_2分布是相互独立的,那么 p(w1,w2)\=p(w1)∗p(w2) p(w\_1,w\_2)=p(w\_1)\*p(w\_2), pmi(w1,w2)\=log1\=0 pmi(w\_1,w\_2)=log1=0。
相反,如果 w1 w\_1和 w2 w\_2的分布不是相互独立的,那么 p(w1,w2)\>p(w1)∗p(w2) p(w\_1,w\_2)>p(w\_1)\*p(w\_2),并且相关性越强pmi的值越大,说明 w1 w\_1和 w2 w\_2共现携带的讯息越多。这个也很好理解,比如美国和川普是经常一起出现的,因为美国的总统是川普。相反,川普和我的名字大概率是不会共现的,因为我两根本没啥关系。
### 1.4 情感分析
我们给每一个句子都给出一个得分score,得分通过 ∑(待测短语的正面情感词的PMI)−∑(待测短语的负面情感词PMI) \\sum(待测短语的正面情感词的PMI)-\\sum(待测短语的负面情感词PMI)得到。
对于socre:
score>0表示正面情感
score=0表示中性情感
socre<0表示负面情感
2.编码
----
有了上文的准备工作就可以进行编码了,代码逻辑为:
* 1.统计和保存 p(w) p(w)和 p(w1,w2) p(w\_1,w\_2)
* 2.统计和保存pmi(w\_1,w\_2)矩阵
* 3.分别计算待测短语中词与正面情感词库所有词的PMI,将得到的PMI相加得到 ∑pmi(wi,wp) \\sum pmi(w\_i,w\_p)
* 4.分别计算待测短语中词与负面情感词库所有词的PMI,将得到的PMI相加得到 ∑pmi(wi,wn) \\sum pmi(w\_i,w\_n)
* 5.计算情感倾向总得分 score\=∑pmi(wi,wp)−∑pmi(wi,wn) score=\\sum pmi(w\_i,w\_p)-\\sum pmi(w\_i,w\_n)
3.总结
----
本文介绍的只是简单的情感分析方法,实际的工作并不是这么简单。本文介绍的方法也有很多不足的地方:
* 需要的人工参与量大
* 模型效果对语料库依赖度高
* 某些修饰词和否定词的作用被忽略,比如不伟大,不开心
这些都是需要后续改进的地方。
* * *
另外新申请了个个人公众号,分享关于学习AI的经历,欢迎关注!
![这里写图片描述](https://img-blog.csdn.net/20171012040312528?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYW5kcm9pZF9ydWJlbg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast)
version\_1\_20171008
### 总结
最后为了帮助大家深刻理解Android相关知识点的原理以及面试相关知识,这里放上相关的我搜集整理的14套腾讯、字节跳动、阿里、百度等2021面试真题解析,我把技术点整理成了视频和PDF(实际上比预期多花了不少精力),包知识脉络 + 诸多细节。
![2020面试真题解析](https://img-blog.csdnimg.cn/img_convert/9d8cb242594797f930fabb4e102f9b2c.webp?x-oss-process=image/format,png)
![腾讯面试真题解析](https://img-blog.csdnimg.cn/img_convert/ebcd24aa9be557065c394c3bcd969a74.webp?x-oss-process=image/format,png)
![阿里巴巴面试真题解析](https://img-blog.csdnimg.cn/img_convert/a2dca76b885412e0e68d48982a29e641.webp?x-oss-process=image/format,png)
![字节跳动面试真题解析](https://img-blog.csdnimg.cn/img_convert/46a40e46dc78fb6c1e73ecf50f28c50b.webp?x-oss-process=image/format,png)
网上学习 Android的资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。希望这份系统化的技术体系对大家有一个方向参考。
![](https://img-blog.csdnimg.cn/img_convert/14ec5649868084214ea2be5986426a21.webp?x-oss-process=image/format,png)
**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**
**[需要这份系统化学习资料的朋友,可以戳这里获取](https://bbs.csdn.net/topics/618156601)**
**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**
系统化学习资料的朋友,可以戳这里获取](https://bbs.csdn.net/topics/618156601)**
**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**