学习内容:
- java基础:
- 听一场讲座:
- pandas基础:
- python实践:
- padas实践:
- 人工智能:
人工智能
属于计算机,python比较火,目前的想法利用java写交互,然后调用python的接口实现人工智能算法的研究。因此要从头开始学习。
弱人工智能:机器人,语音识别,游戏,面部识别
强人工智能:类似人类大脑
超人工智能:超过人类的大脑
人工智能:分为:模式识别,机器学习,数据挖掘
模式识别:对表征事务的判断,判断某种事务
(PS:车牌号,上班打卡)
机器学习:研究计算机模拟人类的行为,类似于数据的预测,
)(PS:预测H1N1的病毒)
数据挖掘:通过算法挖掘搜索有用信息。
开发,应用:(可以调用BAT的接口)
java基础
jdk:集成开发的工具包 jdk>jre>jvm
jre:java运行环境
jvm:java虚拟机
安装java开发环境,建议使用最新版开发工具,javaSE8 就可以开始学习
主要的收获就是知道可以利用百度ai的接口,调用人工智能的处理方法,并能够得到最终的结果。并将结果返回到java的后端。对结果进行处理的操作。
自然语言处理的讲座
- nlp的前沿成果
- nlp的发展方向和就业前景
- nlp的准备工作
前沿成果
标注数据(干净的数据标注)大数据的标准的方法。可以都接触各种框架。
词法,句法。应用比较多。(这两种方法很好)
分词:jieba ,nldk方面
词性标注:(目前大多用端到端方式。用训练字向量)
实体识别:。钱,温度任命地名,人名构成
成分分析:主谓宾,主卫
依存分析:一个词依赖于哪些词
语义:语义表示,语义匹配,语义是谁。
两个语义抽出来是否一样
文本分类
主题抽取:抽取摘要
文本生成:工业级不可以
摘要生成,情感分析,query分析,机器翻译,智能客服(通过抽取相应的东西),对话助手,事件抽取,知识图谱(和nlp结合目前来说比较火)
发力点在预训练模型
提前训练好词向量,然后用于别的数的数据
目前采用暴力的方式计算
神经网络很难在发展,因此提出了不同的方法,并行计算,减少梯度,最大化互信息。
总结来说,主要有两大方面;一方面追求数据量的巨大,另一方面通过输出与隐藏层的互信息达到最大从而减少隐藏层的相关的方法来实现。
NLP的发展就业方向前景
要求技能
更加看中编程,算法部署,算法实现的基本技术
nlp和知识图谱相结合,知识图谱的构建相结合。需要知识图谱方向的研究员。
不在是纯nlp需要知识图谱并进行跨界。
知识图谱很重要
NLP的就业准备
工业界:主流综合性考量,简单模型,课题维护,可以修改源码,需要自己实现相关的算法,会调参。优化已有的参数。
工作向工程能力对以后的工作有用。
最有价值的论文:
LCML,NLPS…顶会
下面三个开拓思路
往公司应聘,会和厉害