语言合成开源库
webrtc开源库 | speex开源库 | audacity开源库 | 音频算法开源库 | |
语言降噪 | 回音消除 | VAD AGC | 音频均衡器/环绕音/低音增强音效算法 | |
NLP语言处理常用算法
HMM隐马尔可夫 | 维特比算法 | jieba开源库(分词,词性标注,命名实体识别) | jieba开源库 | Gensim开源库 Topic Model |
CRF条件随机场CRF | TextRank关键字提取 | 吉布斯采样 | 百度情感识别系统 | 百度FAQ自动问答系统 |
TF/IDF关键字提取 | LSA/LAI/LDA关键字提取 | PLSA算法 | 正向最大匹配原则/分词 | 逆向最大匹配原则/分词 |
SVM支持向量机 | 贝叶斯定理 | 朴素贝叶斯定理 | 激活函数总结及其函数实现 | 双向最大匹配原则/分词 |
PCFG句法分析(最流行) | PTB 宾州树库 句法分析 | 中文宾州树库CTB | 清华树库TCT | 主流句法分析评测PARSEVAL评测体系 |
Adam优化器 Adam算法 | 基于CRF句法分析 | 短语结构树为目标的句法分析器 | 基于最大间隔马尔可夫网络句法分析 | |
基于移进-归约的句法分析模型 | Standford Parser开源句法分析器(java实现)
| StandfordNLP | ||
文本向量化(重点知识) | ||||
word2vec词向量化 | doc2vec文本向量化 | 词袋模型(Bag of word) | 神经网络语言模型NNLM | |
C&W模型 | CBOW模型 | Skip-gram模型 | doc2vecDM模型/DBOW模型 | |
情感分析技术/词法分析 | 情感分析技术/基于机器学习分析 | 情感分析技术/混合分析 | 了解 PMC多项式朴素贝叶斯 | |
分类模型SVM支持向量机 | 分类模型LR逻辑回归 | 情感分析CNN卷积神经网络 | 情感分析RNN循环神经网络 | |
RNN变种 长短时记忆网络(Long Short Term Memory) LSTM | ||||
机器学习算法 | ||||
有监督学习 | 无监督学习 | 半监督学习 | 分类/聚类/回归/降维 | |
分类算法 | 朴素贝叶斯 | SVM支持向量机 | LR逻辑回归 | |
KNN k近邻居 | 决策树(Decision Tree)DT | 神经网络(NN) | 决策树升级版-随机森林 | |
机器学习聚类算法/k-means算法 | ||||
最优化算法 | 梯度下降 | 随机梯度下降 | 批量梯度下降 | |
丢弃法 | ||||
激活函数 | Sigmoid(很少使用了) | tanh | ReLU | |
成功训练模型四个要素 数据/转换数据的模型/衡量数据好坏的损失函数/一个调整模型权重以便最小化损失函数的算法 | ||||
Sep2Sep问答机器人 | tensorflow-seq2seq 例子 | |||
XGBoost开源项目 | ||||
kaggle 竞赛平台和社区 | ||||
mfcc | 聊天机器人开源项目(*) | Angel是一个基于参数服务器(Parameter Server)理念开发的高性能分布式机器学习平台(*) | Vowpal Wabbit是一个机器学习系统,它通过在线,散列,allreduce,简化,学习2搜索,主动和交互式学习等技术推动机器学习的前沿。 |
数学知识
Tensorflow相关知识点
Tensorflow源码地址 | |||||
语音识别关键字统计
webrtc开源库 | speex开源库 | audacity开源库 | 语言降噪 | 回音消除 | VAD AGC |
音频均衡器/环绕音/低音增强音效算法 | 清华大学公开语料库 | 清华大学语料库标签 | |||
机器学习关键字统计
Pandas | SARSA | boosting | |||
Numpy | SVM | ||||
Q-learning | LR |
算法工程师关键字统计
部署上线工程实践
算法模型部署上线的几种工程实践 | jpmml的说明文档开源项目 |
Java调用PMML的范例 | Tensorflow java模型上线部署 |
自然语言处理资源网站 | 模型打包工具bazel To android ios linux 开源工具(谷歌内部构建工具) |