自然语言处理(NLP)算法分类总结

〇、推荐

无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。

一、人工智能学习算法分类

人工智能算法大体上来说可以分类两类:基于统计的机器学习算法(Machine Learning)和深度学习算法(Deep Learning)

总的来说,在sklearn中机器学习算法大概的分类如下:

1. 纯算法类

(1).回归算法
(2).分类算法
(3).聚类算法
(4)降维算法
(5)概率图模型算法
(6)文本挖掘算法
(7)优化算法
(8)深度学习算法

2.建模方面

(1).模型优化
(2).数据预处理

二、详细算法

1.分类算法

(1).LR (Logistic Regression,逻辑回归又叫逻辑分类)
(2).SVM (Support Vector Machine,支持向量机)
(3).NB (Naive Bayes,朴素贝叶斯)
(4).DT (Decision Tree,决策树)

  • 1).C4.5
  • 2).ID3
  • 3).CART

(5).集成算法

  • 1).Bagging
  • 2).Random Forest (随机森林)
  • 3).GB(梯度提升,Gradient boosting)
  • 4).GBDT (Gradient Boosting Decision Tree)
  • 5).AdaBoost
  • 6).Xgboost

(6).最大熵模型

2.回归算法

(1).LR (Linear Regression,线性回归)
(2).SVR (支持向量机回归)
(3). RR (Ridge Regression,岭回归)

3.聚类算法

(1).Knn
(2).Kmeans 算法
(3).层次聚类
(4).密度聚类

4.降维算法

(1).SGD (随机梯度下降)

5.概率图模型算法

(1).贝叶斯网络
(2).HMM
(3).CRF (条件随机场)

6.文本挖掘算法

(1).模型

  • 1).LDA (主题生成模型,Latent Dirichlet Allocation)
  • 2).最大熵模型

(2).关键词提取

  • 1).tf-idf
  • 2).bm25
  • 3).textrank
  • 4).pagerank
  • 5).左右熵 :左右熵高的作为关键词
  • 6).互信息:

(3).词法分析

  • 1).分词
    – ①HMM (因马尔科夫)
    – ②CRF (条件随机场)
  • 2).词性标注
  • 3).命名实体识别

(4).句法分析

  • 1).句法结构分析
  • 2).依存句法分析

(5).文本向量化

  • 1).tf-idf
  • 2).word2vec
  • 3).doc2vec
  • 4).cw2vec

(6).距离计算

  • 1).欧氏距离
  • 2).相似度计算

7.优化算法

(1).正则化

  • 1).L1正则化
  • 2).L2正则化

8.深度学习算法

(1).BP
(2).CNN
(3).DNN
(3).RNN
(4).LSTM

三、建模方面

1.模型优化·

  • (1).特征选择
  • (2).梯度下降
  • (3).交叉验证
  • (4).参数调优
  • (5).模型评估:准确率、召回率、F1、AUC、ROC、损失函数

2.数据预处理

  • (1).标准化
  • (2).异常值处理
  • (3).二值化
  • (4).缺失值填充: 支持均值、中位数、特定值补差、多重插补
  • 3
    点赞
  • 42
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 可以使用C语言编写自然语言处理程序,但是需要使用相关的库和工具来实现。例如,可以使用NLTK、Stanford CoreNLP、OpenNLP等开源工具来处理自然语言。同时,也可以使用C语言的字符串处理函数和正则表达式来实现一些基本的自然语言处理功能。 ### 回答2: C语言是一种高效、功能丰富的编程语言,它被广泛用于编写各种类型的应用程序。自然语言处理NLP)是一项涉及计算机和自然语言的交叉学科,主要关注如何使计算机能够理解、解释和生成人类语言。 在C语言中编写自然语言处理程序可以通过调用相关的库和算法来实现。例如,可以使用C语言中的字符串操作函数来处理文本输入,并使用正则表达式模式匹配来实现特定的文本解析。通过对文本进行分词、词性标注和句法分析等操作,可以实现对自然语言进行语义和结构分析。 此外,C语言还可以与机器学习算法结合使用,以实现文本分类、情感分析、命名实体识别等自然语言处理任务。通过使用C语言中的矩阵计算库,可以实现词向量表示和文本相似度计算等操作。 在编写自然语言处理程序时,需要注意处理中文字符编码的问题。中文字符通常采用UTF-8编码方式存储,因此需要使用C语言提供的相关编码转换函数来确保文本数据的准确处理和解析。 总结而言,以C语言编写自然语言处理程序需要深入理解NLP算法和相关领域的知识,并结合C语言丰富的字符串和算法函数来实现文本处理、特征提取、算法训练等功能。通过编写高效的代码和灵活的数据结构,可以实现各种自然语言处理任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值