【人工智能】自然语言处理(NLP)算法分类总结

目录

〇、推荐

无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。

一、人工智能学习算法分类

人工智能算法大体上来说可以分类两类:基于统计的机器学习算法(Machine Learning)和深度学习算法(Deep Learning)

总的来说,在sklearn中机器学习算法大概的分类如下:

1. 纯算法类

(1).回归算法
(2).分类算法
(3).聚类算法
(4)降维算法
(5)概率图模型算法
(6)文本挖掘算法
(7)优化算法
(8)深度学习算法

2.建模方面

(1).模型优化
(2).数据预处理

二、详细算法

1.分类算法

(1).LR (Logistic Regression,逻辑回归又叫逻辑分类)
(2).SVM (Support Vector Machine,支持向量机)
(3).NB (Naive Bayes,朴素贝叶斯)
(4).DT (Decision Tree,决策树)

  • 1).C4.5
  • 2).ID3
  • 3).CART

(5).集成算法

  • 1).Bagging
  • 2).Random Forest (随机森林)
  • 3).GB(梯度提升,Gradient boosting)
  • 4).GBDT (Gradient Boosting Decision Tree)
  • 5).AdaBoost
  • 6).Xgboost

(6).最大熵模型

2.回归算法

(1).LR (Linear Regression,线性回归)
(2).SVR (支持向量机回归)
(3). RR (Ridge Regression,岭回归)

3.聚类算法

(1).K-Means(K均值)聚类
(2).均值漂移聚类
(3).基于密度的聚类(DBSCAN)
(4).高斯混合模型(GMM)的最大期望(EM)聚类
(5).凝聚层次聚类
(6).图团体检测(Graph Community Detection)

4.降维算法

(1).SGD (随机梯度下降)

5.概率图模型算法

(1).贝叶斯网络
(2).HMM
(3).CRF (条件随机场)

6.文本挖掘算法

(1).模型

  • 1).LDA (主题生成模型,Latent Dirichlet Allocation)
  • 2).最大熵模型

(2).关键词提取

  • 1).tf-idf
  • 2).bm25
  • 3).textrank
  • 4).pagerank
  • 5).左右熵 :左右熵高的作为关键词
  • 6).互信息:

(3).词法分析

  • 1).分词
    – ①HMM (因马尔科夫)
    – ②CRF (条件随机场)
  • 2).词性标注
  • 3).命名实体识别

(4).句法分析

  • 1).句法结构分析
  • 2).依存句法分析

(5).文本向量化

  • 1).tf-idf
  • 2).word2vec
  • 3).doc2vec
  • 4).cw2vec

(6).距离计算

  • 1).欧氏距离
  • 2).相似度计算

7.优化算法

(1).正则化

  • 1).L1正则化
  • 2).L2正则化

8.深度学习算法

(1).BP
(2).CNN
(3).DNN
(3).RNN
(4).LSTM

三、建模方面

1.模型优化·

  • (1).特征选择
  • (2).梯度下降
  • (3).交叉验证
  • (4).参数调优
  • (5).模型评估:准确率、召回率、F1、AUC、ROC、损失函数

2.数据预处理

  • (1).标准化
  • (2).异常值处理
  • (3).二值化
  • (4).缺失值填充: 支持均值、中位数、特定值补差、多重插补
### 回答1: TikTok 使用的自然语言处理(NLP) 算法可能包括: 1. 词法分析算法:用于分析文本中的单词和词组,并标注它们的词性。 2. 句法分析算法:用于分析文本中句子的结构,并标注它们的句子成分。 3. 语义分析算法:用于分析文本中的词语和句子的意义,并建立词语之间的关系。 4. 情感分析算法:用于分析文本中的情绪和感受,以了解用户的态度和偏好。 5. 机器翻译算法:用于将文本从一种语言翻译成另一种语言。 这只是 NLP 算法的一个简单列表,实际上还有许多其他的 NLP 算法,比如摘要算法、问答算法等。 ### 回答2: TikTok 自然语言处理 (NLP) 算法是一种利用人工智能技术处理和理解自然语言的算法。它通过文本分析和语义理解等方法,使得 TikTok 能够更好地理解和处理用户发布的文本信息。 首先,TikTok 的 NLP 算法包括文本分类和情感分析。文本分类是将用户发布的文本信息进行分类,例如将用户发布的评论分为正面或负面评价,以便了解用户对内容的喜好和态度。情感分析则是通过分析用户评论中的情感细微差别,从而更好地理解用户的情感倾向。 其次,TikTok 的 NLP 算法还包括关键词提取和实体识别。关键词提取是通过分析用户发布的文本信息,提取出其中最重要的关键词和短语,以便更好地理解用户意图和相关内容。实体识别则是识别文本中的实体,例如人名、地点、品牌等,从而帮助 TikTok 更好地为用户推荐相关内容。 另外,TikTok 的 NLP 算法还包括语义匹配和语义推断。语义匹配是通过比较两段文本的语义相似性,从而判断它们是否相似或相关。语义推断则是根据已有的信息,推断出缺失的信息,以便更好地理解和解释用户的意图。 总的来说,TikTok 的 NLP 算法结合了文本分析、情感分析、关键词提取、实体识别、语义匹配和语义推断等技术,以提高对用户发布的文本信息的理解和处理能力,从而为用户提供更好的内容推荐和用户体验。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

沙振宇

你的鼓励将是我创作的最大动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值