机器学习是人工智能的一个分支。人工智能致力于创造出比人类更能完成复杂任务的机器。这些任务通常涉及判断、策略和认知推理,这些技能的范围非常大——语言处理、图像识别、规划等等。
使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测
机器学习基本思想:Bayes定理只是一个从经验中学习的数学方法
机器学习能产生影响的主要领域:物联网,聊天机器人,自动驾驶
k-最近邻算法,回归算法,决策树算法,贝叶斯算法,聚类算法
中文分词:
#========将特征值进行分词,并且去除停用词
import jieba
comment_list=[]
for comment in col:
seg_list=jieba.cut(comment,cut_all=False)##精确模式
finall=''
for seg in seg_list:
if seg not in stop_list:
finall+=seg
comment_list.append(finall)
#==========计算词频============:
from sklearn.feature_extraction.text import CountVectorizer
#计算每个词语出现的次数:
vector=CountVectorizer()#实例化
X=vector.fit_transform(comment_list) #每个关键词出现个数
word=vector.get_feature_nam