sklearn入门

刚刚使用SKLearn学习机器学习进行数据分析,分享一些概念和想法,希望可以大家一起讨论,如果理解或者表达有不准确的地方,请多多指点,不吝赐教,非常感谢~~

** 上一次总结的是《机器学习概述》:https://mp.csdn.net/mdeditor/98843972#
** 下一次会总结《决策树和随机森林》


  • sklearn是什么?

全称为scikit-learn,是一个开源的基于python语言的机器学习工具包。它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法应用,并且涵盖了几乎所有主流机器学习算法。官网:http://scikit-learn.org/stable/index.html

  • sklearn的基本建模流程

无论对数据集采用何种算法又如何划分,sklearn的建模流程只有三步,分别是:

  1. 模型实例化:需要传入具体的参数,来建立模型的具体实例对象
  2. 通过模型接口,训练模型:需要传入样本的训练集,所以还要提前对样本划分
  3. 通过模型的接口查看结果,提取需要的信息

举例代码如下:

from sklearn import tree 						#导入需要的模块

clf = tree.DecisionTreeClassifier()     		#实例化
clf = clf.fit(X_train,y_train) 					#用训练集数据训练模型
result = clf.score(X_test,y_test) 				#导入测试集,从接口中调用需要的信息
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
scikit-learn(又称sklearn)是一个基于Python的强大的机器学习库,它建立在numpy、scipy和matplotlib模块之上,为用户提供各种机器学习算法接口。sklearn包含了常用的分类、回归、聚类、降维、模型选择、数据预处理等机器学习方式,可以让用户简单、高效地进行数据挖掘和数据分析。\[1\] 如果你想使用sklearn库来构建一个问答模型,你可以按照以下步骤进行操作: 1. 合并两个标注数据集的问答对,并对所有的问题进行分词并转换成词向量。你可以使用pandas库来读取和合并数据集,使用jieba库进行分词,使用TfidfVectorizer类来进行词向量转换。具体的代码示例可以参考引用\[3\]中的代码。 2. 构建问答库的tf-idf矩阵和特征词列表。你可以使用TfidfVectorizer类的fit_transform方法来计算tf-idf矩阵,使用get_feature_names方法来获取特征词列表。 3. 将问答对集合和相关的数据返回,以供后续使用。 通过以上步骤,你就可以使用sklearn库构建一个基于Python的问答模型了。希望对你有帮助!\[1\]\[3\] #### 引用[.reference_title] - *1* *2* [sklearn入门之多元线性回归](https://blog.csdn.net/weixin_39737111/article/details/111431868)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [基于Python的冬奥会领域问答机器人设计](https://blog.csdn.net/newlw/article/details/124663641)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值