机器学习
肉bot
这个作者很懒,什么都没留下…
展开
-
Datawhale数据分析-建模与评估
建模与评估一级目录二级目录三级目录模型建立1. 清洗数据2. 选择模型3. 分割数据集4. 模型创建5. 输出预测结果评估1. 目的2. 交叉验证3. 评价数据对于一些思考问题的想法1. 清洗前后数据的不同:2. 数据集哪些差异会导致模型在拟合数据是发生变化3. 什么情况下切割数据集的时候不用进行随机选取4. 为什么线性模型可以进行分类任务,背后是怎么的数学关系5. 对于多分类问题,线性模型是怎么进行分类的6. 预测标签的概率对我们有什么帮助一级目录二级目录三级目录模型建立1. 清洗数据由于最初原创 2020-08-28 17:07:22 · 593 阅读 · 0 评论 -
Datawhale机器学习-向量机
机器学习-SVM笔记向量机的分类标准软间隔和硬间隔非线性核函数分类-高斯函数多分类参考向量机的分类标准将两个线性可分的点集(Linearly separable case)分类可以有很多种选择,但如何让机器学习后选择最佳的Decison Boundary?向量机(Support Vector Machine)给出的标准是:找出一条曲线, 使其距离两个类别的最近的样本最远支持向量:样本中距离超平面最近的一些点,这些点叫做支持向量。软间隔和硬间隔然而当样本数据有噪音点时,SVM同样需要处理欠/过拟原创 2020-08-26 20:06:30 · 278 阅读 · 0 评论 -
对几种数据可视化工具的用途
柱状图这类图形比较适合直观的表达离散型特征对分类结果的影响比如泰坦尼克号数据集中男女中死亡人数的可视化:#泰坦尼克号数据集中男女中死亡人数data.groupby(['Sex','Survived'])['Survived'].count().unstack().plot(kind='bar',stacked='True')# stack: 两个图标叠加在一起plt.title('Survived people')plt.ylabel('Number')plt.xlabel('Sex')原创 2020-08-24 23:03:35 · 400 阅读 · 0 评论 -
Datawhale机器学习-决策树感想
机器学习-决策树学习笔记理论模型代码和参数criterionmax_depthmin_samples_leaf怎样提高准确率数据处理调整参数总结理论个人对决策树理论的理解:决策树就像是由不同层级的很多选择器的组合,这些选择器内部的criteria是通过对训练集中的数据学习得到的。之后有新的数据传入时,选择器就一层层的对输入数据做判断,最底层选择器给出最有可能的分类结果模型代码和参数tree_clf = DecisionTreeClassifier()其中可设置的重要参数有:criterion原创 2020-08-22 21:10:30 · 615 阅读 · 0 评论