![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习笔记
文章平均质量分 66
microspore
这个作者很懒,什么都没留下…
展开
-
超级详细使用jieba分词用wordcloud制作词云并进行词频统计实例
最近学习机器学习课程,学到文本分类就研究了下词云如何处理,写下代码和文件以便帮助更多的人,个人变成基础极其薄弱,如有问题请自行修改相关代码。准备工作使用命令安装jieba 分词,这里已经帮大家写好了阿里云的镜像复制使用即可。pip install jieba -i https://mirrors.aliyun.com/pypi/simple/另外一个下载下我的文件,我这里使用的是长篇小说《白鹿原》,有需要的可以使用。文件中包含了:文本(白鹿原.txt)(废都.txt)、jieba自定义词典(原创 2020-12-10 23:33:36 · 6306 阅读 · 0 评论 -
毒蘑菇数据集svm进行分类,内有数据集
毒蘑菇数据集具体可到uci查看相关数据集描述,我看网上翻译的都不是很正确所以就不放了,直接放链接去看,UCI毒蘑菇数据集数据集直接下我整理好的毒蘑菇数据集数据第一列为标签是否为毒蘑菇,其它22个为特征值。因为自己刚学比较菜,就是调包调参,预测结果1,就怀疑自己哪里是不是错了,又用其他模型搞了遍,看了网上用其他分类算法都能到达1,才放心没错。。。里面主要是使用了 get_dummise进行one—hot进行独热编码。其它代码就很简单大家应该能一眼看出来import pandas as pdfr原创 2020-11-22 22:07:13 · 2298 阅读 · 0 评论 -
泰坦尼克号生存预测随机森林和逻辑回归,kaggle渣渣排名
泰坦尼克号生存预测,kaggle得分0.77,4000多排名,实在没有办法提高排名了。# -*- coding: utf-8 -*-# @Time : 2020/11/2 22:17# @Author : sporeimport numpy as npimport pandas as pdfrom sklearn.preprocessing import LabelEncoderfrom sklearn.model_selection import train_test_splitfrom原创 2020-11-19 22:32:56 · 609 阅读 · 0 评论 -
利用KNN算法预测鸢尾花
刚入门学习机器学习,入门例子就是鸢尾花分类,利用skl自带的鸢尾花例子进行knn学习。1.Knn算法。存在一个训练样本集合A,在给定测试样本b时,基于某种距离度量,找出训练集A中与测试样本b最靠近的k个训练样本(通常k≤20且为整数),基于这k个训练样本的信息来预测种类或值。k个样本标签中,哪个标签多就认为是哪个标签。2.鸢尾花数据分类。关于train_test_split。train_data:待划分样本数据train_target:待划分样本数据的结果(标签)test_size:测.原创 2020-11-01 16:56:07 · 1896 阅读 · 0 评论