《python机器学习基础教程》
python机器学习基础教程代码复现
python__reported
python菜鸟入门,期待成为数据分析的大神;
互相帮助!
展开
-
win10安装tersonflowb出错
win10安装tersonflowb出错一、报错二、解决方法(一)有效(一)无效(只是对我无效)一、报错通过查找,发现第一个报错内容为ERROR: Failed building wheel for wrapt.......Running setup.py clean for wrapt...........Failed to build wrapt.......#此处为简写,大体该报错的关键内容如上二、解决方法(一)有效链接: win10 安装tensorflow 报错“ERROR:原创 2020-07-06 09:39:27 · 3582 阅读 · 0 评论 -
粗糙的量刑模型-随机森林算法
粗糙的刑事量刑模型-随机森林算法一、效果(一)特征重要性(二)预测精度(三)结果二、大致思路(一)数据爬取一、效果(一)特征重要性(二)预测精度(三)结果监督学习的几个算法都试过,只有随机森林的测试集效果较好可以达到30%,其余大多只有20%多,当然如果继续调参可能会更好,但是整体而言,大致也仅在30%左右;训练集最好的时候可以到80%以上,但是测试集最高只能30%左右结论:模型泛化能力不足,拟合能力也不是非常好可能原因:特征使用的量刑情节使用的是0、1判断,可能过于稀疏而且提取时也可能存原创 2020-07-01 12:45:35 · 4555 阅读 · 1 评论 -
python机器学习基础教程第七章Traceback (most recent call last):OSError: [E050] Can‘t find model ‘en‘.
OSError: [E050] Can't find model 'en'.一、问题二、方法三、下载成功一、问题初次导入spacy的英语模型时报错:Traceback (most recent call last):File "... ...", line 12, in <module>en_nlp = spacy.load('en') File "D:\Users\Administrator\AppData\Local\Programs\Python\Python37\lib\si原创 2021-01-03 16:03:28 · 1633 阅读 · 1 评论 -
特征工程:交互特征与多项式特征理解
特征工程:交互特征与多项式特征理解一、理解二、测试代码比较一、理解交互特征与多项式特征与数据预处理中的MinMaxScaler是相似的,都是对数据进行缩放处理缩放处理、交互特征与多项式特征都是对原始数据进行缩放,缩放意义在于使得权重与偏置更具有敏感性,更易对数据预测二、测试代码比较from sklearn.datasets import load_bostonfrom sklearn.model_selection import train_test_splitfrom sklearn.pre原创 2020-12-29 22:53:59 · 856 阅读 · 0 评论 -
《Python机器学习基础教程》第二章笔记:ValueError: cannot reshape array of size 4000000 into shape (1000,1000)
@[TOC](《Python机器学习基础教程》第二章笔记:ValueError: cannot reshape array of size 4000000 into shape (1000,1000))成功解决:增加命令y = y % 2一、报错ValueError: cannot reshape array of size 4000000 into shape (1000,1000)二、尝试解决意思:ValueError:无法将大小为4000000的数组重塑为形状(1000,1000原创 2020-06-20 10:49:15 · 7256 阅读 · 0 评论 -
《Python机器学习基础教程》第二章笔记:用于多分类的线性模型-三分类数据集
《Python机器学习基础教程》第二章笔记:用于多分类的线性模型-三分类数据集一、疑问二、理解一、疑问第一个数据集的可视化:from sklearn.linear_model import LogisticRegressionfrom sklearn.svm import LinearSVCimport mglearnfrom matplotlib import pyplot as pltfrom sklearn.model_selection import train_test_split原创 2020-06-18 21:49:12 · 2477 阅读 · 0 评论 -
《Python机器学习基础教程》第二章笔记:random_state的作用
《Python机器学习基础教程》第二章笔记:random_state的作用一、random_state的作用:固定系数与截距二、random_state的取值是对系数排序的结果,random_state值越小,系数越大一、random_state的作用:固定系数与截距random_state的作用在于固定lr.coef_、lr.intercept_,保证每次模型的系数、截距一致不加random_state时,系数与截距不停的变化:from sklearn.linear_model import Li原创 2020-06-18 10:43:10 · 4362 阅读 · 0 评论 -
《Python机器学习基础教程》第一章笔记(最简单的监督学习):鸢尾花品种预测
《Python机器学习基础教程》第一章笔记(最简单的监督学习):鸢尾花品种预测三行程序三行程序from sklearn.datasets import load_irisimport pandas as pdimport numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassifier iris_dataset = load_iri原创 2020-06-16 17:33:45 · 1644 阅读 · 0 评论 -
《Python机器学习基础教程》1.7.3笔记
《Python机器学习基础教程》1.7.3笔记第一个报错:AttributeError: module 'pandas' has no attribute 'scatter_matrix'第二个报错:MatplotlibDeprecationWarning: The colNum attribute was deprecated in Matplotlib 3.2 and will be removed two minor relea第三个问题:没有图形显示成果展示:第一个报错:AttributeE原创 2020-06-16 16:46:01 · 1755 阅读 · 2 评论