机器学习
文章平均质量分 56
u010255214
这个作者很懒,什么都没留下…
展开
-
PCA主成分分析
1、PCA算法:PCA过程的实现:(1)numpy可以模拟 (2)sklearn可以实现1.1、使用numpy模拟PCA过程import numpy as npA=np.array([[3,2000], [2,3000], [4,5000], [5,8000], [1,2000]],dtype='float')#使用numpy模拟PCA过程#数据降维#1、数据归一化mean=n...原创 2021-09-28 14:44:02 · 1168 阅读 · 0 评论 -
贝叶斯算法进行文档分类
from time import timefrom sklearn.datasets import load_filesprint("加载训练集 ...")t=time()news_train=load_files(r'C:\Users\EDZ\PycharmProjects\379\train')#读入内存print("统计:文档数:{0} ,分类数:{1} ".format(len(news_train.data),len(news_train.target_names)))print(.原创 2021-09-28 10:25:42 · 312 阅读 · 0 评论 -
SVM向量机——预测乳腺癌
1、画学习曲线import numpy as npimport matplotlib.pyplot as pltfrom sklearn.model_selection import learning_curveplt.rcParams['font.sans-serif'] = ['SimHei']#显示中文def plot_learning_curve(estimator, title, X, y, ylim=None, cv=None, .原创 2021-09-23 16:31:55 · 1782 阅读 · 0 评论 -
决策树——预测泰坦尼克号幸存者
数据集解释:• Passengerld :乘客ID ,这是个顺序编号, 唯一地标识 乘客。这个特征和幸存与否无关,我们不使用这个特征• Survived : 表示幸存者表示遇难。这个是我们的标注数据。• Pclass :仓位等级,是很重要的特征。看过电影读者都知道,高仓位等级的乘客更快地到达甲板,从而更容易获救。• Name :乘客名字,这个特征和幸存与否无关,我们会丢弃这个特征。• Sex :乘客性别, 过电影的读者都知道,由于救生艇数量不够,船民让妇女和儿童先上救生艇。所 以这也是个很重..原创 2021-09-17 15:17:09 · 3596 阅读 · 0 评论 -
逻辑回归算法——乳腺癌检测
这个数据集总共从病灶造影图片中提取 以下 10 个关键属性。• radius 半径 即病灶中心点离边界的平均距离• texture 纹理,灰度值的标准偏差。• perimeter 周长 即病灶的大小• area 积,也是反映病灶大小一个指标。• smoothness 平滑度 ,即半径的变化幅度。• actness :密实度,周长的平方除以面积的商 再减1• concavity 凹度,凹陷部分轮廓的严重程度• concave points 凹点 凹陷轮廓的数量。• symmetry ...原创 2021-09-16 13:30:26 · 2057 阅读 · 0 评论 -
安装prophet
1、创建一个新的环境按照官网的做法,创建一个新的python环境激活这个环境。2、安装C++的编译工具3、安装依赖库4、安装pystan居然安装好了,我的妈呀,这就是心动的感觉。5、安装fbprophet安装成功了。...原创 2021-09-15 10:52:26 · 1060 阅读 · 0 评论 -
关于销量预测方法和采购备货问题
关于销量预测方法和采购备货问题在所有的预测问题中,最不靠谱的就是销量预测. --master苏1. 前言销量预测是一个古老的问题,进入市场经济以来这个问题变得更加迫切,也得到更多人的关注,特别是进入大数据时代后,随着算法模型被不断提出来,收集数据的成本逐步降低,收集到的数据越来越多,这个问题变得比以前有趣,同时也被寄予更加迫切且不合理的期望,也比以前更难,不仅仅是数据变多了、模型复杂了,而是社会变得复杂了,亚文化兴起,细分领域竞争也逐渐变得激烈,而这些都是要被考虑到预测因素中,你说,在一个不能聚转载 2021-09-13 15:49:50 · 3447 阅读 · 0 评论 -
线性回归——预测波士顿房价
用线性回归算法拟合正弦函数(加入多项式)#用线性回归算法拟合正弦函数#首先,生成 200 个在[-2pai,2pai] 区间内的正弦函数上的点 并且给这些点加上一些随机的噪声。import numpy as npn_dots=200X=np.linspace(-2*np.pi,2*np.pi,n_dots)Y=np.sin(X)+0.2*np.random.rand(n_dots)-0.1#X.shape#(200,)#Y.shape#(200,)X=X.reshape(-1,1)#(原创 2021-09-10 10:21:31 · 1072 阅读 · 0 评论 -
时间序列预测的7种方法
import pandas as pd#取数#df=pd.read_csv('jetrail.csv')#print(df.head())''' ID Datetime Count0 0 25-08-2012 00:00 81 1 25-08-2012 01:00 22 2 25-08-2012 02:00 63 3 25-08-2012 03:00 24 4 25-08-2012 04:0.原创 2021-09-08 13:44:20 · 10916 阅读 · 0 评论 -
画学习曲线的方法
import matplotlib.pyplot as pltimport numpy as npimport pandas as pdfrom sklearn.model_selection import ShuffleSplit from sklearn.model_selection import learning_curvefrom sklearn.neighbors import KNeighborsClassifier#加载数据data=pd.read_csv(r"D:\De.原创 2021-09-02 11:55:55 · 1722 阅读 · 0 评论 -
k-近邻算法
from sklearn.datasets import make_blobsfrom sklearn.neighbors import KNeighborsClassifier,RadiusNeighborsClassifierfrom sklearn.neighbors import KNeighborsRegressorfrom sklearn.model_selection import train_test_splitfrom sklearn.model_selection im.原创 2021-09-05 11:23:14 · 243 阅读 · 0 评论 -
机器学习算法模型速查表
转载 2021-08-31 14:13:52 · 191 阅读 · 0 评论 -
机器学习-手写数字识别1
用到的库:from sklearn import datasetsfrom sklearn.model_selection import train_test_splitfrom sklearn import svmfrom sklearn.externals import joblib1、数据的采集与标记from sklearn import datasetsdigits=datasets.load_dig...原创 2021-08-31 14:01:56 · 303 阅读 · 0 评论