![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习和python实现
文章平均质量分 54
五十岁的少女
十分个性的签名
展开
-
几种数据降维
PCA在使数据降维后得到的新数据的方差最大化,最大程度的保持原始数据的特征以m∗nm*nm∗n的数据降维到m∗km*km∗k(n>k)为例先求n中特征下,每种特征对应的均值: xˉ=∑i=1nxin\bar{x}=\frac{\sum_{i=1}^nx_i}{n}xˉ=n∑i=1nxi得到n个特征的平均值然后计算协方差协方差:cov(X,Y)=∑i=1n(Xi−xˉ)(Yi−Yˉ)n−1cov(X,Y)=\frac{\sum_{i=1}^n .原创 2021-08-01 11:26:07 · 317 阅读 · 0 评论 -
特征选择与稀疏学习
特征选择为什么特征选择**1.**可以降低数据的维度,避免维度灾难**2.**除去不相关的特征,降低学习的难度子集搜索与评价基本思路是产生一个“候选子集”,评价它的好坏,基于评价结果产生下一个候选子集,再对其进行评价,直到无法选出更好的子集子集搜索给定的特征集合{a1,a2,...,ad}\lbrace a_1,a_2,...,a_d\rbrace {a1,a2,...,ad},现将每个特征看作一个特征子集,对d个候选单子集进行评价,假定{a2}\lbrace a_2\rbrace{a2.原创 2021-08-01 11:03:31 · 171 阅读 · 0 评论 -
朴素贝叶斯文本分类 python实现
文章的加载路径也是电脑本地的路径,所以应用时注意路径和读取数据的名称的关系应用的是亚马逊美食评论的数据集,因为数据集本身没有好坏划分,所以我自定义了划分标准import numpy as npimport pandas as pdimport nltk加载数据data=pd.read_csv('./相关资料/Reviews.csv')数据预处理class get_good_bad_data(object): ''' 分数为5为good 分数为1为bad '原创 2021-08-01 09:58:32 · 200 阅读 · 1 评论 -
神经网络 python实现
本文是将mnist的分类测试,神经网络的python实现文章的加载路径也是电脑本地的路径,所以应用时注意路径和读取数据的名称的关系读取mnist数据集,输出结果是一矩阵,每一列为一张图片拉成的向量import structimport osimport numpy as npfrom matplotlib import pyplot as pltclass MNIST(object): ''' MNIST数据集类 ''' def __init__(self,ro原创 2021-08-01 09:58:47 · 171 阅读 · 0 评论 -
k-means python实现
本文的数据集:number,density,sugercontent1,0.697,0.4602,0.774,0.3763, 0.634,0.2644,0.608,0.3185,0.556,0.2156,0.403,0.2377,0.481,0.1497,0.666,0.0918,0.437,0.2119,0.666,0.091文章的加载路径也是电脑本地的路径,所以应用时注意路径和读取数据的名称的关系import numpy as npimport pandas as pdfr原创 2021-08-01 09:58:56 · 72 阅读 · 0 评论