![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
微淡
这个作者很懒,什么都没留下…
展开
-
kmeans聚类算法实现
算法原理模型已知一组有n个样本的数据集{xi}i=1n,xi∈Rt\{x_i\}_ {i=1}^n,x_i\in\mathbb R^t{xi}i=1n,xi∈Rt其中,每个样本xix_ixi都有ttt个特征,没有标签yiy_iyi。现在的目的是希望利用样本特征将数据集分为k类。算法步骤首先要明确一些概念:类是指根据特征的不同将数据分成不同的类别。而不同数据样本组成的集合称...原创 2020-04-14 13:44:44 · 575 阅读 · 0 评论 -
ID3决策树python程序实现
算法原理决策树是一类经典的机器学习方法,既可以用于分类任务,也可以用于回归。分类和回归对应的分别是分类树和回归树,本文将以最常见的一类决策树——ID3分类树为例,讲解模型的原理以及程序实现。模型已知一组有n个样本的训练集{xi,yi}i=1n,xi∈∏k=1tDk,yi∈{0,1}\{x_i,y_i\}_ {i=1}^n,x_i\in\prod_{k=1}^tD^k,y_i\in\{0,...原创 2020-04-05 23:08:25 · 298 阅读 · 0 评论 -
k近邻算法程序实现
算法原理模型k近邻算法是一个多分类的机器学习算法。它的实现过程很容易理解,简单来说,就是通过计算待分类样本与所有训练样本的“距离”,然后取出离待分类样本最近的k个训练样本,最后将这k个训练样本中类别最多的一种作为该待分类样本的预测类别。图解如图所示,假设有若干个训练样本,不同颜色代表不同的类别。现在放入一个待分类样本。定义k值(假设为3),定义距离(假设是欧式距离),计算该待分...原创 2020-03-28 23:13:43 · 1053 阅读 · 0 评论 -
正则表达式常用函数
正则表达式:以字符串的形式规定一个规则,在文本中匹配并找出符合的字符串。re库中常用的六个函数分别是match、compile、sub、split、search、findall,这些函数的用法基本都是相同的,只是目的不一样。假设method是re库中的函数re.method(pattern, string)pattern:正则表达式string:文本意义:从string文本里以pattern这个规...原创 2018-06-06 10:52:48 · 5417 阅读 · 0 评论 -
浅谈python中的浅拷贝和深拷贝
在python中,对一个变量赋值实际上是将这个值的引用赋给变量,在这里涉及到两种拷贝方式:浅拷贝和深拷贝。浅拷贝 创建一个新的对象,这个对象中的元素仍然是原对象中的元素,即元素的地址一样。 浅拷贝方法:1、完全切片操作 [:];2、工厂函数list(), dict();3、copy方法 例子:首先看一下浅拷贝之后新对象和原对象的地址import copyarr_1 = ...原创 2018-06-07 16:56:05 · 285 阅读 · 0 评论 -
pandas读写文件
在python中读写文件较常用的方法是使用pandas库中的函数,即方便又快捷。 读写时需注意:以哪种编码读写的DataFrame格式数据中的列标签和行标签有没有读取以to_csv和read_csv函数为例(读写其他文件的函数类似)先新建一个DataFrame格式的数据import pandas as pdimport numpy as npdf = pd.Data...原创 2018-06-08 21:48:41 · 253 阅读 · 0 评论 -
python面向对象的三大特性:封装、继承、多态
python面向对象的三大特性:封装、继承、多态封装是指它能通过创建一个类,并将若干个属性和方法包装在这个类中,程序员只需创建这个类的一个对象便可以调用这些属性和方法。# 定义一个类class Person(): def eat(self): print("吃") def sleep(self): print("睡觉")...原创 2019-05-04 20:21:56 · 369 阅读 · 0 评论 -
线性最小二乘法——python
算法编写class LinearRegression: ''' alpha:拟合参数 fit :训练函数,得到拟合参数 predict:预测并输出结果 ''' def __init__(self): pass def fit(self,x,y): x = np.in...原创 2019-07-26 16:53:54 · 176 阅读 · 0 评论 -
多元线性回归编程实现
多元线性回归:现有一个包含m个样本的数据集,其中每一个样本都有n个指标值和一个标签值,现试图寻找一种线性关系(加法或数乘运算),使得每个样本的n个指标值都能对应各自的标签值。此时这n个指标值和对应的标签值都已给出,我们需要考虑的问题就是怎样得到这种关系。首先我们可以假设线性关系是f(X)=Xω+bf(X)=X\omega+bf(X)=Xω+b其中矩阵XXX的每一行表示一个样本的指标数据...原创 2019-08-06 09:35:35 · 872 阅读 · 0 评论