自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 迪杰斯特拉和弗洛伊德

迪杰斯塔拉算法和弗洛伊德算法功能室求解出有向图或无向图中最短路劲的方法。迪杰斯特拉大致思想就是依次选择与源点最近的相邻点,然后将相邻点也加入考虑范围(可以经过相邻点),继续计算其他相邻点到远点距离。重复此过程,最终计算出源点到其他点的距离。例如上图,考虑从V0出发,(-)代表目前无法计算v0(0) v1(5),v2(2),v3(4),v4(-),v5(-),v6(-) v0(0),v2(2) v1(5),v3(3)v4(-)v5(3),v6(-) v0(0),v2(2),

2022-03-17 09:18:26 216

原创 K-means和KNN

Kmeans是一种无监督聚类算法。简单理解就是对于样本集选取k个中心点,迭代出每个点距离k个重点的距离,然后分配到离其最近的簇中。需要确定合适的k值,k值太大会导致模型过拟合,k值太小会导致模型欠拟合

2022-03-14 11:51:49 1376

原创 数据挖掘和机器学习

数据挖掘一般是指从海量数据中提取出其中无法直接获取的信息。通过各种数据源,将信息整合,发掘其内在关系。数据挖掘一般来说有6类,分别是回归、分类、预测、关联分析、预测分析和异常检测。回归:确定两种及以上变量之间相互依赖关系的一种方法。简单来说就是找到自变量和因变量之间的哈数关系。根据变量的不同,可分为一元回归和多元回归;根据自变量和因变量之间的关系类型,可分为线性回归和非线性回归。分类:根据事物表现的特征,对事物进行分类,常见有决策树、神经网络、贝叶斯。预测:以现有的数据为基础,推出其内在规律,对

2022-03-13 14:45:00 5661

原创 Apriori的理解

Apriori算法——用于求得物品之间的关联关系,也可用作推荐算法。首先需要知道3个名词解释支持度:support=P(AB),即AB同时发生的概率置信度:confidence=P(B|A),即A发生的条件下B发生的概率频繁项集:满足最小支持度和最小之心度的数据集合最小支持度和最小置信度是认为设置的。下面拿出实际例子:薯片、可乐、鸡爪 鸡爪、可乐 薯片、可乐、鸡爪 泡面 薯片、泡面、鸡爪 薯...

2022-03-12 14:54:25 1211

原创 线性回归讲解

实现线性回归需要用到matplotlib、numpy、pandas和sklearn,matplotlib用于二维作图,numpy、pandas用于对数据的处理,sklearn为机器学习算法模块。导入模块自定义x轴和y轴值定义一个函数,对模型进行训练并计算预测值def linear_model_main(X_parameters,Y_parameters,predict_value): ...

2022-03-12 09:14:48 2449

原创 爬虫的一般步骤

爬虫

2022-03-11 19:21:20 2906

原创 浅谈numpy、scipy、pandas、matplotlib

numpy、scipy、pandas都是python语言中的库,主要用于数据分析。简要地说numpy主要用于处理矩阵,包括array、reshape、sort等功能,pandas是基于numpy的分析工具,包括Series、DataFrame功能,scipy是基于numpy的科学计算包。matplotlib用于数据的画图。首先我们导入所有包首先使用array创建二维数组选取输出数组[0][0]值,选取方法跟c语言一样选取输出[0]行值 使用pd.Series方法创建一维数..

2022-03-11 13:58:30 2293

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除