自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 阿里云天池-AI训练营机器学习TASK04 - 机器学习赛事:快来一起挖掘幸福感

赛事背景在社会科学领域,幸福感的研究占有重要的位置。这个涉及了哲学、心理学、社会学、经济学等多方学科的话题复杂而有趣;同时与大家生活息息相关,每个人对幸福感都有自己的衡量标准。如果能发现影响幸福感的共性,生活中是不是将多一些乐趣;如果能找到影响幸福感的政策因素,便能优化资源配置来提升国民的幸福感。目前社会科学研究注重变量的可解释性和未来政策的落地,主要采用了线性回归和逻辑回归的方法,在收入、健康、职业、社交关系、休闲方式等经济人口因素;以及政府公共服务、宏观经济环境、税负等宏观因素上有了一系列的推测和发现

2020-12-24 16:08:50 322

原创 阿里云天池-AI训练营机器学习TASK3 - KNN

马绞痛数据–kNN数据预处理+kNN分类pipeline# 下载需要用到的数据集!wget https://tianchi-media.oss-cn-beijing.aliyuncs.com/DSW/3K/horse-colic.csv# 下载数据集介绍!wget https://tianchi-media.oss-cn-beijing.aliyuncs.com/DSW/3K/horse-colic.namesimport numpy as npimport pandas as pd# k

2020-12-23 15:01:14 160

原创 阿里云天池-AI训练营机器学习TASK3 - KNN

二维数据鸢尾花数据集#Demo来自sklearn官网import numpy as npimport matplotlib.pyplot as pltfrom sklearn.neighbors import KNeighborsRegressornp.random.seed(0)# 随机生成40个(0, 1)之前的数,乘以5,再进行升序X = np.sort(5 * np.random.rand(40, 1), axis=0)# 创建[0, 5]之间的500个数的等差数列, 作为测试数据

2020-12-22 14:50:13 129

原创 Task 03: K近邻(k-nearest neighbors)初探--阿里云天池

了解K临近的理论K近邻法(knn)算法理论优缺点算法理论K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:在特征空间中,如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属于这个类别。k近邻模型的三个基本要素:1.k值的选择:k值的选择会对结果产生重大影响。较小的k值可以减少近似误差,但是会增加估计误差;较大的k值可以减小估计误差,但是会增加近似误差。一般而言,通常采用交叉

2020-12-21 15:13:56 102

原创 Task 02: 朴素贝叶斯--阿里云天池

模拟离散数据集–贝叶斯分类算法实现的步骤如下Step1: 库函数导入Step2: 数据导入&分析Step3: 模型训练&可视化原理简析Step1: 库函数导入从sklearn库中导入训练用的贝叶斯分类器,和用于划分数据集的函数import randomimport numpy as np# 使用基于类目特征的朴素贝叶斯from sklearn.naive_bayes import CategoricalNBfrom sklearn.model_selection import

2020-12-20 15:36:15 141

原创 Task 02: 朴素贝叶斯--阿里云天池

模拟离散数据集–贝叶斯分类算法实现的步骤如下Step1: 库函数导入Step2: 数据导入&分析Step3: 模型训练&可视化Step1: 库函数导入从sklearn库中导入贝叶斯模型和数据划分函数(将所训练的数据划分为训练集和测试集)import randomimport numpy as np# 使用基于类目特征的朴素贝叶斯from sklearn.naive_bayes import CategoricalNBfrom sklearn.model_selection i

2020-12-19 15:57:32 80 1

原创 Task 02: 朴素贝叶斯--阿里云天池

朴素贝叶斯(Naive Bayes)朴素贝叶斯定义介绍优点:朴素贝叶斯是基于贝叶斯公式得到的,它有着牢固的数学基础,所以也拥有可靠的分类性能,例如邮件的分类,从中筛选掉垃圾邮件这样的应用中有着朴素贝叶斯分类的影子。缺点:此模型所需的参数很少,对数据集参数缺失不敏感。贝叶斯公式????(????|????)=????(????,????)/????(????)=????(????|????)⋅????(????)/(∑????∈ℱ????????(????|????)⋅????(????))其中:

2020-12-18 14:52:37 82 1

原创 Task01:逻辑回归的理论--阿里云天池

基于鸢尾花(iris)数据集的逻辑回归分类实践Step1:库函数导入基础函数库import numpy as np import pandas as pd绘图函数库import matplotlib.pyplot as pltimport seaborn as sns其中:numpy (Python进行科学计算的基础软件包),pandas(pandas是一种快速,强大,灵活且易于使用的开源数据分析和处理工具),matplotlib和seaborn绘图。seaborn就是在matplotl

2020-12-17 16:09:22 738 1

原创 Task01:逻辑回归的理论--阿里云天池

逻辑回归算法:算法实践库函数的导入import numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.linear_model import LogisticRegression训练模型## 构造数据集x_fearures = np.array([[-1, -2], [-2, -1], [-3, -2], [1, 3], [2, 1], [3, 2]])y_label = np.arra

2020-12-16 14:43:39 52

原创 Task01:逻辑回归的理论--阿里云天池

Task01:逻辑回归的理论--阿里云天池逻辑模型代价函数和梯度逻辑模型在逻辑回归中,响应应变描述结果为正的概率。如果响应变量等于或超过阈值,则预测为正类,否则预测为负类。响应变量被建模为使用逻辑函数的特征线性组合函数。逻辑函数总是返回0到1之间的值。如上图所示,我们可以将0.5设置为阈值,并在输出值大于等于0.5时定义为1。而不是零。对于一与二,这是一个很好的分类模型,但一与三,一与多重CNN可能是一个更好的选择。代价函数和梯度由上述定义可知。我们可以通过最小化成本函数来知道模型的参数。为

2020-12-15 19:39:31 67

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除