weixin_46409996-CSDN博客

原创阿里云天池-AI训练营机器学习TASK04 - 机器学习赛事：快来一起挖掘幸福感

赛事背景在社会科学领域，幸福感的研究占有重要的位置。这个涉及了哲学、心理学、社会学、经济学等多方学科的话题复杂而有趣；同时与大家生活息息相关，每个人对幸福感都有自己的衡量标准。如果能发现影响幸福感的共性，生活中是不是将多一些乐趣；如果能找到影响幸福感的政策因素，便能优化资源配置来提升国民的幸福感。目前社会科学研究注重变量的可解释性和未来政策的落地，主要采用了线性回归和逻辑回归的方法，在收入、健康、职业、社交关系、休闲方式等经济人口因素；以及政府公共服务、宏观经济环境、税负等宏观因素上有了一系列的推测和发现

2020-12-24 16:08:50 324

原创阿里云天池-AI训练营机器学习TASK3 - KNN

马绞痛数据–kNN数据预处理+kNN分类pipeline# 下载需要用到的数据集!wget https://tianchi-media.oss-cn-beijing.aliyuncs.com/DSW/3K/horse-colic.csv# 下载数据集介绍!wget https://tianchi-media.oss-cn-beijing.aliyuncs.com/DSW/3K/horse-colic.namesimport numpy as npimport pandas as pd# k

2020-12-23 15:01:14 160

原创阿里云天池-AI训练营机器学习TASK3 - KNN

二维数据鸢尾花数据集#Demo来自sklearn官网import numpy as npimport matplotlib.pyplot as pltfrom sklearn.neighbors import KNeighborsRegressornp.random.seed(0)# 随机生成40个(0, 1)之前的数，乘以5，再进行升序X = np.sort(5 * np.random.rand(40, 1), axis=0)# 创建[0, 5]之间的500个数的等差数列, 作为测试数据

2020-12-22 14:50:13 129

原创 Task 03: K近邻(k-nearest neighbors)初探--阿里云天池

了解K临近的理论K近邻法（knn）算法理论优缺点算法理论K最近邻(k-Nearest Neighbor，KNN)分类算法，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。该方法的思路是：在特征空间中，如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别，则该样本也属于这个类别。k近邻模型的三个基本要素：1.k值的选择：k值的选择会对结果产生重大影响。较小的k值可以减少近似误差，但是会增加估计误差；较大的k值可以减小估计误差，但是会增加近似误差。一般而言，通常采用交叉

2020-12-21 15:13:56 106

原创 Task 02: 朴素贝叶斯--阿里云天池

模拟离散数据集–贝叶斯分类算法实现的步骤如下Step1: 库函数导入Step2: 数据导入&分析Step3: 模型训练&可视化原理简析Step1: 库函数导入从sklearn库中导入训练用的贝叶斯分类器，和用于划分数据集的函数import randomimport numpy as np# 使用基于类目特征的朴素贝叶斯from sklearn.naive_bayes import CategoricalNBfrom sklearn.model_selection import

2020-12-20 15:36:15 143

原创 Task 02: 朴素贝叶斯--阿里云天池

模拟离散数据集–贝叶斯分类算法实现的步骤如下Step1: 库函数导入Step2: 数据导入&分析Step3: 模型训练&可视化Step1: 库函数导入从sklearn库中导入贝叶斯模型和数据划分函数（将所训练的数据划分为训练集和测试集）import randomimport numpy as np# 使用基于类目特征的朴素贝叶斯from sklearn.naive_bayes import CategoricalNBfrom sklearn.model_selection i

2020-12-19 15:57:32 80 1

原创 Task 02: 朴素贝叶斯--阿里云天池

朴素贝叶斯(Naive Bayes)朴素贝叶斯定义介绍优点：朴素贝叶斯是基于贝叶斯公式得到的，它有着牢固的数学基础，所以也拥有可靠的分类性能，例如邮件的分类，从中筛选掉垃圾邮件这样的应用中有着朴素贝叶斯分类的影子。缺点：此模型所需的参数很少，对数据集参数缺失不敏感。贝叶斯公式????(????|????)=????(????,????)/????(????)=????(????|????)⋅????(????)/（∑????∈ℱ????????(????|????)⋅????(????)）其中：

2020-12-18 14:52:37 84 1

原创 Task01:逻辑回归的理论--阿里云天池

基于鸢尾花（iris）数据集的逻辑回归分类实践Step1:库函数导入基础函数库import numpy as np import pandas as pd绘图函数库import matplotlib.pyplot as pltimport seaborn as sns其中：numpy （Python进行科学计算的基础软件包），pandas（pandas是一种快速，强大，灵活且易于使用的开源数据分析和处理工具），matplotlib和seaborn绘图。seaborn就是在matplotl

2020-12-17 16:09:22 740 1

原创 Task01:逻辑回归的理论--阿里云天池

逻辑回归算法：算法实践库函数的导入import numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.linear_model import LogisticRegression训练模型## 构造数据集x_fearures = np.array([[-1, -2], [-2, -1], [-3, -2], [1, 3], [2, 1], [3, 2]])y_label = np.arra

2020-12-16 14:43:39 52

原创 Task01:逻辑回归的理论--阿里云天池

Task01:逻辑回归的理论--阿里云天池逻辑模型代价函数和梯度逻辑模型在逻辑回归中，响应应变描述结果为正的概率。如果响应变量等于或超过阈值，则预测为正类，否则预测为负类。响应变量被建模为使用逻辑函数的特征线性组合函数。逻辑函数总是返回0到1之间的值。如上图所示，我们可以将0.5设置为阈值，并在输出值大于等于0.5时定义为1。而不是零。对于一与二，这是一个很好的分类模型，但一与三，一与多重CNN可能是一个更好的选择。代价函数和梯度由上述定义可知。我们可以通过最小化成本函数来知道模型的参数。为

2020-12-15 19:39:31 67

weixin_46409996的博客

原创阿里云天池-AI训练营机器学习TASK04 - 机器学习赛事：快来一起挖掘幸福感

原创阿里云天池-AI训练营机器学习TASK3 - KNN

原创阿里云天池-AI训练营机器学习TASK3 - KNN

原创 Task 03: K近邻(k-nearest neighbors)初探--阿里云天池

原创 Task 02: 朴素贝叶斯--阿里云天池

原创 Task 02: 朴素贝叶斯--阿里云天池

原创 Task 02: 朴素贝叶斯--阿里云天池

原创 Task01:逻辑回归的理论--阿里云天池

原创 Task01:逻辑回归的理论--阿里云天池

原创 Task01:逻辑回归的理论--阿里云天池

空空如也

空空如也