机器学习
不要绝望总会慢慢变强
当你觉得整个世界都放弃了你,还有那几行代码值得你珍重!
展开
-
k-means聚类及可视化
本文主要是通过sklearn库实现k-means聚类并可视化1.导入库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeansfrom sklearn.cluster import DBSCAN2.读取数据并可视化ori_data = pd.read_csv('D:/DL/机器学习/data.csv',header = None)原创 2020-12-03 18:15:20 · 10696 阅读 · 6 评论 -
SVM实现鸢尾花分类
1.导入库import pandas as pdimport numpy as npfrom sklearn.model_selection import train_test_splitimport sklearn.svm as svmfrom sklearn.metrics import classification_reportlabel2num = {'Iris-setosa': 0, 'Iris-versicolor': 1, 'Iris-virginica': 2}num2la原创 2020-12-03 12:49:31 · 1478 阅读 · 0 评论 -
keras实现线性回归
envwindows+anaconda+jupytertensorflow2.3+keras#导入库import kerasimport tensorflow as tfimport numpy as npimport matplotlib.pyplot as pltfrom keras import layers%matplotlib inline#准备数据x = np.linspace(0,100,30) #在指定的间隔内返回均匀间隔的数字。y = 3*x+7+np.ran原创 2020-10-16 09:28:13 · 2168 阅读 · 0 评论 -
特征选择
降维是指在某些限定条件下,降低随机变量(特征)个数,得到一组‘不相关’的主变量的过程处理对象:二维数组(【n_sample,n_feature】)相关特征:如相对温度与降雨量的相关,会增多许多冗余信息降维的方法主要有特征选择和特征选择1.1 定义:数据中包含冗余或者相关变量(或称特征,属性,指标等),旨在从原有特征中找出主要特征1.2 方法 Filter(过滤式):主要探究特征本身特点,特征与特征和目标值之间关联...原创 2020-09-23 21:10:31 · 279 阅读 · 0 评论 -
数据预处理(归一化和标准化)
什么是特征预处理:通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程1.主要包含:数值型数据的无量纲化+归一化:通过对原始数据进行变换把数据映射到[mi,mx]之间如对于以上数据,映射到[0,1],对于第一列,最大值是90,最小值是60,即X‘=(90-60)/90-60=1,X’‘=1*(1-0)+0=1如果有异常值(通常是最大值或者最小值),归一化将被严重影响。+标准化:对原始数据进行变换到均值为0,标准差为1范围内2.特征预处理API为什..原创 2020-09-21 21:49:23 · 2934 阅读 · 0 评论 -
机器学习特征提取
本文主要介绍基于sklearn的特征提取,旨在为机器学习提供一个好的开端1.分类特征提取如上图所示:许多特征如pclass代表乘客船舱等级,分为1,2,3。还有例如性别,乘客登船码头,称之为分类特征。对于这一类数据的提取,采用one-hot编码。例如:data数据有两个特征,分别是城市和温度,显然第一个特征为分类特征。[[ 1. 0. 0. 50.] [ 0. 0. 1. 40.] [ 0. 1. 0. 36.]]data = [{'city':'beijin原创 2020-09-21 19:58:49 · 1581 阅读 · 0 评论