![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
我在北国不背锅
致力于AI大模型、Java、大数据、运维及各类计算机技术为一体的知识架构
展开
-
机器学习-学习记录:KMeans聚类算法实现图像分割
原图片:代码:import numpy as npimport matplotlib.pyplot as pltfrom skimage import io as iofrom sklearn.cluster import KMeansimport pandas as pdimg = io.imread('D:\\1.jpg')plt.imshow(img)plt.show()# 查看数据结果和维度print(type(img))print(img.shape)# 维度存储原创 2021-08-23 16:45:51 · 854 阅读 · 0 评论 -
机器学习-学习记录:朴素贝叶斯预测学生录取及奖学金情况
数据示例:y:0代表不录取,y:1代表录取,y:2代表录取且有奖学金代码示例:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.naive_bayes import CategoricalNBfrom sklearn.metrics import accuracy_score# 读取数据data = pd.read_csv("D:\\task2_data.csv")#pri原创 2021-08-18 15:23:38 · 1099 阅读 · 0 评论 -
机器学习-学习记录:决策树判断员工是否适合相关工作
数据示例:代码示例:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn import treefrom sklearn.metrics import accuracy_score# 读取数据data = pd.read_csv("D:\\task1_data.csv")#print(data.head())# x和y赋值x = data.drop(["y"],axis=1原创 2021-08-18 14:15:38 · 892 阅读 · 0 评论 -
机器学习-学习记录:逻辑回归商业异常消费数据预测
源数据示例:1、使用一次分类边界函数预测,准确率较差:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.linear_model import LogisticRegressionfrom sklearn.metrics import accuracy_score# 使用一次分类边界函数def task1(): # 读取数据 data = pd.read_cs原创 2021-08-17 15:35:27 · 632 阅读 · 0 评论 -
机器学习-学习记录:线性回归多因子房价预测
数据如下:代码如下:def house_price_predict_task2(): # 读取数据 csv_data = pd.read_csv( "D:\\task2_data.csv") # 获取各因子数据 x1 = csv_data.loc[:,"面积"] x2 = csv_data.loc[:,"人均收入"] x3 = csv_data.loc[:,"平均房龄"] y = csv_data.loc[:,"价格"]原创 2021-08-14 20:27:42 · 1048 阅读 · 0 评论 -
SparkMlLib算法示例学习记录
支持向量机:package com.spark.milibimport org.apache.spark.mllib.classification.{SVMModel, SVMWithSGD}import org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.mllib.util.MLUtilsimport org.apache.spark.mllib.evaluation.BinaryClassificationMe原创 2020-07-14 17:31:00 · 3059 阅读 · 2 评论 -
Spark读取MySQL(Oracle)数据保存为libsvm格式
libsvm数据格式:libsvm使用的训练数据和检验数据文件格式如下: [label] [index1]:[value1] [index2]:[value2] … [label] [index1]:[value1] [index2]:[value2] …label 目标值,就是说class(属于哪一类),就是你要分类的种类,通常是一些整数。index 是有顺序的索引,通常是连续的整数。就是指特征编号,必须按照升序排列value 就是特征值,用来train的数据,通常是一堆实数组成。即原创 2020-07-14 17:11:49 · 3371 阅读 · 1 评论