python
文章平均质量分 92
江南小帅瓜hyf
这个作者很懒,什么都没留下…
展开
-
python制作数据诊断工具
python制作数据诊断工具实现慕课网python制作数据诊断工具的课程,并且给代码添加相应的注释。拥有一个数据诊断工具,对数据预处理工作会有很大的帮助。附上代码链接读取数据,课程提供的数据如图:这是csv格式的文件,打开数据集后,可以观察到第一列ID和最后一列标签列不是需要进行数据诊断的列,所以在处理时先将它们删掉。一、单项指标处理#导入数据df = pd.read_csv(r'F...原创 2019-05-12 10:03:05 · 1711 阅读 · 0 评论 -
K-means代码实现(sklearn)
K-means代码实现(sklearn)载入数据设置k值k = 4训练模型# 训练模型model = KMeans(n_clusters=k)model.fit(data)分类中心点坐标centers = model.cluster_centers_print(centers)预测结果result = model.predict(data)print(result)...原创 2019-07-04 10:43:57 · 3047 阅读 · 0 评论 -
K-means算法代码实现(python)
K-means算法代码实现以及解决质心选择问题计算距离距离通常使用欧几里得距离来衡量def euclDistance(vector1, vector2): return np.sqrt(sum((vector2 - vector1) ** 2))初始化质心def initCentroids(data, k): numSamples, dim = data.shape ...原创 2019-07-04 10:20:20 · 18669 阅读 · 8 评论 -
波士顿房价问题——多元线性回归+TensorFlow
波士顿房价问题——多元线性回归、Tensorflow决定房价的因素有很多,所以采用多元线性回归模型官方提供的波士顿房价项目数据集其中,载入数据df = pd.read_csv('boston.csv', header=0)观察数据摘要描述信息将df转换为np的数组格式,并做归一化归一化:(特征值-特征最小值)/(特征最大值-特征最小值)如果缺少归一化步骤,不同特征值的取...原创 2019-06-03 22:38:22 · 8632 阅读 · 3 评论 -
sklearn实现多项式回归
sklearn实现多项式回归类似这样的数据,显然利用多项式的曲线拟合会比直线效果要好很多载入数据data = np.genfromtxt("\job.csv", delimiter=",")x_data = data[1:, 1]y_data = data[1:, 2]x_data = data[1:, 1, np.newaxis]y_data = data[1:, 2, np...原创 2019-06-03 17:13:04 · 1684 阅读 · 0 评论 -
多元线性回归——梯度下降法、sklearn实现
梯度下降法实现多元线性回归(代码实现)载入数据data = genfromtxt(r"\Delivery.csv", delimiter=',')观察一下数据x_data为特征值,y_data为标签值所以应该设置3个参数θ0,θ1,θ2lr = 0.0001# 参数theta0 = 0theta1 = 0theta2 = 0# 最大迭代次数epochs = 1000...原创 2019-06-03 16:42:49 · 2494 阅读 · 0 评论 -
sklearn实现一元线性回归
sklearn实现一元线性回归导入sklearn以及相关库from sklearn.linear_model import LinearRegressionimport numpy as npimport matplotlib.pyplot as plt载入数据data = np.genfromtxt("data.csv", delimiter=",")x_data = data...原创 2019-06-03 16:24:55 · 2777 阅读 · 0 评论 -
一元线性回归——梯度下降法
梯度下降法实现一元线性回归(代码实现)这篇博客只是针对用代码实现的部分导入需要用到的包import numpy as npimport matplotlib.pyplot as plt载入数据data = np.genfromtxt("data.csv", delimiter=",")x_data = data[:, 0]#所有行第0列y_data = data[:, 1]#所有...原创 2019-06-03 16:09:55 · 1865 阅读 · 0 评论 -
非线性逻辑回归的代码实现(sklearn)
非线性逻辑回归的代码实现(sklearn)随机生成两类或多类数据from sklearn.datasets import make_gaussian_quantiles# make_gaussian-quantiles:将一个单高斯分布的点集划分为两个数量均等的点集,作为两类# 生成2维正态分布,生成的数据按分位数分为两类,500个样本,2个样本特征# 可以生成两类或多类数据x_dat...原创 2019-06-05 21:41:00 · 2254 阅读 · 1 评论 -
非线性逻辑回归的代码实现(梯度下降法)
非线性逻辑回归的代码实现(梯度下降法)当我们需要分类这样的数据集的时候,线性的逻辑回归就派不上用场了前期的代码模块都与线性逻辑回归的步骤一致。线性逻辑回归的代码实现:https://mp.csdn.net/mdeditor/90899227#载入数据data = np.genfromtxt(r'data.txt',delimiter=',')x_data = data[:, :-1...原创 2019-06-05 21:17:09 · 1493 阅读 · 1 评论 -
线性逻辑回归的代码实现
线性逻辑回归的代码实现载入数据data = np.genfromtxt(r'data.csv', delimiter=',')x_data = data[:, :-1] # 特征y_data = data[:, -1] # 标签可以看到,这个数据集有3列,前两列为特征,最后一列‘1’和‘0’为标签作图观察数据集def plot(): x0 = [] x1 = ...原创 2019-06-05 11:15:31 · 567 阅读 · 1 评论 -
TensorFlow中的数据增强
TensorFlow中的数据增强总结TensorFlow中常用的一些数据增强方法,包括图片的缩放、裁剪、翻转等等首先导入需要用到的包import matplotlib.pyplot as pltimport tensorflow as tfimport numpy as np任选选一张图片作为测试,放到项目中,读取图片image_raw_data = tf.gfile.FastGF...原创 2019-05-22 21:53:43 · 1632 阅读 · 0 评论 -
基于python和TensorFlow的电影推荐系统
电影推荐系统——慕课课程(一)第二步:数据准备读取ratings.csv和movies.csv文件,观察一下两个数据集的内容。会用到的函数:tail():查看后几行的数据,默认5行head():查看前几行的数据,默认5行ratings数据集:...原创 2019-05-09 10:07:26 · 11073 阅读 · 30 评论 -
聚类算法的改进——DBSCAN
聚类算法的改进——DBSCANK-means算法有几个明显的缺点,例如需要用户指定聚类数目,而且聚类的形状比较有局限性。这里考虑采用DBSCAN(Density - Based Spatial Clustering of Applications with Noise)该算法将具有足够高密度的区域划分为簇,并可以发现任何形状的聚类DBSCAN和K-Means的比较:1、 DBSCAN和K...原创 2019-07-04 11:16:08 · 5834 阅读 · 1 评论