ML
文章平均质量分 63
Machine learning record
Moelimoe
Every single day that makes no difference is a betrayal to my life.
展开
-
李宏毅老师ML_HW1——PM2.5预测
0、处理数据之前的pre-process观察下载的数据文件train.csvtrain.csv只有每个月前20天的数据,另外每个月剩下10天数据用于作业结果评估,对学生不可见观察数据发现rainfall栏有很多NR表示没有降雨,但是我们只需要数字,因此可以使用excel的替换将NR替换为0,之后再进行处理作业要求:前9小时作为训练集,第10小时的PM2.5作为实际结果,实际一共有18个特...原创 2020-03-09 13:25:46 · 1064 阅读 · 4 评论 -
聚类(Clustering):hierarchical clustering 层次聚类及其应用
聚类(Clustering):hierarchical clustering 层次聚类及其应用clustering实现:from numpy import *import math#基于matrix计算的pakage#定义树形结构图的结点,当再往上两则分为一类时则将其连接起来#用面向对象(class)的方法实现此次的代码:class cluster_node: def __...原创 2019-08-04 20:35:44 · 768 阅读 · 0 评论 -
简单线性回归(Simple Linear Regression)和多元线性回归(Multiple Regression)学习笔记
简单线性回归(Simple Linear Regression)上0.前提介绍:为什么需要统计量?统计量:描述数据特征0.1集中趋势衡量0.1.1均值(平均数,平均值) (mean):(求和除以个数,Ex也可以表示x求均值)0.1.2中位数(median) : 将数据中的各个数值按照大小顺序排列,居于中间位置的变量0.1.2.1.给数据排序: 1,2,2,6,90.1.2.2.找...原创 2019-08-01 00:52:47 · 8302 阅读 · 0 评论 -
回归中的相关度和R平方值 学习笔记
回归中的相关度和R平方值自变量x和因变量y的相关度1.皮尔逊相关系数(Pearson Correlation Coefficient):1.1衡量两个值线性相关强度的量1.2取值范围[-1,1]:正向相关: >0,负向相关: <0,无相关性: =0公式:correlation, correlationvariance(Cov):协方差(两个量相关方差) Var:方差变...原创 2019-08-01 00:07:44 · 6865 阅读 · 0 评论 -
非线性回归(Non-linear Regression)学习笔记
非线性回归(Non-linear Regression)1.概率:1.1定义概率§robability:对一件事情发生的可能性的衡量1.2范围 0<=P<=11.3计算方法:1.3.1根据个人置信1.3.2根据历史数据1.3.3根据模拟数据1.4条件概率:(A发生的条件下B发生的概率)逻辑回归(Logistic Regression)x∈(-∞,+∞),y∈(0...原创 2019-07-31 23:55:33 · 9574 阅读 · 0 评论 -
tensorflow训练神经网络时loss出现nan的问题
tensorflow训练神经网络时loss出现nan的问题一般情况下原因是由于优化器上的学习比率learning_rate定义值太大,如:train_step = tf.compat.v1.train.GradientDescentOptimizer(0.1).minimize(loss) 运行打印loss:for i in range(100): sess.run(train_...原创 2019-07-26 00:21:24 · 1843 阅读 · 0 评论 -
python或anaconda下安装opencv提示Error:No matching distribution found for opencv
python或anaconda下安装opencv提示Error:No matching distribution found for opencv原文:https://blog.csdn.net/qq_27668313/article/details/90482872错误提示:ERROR: Could not find a version that satisfies the require...原创 2019-07-24 00:18:48 · 22386 阅读 · 1 评论 -
numpy中两个array数值比较,在IDE中显示完全相同,但是bool判断两个array是否相等却返回False
numpy中两个array数值比较,在IDE显示相同,但是bool值却是False在numpy数据比较时,在IDE显示相同但是比较是否相等却有时候反回False原因是使用了np.set_printoptions(precision=3) # 可以设置显示精度np.set_printoptions(suppress=True) # 抑制小数的科学计数法显示抑制小数点显示,但是实际上小数...原创 2020-03-01 12:08:49 · 1303 阅读 · 0 评论 -
ML Backpropagation算法的计算过程举例
Backpropagation计算过程举例初始权重(initialize weights)是随机产生的(如-1~1之间)初始化可以选择均值为0,方差为1/n_in的正态分布,n_in为输入的实例个数,Python中可使用np.random.normal函数来初始化权重:np.random.normal(0, 1/3, size=(2, 3))初始化了均值为0,方差为1/3的2行3列矩阵,对应输入层3个结点、隐藏层2个结点的情况正向计算结点值X为实例向量,w为权重,θ为偏向(bias),对于inpu原创 2019-09-15 00:53:40 · 503 阅读 · 0 评论 -
OSError: [Errno 22] Invalid argument:**
OSError: [Errno 22] Invalid argument:在使用open打开文件时,出现报错OSError: [Errno 22] Invalid argument:'H:\\GitRepository\neural-networks-and-deep-learning\\data\\mnist_expanded.pkl.gz'python3可以将 \ 换为 / ,或...原创 2019-09-04 20:51:30 · 2905 阅读 · 0 评论 -
python3 numpy中矩阵np.dot(a,b)乘法运算
numpy中数组相乘np.dot(a,b)运算条件首先np.dot(a,b)和a.dot(b)运算结果是一样的,并且dot是不满足交换律的,所以np.dot(a,b)与np.dot(b,a)是不一样的对于两数组a和b(适用于每一个最小[]的维度都相等的数组):np.dot(a,b) 的运算条件:需满足b中最小[]的个数等于a中最小[]中元素的个数;同理对于np.dot(b,a) 的运算条件...原创 2019-08-21 22:42:48 · 7879 阅读 · 0 评论 -
TypeError: object of type 'zip' has no len()、'zip' object is not subscriptable
TypeError: object of type ‘zip’ has no len()、‘zip’ object is not subscriptablezip 对象没有length属性不可以遍历代码报错:print(len(training_data)) # TypeError: object of type 'zip' has no len()print(training_data[...原创 2019-08-20 20:36:18 · 2350 阅读 · 1 评论 -
ValueError: Found array with dim 4. Estimator expected和ValueError: Expected 2D array, got 1D array i
python3中对numpy数组进行降维或升维解决报错如:1.ValueError: Found array with dim 4. Estimator expected <= 2.2.ValueError: Expected 2D array, got 1D array instead:报错1ValueError: Found array with dim 4. Estimator...原创 2019-08-06 23:39:33 · 10938 阅读 · 0 评论 -
非线性回归(Non-linear Regression)
非线性回归应用(Logistic Regression Application)import numpy as npimport random# 一个函数为梯度下降的算法def GradientDescent(x,y,theta,alpha,m,numInterations):# m denotes the number of examples here, not the number ...原创 2019-08-04 20:47:09 · 2053 阅读 · 0 评论 -
聚类(Clustering): K-means算法
聚类(Clustering): K-means算法1.归类:聚类(clustering)属于非监督学习(unsupervised learning)无类别标记( class label)3. K-means 算法:3.1 Clustering 中的经典算法,数据挖掘十大经典算法之一3.2 算法接受参数 k ;然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚...原创 2019-08-04 20:42:47 · 768 阅读 · 0 评论