机器学习,深度学习,AI
文章平均质量分 63
SpecYue
学习自记录
展开
-
tensorflow实现线性回归--My way of ML13
首先回顾一下什么是线性回归ML12#思维导图注意:代码中可以自己构建数据,但是要是tensor的变量形式,要初始化变量代码:import tensorflow as tfimport numpy as npdef linnergression(data): """ 线性回归练习,接收处理两个特征值的样本 :return: None """ ...原创 2018-10-22 20:23:43 · 156 阅读 · 0 评论 -
拉普拉斯平滑-My way of ML7.1
朴素贝叶斯算法有一个问题:某篇文章是娱乐的概率是0这是不合理的,如果词频列表中出现很多次数都是0的话,很可能计算结果都是 0.解决办法:拉普拉斯平滑p(Fi|C)=(Ni+alpha)/(N+alpha*m)alpha是指定的系数一般是1,m是训练文档中统计出来的特征词的个数。API:sklearn.naive_bayes.MultinomiaLNB(alpha=1.0)默认平滑系数1....原创 2018-10-21 19:16:41 · 297 阅读 · 0 评论 -
分类模型评估-My way of ML8
朴素贝叶斯Demo里我们用到了一个衡量标准叫做精确率和召回率。那么这个东西是什么呢,有什么作用呢?我们先回顾一下我们常用的评估模型预测结果的方法:estimator.score(x_test,y_test)https://blog.csdn.net/jjddss/article/details/73130050这里是我在网上看到的很好的解释...原创 2018-10-21 19:24:38 · 114 阅读 · 0 评论 -
模型选择与调优--My way of ML9
一:交叉验证目的:为了让被评估的模型更加准确可信,是一种验证方法步骤:所有数据分成n等分,第一份作为测试集,其他作为验证集。。。。。。。。。。。二。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。所有模型的准确率求平均值二:网格搜索目的:选择参数通常很多需要手动指定的参数都是超参数,所谓超参数就是能对算法效果产生很大影响的参数。但是手动选择参数过程很复...原创 2018-10-22 08:17:26 · 141 阅读 · 0 评论 -
决策树--My way of ML10
test原创 2018-10-22 08:17:49 · 109 阅读 · 0 评论 -
随机森林--My way of ML11
集成学习方法:建立几个模型来解决单一的预测问题,它的原理是生成多个estimator,各自独立的学习和做出预测,这些预测最后结合成单测,因此由于任何一个模型随机森林就是用集成学习的方法建立多个决策树,最后采用VOTE的方式输出最后的结果随机森林建立多个决策树过程单个树建立:1 随机在n个样本中选择一个样本,重复n次,样本可能重复2 随机在M个特征中选择m个特征(M>m)...原创 2018-10-22 08:19:25 · 132 阅读 · 0 评论 -
线性回归--My way of ML 12
上一篇文章到随机森林为止学习完了基础的分类算法,从现在开始就是回归算法的学习了。关于什么是分类算法什么是回归算法的分类看ML0.线性回归寻找一种能预测的趋势定义:通过一个或者多个自变量(特征)与因变量(目标值)之间的进行见面的回归的分析。其中可以为一个或者多个自变量之间的线性组合通用公式:h(w)=w0+w1x1+…=wTx误差大小的度量方式—损失函数最小二乘法误差平方和...原创 2018-10-22 08:20:07 · 136 阅读 · 0 评论 -
卷积神经网络---My way of AI 21
卷积神经网络上一篇文章实现了用全连接层神经网络手写数字识别,但是全连接层神经网络有一个缺点就是:假设我是32323的RGB图片,如果我的第一层全连接层是500个节点,那么我需要的参数就是32323*500+500一共需要150多万个参数,这样会导致计算过慢以及过拟合的问题。于是就有了卷积神经网络的算法。卷积神经网络也有全连接层,但是在全连接层之前它加入了卷积层和池化层达到了减少计算参数的作用...原创 2018-10-29 12:52:24 · 188 阅读 · 0 评论 -
卷积神经网络实现手写数字识别---My way of AI 22
在手写数字识别这篇文章中我们实现了用全连接神经网络实现图像识别。这篇文章我们在卷积神经网络的理论基础之上实现手写数字识别。流程1.定义卷积模型卷积模型是我们自定义的,我们用来两侧卷积激活池化和一层全连接层实现卷积模型。 #卷积操作 con=tf.nn.conv2d(x_reshape,weight,strides=[1,1,1,1],padding="SAME") ...原创 2018-10-29 15:34:10 · 712 阅读 · 0 评论 -
tensorflow入门---My way of AI15
这两天一直在学习tensorfow学到迷糊了,是时候总结一下了。记得刚来实验室的时候墙上写着上一届的一个要求还是啥,说熟练使用tensorflow语言,当时我还有一些困惑:tensorflow不就是一个框架吗,怎么独立成一个语言了。现在我理解了,tensorflow的确有很多语言特征值得深究。首先下载tensorflow框架,可与瞎咋cpu和gpu版本,现阶段学习的话我用的cpu版本,不过的确...原创 2018-10-24 10:09:57 · 145 阅读 · 0 评论 -
验证码识别1---My way of AI 23
写一个练手的验证码识别项目数据集和完整代码我会传到我的下载资源这篇文章是项目第一步,创建tfrecords文件# 代码逻辑1.读取图片文件2.读取csv文件3.处理一下读取好的csv文件到数字张量4.写入tfrecords文件1.读取图片文件1.创建文件队列2.构造阅读器取读取文件内容3.选择相应的文件解码器取decode4.要根据验证码的尺寸取setshape,因为读取过...原创 2018-10-31 20:06:32 · 454 阅读 · 1 评论 -
Faster rcnn 资料
https://blog.csdn.net/u012834824/article/details/78626027 faster rcnn训练自己的训练集原创 2018-12-26 10:49:06 · 89 阅读 · 0 评论 -
python课程设计作业—贷款发放预测
1.应用调研 贷款业务是银行最基本、最主要的资产业务,是银行获得利润的主要来源,也是一项风险性较大的资产。其风险性在于如果被贷款人没有偿还贷款的能力,那么银行就会产生坏账,造成亏损。因此在银行业务中常常需要做很多是否发放贷款的调研。本课程设计旨在利用python课堂上学习到的numpy和pandas知识对网络上收集到的数据进行数据清洗,对清洗好的数据进行逻辑回归来预测是否发放贷款。2.代码分...原创 2018-11-23 09:09:06 · 1638 阅读 · 1 评论 -
朴素贝叶斯算法-My way of ML7
预备知识联合概率:包含多个条件,所有条件同时成立概率P(A,B)=P(A)P(B)条件概率:事件A发生在事件B发生的条件之下的概率。所有的特征值无关的时候才能适用条件概率朴素贝叶斯的前提是:特征条件独立,哈哈,这也是她被叫做朴素的原因,因为特征之间很难独立是自然条件下的情况,所以很朴素。。。朴素贝叶斯算法大多被用在文本分类,关于文本分类的特征抽取看这个理论基础w是给定文档的特征值,c...原创 2018-10-21 19:05:29 · 146 阅读 · 0 评论 -
k-近邻算法-My way of ML6
用你的邻居来判断你的类型如果一个样本在特征空间中的k个最近似的样本中大多数数以一个类别,则该样本也属于这个类别*计算公式:欧式公式k-近邻算法需要做标准化处理还记得标准化归一化吗?什么时候用标准化呢?标准化API:sklearn.nerhbors.KNerghborsClassifier(n_nerghbors=5)下面我们做一个实例facebook签到事件预测,这个数据集在kagg...原创 2018-10-21 18:38:02 · 162 阅读 · 0 评论 -
数据集-My way of ML5
数据集划分一般是0.75划分成训练集,0.25划分成测试集数据集划分API:sklearn.model_selection.train_test_split(test_size=0.25)sklearn流行数据集sklearn.databases.load_* 获取小规模数据集,数据包含在databases里databases.fetch_* 获取大规模数据集获取燕尾花的数据集...原创 2018-10-21 18:16:13 · 148 阅读 · 1 评论 -
梯度爆炸,tensorboard可视化,变量作用域---My way of ML14
梯度爆炸在极端的情况下,不合适的学习率,会导致权重的值变得非常大,以至于溢出导致Nan如何解决重新设计网络(对于神经网络而言)调整学习率使用梯度截断(在训练过程中检查和限制梯度的大小)使用激活函数可视化数据序列化–event文件API:tf.summary.FileWirte(路径,graph=sses.graph)开启:tensorboard --logdir=“路径”...原创 2018-10-22 21:35:27 · 2022 阅读 · 0 评论 -
tensorflow文本读取---My way of AI17
流程tendorflow可以读取文本文件,二进制文件,图片文件和tfrecords文件。除了阅读器不一样,读文件的流程是差不多的。1.构造文件队列2.读取文件内容3.解码4.批处理import tensorflow as tfimport os# 模拟一下同步先处理数据,然后才能取数据训练# tensorflow当中,运行操作有依赖性# # 1、首先定义队列# Q = ...原创 2018-10-28 09:14:47 · 222 阅读 · 0 评论 -
初识神经网络---My way of AI18
感知机说到神经网络之前我们先说一下感知机,它其实是一种伪神经元。有n个数据,通过权重与各种数据之间的计算和比较激活函数结果,得出输出,它的主要目的是解决分类问题。但是如何现在是有一个感知机解决不了的我们就引入了多个感知机,这其实也就是我们常说的svm算法。我们登陆playground.tensorflow.org网站去模拟一下单个以及多个感知机的分类效果。1.一个神经元进行二分类可以...原创 2018-10-28 11:20:09 · 248 阅读 · 0 评论 -
MNIST手写数字识别---My way of AI 19
手写数字的识别相当于是深度学习的helloworld首先这是一个流行数据集可以从网络下载,也可以直接importfrom tensorflow.examples.tutorials.mnist import input_data学这个简单的神经网络之前我们首先要知道这个算法用到的衡量误差的策略和优化方法,我们这里的策略比较固定,在分类问题中常用的损失函数就是交叉熵。优化算法就是反向传播的一...原创 2018-10-28 17:39:55 · 207 阅读 · 0 评论 -
tensorflow读取csv文件---My way of AI 16
流程构造一个文件队列读取文件内容,csv文件默认读取一行,图片默认读取一张,二进制文件默认读取指定byte解码decode批处理主线程去样本训练数据构造队列API#*tf.train.string_input_producer(string_tensor,,shuffle=True)将输出字符串(例如文件名)输入到管道队列string_tensor 含有文件名的1阶张量n...原创 2018-10-25 17:13:21 · 334 阅读 · 0 评论 -
自定义损失函数 ———My way of AI 20
在深度学习当中损失函数是我们计算优化的基础,对于不同的项目需求而言,损失函数往往不会一模一样,尽管tensorflow提供了很多损失函数的接口,但是往往自定义损失函数还是有实际的必要性的。EX我们在预测商品销量的时候,如果预测值比真是值小,我们利润损失10元, 如果预测值比真是值大我们损失1元,这个时候如果我们使用常用的均方误差,往往达不到利润最大化的模型。关键代码loss_less = ...原创 2018-10-28 19:13:16 · 170 阅读 · 0 评论 -
浅谈学习-My way of ML0
人工智能现在大热,机器学习作为深度学习和人工智能的基础,现在学习非常有必要。这个系列的文章记录我的学习路径,希望对后来的学习者有帮助,以及对自己起到自我监督的作用。== 学习机器之前我们首先要了解学习了它能做什么==机器学习算法主要是,分类算法,回归算法,和聚类算法。其中分类算法简单来说就是把数据分类,处理的是离散的数据*比如癌症与否的预测*。回归算法处理的是连续数据,根据我们的数据集得出...原创 2018-10-21 15:44:01 · 157 阅读 · 0 评论 -
特征数据抽取-My way of ML1
浅谈我的机器学习提到了机器学习算法的分类,以及在学习算法之前需要学习的点就是特征工程。这篇文章就是介绍特征工程的第一个知识点:特征数据抽取。笔者所用的机器学习的API都是sklearn里的,关于sklearn自行百度。字典特征抽取字典特征抽取就是把字典中一些类别的特征分别转换成特征。代码如下首先字典特征抽取的API是sklearn.feature_extraction.Dictvector...原创 2018-10-21 16:31:28 · 236 阅读 · 0 评论 -
特征预处理-My way of ML2
通过特定的方法将数据转换成算法要求的数据数值型数据:1.归一化2.标准化3.处理缺失值类别型数据:ont-hot编码所有的对数据处理的API都放在sklearn.preprocessing里归一化API:sklearn.preprocessing.MinMaxScaler(feature_range=指定缩放范围)特点:通过原始数据的变换,把数据映射到莫热门的0~1...原创 2018-10-21 17:03:24 · 149 阅读 · 0 评论 -
特征选择-My way of ML
数据降维也是特征工程里的一环,这里的降维不是说降低数组的维度,而是说减少特征的数量主要分为两大类:特征选择,主成分分析(PCA)特征选择目的:减少无关特征对机器学习的影响主要方法:Filter过滤式,对数据过滤分析,如方差小,则说明这个数据没有区分度,在线性代数里面来说其实就是线性相关,可以过滤API:sklearn.feature_selection.VarianceThreshold...原创 2018-10-21 17:30:03 · 226 阅读 · 0 评论 -
Instacart菜篮子分析-My way of ML4
这是kaggle上的项目,数据集可以到kaggle上下载kaggle下载数据集需要注册,第一次注册需要翻墙,以后登陆就不要了点击这里下载数据集观察特征每个表的行是用户样本,列是对应的特征,首先我们需要合并表,这里需要一些pandas的基础。pd.read_csv(’./products.csv’),读取表数据,这个readcsv函数很万能pd.merge(prior, pr...原创 2018-10-21 18:03:05 · 1460 阅读 · 0 评论 -
实验室服务器
ssh -p 2204 root@172.16.70.174已配置好tensorflow和caffe环境原创 2018-11-28 11:20:31 · 543 阅读 · 1 评论