![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
Wang Guo
这个作者很懒,什么都没留下…
展开
-
CNN之LeNet
LeNet实现(TensorFlow&PyTorch)TensorFlowPyTorchTensorFlowimport tensorflow as tf def LeNet(input_tensor,train,regularizer): #第一层:卷积层,卷积核5×5,输入1,输出6,不使用全0补充,步长为1。 #尺寸变化:32×32×1->28×28...原创 2020-04-09 22:39:55 · 237 阅读 · 0 评论 -
使用skflow内置的LR,DNN,Scikit-learn中的集成回归模型对“美国波士顿房价”进行预测
话不多说,直接上代码1 代码实现及结果截图、#coding:utf-8#使用skflow内置的LR,DNN,Scikit-learn中的集成回归模型对“美国波士顿房价”进行预测from sklearn import datasets,metrics,preprocessing,cross_validation#读取数据boston=datasets.load_boston()#获取房价数据特征及对...原创 2018-02-12 00:18:45 · 1867 阅读 · 2 评论 -
无监督学习之特征降维-主成分分析
1 特征降维是无监督学习的应用之一,主成分分析是最为经典和实用的特征将维技术,尤其是在辅助图像识别方面 实验数据:手写体数字图像 全集数据2 实验代码及结果截图#coding:utf-8import numpy as np import pandas as pd #读取训练数据和测试数据digits_train=pd.read_csv('https://a原创 2018-02-07 19:28:31 · 1942 阅读 · 0 评论 -
特征提升之特征提取-基于文本数据的DictVectorizer,TfidfVectorizer在去掉停用词和不去停用词条件下的分析
1 特征提取:逐条将原始数据转化为特征向量的形式,其中涉及到数据特征的量化表示实验数据:字典存储数据2 实验代码及结果截图#coding:utf-8#导入朴素贝叶斯模型from sklearn.naive_bayes import MultinomialNBfrom sklearn.metrics import classification_report#导入新闻文本数原创 2018-02-07 19:43:41 · 3448 阅读 · 3 评论 -
TensorFlow学习之实现深度卷积分类器
1 利用TensorFlow在MNIST数据上构建深度卷积分类器 数据集:MNIST 数据,MNIST是一个入门级的计算机视觉数据集,包含各种手写体数字图片本文分为两部分(1)softmax模型实现 (2)深度卷积分类器实现2 实验代码及结果截图#coding:utf-8#softmax模型#下载数据from tensorflow.examp...原创 2018-03-07 23:07:50 · 851 阅读 · 0 评论 -
TensorFlow学习之平面拟合三维数据
1 利用Python编写的TensorFlow代码,初步对TensorFlow有所了解。 生成一些三维数据,然后用一个平面进行拟合2 实验代码及结果截图#coding:utf-8import tensorflow as tfimport numpy as np#生成假数据,总共100个点x_data=np.float32(np.random.rand(2,100))y_data=np.dot([...原创 2018-03-06 23:00:29 · 1985 阅读 · 0 评论 -
TensorFlow学习之 TensorBoard的使用
TensorBoard的使用1 TensorBoard— tensorboard是tensorflow附带的可视化工具;具体的介绍可以参考官方教程,在这里提供 TensorFlow 官方文档中文版 - v1.2.pdf的下载链接,可以直接下载。2 通过一个简单的实例了解其使用— 代码:import tensorflow as tfimport numpy as np...原创 2018-08-24 07:45:39 · 368 阅读 · 0 评论 -
tf-faster-rcnn[cpu]实现目标检测(二)模型测试
继CPU下运行demo之后,现在开始使用res101进行voc数据的训练(1)在tf-faster-rcnn根目录下,执行:NET=res101TRAIN_IMDB=voc_2007_trainval+voc_2012_trainvalmkdir -p output/${NET}/${TRAIN_IMDB}cd output/${NET}/${TRAIN_IMDB}ln -s ../....原创 2018-12-08 23:27:15 · 1277 阅读 · 18 评论 -
tf-faster-rcnn[cpu]实现目标检测(一)项目环境配置
tf-faster-rcnn[cpu]实现目标检测(一)项目环境配置下载项目git clone https://github.com/endernewton/tf-faster-rcnn.git编译,配置相应的运行环境安装Cpython (这里相应的模块需要根据个人平时的使用下载,有很多的本人电脑已经存在,便没有一一列举出来)shell sudo apt-get insta...原创 2018-12-03 23:33:37 · 1849 阅读 · 23 评论 -
tf-faster-rcnn[cpu]实现目标检测(三)训练自己的数据
在前两篇博客中我们分别配置了环境和进行了demo的测试,接下来我们训练自己的图像数据并进行检测.(1)制作数据集我们采用VOC2007的数据模板,进行数据制作VOC2007数据文件图:VOC2007├── Annotations #图像标签文件,是.xml格式├── ImageSets │ ├── Layout│ ├── Main #训练和测试用到的数据...原创 2018-12-28 19:29:11 · 1544 阅读 · 5 评论 -
使用Tensorflow自定义一个线性分类器对‘良/恶性乳腺癌肿瘤’进行预测
1 Tensorflow作为一个开源框架,在深度学习与机器学习方面有着很大的应用。 对于Tensorflw就不作介绍,仅仅对其应用简单的实现一下利用tensorflow自定义一个线性分类器对‘良/恶性乳腺癌肿瘤’进行预测2 代码实现及结果截图#coding:utf-8#使用tensorflow自定义一个线性分类器对‘良/恶性乳腺癌肿瘤’进行预测import tensorflow as tfim...原创 2018-02-12 00:12:47 · 1335 阅读 · 0 评论 -
K均值算法
1 K均值算法 K-means算法是最为经典,易用的数据聚类模型; 该算法要求我们预先设定聚类的数量,然后通过迭代更新聚类中心,最后让所有数据点到其所属聚类中心距离的平方和趋于稳定。算法执行: 随机布设K个特征空间点作为初始的聚类中心 根据每个数据的特征向量,从K个聚类中心寻找距离最近的一个,并将此数据标记为从属于这个聚类中心 在所有的数据都被标记过聚类中心原创 2018-02-05 21:03:24 · 2241 阅读 · 0 评论 -
支持向量机,K近邻模型,回归树在不同配置下的性能比较
1 延续上一篇,还是采用美国波士顿房价测试数据,对支持向量机,K近邻模型以及回归树采用不同的参数配置,进行同一模型在不同配置下的回归预测性能的评估2 实验代码及结果截图#导入数据读取器from sklearn.datasets import load_boston boston=load_boston()#数据分割from sklearn.cross_validatio原创 2018-02-04 22:49:16 · 1431 阅读 · 0 评论 -
良/恶性乳腺癌肿瘤预测---线性分析
1 线性分类器 介绍:假设特征与分类结果存在线性关系的模型;通过累加计算每个维度的特征与各自权重的乘积帮助类别决策。2 实验代码及截图#coding:utf-8import pandas as pd import numpy as np #创建特征列表column_names=['samples code number','Clump Thickness','U原创 2018-02-01 16:13:08 · 1539 阅读 · 0 评论 -
泰坦尼克号上的乘客是否生还的预测分析
1 本文是以《Python机器学习及实践 从零开始通往kaggle竞赛之路》为参考书籍进行的实践通过随机分类模型以及XGBoost模型进行泰坦尼克号上的乘客是否生还的预测分析2 实验代码以及结果截图#coding:utf-8#泰坦尼克号上的乘客是否生还的预测能力import pandas as pd from sklearn.ensemble import RandomFo原创 2018-02-01 21:48:20 · 1031 阅读 · 0 评论 -
K近邻模型
本文是以《Python机器学习及实践 从零开始通往kaggle竞赛之路》为参考书籍进行的实践1 利用K近邻模型对生物物种进行分类,使用Iris数据集2 实验代码以结果截图#coding:utf-8#K近邻模型#读取Iris数据集细节资料#导入iris数据加载器from sklearn.datasets import load_iris #读取数据并存原创 2018-02-01 22:07:48 · 1165 阅读 · 0 评论 -
朴素贝叶斯模型
本文是以《Python机器学习及实践 从零开始通往kaggle竞赛之路》为参考书籍进行的实践1 朴素贝叶斯模型 构造基础是贝叶斯理论,单独考量每一维度特征被分类的条概率,进而综合这些所概率对其所在的特征向量做出分类预测。其主要应用于文本分类。2 实验代码及结果截图#coding:utf-8#从sklearn.datasets中导入新闻数据抓取器fetch_20news原创 2018-02-01 22:14:02 · 706 阅读 · 0 评论 -
支持向量机分类器
1 支持向量机分类器 根据训练样本的分布,搜索所有可能的线性分类器中最佳的那个。 本文是利用支持向量机进行手写体数字图像的分类任务。2 实验代码及结果截图#coding:utf-8#支持向量机分类器#手写体数据读取#从slearn.datasets里导入手写数字加载器from sklearn.datasets import load_digits原创 2018-02-01 22:00:00 · 3811 阅读 · 0 评论 -
LinearRegression模型与SGDRegressor模型的性能比较
本文是以《Python机器学习及实践 从零开始通往kaggle竞赛之路》为参考书籍进行的实践1 LinearRegression模型与SGDRegressor模型的性能比较 利用对数据处理的结果进行性能的比较;数据源为:美国波士顿地区房价数据2 实验代码及结果截图#coding:utf-8#导入数据读取器from sklearn.datasets import lo原创 2018-02-02 21:26:00 · 3452 阅读 · 0 评论 -
特征提升之特征筛选
1 特征筛选 数据集:Titanic数据集; 通过特征筛选来寻找最佳的特征组合,并且达到提高预测准确性的目标2 实验代码及结果截图#coding:utf-8#数据导入import pandas as pd titanic=pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pu...原创 2018-02-08 19:33:27 · 618 阅读 · 0 评论 -
模型正则化之欠拟合和过拟合
1 拟合 是指机器学习模型在训练的过程中,通过更新参数,使得模型不断契合可观测数据的过程数据集:比萨饼直径和价格数据通过线性回归模型,2次多项式回归模型,4次多项式回归模型的预测性能分析,来理解拟合过程;并针对所存在的问题,使用L1范数正则化,L2范数正则化进行改进后的性能测试。2 实验代码及结果截图#coding:utf-8#比萨饼价格预测#输入训练样本的特征及目标值x_train=[...原创 2018-02-08 20:24:11 · 385 阅读 · 0 评论 -
良/恶性乳腺癌肿瘤预测
本文是以《Python机器学习及实践 从零开始通往kaggle竞赛之路》为参考书籍进行的实践1 环境 ubuntu16.04+Python 2.7 其中,python 下需要安装相应的扩展包:Numpy ,Pandas ,Matplotlib ,Scikit-learn 。2 实验代码及实验结果截图#coding:utf-8#良/恶性乳腺癌肿瘤原创 2018-01-31 22:49:43 · 745 阅读 · 0 评论