机器学习
文章平均质量分 71
whackw
测试相关,尽量做到比开发与运维还要牛
展开
-
PyTorch examples入门实例之路
在学习PyTorch 之前,肯定会有人问为不学习tensorflow呢?我的回答如下1、我也是学习了tensorflow,但在继续学习时发现github与知乎中,各种模型网络与新出来模型网络大都是PyTorch版本,也就是大神们研究复现算法时都用PyTorch2、tensorflow是静态的网络结构是提前规化好不能改变,PyTorch是动态灵活可以在运行时自己控制任何细节实现首先推荐大家先进入这个手敲一遍PyTorch examples/PyTorch入门实例但在之前需要安装环境,因为自己安原创 2020-06-01 00:56:01 · 737 阅读 · 0 评论 -
tensorflow初学习者路上各种问题之杀怪(自己遇到解决过,持续更新)
1、解决出现 ImportError: No module named 'tensorflow_datasets'的问题2、distorted_inputs() got an unexpected keyword argument 'data_dir'3、AttributeError: module 'tensorflow' has no attribute 'scalar_summary...原创 2020-01-22 00:55:57 · 300 阅读 · 0 评论 -
sklearn上使用集成算法
集成方法即将不同的分类器组合起来,使用集成方法会有多种形式:不同算法的集成、同一算法在不同设置下的集成、数据集不同部分分配给不同分类器之后的集成。sklearn中封装了Ensemble methods.AdaBoost和bagging方法。他们都是基于同一种分类器多个不同实例的计算方法.1.boosting 【是啥】boosting是几个不同的分类器的集成。(注意:这里的不同只是训练集不同,或转载 2017-09-13 19:32:11 · 606 阅读 · 0 评论 -
基于Scikit-Learn的五个文本分类案例研究
Scikit 是一个开源的 Python 机器学习库。主要涵盖了分类、回归分析、聚类等算法,具体包括支持向量机、随机森林、梯度提升(gradient boosting)、K-means 和 DBSCAN 等算法,同时也集成了 Python 的数据科学包 NumPy 和 SciPy。下面是5个利用 SciKit 进行文本分类的案例初创智能公司的新闻分类:CB Insights,一个初创智能公司的数转载 2017-09-12 21:04:57 · 769 阅读 · 0 评论 -
]scikit-learn进行机器学习
http://www.cnblogs.com/taceywong/p/4568806.htmlhttp://www.cnblogs.com/taceywong/p/4570155.html转载 2017-09-12 21:02:10 · 372 阅读 · 0 评论 -
python情感词分析
http://www.360doc.com/content/16/0725/19/15165994_578332920.shtml转载 2017-09-12 19:57:41 · 1010 阅读 · 0 评论 -
sklearn参数优化方法
学习器模型中一般有两个参数:一类参数可以从数据中学习估计得到,还有一类参数无法从数据中估计,只能靠人的经验进行指定,后一类参数就叫超参数比如,支持向量机里的C,Kernel,gama,朴素贝叶斯里的alpha等,在学习其模型的设计中,我们要搜索超参数空间为学习器模型找到最合理的超参数,可以通过以下方法获得学习器模型的参数列表和当前取值:estimator.get_params()转载 2017-09-12 19:29:55 · 1268 阅读 · 0 评论 -
sklearn分类器
这几天在看 sklearn 的文档,发现他的分类器有很多,这里做一些简略的记录。大致可以将这些分类器分成两类: 1)单一分类器,2)集成分类器 一、单一分类器下面这个例子对一些单一分类器效果做了比较from sklearn.cross_validation import cross_val_scorefrom sklearn.datasets impo转载 2017-09-12 19:07:43 · 751 阅读 · 0 评论 -
sklearn做单机特征工程
使用sklearn做单机特征工程目录1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特征选择 3.1 Filter转载 2017-09-12 15:51:17 · 357 阅读 · 0 评论 -
sklearn进行数据挖掘
1 使用sklearn进行数据挖掘1.1 数据挖掘的步骤 数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、transform和fit_transform,fit方法居然和模型训练方法fit同名(不光同名转载 2017-09-12 15:31:06 · 446 阅读 · 0 评论 -
支持向量机通俗导论(理解SVM的三层境界)
前言 动笔写这个支持向量机(support vector machine)是费了不少劲和困难的,原因很简单,一者这个东西本身就并不好懂,要深入学习和研究下去需花费不少时间和精力,二者这个东西也不好讲清楚,尽管网上已经有朋友写得不错了(见文末参考链接),但在描述数学公式的时候还是显得不够。得益于同学白石的数学证明,我还是想尝试写一下,希望本文在兼顾通俗易懂的基础上,真真正正能足以成为一转载 2017-08-11 15:28:20 · 472 阅读 · 0 评论 -
用Pandas完成Excel中常见的任务
本文的目的,是向您展示如何使用pandas 来执行一些常见的Excel任务。有些例子比较琐碎,但我觉得展示这些简单的东西与那些你可以在其他地方找到的复杂功能同等重要。作为额外的福利,我将会进行一些模糊字符串匹配,以此来展示一些小花样,以及展示pandas是如何利用完整的Python模块系统去做一些在Python中是简单,但在Excel中却很复杂的事情的。有道理吧?让我们开始吧。为某转载 2017-08-11 14:32:48 · 531 阅读 · 0 评论 -
同一个主机上安装不同版本TensorFlow1.x与TensorFlow2.x之杀怪
windows系统安装Linux系统安装原创 2020-01-16 12:38:36 · 1785 阅读 · 0 评论 -
tensorflow学习之路-初学习者版本选择
tensorflow各个版本的区别tensorflow - 仅支持 CPU 的当前稳定版本(建议新手使用)tensorflow-gpu - 支持 GPU 的当前稳定版本(Ubuntu 和 Windows)tf-nightly - 仅支持 CPU 的每夜版(不稳定)tf-nightly-gpu - 支持 GPU 的每夜版(不稳定,Ubuntu 和 Windows)tensorflow1.x...原创 2020-01-16 12:33:57 · 4707 阅读 · 0 评论 -
tensorflow学习之路-正则化
为什么要正则化简单来说,正则化是一种为了减小测试误差的行为(有时候会增加训练误差)。我们在构造机器学习模型时,最终目的是让模型在面对新数据的时候,可以有很好的表现。当你用比较复杂的模型比如神经网络,去拟合数据时,很容易出现过拟合现象(训练集表现很好,测试集表现较差),这会导致模型的泛化能力下降,这时候,我们就需要使用正则化,降低模型的复杂度。1、机器学习中的正则化(Regularization...原创 2020-01-14 23:18:21 · 197 阅读 · 0 评论 -
tensorflow学习之路-卷积神经网络笔记
1、卷积神经网络——输入层、卷积层、激活函数、池化层、全连接层2、卷积神经网络的卷积核大小、卷积层数、每层map个数都是如何确定下来的呢?3、卷积神经网络的通道数与卷积核数的关系4、卷积神经网络之卷积计算、作用与思想5、模型优化的熵与不平衡学习6、批量梯度下降(BGD)、随机梯度下降(SGD)以及小批量梯度下降(MBGD)的理解...原创 2020-01-14 12:53:05 · 281 阅读 · 0 评论 -
tensorflow学习之路-全连接层的理解
卷积取的是局部特征,全连接就是把以前的局部特征重新通过权值矩阵组装成完整的图。因为用到了所有的局部特征,所以叫全连接。全连接层(fully connected layers,FC)在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。先看全连接的图:全连接把卷积输...原创 2020-01-14 12:42:15 · 1789 阅读 · 1 评论