机器学习
文章平均质量分 92
honor、
但行好事,莫问前程
展开
-
Classification分类器|机器学习实战-基于Scikit-Learn和TensorFlow
Chapter 3 – ClassificationThis notebook contains all the sample code and solutions to the exercises in chapter 3.SetupFirst, let’s make sure this notebook works well in both python 2 and 3, import a few common modules, ensure MatplotLib plots figures in原创 2020-07-12 16:23:44 · 962 阅读 · 0 评论 -
常用的向量与矩阵的范数总结[L0、L1、L2范数]
向量的范数首先定义一个向量为:x=[-5,6,8, -10]1-范数:,即向量的各个元素的绝对值之和,matlab调用函数norm(x, 1) 。则上述x的1-范数结果是292-范数:,Euclid范数(欧几里得范数,常用计算向量长度),即向量元素绝对值的平方和再开方,matlab调用函数norm(x, 2)。-范数:,即所有向量元素绝对值中的最大值,matlab调用函数norm(x, inf)。-范数:,即所有向量元素绝对值中的最小值,matlab调用函数norm(x, -inf)。p原创 2020-07-09 11:16:04 · 6079 阅读 · 0 评论 -
端到端的机器学习项目,预测房价
端到端的机器学习项目主要步骤:1.观察大局。2.获得数据。3.从数据探索和可视化中获得洞见。4.机器学习算法的数据准备。5.选择和训练模型。6.微调模型。7.展示解决方案。8.启动、监控和维护系统。使用的数据集选用StatLib库中选择了加州住房价格的数据集,该数据集基于1990年加州人口普查的数据。观察大局首先要做的事是使用加州人口普查的数据建立起加州的房价模型。 数据中有许多指标, 诸如每个街区的人口数量、 收入中位数、 房价中位数等。 街区是美国人口普查局发布样本数据的最小地原创 2020-07-05 21:33:28 · 4629 阅读 · 2 评论 -
NLP入门-情感分析|paddle
### 任务介绍:在自然语言处理中,情感分析一般指判断一段文本所表达的情绪状态,属于文本分类问题。情绪:正面/负面数据集介绍:IMDB数据集包含来自互联网的50000条严重两极分化的评论,该数据被分为用于训练的25000条评论和用于测试的25000条评论,训练集和测试集都包含50%的正面评价和50%的负面评价。该数据集已经经过预处理:评论(单词序列)已经被转换为整数序列,其中每个整数代表字典中的某个单词。1、准备数据:创建数据读取器train_reader 和test_reader2、原创 2020-07-04 13:13:03 · 1294 阅读 · 0 评论 -
NLP入门-文本分类|paddle
数据来源:从网站上爬取56821条数据中文新闻摘要数据内容:包含10种类别,国际、文化、娱乐、体育、财经、汽车、教育、科技、房产、证券1、准备数据:创建数据集和数据字典创建数据读取器train_reader 和test_reader2、配置网络定义网络定义损失函数定义优化算法3、训练网络4、模型评估5、模型预测# 查看当前挂载的数据集目录!ls /home/aistudio/data/#将数据移动到 /home/aistudio/data/ 目录下!cp data/d原创 2020-07-04 10:54:58 · 682 阅读 · 1 评论 -
生成对抗样本的方法|攻击方法
对抗样本1.Biggio′s attackBiggio[22]等人首先针对传统机器学习分类器(如SVM和三层全连接神经网络)的MNIST手写数字识别数据集生成对抗样本。它通过优化判别函数来误导分类器。2. Szegedy′s limited-memory BFGS (L-BFGS) attackSzegedy[8]等人首次证明了可以通过对图像添加小量的人类察觉不到的扰动误导深度神经网络图像分类器做出错误的分类。他们首先尝试求解让神经网络做出误分类的最小扰动的方程。作者认为,深度神经网络所具有的强大原创 2020-07-03 17:01:59 · 8944 阅读 · 1 评论 -
高被引Top1团队综述:Adversarial Attacks and Defenses in Images, Graphs and Text: A Review【论文翻译】
深度神经网络(DNN)逐渐代替传统模型,成为机器学习中最热门的工具,它已被成功应用于计算机视觉,自然语言处理等很多领域。然而,最近的研究表明,深度模型极容易被对抗样本攻击。人为稍微扰动模型的输入,可能导致模型给出完全相反的预测结果,从而出现差之毫厘、失之千里的错误。从此,对于深度模型在对抗样本的鲁棒性的研究成为机器学习的热门话题之一。 4月,IJAC于最新一期发表美国工程院院士、密歇根州立大学Anil K. Jain团队和Jiliang Tang 团队合作带来的特约综述,第一作者为密歇根州立大翻译 2020-06-29 20:36:38 · 4281 阅读 · 0 评论 -
Kaggle-泰坦尼克号生存者预测比赛|初级入门
问题描述泰坦尼克号的沉没是历史上最臭名昭著的沉船事件之一。1912年4月15日,泰坦尼克号在处女航中撞上冰山沉没,2224名乘客和船员中1502人遇难。这一耸人听闻的悲剧震惊了国际社会,并导致了更好的船舶安全条例。沉船造成如此巨大人员伤亡的原因之一是没有足够的救生艇来容纳乘客和船员。虽然在沉船事件中幸存下来也有一些运气的因素,但有些人比其他人更有可能幸存下来,比如妇女、儿童和上层阶级。在这个挑战中,我们要求你完成对可能存活下来的人的分析。我们特别要求你们运用机器学习工具来预测哪些乘客在灾难原创 2020-06-27 22:23:21 · 646 阅读 · 0 评论 -
python+opencv实现人脸识别|采用现成训练好的模型
一、图片人脸检测(opencv)1、安装opencv环境介绍windows中opencv在python3上的实现,我的系统环境win10+python3.6+opcv3.4.1首先去网站下载OpenCV对应的.whl版本压缩包,网址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv 本人下载的版本是:opencv_python‑3.4.1‑cp36‑cp36m‑win_amd64.whl 64位系统对应python3.6的,下载到F盘根目录。链接:原创 2020-06-23 19:23:33 · 10174 阅读 · 2 评论 -
强化学习课程|paddle|入门
什么是强化学习强化学习(英语:Reinforcement learning,简称RL)是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。核心思想:智能体agent在环境environment中学习,根据环境的状态state(或观测到的observation),执行动作action,并根据环境的反馈reward(奖励)来指导更好的动作。注意:从环境中获取的状态,有时候叫state,有时候叫observation,这两个其实一个代表全局状态,一个代表局部观测值,在多智能体环境里会有差原创 2020-06-20 19:28:58 · 650 阅读 · 0 评论 -
DNN|CNN|百度paddle学习
深度学习三个步骤:建立模型选择什么样的网络结构选择多少层,每层选择多少神经元损失函数选择常用损失函数,平方误差,交叉熵…参数学习梯度下降反向传播算法全连接神经网络DNN由于模型结构不够灵活,模型参数太多,通过模型改进,就出现了卷积神经网络CNN。CNN在结构上有三大特性:局部连接,在我们进行图像识别的时候,不需要对整个图像进行处理,只需要关注图像中某...原创 2020-04-08 09:38:32 · 3517 阅读 · 2 评论 -
Pycharm汉化之后无法打开setting设置
我在安装了pycharm汉化包之后,发现pycharm点击设置setting没反应,不能打开。网上找了解决方案:一般的问题都是装了中文汉化包resources_cn.jar造成的,解决办法:更换一个汉化包把这里的两个jar包放到PyCharm安装目录里的lib目录里面即可。同时删掉之前的汉化包。链接:https://pan.baidu.com/s/1khtnNGAkMkwkGsDjzw...原创 2020-04-02 10:59:35 · 5538 阅读 · 0 评论 -
机器学习|Andrew Ng|学习笔记
Machine Learning(机器学习)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。有一个算法叫支持向量机,里面有个巧妙的数学技巧,能让计算机处理无限多个特征。监督学习:其基本思想是数据集中的每个样本都有相应的“正确答案”,再根据这些样本作出预测。例如垃圾邮件问题。无监督学习:在无监督学习中,不同于监督学习的数据的样子(...原创 2020-04-01 18:23:46 · 329 阅读 · 0 评论 -
机器学习-李宏毅| keras demo | python
利用keras实现手写数字辨识首先要建一个Network scratch,input是28∗28的dimension,其实就是说这是一张image,image的解析度是28∗28,把它拉成长度是28∗28维的向量。output呢?现在做的是手写数字辨识,所以要决定它是0-9的哪个数字,output就是每一维对应的数字,所以output就是10维。中间假设你要两个layer,每个layer有500...原创 2020-03-30 21:47:05 · 278 阅读 · 0 评论 -
Anaconda3安装教程(详细)
Anaconda3下载下载地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/选择anaconda 3.5.2 对应的python版本是python3.6安装anaconda3点击next点击I Agree然后选择Install for All Users,点击Next选择安装位置,建议不要安装在C盘。默认第...原创 2020-03-19 20:29:38 · 17362 阅读 · 0 评论 -
机器学习-李宏毅| 回归演示 | python
回归的定义Regression就是指找到一个函数functionfunctionfunction,通过输入特征x,输出一个数值ScalarScalarScalar看了李宏毅老师的机器学习课程视频,其中的Regression demo部分,关于预测宝可梦的CP值的应用代码,在jupyter notebook中实现。现在假设有10个x_data和y_data,x和y之间的关系是y_data=b+...原创 2020-03-12 15:52:26 · 221 阅读 · 0 评论