自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(79)
  • 收藏
  • 关注

转载 的机器学习开源工具分享

本文将介绍21个你可能没使用过的机器学习开源工具。· 每个开源工具都为数据科学家处理数据库提供了不同角度。· 本文将重点介绍五种机器学习的工具——面向非程序员的工具(Ludwig、Orange、KNIME)、模型部署(CoreML、Tensorflow.js)、大数据(Hadoop、Spark)、计算机视觉(SimpleCV)、NLP(StanfordNLP)、音频和强化学习(O...

2019-08-05 16:58:00 214

转载 机器学习常见的采样方法

Index数据采样的原因常见的采样算法失衡样本的采样02数据采样的原因其实我们在训练模型的过程,都会经常进行数据采样,为了就是让我们的模型可以更好的去学习数据的特征,从而让效果更佳。但这是比较浅层的理解,更本质上,数据采样就是对随机现象的模拟,根据给定的概率分布从而模拟一个随机事件。另一说法就是用少量的样本点去近似一个总体分布,并刻画总体分布中的不确定性。因为...

2019-08-02 16:01:00 1554

转载 图像配准与深度学习方法

目录:图像配准:从SIFT到深度学习什么是图像配准传统的基于特征的方法关键点检测和特征描述特征匹配图像变换深度学习方法特征提取Homography学习监督学习无监督学习其他方法强化学习复杂的转换图像配准(Image Registration)是计算机视觉中的基本步骤。在本文中,我们首先介绍基于OpenCV的方...

2019-07-31 16:06:00 5714

转载 卷积网络中的几何学你了解多少?

几何深度学习是个很令人兴奋的新领域,但是它的数学运算逐渐转移到代数拓朴和理论物理的范围。在Cohen等人的论文《规范等变卷积网络和二十面体CNN》中,这种现象尤其明显。这篇论文也正是本文要探讨的对象。论文中使用了规范场理论的用辞,那些喜欢把“量子”和“场”两个词合起来使用的所有的物理学当中,规范场理论居于中心地位。论文承诺对规范场理论的基础知识提供一个直观的解读,其实,我也不得不承认...

2019-07-26 14:16:00 226

转载 云计算、虚拟化和容器

“云计算”这个词,相信大家都非常熟悉。作为信息科技发展的主流趋势,它频繁地出现在我们的眼前。伴随它一起出现的,还有这些概念名词——OpenStack、Hypervisor、KVM、Docker、K8S...这些名词概念,全部都属于云计算技术领域的范畴。对于初学者来说,理解这些概念的具体含义并不是一件容易的事情。所以,小枣君今天这篇文章,将给大家做一个通俗易懂的介...

2019-07-24 15:09:00 370

转载 在数据科学领域,你掌握这个24个python库就够了!

介绍我是Python语言的忠实粉丝,它是我在数据科学方面学到的第一门编程语言。Python有三个特点:它的易用性和灵活性全行业的接受度:它是业内最流行的数据科学语言用于数据科学的庞大数量的Python库事实上,有如此多的Python库,要跟上它们的发展速度可能会变得非常困难。这就是为什么我决定消除这种痛苦,并编辑这24个Py...

2019-07-22 17:58:00 187

转载 你知道NBA球星都喜欢在哪个位置出手? Python告诉你

导读:NBA 2018-19 赛季已经落下帷幕,猛龙击败勇士,成为新科冠军球队。近日各队纷纷发布2019-20季前赛赛程,迎接新赛季。我想,不如来做个NBA 相关的数据分析案例好了。实际上,数据分析团队对于现在的 NBA 球队已经算是标配了,无论是在球员选择还是战术制定上都起着重要的作用。当下整个联盟越来越盛行的“魔球化”打法,其实也正是基于数据分析的产物。于是,我们就借助官方...

2019-07-19 17:28:00 987

转载 PaddlePaddle显存优化策略

飞桨(PaddlePaddle)为用户提供技术领先、简单易用、兼顾显存回收与复用的显存优化策略,在Transformer、BERT、DeepLab V3+上Max Batch Size性能优于对标开源框架,在YOLOv3、Mask-RCNN模型上显存性能与对标开源框架持平,有兴趣的同学可以试一下,上一组数据先睹为快。测试条件如下:Paddle version:1.5...

2019-07-18 13:59:00 660

转载 基于numpy模块实现常规线性代数的求解问题

前言数据挖掘的理论背后,几乎离不开线性代数的计算,如矩阵乘法、矩阵分解、行列式求解等。本文将基于numpy模块实现常规线性代数的求解问题,需要注意的是,有一些线性代数的运算并不是直接调用numpy模块,而是调用numpy的子模块linalg(线性代数的缩写)。该子模块涵盖了线性代数所需的很多功能,本文将挑几个重要的例子加以说明。函数清单为使读者有一个全局的概念,下面罗列一...

2019-07-17 14:15:00 122

转载 最强大的数据处理引擎: Spark和Flink

本篇文章属于阿里巴巴Flink系列文章之一。当提及大数据时,我们无法忽视流式计算的重要性,它能够完成强大的实时分析。而说起流式计算,我们也无法忽视最强大的数据处理引擎:Spark和Flink。Apache Spark自2014年以来迅速普及。它提供了一个适用常见数据处理场景的统一引擎,如批处理、流处理、交互式查询和机器学习。在某些情况下,它的性能是前一代Hadoop Ma...

2019-07-16 11:05:00 230

转载 21机器学习开源工具分享

我们将开源机器学习工具分为以下5类:面向非程序员的开源机器学习工具用于机器学习模型部署大数据开源工具用于计算机视觉,NLP和音频用于强化学习1. 面向非程序员的开源机器学习工具对于非程序员或是没有技术背景的人来说,机器学习看起来很复杂。这是一个广阔的领域,可以想象可能第一次接触机器学习会多么令人生畏。那么没有...

2019-07-15 14:49:00 127

转载 机器学习模型ML

“其实我是做机器学习模型的。”“什么模型?拿出来给大家看看啊!”如果你是一个机器学习(ML)程序员,向爸妈、亲友或者客户介绍自己的职业时,可能会遇到这样的尴尬。现在有了斯坦福大学出品的Gradio,你真的可以把自己的ML模型“搬”出来了。只需几行代码,你就可以创建一个简单的网页,即使完全不会代码的爸妈,也能用拖拽操作体验你的ML模型。除此之外,Gradio还可...

2019-07-12 11:00:00 235

转载 一文总结深度学习的12张思维导图

来源商业新知网,原标题:一文总结深度学习的12张思维导图本文以思维导图的形式,为大家介绍了深度学习的核心内容,主要包括:深度学习基础、神经网络介绍、CNN从入门到应用、Caffe、Tensorflow、Pytorch等深度学习框架、词向量、循环神经网络、RNN条件生成与Attention、对抗生成网络、增强学习、迁移学习导图总览深度学习基础CNN入门...

2019-07-11 14:25:00 738

转载 常用的基于内容的推荐算法实现原理

这篇文章我们主要关注的是基于内容的推荐算法,它也是非常通用的一类推荐算法,在工业界有大量的应用案例。本文会从什么是基于内容的推荐算法、算法基本原理、应用场景、基于内容的推荐算法的优缺点、算法落地需要关注的点等5个方面来讲解。希望读者读完可以掌握常用的基于内容的推荐算法的实现原理,并且可以基于本文的思路快速将基于内容的推荐算法落地到真实业务场景中。01什么是基于内容的推荐...

2019-07-10 11:51:00 3187

转载 高质量深度学习模型, 一键模型预测,迁移学习很简单

飞桨(PaddlePaddle)核心框架Paddle Fluid v1.5已经发布,而作为其关键工具,用来迁移学习的PaddleHub也进行了全面更新,正式发布了1.0版本。全新的PaddleHub模型和任务更加丰富,为用户提供了覆盖文本、图像和视频三大领域八大任务的40+预训练模型,同时还在飞桨官网上开辟了PaddleHub的网页。本文将对PaddleHub及其...

2019-07-09 15:14:00 537

转载 Python 4.0 将怎样发展?

最近讨论的 Python 4.0 预计推出的新功能,代码名为“ Ouroboros:自噬蛇当提出向后不兼容的更改时python-ideas的新手偶尔会提出“Python 4000”的概念,这些更改不给当前合法的Python3代码提供明确的移植路径。毕竟,我们允许Python 3.0进行这种更改,那么为什么我们不允许它用于Python 4.0呢?我现在已经听过那么多问题了(包...

2019-07-08 14:49:00 166

转载 Python中csv xml json之间相互转换最简单的方法分享

Python优越的灵活性和易用性使其成为最受欢迎的编程语言之一,尤其是对数据科学家而言。这在很大程度上是因为使用Python处理大型数据集是很简单的一件事情。如今,每家科技公司都在制定数据战略。他们都意识到,拥有正确的数据(干净、尽可能多)会给他们带来关键的竞争优势。数据,如果使用有效,可以提供深层次的、隐藏在表象之下的信息。多年来,数据存储的可能格式显著增加,但是,在日常...

2019-07-05 14:31:00 262

转载 八大前端JavaScript趋势和工具

JavaScript的世界正在快速发展。前端开发(和网络开发)的世界正在以极快的速度发展。如今,如果不借助前端或Webpack、React Hooks、Jest、Vue和NG元素,你会很快被远远抛下。不过,情况正在发生改变。尽管开发人员和技术人员在前端领域中的数量逐年上升,生态系统却有标准化的趋势。新技术和工具的出现正在改变当下的规则。总体趋势肯定会是一种基于组件构成的用户界...

2019-07-04 13:54:00 127

转载 Python是人工智能和机器学习的最佳编程语言,证据在此!

人工智能与机器学习是IT行业的新兴热门领域。虽然有关其发展安全性的讨论日益增多,但开发人员仍在不断扩展人工智能的能力与存储容量。如今,人工智能已远远地超出科幻小说中的构想,成为了现实。人工智能技术广泛应用于处理分析大量数据,由于其处理的工作量及工作强度明显提高,因此这些工作今后无需人工操作。例如,人工智能被应用于分析学中以建立预测,帮助人们创建有力策略和更为有效的解决办法。金融科技公...

2019-07-03 15:01:00 272

转载 深度学习中的多种Normalization模型

转载作者:张俊林“张俊林,中国中文信息学会理事,中科院软件所博士,目前在新浪微博AI Lab担任资深算法专家。在此之前,张俊林曾经在阿里巴巴任资深技术专家并负责新技术团队,以及在百度和用友担任技术经理及技术总监等职务。同时他是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届输出版优秀图书奖)、《大数据日知录:架构与算法》的作者。”编者按不管是传...

2019-07-02 16:28:00 149

转载 机器学习者面试,看这10个建议

在过去的一年里,我采访了一些在Expedia Group担任数据科学职位的人,职位从入门级到高级的都有。我想分享我的经验,这些经验适用于对申请数据科学职位的人。在这篇文章里,我还会给出关于你可能在面试中会遇到的问题的一些提示。面试候选人帮助我认识了一些有广泛背景和技能的人。从CS / ECE,统计/数学到土木/机械工程,这些领域的人我都接触过。所幸我有机会能在这里与这...

2019-07-02 15:58:00 268

转载 分享10个数据分析的小技巧(Python)

一些小提示和小技巧可能是非常有用的,特别是在编程领域。有时候使用一点点黑客技术,既可以节省时间,还可能挽救“生命”。一个小小的快捷方式或附加组件有时真是天赐之物,并且可以成为真正的生产力助推器。所以,这里有一些小提示和小技巧,有些可能是新的,但我相信在下一个数据分析项目中会让你非常方便。Pandas中数据框数据的Profiling过程Profiling(分析器)是一个帮助我们...

2019-06-28 11:37:00 191

转载 工作学习上实用的编程相关知识分享

简单分享几点在工作学习上还比较实用的一些知识1、Mysql导出数据--Navicat软件可以用程序导出数据,相信大家用程序对常见数据格式的导出应该都有所了解,这里介绍一款可视化软件Navicat,可以方便导出多种格式,选中数据库中的表后点击导出按钮,可以看到多种导出格式,我个人经常导出csv和sql脚本文件,csv方便作为文件查看传输,sql脚本文件方便利用source命令进行...

2019-06-27 16:52:00 107

转载 前端React 框架- UmiJS有听说过吗?

介绍umi官方宣称是一个可插拔的企业级 react 应用框架。umi 以路由为基础的,支持类 next.js 的约定式路由,以及各种进阶的路由功能,并以此进行功能扩展,比如支持路由级的按需加载。然后配以完善的插件体系,覆盖从源码到构建产物的每个生命周期,支持各种功能扩展和业务需求,目前内外部加起来已有 50+ 的插件。umi 是蚂蚁金服的底层前端框架,已直接或间接地服务了...

2019-06-26 14:20:00 2853

转载 PyTorch如何构建深度学习模型?

简介每过一段时间,就会有一个深度学习库被开发,这些深度学习库往往可以改变深度学习领域的景观。Pytorch就是这样一个库。在过去的一段时间里,我研究了Pytorch,我惊叹于它的操作简易。Pytorch是我迄今为止所使用的深度学习库中最灵活的,最轻松的。在本文中,我们将以实践的方式来探索Pytorch,包括基础知识与案例研究。我们会使用numpy和Pytorch分别从头开始构...

2019-06-25 17:03:00 1279

转载 Sigmoid 和 Softmax 如何进行函数处理分类?

来源商业新知网,原标题:函数分类大PK:Sigmoid和Softmax,分别怎么用?设计模型执行分类任务(如对胸部X光检查到的疾病或手写数字进行分类)时,有时需要同时选择多个答案(如同时选择肺炎和脓肿),有时只能选择一个答案(如数字“8”)。本文将讨论如何应用Sigmoid函数或Softmax函数处理分类器的原始输出值。神经网络分类器分类算法有很多种,但本文讨论的内...

2019-06-24 16:11:00 935

转载 从零开始学习机器学习最简单的 kNN 算法

来源商业新知网,原标题:Python 手写机器学习最简单的 kNN 算法摘要:从零开始学习机器学习最简单的 kNN 算法。今天开始,我打算写写机器学习教程。说实话,相比爬虫,掌握机器学习更实用竞争力也更强些。目前网上大多这类教程对新手都不友好,要么直接调用 Sklearn 包,要么满篇抽象枯燥的算法公式文字,看这些教程你很难入门,而真正适合入门的手写 Python...

2019-06-21 10:34:00 162

转载 监督学习中的决策树算法(含代码)

来源商业新知网,原标题:决策树的Python实现(含代码)一天,小迪与小西想养一只宠物。小西:小迪小迪,好想养一只宠物呀,但是不知道养那种宠物比较合适。小迪:好呀,养只宠物会给我们的生活带来很多乐趣呢。不过养什么宠物可要考虑好,这可不能马虎。我们需要考虑一些比较重要的问题。小西:我也考虑了好多呀,可是还是很难去选择。我想养可爱的小兔兔,可是兔兔吃得很挑剔,又想养狗狗,可是...

2019-06-20 15:02:00 511

转载 可视化Bert网络,发掘其中真实世界的嵌入

来源商业新知网,原标题:Jeff Dean强推:可视化Bert网络,发掘其中的语言、语法树与几何学本文是论文(Visualizing and Measuring the Geometry of BERT)的系列笔记的第一部分。这篇论文由Andy Coenen、Emily Reif、Ann Yuan、Kim、Adam Pearce、Fernanda Viegas和Martin W...

2019-06-19 15:09:00 228

转载 50行代码轻松搞定GAN !

来源商业新知网,原标题:50行代码实现GAN | 干货演练2014年,Ian Goodfellow和他的同事发表了一篇论文,向世界介绍了生成对抗网络(GAN)。通过对计算图和博弈论的创新性组合,他们表明如果有足够的建模能力,两个相互对抗的模型可以通过普通的反向传播进行共同训练。模型具有两个不同的角色。给定数据集R,生成器G试图创建类似真实数据的假数据,鉴别器D分辨真实...

2019-06-18 14:08:00 148

转载 史上最全的机器学习工具手册!

来源商业新知网,原标题:吐血整理!这可能是最全的机器学习工具手册工欲善其事必先利其器!之前我也断断续续给大家发文整理过一些关于数据科学,尤其是机器学习、深度学方面的速查手册!但是,每次分享的都比较是针对某一块的内容,相对来说,还是不够全面。而且,零散的资料也不便于快速收藏和整理!今天,我发现了一份绝佳的、超全的数据科学机器学习手册,内容非常丰富,可以说是很全面了。一起来看一...

2019-06-17 15:52:00 96

转载 同样是玩Python,怎么能玩出新花样?

来源商业新知网,原标题:同样是玩Python,他们却能玩出花儿来~大家有没有在每一个月黑风高的夜晚,为以下问题苦恼过,辗转反侧过……丨吃鸡游戏中哪里装备药品最富裕(俗话说得好:要吃鸡,先富裕)?丨在北上广深哪里租房价格便宜、交通方便呢?丨女票是新媒体小编,如何帮助她找到最吸睛的文章标题?丨如何为爱豆超越从0开发一个智能语音机器人?丨朋友...

2019-06-14 14:47:00 140

转载 2019阿里巴巴面试题集锦(有答案哦),收藏!

来源商业新知网,原标题:【收藏】2019阿里巴巴面试题集锦(含答案)【导读】本文是阿里巴巴 2019 面试题集锦(含答案),是阿里巴巴自身技术专家们结合多年的工作、面试经验总结提炼而成的面试真题。通过这些面试题,还可以间接地了解技术大牛们出题思路与考察要点。想要入职大厂可谓是千军万马过独木桥。要通过层层考验,刷题肯定是必不可少的。为帮助开发者们提升面试技能、有机...

2019-06-13 16:40:00 421

转载 10个Python图像处理工具,干货整理!

来源商业新知网,原标题:干货整理!10个Python图像处理工具,入门必看,提效大法 | 资源在图像处理领域,一库在手,相当于天下已有。最近,有一位搞数据科学的小姐姐Parul Pandey,整理了一份实用Python图像处理工具,内含十大经典Python库。这份资源中的工具可用于图像处理中的常见任务,包括裁剪、翻转、旋转、图像分割、分类和特征提取、图像恢复和图像识...

2019-06-13 16:36:00 138

转载 网页数据如何实现实时刷新?

来源商业新知网,原标题:精讲网页数据实时刷新实现本文仅为学技术而简单举例,后端框架是Django,具体业务逻辑是否合理可以不用管,下方是工作中需要实现的需求自动化程序脚本运行的三种任务状态:1、未执行 2、执行成功 3、执行失败任务状态在网页前端实时展示,需要每隔一段时间请求数据库中的状态数据字段为webtask_stu,并返回前端展示两种思路:1、前端轮...

2019-06-12 16:26:00 3928

转载 数据结构与算法之链表学习方法攻略

来源商业新知网,原标题:题型篇 | 数据结构与算法之链表系列写在前边如果你和小鹿一样,刚开始对链表的操作代码实现很懵的话,不妨按照小鹿经过一个月的时间对链表相关操作以及题型的整理总结,由浅入深进行适当的练习,我相信,当你真正的练习完这些题目,不但会让你放下对链表心理上的困惑,而且对你学习其他数据结构有很大的信心和帮助!由于文章篇幅共计 8000 字,公众号为缩减版本,完...

2019-06-12 16:05:00 116

转载 高考为什么这么难?Python爬取42年高考数据为你揭晓

来源商业新知网,原标题:Python爬取42年高考数据,告诉你高考为什么这么难?对于像作者一样已经工作的“上班族”来说,6月7号到9号三天无疑是兴奋到飞起的,终于迎来了令人愉悦的端午假期:然而有那么一群人,将在端午节日之际迎来人生特别重要的一次经历或者说是挑战,那就是高考生们。高考的重要性无须赘述,今天我们就来聊聊那些年我们一起经历的高考。历年录取率可能很多经历过高...

2019-06-06 16:13:00 153

转载 C++七大新特性,程序员们纷纷喜极而泣!

来源商业新知网,原标题:不知道C++这七大特性,绝对枉为圈中人作为一种计算机语言,C++经历了许多发展变化。当然,这些改变并不是一蹴而就的。C++曾经缺乏活力与创新,因此很不受欢迎。但是在C++标准委员会决定加速发展这个语言之后,形势发生了改变。2011年起,C++一跃成为了具有活力、不断演进、广受喜爱的计算机语言。C++蜕变后也并没有简单多少,仍是最难的编程语...

2019-06-05 15:24:00 280

转载 如何用更智能、更简便的方法来训练神经网络?

来源商业新知网,原标题:重磅论文!颠覆你对神经网络训练的所有认知现实生活中,机器学习模型训练是数据科学中难度最大和计算成本最高的一种。几十年以来,在单一公理假设训练会覆盖整个模型的影响下,人工智能领域已经开发出了许多技术来提高机器学习模型的训练。最近,来自麻省理工学院的人工智能研究员发表了一篇名为“Lottery Ticket Hypothesis(彩票假设)”的论文,在人...

2019-06-04 14:40:00 129

转载 深度学习的下一个大热门——Swift

来源商业新知网,原标题:为什么Swift会是深度学习的下一个大热门?如果你喜欢编程,当你听到Swift,你可能会想到iOS或MacOS的应用程序开发。如果你正在进行深度学习,那么你一定听说过Swift for Tensorflow(缩写为S4TF)。然后,你可以问自己:“为什么谷歌要为Swift创建一个TensorFlow版本?”Python和c++已经有了版本;为什么要添加另...

2019-06-03 16:54:00 62

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除