自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据分析

专注大数据、人工智能、移动/互联网、IT科技、电商/金融、数据分析/挖掘等领域的综合信息服务与分享平台。...

转载 无脑带你遍历用户生命价值与流失挽救(下):流失分析与产品化

前言:第一篇是从用户生命周期出发,用一个短视频的案例来做分析,阐述了用户价值体系。本文下篇,将从价值与流失的分析角度来做一些分享。本文涉及到的知识点有:用户生命周期、流量方向的分析方法论...

2020-07-10 08:57:10 18 0

转载 无脑带你遍历用户生命价值与流失挽救(上) : 流量下的价值套路

这是一篇讲述用户生命周期与流失挽救方面知识的文章,穿插了大量的从BI角度对业务进行数据分析的方法。相关知识的宽度与深度有点高,涉及到的知识点有:用户生命周期、流量方向的分析方法论、用户分...

2020-07-08 08:41:06 54 0

转载 数字化转型下的大数据领域黑科技大揭秘

一元复始,万物互联疫情之下,永洪科技探索的脚步从未停止永洪科技新产品又要和大家见面了记得4月,在疫情笼罩的艰难环境下为打造更好的产品体验永洪研发团队攻坚作战Yonghong Z-Suit...

2020-07-07 09:03:00 31 0

转载 如何使用 Python 绘制一套动态图形?

来源:机器之心本文约2161字,建议阅读5分钟。本文介绍Python 中一种简单的动态图表制作方法。在读技术博客的过程中,我们会发现那些能够把知识、成果讲透的博主很多都会做动态图表。他们...

2020-07-07 09:03:00 35 0

转载 机器学习数学基础:数理统计与描述性统计

所谓机器学习和深度学习, 背后的逻辑都是数学, 所以数学基础在这个领域非常关键, 而统计学又是重中之重, 机器学习从某种意义上来说就是一种统计学习。今天是概率统计基础的第二篇文章, 基于...

2020-07-03 09:04:49 43 0

转载 分享 :如何成为一个合格的数据架构师?

写在前面早在1980年,未来学家阿尔文·托夫勒就在《第三次浪潮》中,将大数据比喻为“第三次浪潮的华彩乐章”。21世纪以来,数据量进入每两年翻一番的增长期,越来越多人意识到了数据的价值,...

2020-07-01 08:42:16 157 0

转载 推荐 :用pandas-profiling做出更好的探索性数据分析(附代码)

作者:Thomas Gey 翻译:廖倩颖 校对:和中华本文约2300字,建议阅读5分钟。探索性数据分析已失势,Pandas-profiling万岁!用更省力的办法完美呈现你的数据。...

2020-07-01 08:42:16 37 0

转载 推荐!关于学习数据科学的10件事

我经常在我的YouTube频道DataProfessor上被问到以下有关如何进入数据科学领域的问题:如何成为数据科学家?成为数据科学家的路线图是什么?我应该学习什么课程来学习数据科学?链...

2020-06-29 08:52:06 68 0

转载 一文读懂贝叶斯优化

作者:Apoorv Agnihotri,Nipun Batra.翻译:王雨桐.校对:张一然本文约6200字,建议阅读10+分钟。本文将贝叶斯优化拆解为易于理解的小部分。许多现代的机器...

2020-06-26 09:00:57 87 0

转载 谷歌医学AI在生活中的精确度(附链接)

作者:Will Douglas Heaven 翻译:王晓颖 校对:wwl本文长度为2000字,建议阅读5分钟如果需要靠AI来扭转病人的处境,那我们需要了解当人类真正地使用AI时,它在...

2020-06-24 08:37:52 55 0

转载 一文读懂机器学习

本文转载自公众号 sigua心底的小声音,数学系的一线小研发,更新数据结构和算法 | 深度学习 | 职场等技术原创文章。本文约6000字,建议阅读10+分钟本文以图文的形式对模型算法中...

2020-06-24 08:37:52 54 0

转载 什么是Python的迭代器和生成器?(附代码)

作者:Aniruddha Bhandari 翻译:王琦 校对:和中华本文约3700字,建议阅读10分钟。本文介绍了Python中的生成器和迭代器。在处理大量数据时,计算机内存可能不足...

2020-06-19 08:43:01 30 0

转载 315道Python面试题,欢迎挑战

来源:数据分析1480本文长度为5347字,建议阅读5分钟80 + 34 + 46 + 155 = 315题第一部分 Python基础篇(80题)1、为什么学习Python?2、通过什么...

2020-06-19 08:43:01 58 0

原创 数据运营加速器

业务产品是基本盘,市场推广、运营、品牌等其他手段均是对基本盘的加持,至于加持系数的大小,则是“天时、地利、人和”等前浪因素的影响结果,如果再给加持系数加一个放大器,或许“数据”后浪是不错...

2020-06-17 08:41:51 46 0

转载 在机器学习中利用统计插补来处理缺失值(附代码)

作者:Jason Brownlee 翻译:吴振东 校对:冯羽本文约4500字,建议阅读10分钟本文以病马数据集为例,帮助你了解在机器学习领域如何利用统计策略来处理缺失值,对代码进...

2020-06-17 08:41:51 92 0

转载 对不起,你的PPT数据不够直观,你可能需要让数据动起来

选自TowardsDataScience作者:Costas Andreou 机器之心编译 参与:Jamin、张倩在读技术博客的过程中,我们会发现那些能够把知识、成果讲透的博主很...

2020-06-15 08:22:36 78 0

转载 推荐 :决策树VS随机森林--应该使用哪种算法?(附代码&链接)

作者:Abhishek Sharma 翻译:陈超 校对:丁楠雅本文长度为4600字,建议阅读20分钟本文以银行贷款数据为案例,对是否批准顾客贷款申请的决策过程进行了算法构建,并对比...

2020-06-12 07:56:44 118 0

转载 分享 :Google的42条军规,别说你懂职场,太有价值了

本文是谷歌产品高级副总裁Jonathan Rosenberg在其母校克莱蒙特·麦肯纳学院向毕业生分享的他自己多年的职场经验,包括沟通、文化、团队建设、决策、创新和谦卑等六方面内容。这浩浩...

2020-06-10 08:27:20 109 0

转载 推荐 :手把手教你推导决策树算法

作者:Arun Mohan 翻译:杨毅远 校对:王琦本文长度为2000字,建议阅读5分钟本文为大家介绍了机器学习中常用的决策树算法以及相关术语,并基于天气数据集进行决策树算法(ID3...

2020-06-10 08:27:20 56 0

转载 一文看尽2020上半年阿里、腾讯、百度入选AI顶会论文(附地址)

2020年已过近半,人工智能学术界的顶级会议也举行了不少。在今年已经举行的顶会中,腾讯、百度、阿里等国内科技巨头被收录论文在数量和质量上均有所突破,涉及机器学习、自然语言处理、计算机视觉...

2020-06-08 08:06:35 492 0

转载 数据可视化的方法、工具和应用

1. 数据可视化简介数据可视化,是指用图形的方式来展现数据,从而更加清晰有效地传递信息,主要方法包括图表类型的选择和图表设计的准则。随着互联网的广泛应用,我们的工作和生活等各个方面,每时...

2020-06-02 08:29:29 632 0

转载 速成这项硬技能,秋招前就拿下中外高薪offer!

如果你有心求职,那一定知道Glassdoor 、实习僧这些国内外职位搜索平台。当你在Glassdoor搜索“data”关键词时,会出现65万个招聘贴,这是“marketing”(29万)...

2020-06-02 08:29:29 132 0

转载 一文读懂主成分分析(PCA)

作者:贾恩东本文长度为2500字,建议阅读7分钟这篇文章主要带大家入门PCA,逐渐理解PCA最原始的概念和设计思路,以及简单的实现原理。主成分分析,即Principle Componen...

2020-06-01 07:49:52 181 0

转载 推荐 :机器学习中的四种分类任务(附代码)

作者:Jason Brownlee 翻译:陈丹 校对:杨毅远全文约4400字,建议阅读18分钟本文为大家介绍了机器学习中常见的四种分类任务。分别是二分类、多类别分类、多标签分类、不平...

2020-05-29 08:22:00 459 0

转载 数据科学入门指南:新手如何步入数据科学领域?

作者:Sangeet Aggarwal.翻译:陈之炎 校对:冯羽本文长度为2900字,建议阅读6分钟本文将带大家讨论如何从零开始数据科学之旅。数据科学,据说是本世纪最吸引人的工作,已...

2020-05-27 08:15:13 141 0

转载 推荐 :浅析机器学习中的自由度

作者:Jason Browniee翻译:张若楠 校对:林鹤冲本文长度为2800字,建议阅读8分钟本文介绍了自由度的概念,以及如何判断统计学模型和机器学习模型中的自由度。标签:数据处理...

2020-05-25 08:17:48 63 0

转载 案例 :SVP/一种用于深度学习的高效数据选择方法

作者:Cody Coleman, Peter Bailis, and Matei Zaharia翻译:杨毅远校对:王琦本文长度为1800字,建议阅读7分钟本文为你介绍SVP方法如何在...

2020-05-18 08:11:26 153 0

转载 推荐 :一文读懂模型的可解释性(附代码&链接)

本文长度为10000字,建议阅读10+分钟对于信任和管理我们的人工智能“合作伙伴”,可解释AI则至关重要。目录1.1 可解释的重要性1.2 可解释性的范围1.2.1. 算法透明度(Alg...

2020-05-15 08:21:25 1591 0

转载 推荐 :强化学习必知二要素——计算效率和样本效率

作者:Kevin Vu,Exxact公司翻译:陈之炎 校对:吴振东本文约4800字,建议阅读10分钟在强化学习模型中尝试不同的策略对于开发最佳应用程序至关重要,然而,资源的占地可能...

2020-05-13 08:05:30 194 0

转载 数据分析必备!Pandas实用手册(PART III)

这一系列的对应代码,大家可以在我共享的colab上把玩,????https://colab.research.google.com/drive/1WhKCNkx6VnX1TS8uar...

2020-05-11 08:03:10 129 0

转载 教你使用torchlayers 来构建PyTorch 模型(附链接)

作者:Matthew Mayo翻译:王琦 校对:和中华本文约1200字,建议阅读5分钟本文介绍了torchlayers。torchlayers 旨在做Keras为TensorFlo...

2020-05-08 08:12:55 76 0

转载 分享 :国家信息中心杜平谈关于数字化的几点思考

[ 导读 ]清华大学109周年校庆之际,清华校友总会软件学院分会、大数据系统软件国家工程实验室和清华大学大数据研究中心共同主办了以“软件定义新基建,数据驱动新未来”为主题的系列线上讲座活...

2020-05-06 08:28:23 330 0

转载 为你的数据科学项目提供有力支撑--3个寻找数据集的最佳网站

作者:Angelia Toh,Self Learn Data Science联合创始人翻译:李海明 校对:冯羽本文约1000字,建议阅读5分钟本文为你介绍3个寻找数据集的最佳网站...

2020-04-29 08:13:51 215 0

转载 520 页机器学习笔记!图文并茂可能更适合你(附资源下载)

本文约1600字,建议阅读5分钟本文为全球第一大商业软件公司的梁劲公开了自己所写的一份 520 页的学习教程,详细、明了地介绍了机器学习中的相关概念、数学知识和各种经典算法。前段时间,来...

2020-04-27 08:27:21 101 0

转载 推荐 :数据科学如何用于理解COVID-19(附链接)

作者:Kayla Matthews翻译:陈超校对:吴金笛本文约1800字,建议阅读5分钟。本文为你介绍数据科学如何用于更好地学习和理解COVID-19。阅读这篇概览,你将获得对数据科...

2020-04-24 08:25:11 406 0

转载 推荐 :常见损失函数和评价指标总结(附公式&代码)

作者:董文辉本文长度为4500字,建议阅读10+分钟本文为你总结常见损失函数和评价指标。目录一、损失函数1.1 回归问题1.2 分类问题二、评价指标2.1 回归问题2.2 分类问题参考资...

2020-04-22 08:11:40 528 0

转载 这些pandas技巧你还不会吗 | Pandas实用手册(PART II)

这一系列一共三部分,里面的一些技巧可能暂时用不上,但是相信总有一天你会接触到,建议收藏每一小节对应代码大家可以在我共享的colab上把玩,????https://colab.res...

2020-04-20 08:02:26 121 0

转载 强烈推荐,B站最强学习资源汇总(数据科学,机器学习,python)

经过这几个月的居家隔离,想必大多数同学都开始习惯通过线上的方式开展学习了,在线教育领域也因此迎来了一波爆发,竞争异常激烈,既有知名平台如MOOC、学堂在线、网易云课堂等,也有不少初创新星...

2020-04-17 08:26:09 803 0

转载 送你16个matplotlib绘图实用小技巧(附代码)

1. 添加标题-titleimport numpy as npimport matplotlib.pyplot as plt# 显示中文plt.rcParams['font.sa...

2020-04-15 08:26:24 55 0

转载 超详细整理!Pandas实用手册(PART I)

这一系列一共三部分,里面的一些技巧可能暂时用不上,但是相信总有一天你会接触到,建议收藏每一小节对应代码大家可以在我共享的colab上把玩,????https://colab.res...

2020-04-15 08:26:24 115 0

提示
确定要删除当前文章?
取消 删除