- 博客(12)
- 收藏
- 关注
转载 加速数据分析,这12种高效Numpy和Pandas函数为你保驾护航
选自TowardsDataScience 作者:Kunal Dhariwal. 机器之心编译 参与:Jamin、杜伟、张倩我们都知道,Numpy 是 ...
2020-03-27 08:10:48 239
转载 独家 | 如何创建用于离线估算业务指标的测试集?(附代码&链接)
作者:AARSHAY JAIN 翻译:张若楠 校对:张玲本文约6500字,建议阅读10+分钟本文将从原理及应用两方面出发,介绍如何采用日志数据对新模...
2020-03-27 08:10:48 519
转载 拓扑机器学习的神圣三件套:Gudhi,Scikit-Learn和Tensorflow(附链接&代码)
作者:Mathieu Carrière 翻译:孙韬淳校对:和中华本文约4500字,建议阅读10分钟本文简要介绍了机器学习中拓扑数据分析的力量并展示如何...
2020-03-25 08:44:35 1045
转载 一文回顾近二十年数据科学领域的里程碑事件或突破性技术
回顾数据科学的早期发展历史,我们会发现有两个主题密切相连:大数据意味着计算机的使用频率增加;统计学家很难将纸张上所写算法用计算机实现。由此,数据科学得以...
2020-03-23 08:34:12 1528
转载 独家 :教你用Pytorch建立你的第一个文本分类模型!
作者:Aravind Pai 翻译:王威力 校对:张一豪本文约3400字,建议阅读10+分钟本文介绍了利用Pytorch框架实现文本分类的关键知识...
2020-03-18 08:17:39 763
转载 机器学习第一步,这是一篇手把手的随机森林入门实战
选自TowardsDataScience作者:Alexander Cheng机器之心编译参与:高璇、思到了 2020 年,我们已经能找到很多好玩的...
2020-03-16 08:40:03 1566
转载 10大类、142条数据源,中文NLP数据集线上搜索开放
机器之心报道 项目作者:CLUE benchmark 参与:思、杜伟有了这个开源项目,再也不用担心找不到好用的中文 NLP 数据集,142 条数据集,...
2020-03-13 08:56:16 779
转载 干货 :教你一文掌握数据预处理
数据分析一定少不了数据预处理,预处理的好坏决定了后续的模型效果,今天我们就来看看预处理有哪些方法呢?记录实战过程中在数据预处理环节用到的方法~主要从以下几个方面介绍:常用方法Numpy部...
2020-03-11 08:34:38 639
转载 数据可视化之美:让你的数据活动起来!
现如今无论是工作汇报、产品设计、后台设计甚至是数据大屏,越来越多的行业需要和数据打交道,数据几乎无处不在,任我们取用。然而同样的数据给人的感觉可能会千差万别:或冰冷枯燥,让人望而生畏、百...
2020-03-06 08:50:47 543
转载 实战案例 :电信客户流失分析与预测
本文所有代码都通过运行!将从以下方面进行分析:1.背景 2.提出问题 3.理解数据 4.数据清洗 5.可视化分析 6.用户流失预测 7.结论和建议本项目带你根据以上过程详细分析电信客户数...
2020-03-06 08:50:47 3549
转载 指南:不平衡分类的成本敏感决策树(附代码&链接)
作者:Jason Brownlee翻译:陈超校对:冯羽本文约3500字,建议阅读10+分钟本文介绍了不平衡分类中的成本敏感决策树算法。决策树算法对平衡分类是有效的,但在不平衡数据集上...
2020-03-04 08:51:27 1633
转载 秘籍:10个Python字符串处理技巧(附代码)
作者:马修·梅奥 翻译:陈之炎 校对:和中华本文约1600字,建议阅读7分钟。本文为你介绍利用Python处理字符串的一些基本操作。在探寻文本分析途径时却不知从何下手,该怎么办?那么...
2020-03-02 08:46:24 442
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人