自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1368)
  • 收藏
  • 关注

转载 偷偷爆料下各公司年终奖!(27日最新版)

来源:互联网整理:Jack Cui大家好,我是小z年快过完了,马上复工,年终奖也在路上了。今年的年终奖,应该是有喜有忧,互联网没有年终奖的情况,可能也会上演。汇总了截止 1 月 27 日的最新爆料,给大家分享一下,如果有求职、跳槽的打算,也可以作为参考信息。一些公司还没有发年终奖,但是也有领导的预沟通,属于提前爆料信息,也是有一定的参考价值。当然,其中也会存在幸存者偏差,愿意曝光的大概率是绩效表...

2023-01-28 22:03:24 101

原创 我最近发现的一些问题。

‍‍ 大家好,我是小z,也可以叫我阿粥~这段时间看了不少分析报告,启发颇多。也发现有一些普遍存在且很容易误导分析师的问题。在聊问题之前,先给大家分享一个(我刚写的)小故事:有一个学生,他属于学习不怎么用功型的,但是成绩非常好,常年稳居年级第一,岿然不动。学校决定好好研究一下这个典型,想总结一套人人都可复用的高效学习方法。但是呢,老师们采访他是怎么学习的,回答总是油盐不进,三句话蹦不...

2023-01-08 22:03:24 344

转载 BI+AI 有没有前途?

文章来源:数据工匠俱乐部0从一个曲线图说起数据可视化只是数据分析中的一步,不是所有。今天,我们从一个数据可视化中典型的指标曲线开始说起。(图-1:某连锁超市每个月利润率的指标曲线)如上图,某个业务指标的趋势很容易通过可视化展示出来,但缺憾在于,单纯的可视化不能告诉用户,某个节点指标大幅波动(上涨或下跌)背后的原因是什么。又是什么关键因素引起了这个波动?如果排除一个或多个关键因素后,可能会带来什么变...

2022-12-27 22:03:21 303

转载 阳了后,会重复感染吗?

最近北京基本上都快羊一遍了,今天我们就针对现状,从数据角度探讨一下本轮阳了后会重复感染吗?多久会重复感染呢?1、又有新冠新毒株了吗?我们提到讨论一切的前提是,此刻的病毒状况如何。病毒一直在迭代变异,新版本就该有新打法,了解它现在的特性,有助于我们更科学地面对它。而当时只提到了目前国内本轮疫情的主要毒株是奥密克戎BF.7,但实际准确的来说:我国现阶段流行的新冠病毒以奥密克戎变异株BA.5的亚分支BA...

2022-12-21 22:03:17 818

转载 中国各城市首轮感染高峰期预测

作者:chenqin@知乎,经济学研究者编辑来源:Datawhale对台湾地区、香港特别行政区和日本的感染情况与“发烧”搜索指数进行了分析,发现一个可能可以帮助预测感染高峰期的方法:1. 将Google搜索指数分为疫情期间和非疫情期间,非疫情期间的发烧指数平均数为非疫情,将疫情期间的搜索指数做以下处理后加总,计算一个数值疫情非疫情非疫情其中S的含义是这样的:如果发烧的搜索是发烧人口的一个相对稳定的...

2022-12-15 22:03:24 3483

转载 如何写出一份领导满意的数据分析报告?

作者:好好的分析师链接:https://zhuanlan.zhihu.com/p/414346701转自:数据分析不是个事儿大家好,我是小z,也可以叫我阿粥~前排提示:文末送一本算法的好书沃尔玛啤酒搭售尿布,展现数据分析的洞察之细致;Alpha Go打败柯洁,凸显人工智能的能力之强大;Target寄送育儿优惠券,表现用户画像的刻画之精准。一个个故事,把复杂的信息变简单,抽象的技术变具象。人类需要故...

2022-12-12 19:52:47 107

转载 替代VBA!用Python轻松实现Excel编程(文末赠书)

大家好,我是小z,也可以叫我阿粥~面向Excel数据处理自动化的脚本编程,目前主要有VBA和Python两种语言可供选择。从上世纪90年代到目前,VBA一直是Excel脚本编程的主要工具。VBA语言具有简单易学、功能强大的特点,在长达几十年的时间里为提高Excel工作效率作出了贡献,也积累了海量的代码和学习资料。在这段时间里,Basic语言也一直是国内中学到大学教学首选的计算机语言。随着网络时代的...

2022-12-11 22:03:29 366

转载 ChatGPT已经杀疯了...

来源:机器之心关于 AI 的问题,可以直接问 AI。OpenAI 新上线的ChatGPT可谓是火爆出圈,这个对话模型可以回答后续问题,承认错误,挑战不正确的前提,还能帮你修改代码中的 bug……只要和它聊上几句,一会儿功夫它就能把问题给你解决了。例如用户要求:「ChatGPT 帮我解释一下文中正则表达式的含义。」ChatGPT:安排。密密麻麻的解释了一大段内容,应该是解释清楚了。由于ChatG...

2022-12-06 16:37:43 356

转载 整理了4000字的Google数据可视化指南!

译者丨红薯啊红薯链接丨https://www.ui.cn/detail/477349.html今天跟大家分享一套谷歌数据可视化团队形成的全面的数据可视化指南,涵盖了设计原则、图表分类、图表的选用、样式设计、交互设计、仪表板设计等方面。有人对其进行了翻译,这个规范指南基本适用所有数据图表设计,很有参考价值,建议收藏。希望能够分享给更多对数据可视化有兴趣的同学!另外,前排提示文末送书~数据可视化数据可...

2022-12-04 21:37:18 96

转载 图解玩转机器学习神器:Scikit-Learn!

图解机器学习本文详解 scikit-learn 工具库的用法,覆盖机器学习基础知识、SKLearn讲解、SKLearn三大核心API、SKLearn高级API等内容。https://www.showmeai.tech/article-detail/203在本篇内容中,我们展开讲解SKLearn的进阶与核心内容。SKLearn 中有六大任务模块,如下图所示:分别是分类、回归、聚类、降维、模型选择...

2022-11-29 22:03:43 167

转载 让数据分析效率再提升50%,帆软FineBI V6.0版本最新剧透!

1881年,英国出版的《机械与成绩》一书中曾写道:现在一千人当中,没有一个人不穿袜子。工业革命的伟大之处,就在于机器大生产解放了劳动力,让成千上万的英国女工穿上了女王同款丝袜。在工业时代,技术、劳动、资本甚至企业家的战略眼光,皆成为了促进生产力发展的关键要素。但随着科学技术不断发展,特别是大数据、人工智能、互联网和物联网、云计算、区块链等数字技术涌现,“数据”的价值开始凸显,与劳动、资本、土地、技...

2022-11-28 17:31:12 162

转载 数字化变革与冲突下,如何运用 BI 打造经营分析系统!

近日,“让业务用起来·观远数据2022智能决策峰会”落下帷幕。汉堡王中国运营优化副总裁/教练孙晓鹿分享了“冲突—数字化变革与创新的礼物”的主题演讲。孙晓鹿通过洞察数字化变革与创新中的种种冲突,分享了冲突带来的“礼物”以及汉堡王中国如何携手观远数据打造经营分析系统的实践经验。01数字化变革与冲突自2005年入驻中国,汉堡王在2012年迎来了爆发性发展,大大加快了中国市场的开店速度和城市布局,截止目前...

2022-11-25 09:13:15 200

转载 23个机器学习最佳入门项目!(附数据+源代码)

本文介绍23种机器学习项目创意,以获取有关该增长技术的真实经验。大家都知道,教科书上所学与实际操作还是有出入的,那关于机器学习有什么好的项目可以实操吗?这次给大家分享一个涵盖面向初学者,中级专家和专家的23种机器学习项目创意,以获取有关该增长技术的真实经验。这些机器学习项目构想将帮助你了解在职业生涯中取得成功、和当下就业所需的所有实践。通过项目学习是你短期内能做的最好投资,这些项目构想使你能够快速...

2022-11-22 22:03:33 223

转载 7张图大总结:SQL 数据分析常用语句!

“今天给大家分享一波SQL的基础查询语句,不管是数据分析小白还是在恶补基础知识的数据分析师,都快来学一学吧! 来源:InfoQ”本文目录:基础查询字符串\数字\日期时间聚合数据查询子查询联接\组合查询高级查询更新数据01 基础查询02 字符串\数字\日期时间03 聚合数据查询04 子查询05 联接\组合查询06 高级查询07 更新数据参考资料:《SQL Server 应用与开发范例宝典》htt...

2022-11-15 22:03:16 126

转载 36个顶级数据分析方法与模型!

来源:数据分析不是个事儿大家好,我是小z,也可以叫我阿粥~好的数据分析师不仅熟练地掌握了分析工具,还掌握了大量的数据分析方法和模型。这样得出的结论不仅具备条理性和逻辑性,而且还更具备结构化和体系化,并保证分析结果的有效性和准确性。今天从以下6个维度36种分析模型和方法逐个简略介绍,赶紧点赞收藏!战略与组织质量与生产营销服务财务管理人力资源互联网运营一、战略与组织1、SWOT分析主要应用于商业和管理...

2022-11-10 16:37:37 126

转载 回归模型相关重要知识点总结

来源 |机器学习研习院回归分析为许多机器学习算法提供了坚实的基础。在这篇文章中,我们将总结 10 个重要的回归问题和5个重要的回归问题的评价指标。一、线性回归的假设是什么线性回归有四个假设:线性:自变量(x)和因变量(y)之间应该存在线性关系,这意味着x值的变化也应该在相同方向上改变y值。独立性:特征应该相互独立,这意味着最小的多重共线性。正态性:残差应该是正态分布的。同方差性:回归线周围数据点...

2022-11-09 22:03:26 253

转载 几本牛X的数据分析好书!

大家好,我是小z最近双十一,很多书半价+平台满减折扣,很香!给大家分享了一波数据分析类的书单,感兴趣的可以冲了~精益数据分析本书围绕精益创业展开讨论,融合了精益创业法、客户开发、商业模式画布和敏捷/ 持续集成的精华。本书汇聚了100多位创始人、投资人、内部创业者和创新者的成功创业经验,呈现了30多个极具价值的案例分析,可以为各阶段的创业者提供行为准则。R语言实战(第2版)|两版合计印刷50+次...

2022-11-09 22:03:26 232

转载 移动看数?远不止于此,一文详解如何用好移动BI

自移动BI诞生以来,似乎一直仅停留在“移动看数”的表层。事实真是如此么?并不。随着与企业业务的深度结合,移动BI已具备更多“全新”能力。近日,观远数据发布《2022移动BI白皮书》,全新定义移动BI,不仅仅是数据展现,更重要的是数据消费与分享反馈,以及企业内部系统的协作能力。白皮书中首次提出「移动BI直升机模型」,拆解移动BI能力全景,基于5大功能点,详述移动BI如何成为一架推动企业数字化转型的直...

2022-11-08 22:03:04 217

转载 互联网最值得加入的173家国企汇总

今年的就业形势,实在是严峻。社招都这样,更别说应届生。虽然有一些垃圾国企,但仍然有非常多值得考虑的国企,毕竟优质的国企很稳定,不会像互联网一样担忧年纪大被裁员的情况发生,福利又好,同事间工作不会卷来卷去,享受足额的五险一金等等。这里汇总了一些计算机专业可以加入的国企,分享给求职的小伙伴们,内容很多,先收藏再看!原文链接:https://www.zhihu.com/question/28573009...

2022-11-04 22:03:52 179

转载 判断客户价值,用好这3个数据分析模型就足够了!

细边框标题“分享3个判断用户价值的模型。”工作中,很多时候都是要在资源有限的情况下,去最大化的撬动效益。挖掘创造最大价值的用户,给用户分类针对性营销等,就是一种典型的应用。本文将来谈谈常用的几个衡量客户价值的数据分析模型,以及它们的应用场景。这在用户运营、市场营销、客户管理等领域常常会用到。01使用帕累托模型判断重要客户帕累托原则,又称二八原则,是关于效率与分配的判断方法。帕累托法则是指在任何大系...

2022-11-03 22:04:00 203

转载 美化Matplotlib的3个小技巧

Matplotlib是Python的数据可视化库的基础。它是其他可视化工具(如Seaborn)的基础。Matplotlib提供了很大的灵活性,因此您可以自定义或调整几乎所有的图表。但是想要完全控制可视化就需要编写更多的代码。在本文中,我们将介绍3个可以用于定制Matplotlib图表的技巧:减少x轴或y轴上的刻度数添加一个辅助y轴共享x轴的子图坐标对齐本文中我们将使用折线图为例,但这些技巧也可以应...

2022-10-31 22:03:17 168

转载 今年这情况。。咱还是留个心眼吧

想必大家也知道,今年互联网裁员比较多,整体行情不好。今天分享一个被裁员无赔偿,但最终还是在作者的努力下拿到n+1的故事。文章很长,可以收藏备用,但希望大家都永远用不到。作者:翠花bananahttps://www.zhihu.com/question/27843346/answer/2690213218杭州,工龄11个月。想裁员不赔偿,我用十天的时间,拿到了到了n➕1!“我们公司没有赔偿这个文化。...

2022-10-27 22:03:24 180

转载 70个数据分析工具,必须收藏!

大家好,我是小z,也可以叫我阿粥今天给大家分享的这篇文章,更像是一份数据分析常用网站字典,一共70个,可视化、词频词云、PPT模板等等面面俱到,值得收藏!一、数据可视化工具百度EChartshttp://echarts.baidu.com/Cytoscapehttp://www.cytoscape.org/图表秀http://www.tubiaoxiu.com/数据观http://shujugua...

2022-10-20 22:03:21 303

转载 南开教授因个人简历太好笑冲上热搜!学校回应来了!

‍‍ 最近,一位不走寻常路的南开教授在社交媒体刷屏了。这简历能有多好笑?一切还要从南开官网上说起...南开教授简历展示括号的力量在学院官网主页上的个人介绍自带 “括号吐槽” 是种怎样的体验?胡金牛教授的这份简历让无数网友直呼666的同时表示“想选他的课!”自嘲读博士后原因是“找不到工作”在南开大学物理学院官网看到胡金牛教授的教育经历:于2006年7月南开大学物理学院本科毕业,在2007...

2022-10-17 22:03:22 231

转载 统计学常犯错误TOP榜,避坑防雷指南!

来源:知乎 良好研究方法作者:求知鸟pythonic生物人1. 变量之间关系可以分为两类:函数关系:反映了事务之间某种确定性关系相关关系:两个变量之间存在某种依存关系,但二者并不是一一对应的;反映了事务间不完全确定关系;2. 为什么要对相关系数进行显著性检验?实际上完全没有关系的变量,在利用样本数据进行计算时也可能得到一个较大的相关系数值(尤其是时间序列数值)当样本数较少,相关系数就很大。当...

2022-10-16 22:03:51 150

转载 这个公司对外包的操作有点恶心,建议避开!

今天上午看到一篇曝光 ZH 对外包一系列恶心措施的文章,分享一下,帮大家避避坑。原文:blog.csdn.net/w497671114/article/details/116244886从 ZH(特殊原因,无法直说) 离开时,准备写点东西揭露下 ZH 对外包的一系列恶心措施,但是感觉蚍蜉撼树,什么也改变不了,自己倒霉就认了,最近流行向前看吗。但是今天又听到有同事被离场,心中光有怒火,还是无可奈何。...

2022-10-14 22:03:58 109

转载 机器学习超参调优:常用 8 种方法

超参数调优是机器学习例程中的基本步骤之一。该方法也称为超参数优化,需要搜索超参数的最佳配置以实现最佳性能。机器学习算法需要用户定义的输入来实现准确性和通用性之间的平衡。这个过程称为超参数调整。有多种工具和方法可用于调整超参数。我们整理了一份用于调整机器学习模型超参数的前八种方法的列表。1 贝叶斯优化贝叶斯优化已成为机器学习算法超参数调整的有效工具,更具体地说,适用于深度神经网络等复杂模型。它提供了...

2022-10-14 22:03:58 276

转载 25个案例强化Pandas groupby 操作!

来源丨DeepHub IMBAgroupby是Pandas在数据分析中最常用的函数之一。它用于根据给定列中的不同值对数据点(即行)进行分组,分组后的数据可以计算生成组的聚合值。如果我们有一个包含汽车品牌和价格信息的数据集,那么可以使用groupby功能来计算每个品牌的平均价格。在本文中,我们将使用25个示例来详细介绍groupby函数的用法。这25个示例中还包含了一些不太常用但在各种任务中都能派上...

2022-10-13 14:07:55 79

转载 整理了8个分析师必知必会的SQL技巧!

来 源:数据前线不管是做数据开发还是数据分析,大部分人都离不开跟数据库打交道。如果数据量大,人员流动大,那么我么还能保证下一段时间系统还能流畅的运行吗?我么还能保证下一个人能看懂我么的存储过程吗?那么今天,我们结合平时个人工作经验和大家分享一下,希望对大家有帮助。1、查询的逻辑执行顺序(1)FROM < left_table>(2)ON < join_condition&gt...

2022-10-11 22:03:59 70

转载 总结了万字,数据分析如何突破!

文整理自知乎专栏:突破数据分析,作者是网易数据分析高级总监贺志。看到一篇数据分析好文,分享给大家,主要讲数据分析方法论、经验总结以及个人成长和突破。正 文我是一个数据从业者,很早以前就想把自己在工作和学习中的心得做个总结。一方面是对自己过往经历的一个总结和回顾;一方面最近几年大数据是越来越火了,也希望自己的经验能帮到那些对数据有热情、希望从事数据行业的新人们;还有一方面,也非常重要,是希望借助知乎...

2022-10-07 22:03:47 137 1

转载 强烈推荐一个有趣的数据分析神器~

大家好,我是小z,也可以叫我阿粥~今天开始文章之前,先跟大家聊一类书哈——口袋书,其实这类书是我喜欢的风格之一。将知识精简成薄薄的小册子,这种小型平装书非常适合读者携带、随时阅读。而且其中的科技书往往会采用对话、图解、漫画等各种轻便形式,这些优点在我自己写书时也参考不少。目前市面上已经有不少数据分析的书籍了(尤其今年),当然都是各有各的风格了,那有没有的结合的我前面说的口袋书风格呢?最近我还真看到...

2022-09-29 22:03:55 187

转载 如何向5岁小孩解释什么是支持向量机(SVM)?

编辑:王萌(深度学习冲鸭)著作权归作者所有,本文仅作学术分享,若侵权,请联系后台删文处理今天和大家分享一个入门级分类方法的讲解吧!什么是SVM?关于什么是SVM这个事情,就要必须要说一说刘强西救爱人的故事:在很久以前的情人节,魔鬼抢走了刘强西的爱人,旅馆老板刘强西便发誓要救他的爱人。来到魔鬼的城堡前,魔鬼和他玩了一个游戏,只要他通过了就放走他的爱人。魔鬼在桌子上似乎有规律放了两种颜色的球,说:“你...

2022-09-28 22:03:50 210

转载 用Python破解WiFi密码,太刺激了!

来源丨网络大家好,我是小z,也可以叫我阿粥~本文给大家分享的是如何通过 Python 脚本实现 WIFI 密码的暴力破解,从而实现免费蹭网。脚本从无图形和图形界面来分别实现,主要使用的是pywifi库:无图形界面 先来看看没有图形界面版的爆破脚本。WIFI爆破importpywififrompywifiimportconstimporttimeimportdatetime#...

2022-09-25 22:03:48 4076 2

转载 如何用DBSCAN聚类模型做数据分析?

DBSCAN属于无监督学习算法,无监督算法的内涵是观察无标签数据集自动发现隐藏结构和层次,在无标签数据中寻找隐藏规律。聚类模型在数据分析当中的应用:既可以作为一个单独过程,用于寻找数据内在规律,也可以作为分类等其他分析任务的前置探索。什么是DBSCANDBSCAN是一种基于密度的考虑到噪音的空间聚类算法。简单来讲,给定一组点,DBSCAN将彼此距离(欧几里得距离)很近的点聚成一类,同时它还将低密...

2022-09-25 22:03:48 170

转载 终于有人把指标设计方法讲明白了——抽象、加工、限定...

“ 归纳、沉淀指标设计的方法”一、为什么要设计指标?因为我们知道的太少。不仅是Jon Snow,“我们真的知道的,比我们认为自己知道的,知道的少。”是一个对于大多数人而言都普遍存在的现象。图1:牵强附会加张 图而设计指标的目的就在于:让我们了解更多。具体而言,通过指标数值,可以在可接受的成本下,传递足够多的信息。设想一下:中年危机老贾去医院体检,咨询身体状况如何;医生说:“还行。有点问题。问题不...

2022-09-23 21:37:10 187

转载 机器学习回归模型相关重要知识点总结!

来源:机器学习研习院回归分析为许多机器学习算法提供了坚实的基础。在这篇文章中,我们将总结 10 个重要的回归问题和5个重要的回归问题的评价指标。一、线性回归的假设是什么?线性回归有四个假设:线性:自变量(x)和因变量(y)之间应该存在线性关系,这意味着x值的变化也应该在相同方向上改变y值。独立性:特征应该相互独立,这意味着最小的多重共线性。正态性:残差应该是正态分布的。同方差性:回归线周围数据点的...

2022-09-22 20:37:25 221

转载 您已关注公众号满1年,诚邀您免费加入网易数据分析培训营!

网易数据分析培训营printf("为什么一定要学数据分析?");* Excel高效处理数据,提高N倍工作效率* 数据思维解读业务,增加N倍决策科学性* 可视化完美汇报数据,获得N倍老板赞赏数据处理、数据思维、数据可视化3大数据利器,来网易,免费学透!网易官方认证原价值¥599课程限时扫码 I 免费报名3重福利,限量免费领福利1:100套万能可视化模板福利2:100套职场汇报万能PPT模板福利...

2022-09-22 20:37:25 66

转载 整了9种最常用的数据分析方法!

大家好,我是小z,也可以叫我阿粥今天给大家分享一篇关于常用数据分析方法的干货~一、关联分析关联分析,也叫作“购物篮分析”,是一种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法。关联分析目的是找到事务间的关联性,用以指导决策行为。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。关联分析在电商分析和...

2022-09-20 22:03:31 933

转载 微软真牛X,把服务器部署在海底!除了长点贝类和藻类完全没问题...

2014年微软首次提出了水下数据中心概念,当时认为这个概念有望为沿海人口提供高速云服务,并节省能源。2015年,微软在太平洋开展为期105天的部署过程中证明了水下数据中心概念是切实可行的。2018年,微软把一个数据中心沉入苏格兰北部冰冷的海底。2020年9月份,微软将沉入海底经过两年试运行的数据中心从海床上捞了回来,研究人员对其进行了评估,得出的第一个结论就是:水下数据中心的服务器故障率比传统数据...

2022-09-17 22:03:30 159

转载 机器学习基础:如何防止过拟合

作者丨Poll来源丨炼丹笔记编辑丨极市平台导读本文对几种常用的防止模型过拟合的方法进行了详细的汇总和讲解。其实正则化的本质很简单,就是对某一问题加以先验的限制或约束以达到某种特定目的的一种手段或操作。在算法中使用正则化的目的是防止模型出现过拟合。一提到正则化,很多同学可能马上会想到常用的L1范数和L2范数,在汇总之前,我们先看下LP范数是什么?LP范数范数简单可以理解为用来表征向量空间中的距...

2022-09-17 22:03:30 122

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除