自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(534)
  • 收藏
  • 关注

转载 时隔500天后,对比Excel系列又一新书发布

时隔500天后,对比Excel系列的又一本新书发布,本来这本书应该早出现在大家面前了,因为最近一年工作有些忙,所以一直拖到了现在。新书就是下面这本《对比Excel,轻松学习Python报表...

2021-10-12 09:00:00 204 1

转载 新书发布:时隔一年,我的第二本书终于来了

在大家的日夜催更下,我的第二本书终于上市了。我是怎么都没想到我能写书,更是没想到我写了一本以后还能再写一本,而且第一本竟然卖成了畅销书。是多么一次有趣的经历哈。下面这本书就是今天的主角:...

2020-05-29 09:00:00 423

转载 『对比Excel,轻松学习Python数据分析』新书发布

之前在公众号提过,我写了一本书,现在这本书终于面世了,这本书就是『对比Excel,轻松学习Python数据分析』,这本书是写什么的,以及这本书怎么写的,相信大家通过书名就能了解一二,但还...

2019-02-20 20:15:45 836

原创 我的2022年度总结

今天是腊月廿七,又到了写年度总结的时候了,这是写年度总结的第七个年头,希望可以一直坚持写下去。今年是新冠疫情的第三年,疫情管控结束了,同时疫情流行也开始了。我在北京刚全面放开的时候就阳了。用了差不多一周多的时间恢复。这篇记录下我的2022。家庭今年的身份角色又多了一个———爸爸,迎来了我可爱的闺女。从最开始觉得不真实,到后来的期待,再到焦虑与躺平之间的反复横跳。不真实主要是觉得,我自己在父母眼里可...

2023-01-18 09:00:57 264

转载 您已关注公众号满1年,诚邀您免费加入网易数据分析培训营!

数据分析职场必备网易出品|名师带练|费用全免大数据时代,数据是公司最具价值的资产之一,数据分析是每个公司员工必备的基础技能之一。学好数据分析|业务决策更自信学透数据分析|升职加薪更容易010元免费领职场人必备礼包丁磊推荐数据分析学习书目100套万能可视化模板100套职场汇报PPT模板学好数据分析|业务决策更自信学透数据分析|升职加薪更容易02网易“跟练”系统学习更高效网易自研云舰教学系统,学员可...

2022-12-22 09:00:04 40

转载 这10个Excel功能,SQL也能实现!附面试原题

SQL,数据分析岗的必备技能,你可以不懂Python,R,不懂可视化,不懂机器学习。但SQL,你必须懂。要不然领导让你跑个数据来汇......,哦不,你不懂SQL都无法入职数据分析岗,更别说领导了。SQL难吗?说实话,要写好,很难很难。但要通过SQL笔试这关,并不难。相信大伙都使用过Excel,用SQL实现excel 常用操作去学,感觉会比较具体。我自身也刚入数据岗不久,本文也是为自己巩固一下SQ...

2022-12-14 09:00:58 49

转载 数据分析师8大经典问题

做数据的同学们,你们在工作中被刁难过吗?有哪些问题是经常遇到,又让人恨得咬牙切齿的呢?从之前同学们吐槽的话题里,我精选了8个高频问题,今天一起来看一下。注意!前方高能,准备好降压药~问题1:“不就是一个数吗,为啥要这么久?”这个问题很常见,大部分人并不知道“一个数”到底意味着啥,而上幼儿园第一个学的就是数数,所以让人误以为“搞一个数”和数数一样容易。想解决问题,首先得向业务宣传,数据是咋来的,丫不...

2022-11-17 09:00:07 78

转载 7张图总结:SQL 数据分析常用语句

“今天给大家分享一波SQL的基础查询语句,不管是数据分析小白还是在恶补基础知识的数据分析师,都快来学一学吧! 来源:InfoQ”本文目录:基础查询字符串\数字\日期时间聚合数据查询子查询联接\组合查询高级查询更新数据01 基础查询02 字符串\数字\日期时间03 聚合数据查询04 子查询05 联接\组合查询06 高级查询07 更新数据参考资料:《SQL Server 应用与开发范例宝典》ht...

2022-11-11 09:00:54 58

转载 互联网最值得加入的173家国企汇总

今年的就业形势,实在是严峻。社招都这样,更别说应届生。虽然有一些垃圾国企,但仍然有非常多值得考虑的国企,毕竟优质的国企很稳定,不会像互联网一样担忧年纪大被裁员的情况发生,福利又好,同事间工作不会卷来卷去,享受足额的五险一金等等。这里汇总了一些计算机专业可以加入的国企,分享给求职的小伙伴们,内容很多,先收藏再看!原文链接:https://www.zhihu.com/question/28573009...

2022-11-07 09:00:14 168

转载 实测,pandas 中使用 Merge、Join 、Concat 合并数据的效率对比!

来源:Deephub Imba编辑:Python数据科学在 Pandas 中有很多种方法可以进行DF的合并。本文将研究这些不同的方法,以及如何将它们执行速度的对比。合并DFPandas 使用 .merge() 方法来执行合并。importpandasaspd#adictionarytoconverttoadataframedata1={'identific...

2022-11-04 09:00:01 130

转载 SQL 优化 20 连问

一、查询SQL尽量不要使用select *,而是具体字段1、反例SELECT*FROMuser2、正例SELECTid,username,telFROMuser3、理由节省资源、减少网络开销。可能用到覆盖索引,减少回表,提高查询效率。注意:为节省时间,下面的样例字段都用*代替了。二、避免在where子句中使用 or 来连接条件1、反例SELECT*FROMuserWHEREi...

2022-11-03 09:00:04 76

转载 Python 办公自动化,全网最全干货来了!

几个表格又让我复制粘贴了一下午,几个 Word 文档又让我合并了好几个小时,几个PPT又让我复制粘贴到 Word 中............为什么会有这么多的体力活呢?怎么才能真正摆脱复制粘贴式的工作,提高办公自动化快人一步呢?我会高举它给你提一个醒---不妨换一种办公自动化的工作方式,从眼下的困顿中抽身。入手该书即可获得作者微信,作者手把手指导。02六大主题,专治复制粘贴全书共17章,分为6个部...

2022-11-01 09:00:19 273

转载 Python 3.11 终于发布了,性能大提升!

2020 年 1 月 1 日,Python 官方结束了对 Python 2 的维护,这意味着 Python 2 已完全退休,进入了 Python 3 时代。打从进入 3 版本以来,Python 官方已经发布了众多修改分支,现在来到了最新的版本 Python 3.11。其实研究界有个不公开的秘密,那就是 Python 运行速度并不快但容易上手,因此使用人数超级多,在众多最受欢迎语言榜单中 Pytho...

2022-10-27 09:00:56 134

转载 一图胜千言!数据可视化多维讲解(1-6维)

作者丨Dipanjan来源丨机器之心数据聚合、汇总和可视化是支撑数据分析领域的三大支柱。长久以来,数据可视化都是一个强有力的工具,被业界广泛使用,却受限于 2 维。在本文中,作者将探索一些有效的多维数据可视化策略(范围从 1 维到 6 维)。一、可视化介绍描述性分析(descriptive analytics)是任何分析生命周期的数据科学项目或特定研究的核心组成部分之一。数据聚合(aggregat...

2022-10-25 09:00:37 160

转载 都说计算机今年炸了,没想到是这么炸的:年薪40w以下都不去

来源:数据分析不是个事儿每日一闻都说计算机今年炸了,究竟炸到什么程度呢?我真的想说不要恶意卖惨了,年薪40万以下就不愿意去,你有没有想过,大环境就是这样,只是计算机往年泡沫更多,今年给的没那么多了,就一口一个失业,无语了。你们以为的炸了:找不到工作,急死了,没钱吃饭,好不容易找了份工作,连房租生活费都cover不住。他们的炸了:年薪四十万都不到,还想招劳资?鬼才给你干。还是有很多人拿到的offer...

2022-10-21 09:00:03 65

转载 好看的数据可视化图片是怎样做的?

好看的数据可视化图片是怎么样做的?这里我将介绍如下几个知识点,相信掌握如下数据可视化技巧和知识,一定可以让你的图表焕然一新,令人眼前一亮~图表制作规范:图表选取,突出显示重点数据,消除图表杂乱;图表制作技巧:借助Excel+PowerBI多种可视化工具绘制精美的图表;图表学习资源:多种素材网站,不断学习数据可视化的技巧和方法。通过细致地学习,你也可以创建一个诸如下面一样的大屏看板,且这种看板可以做...

2022-10-19 09:00:58 140

转载 Python 的一些日常高频写法总结!

(点击上方快速关注并设置为星标,一起学Python)来源:https://github.com/jackzhenguo/python-small-example今天给大家准备了60个python日常高频写法,如果觉得有用,那就点赞收藏起来吧~一、 数字1 求绝对值绝对值或复数的模In [1]: abs(-6)Out[1]: 62 进制转化十进制转换为二进制:In [2]: bin(10)Out...

2022-10-18 09:00:30 57

转载 面试通过,背调凉了?

本文共990字,建议阅读3分钟来源:网络转自:大数据梦想家今天跟大家分享关于职场背调的那些事儿背调,可以很精准的检验应聘者简历中所写和所讲的是否属实,已经成为招聘企业检验员工是否合格的重要手段之一,也是应聘者在面试过程中十分反感的一点。我们经常会看到有人在网络上吐槽自己因为背调错失了高薪offer,而企业也会因为背调感到头疼。因为面试者能力很强,但是却在背调中发现有作假情况,这样到底应不应该发of...

2022-10-14 09:00:18 61

转载 移动通信客户价值数据挖掘分析实战

本实战案共分为五个部分:商业背景、指标设计、部署环境、数据准备、回归分析,其中回归分析包括:模型构建、模型诊断、模型结果、模型应用。©️数据STUDIO投稿·作者|玄武1.商业背景众所周知,移动通信市场已经日趋饱和,增加规模已经变得异常艰难,通信运营商互挖墙角已经成为家常便事。很多消费者,今天还是中国移动的客户,明天只要中国电信给点好处,就变成中国电信的客户,后天一看中国联通推出打折促销活动,...

2022-10-12 09:00:15 606

转载 70个数据分析工具,值得收藏!

今天给大家分享的这篇文章,更像是一份数据分析常用网站字典,一共70个,可视化、词频词云、PPT模板等等面面俱到,值得收藏!一、数据可视化工具百度EChartshttp://echarts.baidu.com/Cytoscapehttp://www.cytoscape.org/图表秀http://www.tubiaoxiu.com/数据观http://shujuguan.cn/微博足迹可视化http...

2022-10-11 09:00:36 83

转载 美化Matplotlib的3个小技巧

Matplotlib是Python的数据可视化库的基础。它是其他可视化工具(如Seaborn)的基础。Matplotlib提供了很大的灵活性,因此您可以自定义或调整几乎所有的图表。但是想要完全控制可视化就需要编写更多的代码。在本文中,我们将介绍3个可以用于定制Matplotlib图表的技巧:减少x轴或y轴上的刻度数添加一个辅助y轴共享x轴的子图坐标对齐本文中我们将使用折线图为例,但这些技巧也可以应...

2022-10-09 09:00:02 67

转载 统计学常犯错误TOP榜,避坑防雷指南!

来源:知乎 良好研究方法 作者:求知鸟 pythonic生物人本文约2400字,建议阅读5分钟本文为你总结统计学常犯错误。1. 变量之间关系可以分为两类:函数关系:反映了事务之间某种确定性关系相关关系:两个变量之间存在某种依存关系,但二者并不是一一对应的;反映了事务间不完全确定关系;2. 为什么要对相关系数进行显著性检验?实际上完全没有关系的变量,在利用样本数据进行计算时也可能得到一个较大的相...

2022-09-27 09:00:06 66

转载 终于有人把指标设计方法讲明白了——抽象、加工、限定...

“ 归纳、沉淀指标设计的方法”一、为什么要设计指标?因为我们知道的太少。不仅是Jon Snow,“我们真的知道的,比我们认为自己知道的,知道的少。”是一个对于大多数人而言都普遍存在的现象。图1:牵强附会加张 图而设计指标的目的就在于:让我们了解更多。具体而言,通过指标数值,可以在可接受的成本下,传递足够多的信息。设想一下:中年危机老贾去医院体检,咨询身体状况如何;医生说:“还行。有点问题。问题不...

2022-09-26 09:00:55 108

转载 历时两年,Datawhale开源项目“熊猫书”重磅出版!

“告别痛苦,快乐学习pandas”是Datawhale社区和耿远昊发起“Joyful pandas”开源项目的初衷。历经两年的精心打磨,它终于要以熊猫书《pandas数据处理与分析》新面貌与大家见面啦。▲ 点击图片购书5折本书作者耿远昊正在威斯康星大学麦迪逊分校统计学攻读硕士学位。他是Datawhale开源社区成员,“Joyful Pandas”开源项目作者。他也是pandas贡献者,活跃于pan...

2022-09-24 09:00:19 49

转载 如何向5岁小孩解释什么是支持向量机(SVM)?

编辑:王萌(深度学习冲鸭公众号)著作权归作者所有,本文仅作学术分享,若侵权,请联系后台删文处理今天和大家分享一个入门级分类方法的讲解吧!什么是SVM?关于什么是SVM这个事情,就要必须要说一说刘强西救爱人的故事:在很久以前的情人节,魔鬼抢走了刘强西的爱人,旅馆老板刘强西便发誓要救他的爱人。来到魔鬼的城堡前,魔鬼和他玩了一个游戏,只要他通过了就放走他的爱人。魔鬼在桌子上似乎有规律放了两种颜色的球,说...

2022-09-24 09:00:19 47

转载 SQL养成这8个好习惯是一笔财富

来 源:数据前线不管是做数据开发还是数据分析,大部分人都离不开跟数据库打交道。如果数据量大,人员流动大,那么我么还能保证下一段时间系统还能流畅的运行吗?我么还能保证下一个人能看懂我么的存储过程吗?那么今天,我们结合平时个人工作经验和大家分享一下,希望对大家有帮助。要知道SQL语句,我想我们有必要知道SQLserver查询分析器怎么执行SQL语句的,我么很多人会看执行计划,或者用profile来监...

2022-09-23 09:00:26 25

转载 再见,VLOOKUP!66个经典Excel数据分析、可视化神技汇总,付费搞来的,一会儿删...

大数据时代,学好Excel的重要性不言而喻!筛选、汇总、分类、透视图表等数据处理,vlookup、sumifs、index这些函数公式应用,数据分析、可视化图表都能提高工作效率,获得领导赏识!今天隆重为大家介绍Excel数据实战训练营,几乎涵盖所有岗位工作情境,以实际问题为出发点。1天直播+3关AI闯关互动课堂+超实用Excel技巧+综合应用场景实战+110份常用Excel干货,培养你科学规范的制...

2022-09-22 09:00:05 169

转载 python 的 tuple(元组) 是不是冗余设计?

有人问,python 的 tuple(元组) 是不是冗余设计?因为它和list(列表)很像。先抛观点,tuple不是冗余设计,它最大的特点是「不可变」,在Python程序设计中非常重要。tuple与list区别tuple中文翻译成元组,它和list(列表)像是一对兄弟,两者都是容器,很多用途、方法都一致,主要的区别是list可变,tuple不可变,tuple更轻量。差异如下:ListTuple可变...

2022-09-21 09:00:59 45

转载 9种最常用数据分析方法,解决90%分析难题

分享九个数据分析的方法。”一、关联分析关联分析,也叫作“购物篮分析”,是一种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法。关联分析目的是找到事务间的关联性,用以指导决策行为。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。关联分析在电商分析和零售分析中应用相当广泛。关联分析需要考虑的常见指标:...

2022-09-20 09:00:33 522

转载 精选 | 认清纷繁世界的 10 大数据法则

今天我用数据分析思维来深度解读《拼凑真相》这本书,副标题是:认清纷繁世界的 10 大数据法则,作者是英国的蒂姆·哈福德。 在目不暇接的数据海洋中,如何看清纷繁世界的真相?我们不妨运用数据分析的 9 种思维,来学习书中介绍的 10 大数据法则(顺序有调整),以便提升洞察事物本质的能力。 理解现状 1.目标思维数据分析的目标,是为了能够更好地理解和应用数据,从数据中挖掘出可靠的信息,学...

2022-09-08 09:00:52 62

转载 详解Python当中的pip常用命令!

来源丨网络相信对于大多数熟悉Python的人来说,一定都听说并且使用过pip这个工具,但是对它的了解可能还不一定是非常的透彻,今天小编就来为大家介绍10个使用pip的小技巧,相信对大家以后管理和使用Python当中的标准库会有帮助。安装当然在Python 3.4版本之后以及Python 2.7.9版本之后,官网的安装包当中就已经自带了pip,用户直接在安装完Python之后就可以直接使用,要是使用...

2022-09-07 09:00:33 59

转载 如何解决抽样调查过程中所面临的难点和问题?——以政治学研究为例

论文| 量化研究方法政治学抽样调查面临概念抽象、复杂,难以测量,理论假设中的关系结构复杂,不得不较多依赖面访式概率抽样调查的难点。受这些难点所限,一些调查中发生了概念不清、社会期许偏差、评价参照系偏差、覆盖偏差、无回答偏差,以及抽样成本高昂和无应答率居高不下等问题。针对这些难点和问题,学者们利用列举实验法、随机化回答技术、虚拟情境锚定法来解决社会期许偏差和评价参照系偏差问题;利用地址抽样来解决覆盖...

2022-09-06 09:00:44 432

转载 搞定高质量数据可视化的20条建议

如今,商业领域的决策越来越重视数据驱动,数据可视化已经是当今的潮流。高质量的数据可视化能帮助人们更好地解读数据的意义,发掘数据背后的价值。但是我们发现,实践中很多图表并不容易让人理解,甚至会产生误导。因此本文列出如下20条优化建议,希望能够帮助你实现更好的数据可视化。01选择正确的图表类型如果选择了错误的图表类型,或只是默认使用最常见的图表类型,可能会使用户感到困惑,或对数据的意义产生误解。一个数...

2022-09-05 09:00:41 62

转载 数据分析进阶:如何利用机器学习做商业数据分析

数据分析,曾经是一个特定岗位,现在也可以说是一种通用能力。无论你业务岗,还是技术岗,都得会点儿。求职时,你会发现,什么职位都会要求你具备数据分析能力。而具备数据分析能力的你,可以在面试过程中自我展示,也会大幅增加你的职场竞争力。而机器学习,则是人工智能时代的另一种硬核能力。与数据分析相比,机器学习则似乎显得更加高大上一些,似乎需要更多的数学知识和技术编码能力,学起来有点令人望而生畏。随便找一张机器...

2022-09-04 09:00:04 337

转载 万字总结,行业分析到底应该怎么做!

今天给大家分享一篇关于行业研究的干货,从行研基本内容、数据来源、分析框架到常见误区,总结的非常系统,值得一看~一、行业研究的基本内容1、行业研究的目的咨询、研究机构、券商/投行以及企业都会做行业研究。很多新手分析师在拿到一个新的行业后,往往第一反应都是一脸懵逼。面对陌生的行业,不知道如何切入。其实,切入的关键并不在于了解行业,而是要了解行业研究的目的。咨询公司的行业研究报告一般都目的很明确,无非是...

2022-09-03 09:00:21 380

转载 数据分析最常用的36个Excel函数

大家好,今天给大家分享Excel函数~Excel是我们从事数据分析的朋友们,会经常用到的最基本的工具。而Excel函数又是Excel中最为重要的、最为常用的知识点,我们必须要掌握。基于此,今天就分类为大家讲述最为常用的Excel函数。01逻辑函数1、and2、or3、if当使用了if()函数进行多层嵌套,很容易写错,那么怎么规避这个问题呢?02字符串函数4、left5、right6、mid7、le...

2022-08-30 09:00:39 406

转载 NumPy, SciPy, Pandas 相关性计算及可视化

相关性系数 数量化了一个数据集的变量或特征之间的关联。这些统计数据对科学和技术具有高度的重要性,Python有很好的工具,诸如SciPy、NumPy和Pandas,都可以用来计算,并且它们的相关方法是快速、全面和有据可查的。在本文中,云朵君将和大家一起学习:什么是皮尔逊、斯佩尔曼和肯德尔相关性系数如何使用SciPy、NumPy和Pandas的相关性函数如何用Matplotlib实现数据、回归线和相...

2022-08-29 09:00:52 299

转载 30个数据科学工作中必备的Python包!

来源丨数据STUDIO在本文中,云朵君将介绍一些非常独特的并且好用的 Python 包,它们可以在许多方面帮助你构建数据的工作流。Python 可以说是最容易入门的编程语言,在numpy,scipy等基础包的帮助下,对于数据的处理和机器学习来说Python可以说是目前最好的语言,在各位大佬和热心贡献者的帮助下Python拥有一个庞大的社区支持技术发展,开发两个各种 Python 包来帮助数据人员的...

2022-08-26 09:00:23 168

转载 超强图解 Pandas 18 招!

Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。sort_values(dogs[dogs['size']=='medium'].sort_values('type').groupby('type').median())执行步骤:size列筛选出部分行然后将行的类型进行转换按照type列进行分组,计算中位数sel...

2022-08-25 09:00:41 48

转载 包邮再送500份!我们自制了一张【数据分析知识鼠标垫】,抓紧领取

之前,我们自制了一款《数据分析全栈知识鼠标垫》,做了500张送给粉丝,很快就抢没了,获得了不错的反馈,来看看大家的晒图:感谢粉丝们的口口相传,这张鼠标垫现在也算小有名气了,现在还经常有读者来问什么时候还有?能不能购买?架不住大家的热情,我们决定,再做500张送给各位,包邮到家,并且只送不卖!(等不及的朋友可以直接拉到文末领取)这张鼠标垫足有90cm*40cm*3mm大小,既是桌垫也是一张超大的鼠标...

2022-08-24 17:20:09 50

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除