数据分析与机器学习
数据分析小Y
学习BI、数据仓库、数据分析、机器学习。
毕业4年,从应届生到BI数据分析师老油条,不定期将过去自己求职积累经验和数据分析学习相关的一些笔记分享给大家,对互联网数据分析、机器学习有兴趣的朋友也可以关注我的工重号:python数据分析和机器学习,专注BI、数据分析和机器学习的学习和实践
展开
-
奥卡姆剃刀和没有免费的午餐定理
“奥卡姆剃刀”和“没有免费的午餐”是机器学习中两个很基本的原则和定理。由于名字有点怪,所以初学者可能在理解上陷入误区。本文试图用简洁易懂的方式解释这两个原则和定理,并告诉大家它们的名字是怎么来的。转载 2020-05-25 14:27:57 · 791 阅读 · 1 评论 -
python数据分析和机器学习入门,我有一些书单来推荐
想要快速入门python数据分析与机器学习,书籍是一个很好的门路,可以帮助我们系统的快速入门!下面是一些不错的书单,分享给大家,我也在拔草中,未来会把阅读笔记分享在我的公众号:python数据分析和机器学习(文章末尾有二维码,可以直接保存并扫码即可关注),可以先关注哦~~入门读物The Elements of Statistical Learning(英文第二版)The Element...原创 2020-05-07 13:04:07 · 548 阅读 · 2 评论 -
Python如何删除多余的空格与空行(有代码)
‘’’-- encoding: utf-8 --@author:YY@Time:@Desc:删除字符串多余空格及删除多余的空格与空行‘’’#方法1. 通过字符串的replace方法去掉所有的空格test = 'I love python ’test_new1 = test.replace(" ", “”)print(test_new1)#方法2. 通过字符串的 sp...原创 2020-04-29 23:53:52 · 22761 阅读 · 0 评论 -
来几道面试遇到的sql笔试题测测你的水平吧 |大数据分析师面试必备
面试遇到的sql笔试题目,共享给大家,如果是数据分析或者数据开发岗位,对sql一般都需要掌握,以下问题,最好能再hive,mysql或者oracle场景下都 实现下,熟悉巩固各个数据库的语法。1.A 和B 两张表,A中有B表的外键,B表中有A表中的外键,求A表中,B表中没有的数据行,B表中,A表没有的数据行。select * from a where not exists (select 1 ...原创 2019-06-29 10:31:44 · 1305 阅读 · 0 评论 -
费米估算题:上海有多少辆自行车?
上海有多少辆自行车?这个解法要点就是根据年龄进行用户分群。参考:共享单车的标准渗透率 2.5%自行车数量=私家自行车数量+共享单车数私家自行车是以家庭为单位的,私家自行车车数量=平均每家有自行车数量*有自行车的家庭数量 =平均每家有自行车数量*上海家庭数量*有自行车的比例 =平均每家有自行车数量*上海人口数量/平均每家人口数量*有自行...原创 2020-03-12 00:17:05 · 4494 阅读 · 1 评论 -
关于kaggle没有办法下载数据集dataset问题
关于kaggle没有办法下载数据集dataset问题问题:我试图下载房价预测数据集,没有反应,或者断开连接,提示我检查代理服务器?什么鬼?经过一番搜索,最终通过以下方法解决。。。有跟我一样的朋友可以参考我的做法。(我爱分享,分享快乐)首先打开cmd安装kaggle库。命令:pip install kaggle然后,进入到C:\User\<用户名>下,如下图所示,就是...原创 2019-06-13 11:21:34 · 12321 阅读 · 5 评论 -
EXCEL图表技巧:选择合适图表最全指南,建议收藏
数据可视化是数据分析师必备流程之一。如何将自己的分析结果更好的呈现在用户面前,然后借助图表才能把数据故事讲好。 首先,我们需要认识到,其实数据通常不外乎五种相关关系,如构成、比较、趋势、分布及联系。本图摘自数据观我们常说的图表就是图形+表格。之前网上流行一个神图,根据上述相关关系选择不同数据图表类型,给大家做个参考。这个图表虽然很全面,但是我认为真正大部分复杂的图表都可以由饼图、条形图、柱形...原创 2020-04-30 00:11:41 · 11527 阅读 · 0 评论