自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(207)
  • 收藏
  • 关注

原创 我 2019 年最喜欢的 5 个数据科学资源

数据科学学习资源推荐:五款网站助你提升技能本文作者推荐了五个在线资源,帮助数据科学家学习新知识和了解行业动态,并强调这些资源注重实践学习。第五名:YouTube作者推荐利用 YouTube 获取对概念的初步理解,并推荐 Siraj Reval 的频道,其内容能够清晰地解释复杂的数据科学主题。第四名:MediumMedium 是一个新闻网站,优秀文章会通过点赞获得收益。该平台拥有大量高质量...

2024-08-20 15:27:22 182

原创 数据科学家 VS NFT 骗局

NFT 赠送:OpenSea 平台上的暗黑交易NFT 在 2021 年大放异彩,OpenSea 平台上的交易额突破 140 亿美元。 然而,NFT 热潮也伴随着大量诈骗、操纵价格和不道德行为。名人纷纷加入 NFT 领域,为项目背书,甚至不公开披露自己的利益关系。本文揭露了 NFT 项目利用 OpenSea 平台赠送 NFT 的暗黑手法。 由于 OpenSea 平台缺乏透明度,无法区分 NFT ...

2024-08-20 15:26:50 134

原创 精通数据科学所需的数学知识

这段文字主要介绍了数据科学领域需要掌握的数学基础知识。作者认为,数据科学的核心数学基础是统计学,包括概率论、描述性统计、假设检验和推断统计以及线性回归等。概率论帮助理解分布和随机性,是算法和结果解释的基础;描述性统计则帮助理解集中趋势和相关性,以便确定影响结果的关键特征;假设检验和推断统计帮助提出问题并确定发现的意义;线性回归则是数据科学中常见的主题。除了统计学,作者还强调了离散数学的重要性。离...

2024-08-20 15:18:18 209

原创 如何在 FAANG 公司获得数据科学职位(@Data Science Jay) - KNN 第 3 集

这段文字主要介绍了在科技巨头公司(Fang:Facebook、Amazon、Netflix 和 Google)和湾区初创公司进行数据科学面试的差异。作者邀请了数据科学领域的博主Data Science Jay来分享经验。Jay在湾区初创公司工作过,也创办了Interview Query公司,专门提供科技公司面试问题资源,并帮助求职者进行模拟面试。Jay指出,与其他地区相比,湾区科技公司和初创公...

2024-08-20 15:16:40 133

原创 使用 Twitterscraper 模块在 Python 中抓取 Twitter 数据

这段文字介绍了如何使用Twitter Scraper库从推特抓取数据。作者首先介绍了该库的安装方式,然后演示了如何在Jupyter Notebook中使用该库抓取数据。具体步骤如下:安装Twitter Scraper库: 使用pip install Twitter Scraper命令安装该库。导入相关库: 导入query_tweets函数、datetime库和pandas库。设置参数:...

2024-08-20 15:16:08 105

原创 为什么你还没有获得数据工作...

数据科学求职攻略:避开误区,提升成功率本文分析了数据科学领域求职者难以找到工作的原因,并提供了提升求职成功的建议。现状: 虽然数据科学岗位需求不断增长,但求职竞争激烈。原因:岗位类型差异: 数据科学家岗位竞争激烈,而数据分析师岗位相对较多,更容易获得入职机会。供需失衡: 数据工程师岗位需求高,但人才供给不足,薪资水平甚至超过数据科学家。求职者误区: 盲目追求热门岗位,忽视自身技能和经...

2024-08-20 15:15:04 279

原创 你应该做的项目,以获得数据科学工作

数据科学项目建议:学习与职业发展视频作者搬了新家,并分享了关于数据科学项目的选择建议。视频分为三个部分:第一部分:数据科学项目必备要素数据收集: 从Kaggle、网站或其他在线资源获取数据,或自行收集数据。描述性分析: 进行数据探索,进行数据清洗,并根据描述性统计结果判断变量之间的相关性,为模型构建提供参考。数据清洗: 处理缺失值,例如将其替换为平均值或删除包含大量缺失值的列。特征工...

2024-08-20 15:13:22 130

原创 使用这 3 种技巧寻找数据科学项目

寻找数据科学项目:从问题出发,找到灵感视频作者认为,发现有趣的数据科学项目是一项技能,可以不断提升。他拒绝直接提供项目想法,而是强调通过找到问题来激发项目灵感的重要性。他分享了三种方法:1. 日常问题: 思考生活中遇到的问题,数据是否可以帮助解决或理解这些问题?例如,我们每天使用许多应用程序,收集了大量数据,我们是否应该有权分析这些数据?2. 思考练习: 每天花时间思考并写下10个商业想法,...

2024-08-20 15:10:13 261

原创 数据科学基础:Python 中的数据操作(Pandas)

视频摘要:Pandas 数据操作本视频是数据探索系列的第二部分,主要讲解如何使用 Pandas 库进行数据操作。视频内容:回顾前一视频: 讲解了基本的数据探索函数和方法,所有代码都可以在作者的 Github 上找到。数据源: 来自 Kaggle 的 Craigslist 汽车价格数据集。环境设置: 演示了如何设置工作目录并保存代码文件。导入 Pandas: 介绍如何导入 Pa...

2024-08-20 15:09:37 161

原创 如果我能重新开始,我会如何用人工智能学习数据科学

AI 时代的数据科学:机遇与挑战本文作者针对 AI 工具 (如 ChatGPT 和 GPT4) 对教育和技术技能学习的影响,探讨了数据科学在未来是否依然重要,以及如何利用新技术学习数据科学。作者认为,虽然 AI 的发展可能改变数据科学工作的方式,但数据科学的知识和技能仍然至关重要。他指出,未来企业需要具备数据科学背景的人才来管理和监督 AI 系统,即使 AI 能够完成部分数据分析工作。作者还...

2024-08-20 15:07:55 146

原创 如果我需要重新开始,我会如何在 2022 年学习数据科学

数据科学学习的“零起点”:不要试图学完,而是要循序渐进这篇文章主要讲述了作者对数据科学学习方法的重新思考,并强调了循序渐进、目标明确的重要性。作者认为,数据科学是一个不断发展的领域,不可能学完所有内容。尝试学习整个领域会让人感到困惑和疲惫,而制定明确的学习计划,并设定小目标,则能使学习过程更加轻松和有效。作者建议在开始学习数据科学之前,首先要了解该领域的组成部分,并制定个人学习计划。这就像在海...

2024-08-20 15:07:24 208

原创 数据工作市场严酷的现实

数据科学就业市场现状:挑战与机遇并存本文作者以自身经历和数据分析,探讨了当前数据科学就业市场的现状。作者在过去一年中申请了近300个职位,面试了10个,但至今未收到任何offer。他发现,不仅自己面临困境,许多初学者和经验丰富的专业人士都在努力寻找数据科学相关的工作。作者通过分析Interview Query博客和Luke Barus的数据,发现数据科学就业市场存在以下趋势:大公司招聘减少...

2024-08-20 15:00:55 237

原创 数据科学项目示例从头到尾(深度学习图像分类器)

这段文字主要讲述了作者用深度学习进行体育球类分类的项目经验。作者认为,数据科学项目并不需要太过复杂,只需要将现有的方法应用到新的数据上,并进行一些微调即可。他使用fast AI库构建了一个体育球类分类器,并利用Google的虚拟环境,省去了配置GPU等繁琐步骤。整个项目花费了约两个小时,其中大部分时间用于数据整理和清洗。作者还强调了项目的多样性,并指出项目可以帮助人们了解不同运动的规则、著名运动员...

2024-08-20 14:59:49 141

原创 为什么数据工程现在如此火热?

数据工程的崛起:从数据科学的“后遗症”到未来的关键本文探讨了数据工程领域近年来的快速发展,并分析了其背后的原因。文章指出,数据工程在数据科学领域中扮演着至关重要的上游角色,为数据分析、数据科学和机器学习工程师提供数据基础设施。数据科学的兴起最初源于科技巨头利用其带来的巨大经济效益,但许多非科技公司在跟风引入数据科学时却忽视了数据基础设施的重要性。这导致许多公司雇佣的数据科学家实际从事着数据工程...

2024-08-20 14:59:17 241

原创 她如何征服 FAANG 数据科学面试 (@TinaHuang1 ) - KNN 第 11 集

本段文字讲述了Tina Huang从药学背景转行到数据科学领域的故事,并分享了她成功应聘到一家大型科技公司(Fang 公司)的经验。Tina 在面试过程中展现了独特的策略,她利用自身优势,在面试中争取到了数据科学的职位,而不是软件工程职位。她强调了在大型公司,数据科学和软件工程之间的界限并不清晰,她也鼓励大家在面试中大胆表达自己的兴趣。此外,这段文字还介绍了“66 Days of Data Ch...

2024-08-20 14:57:09 180

原创 数据科学中的剽窃问题

数据科学领域的剽窃问题:避免抄袭的指南作者最近发现自己的作品被剽窃,并与其他数据科学创作者交流后发现,类似问题并不罕见。作者起初非常愤怒,但冷静下来后,反思了整个事件,并联系了剽窃者。令作者惊讶的是,剽窃者并不知道自己的行为是错误的。作者认为,这不仅仅是个人使用他人作品的问题,更重要的是,数据科学领域缺乏对剽窃的明确定义。视频将重点阐述数据科学领域的剽窃问题,并提供避免剽窃的清晰指南。什么是...

2024-08-20 14:54:29 244

原创 我如何平衡数据科学和内容创作 (7个秘诀)

这篇文章主要探讨了时间管理和平衡的观念。作者认为,每天都追求完美平衡是不现实的,但可以在更长的时间范围内,例如每周或每月,找到平衡点。作者通过自己的经验,分享了几个时间管理技巧:专注于长期平衡: 作者认为,在不同的时间段内,可以专注于不同的领域,例如工作、社交、家庭等等。例如,在工作繁忙的时候,可以集中精力完成工作,而在假期的时候,可以花更多时间陪伴家人朋友。利用工作空闲时间: 作者利用工作...

2024-08-20 14:48:59 118

原创 我为什么重新开始学习数据科学。

这段文字介绍了作者重新学习数据科学的计划,并邀请观众一起参与。作者分享了三个重新学习数据科学的原因:为了克服工作中的倦怠和知识停滞,作者希望通过重新学习数据科学来提升自己。为了更好地与观众互动,作者希望通过从头学习数据科学来更好地理解初学者的心路历程。为了打造更清晰的数据科学学习路线图,作者希望通过实际操作来分享自己的学习经验。作者提倡了一种名为“66天数据挑战”的学习计划,鼓励观众每...

2024-08-20 14:47:56 161

原创 回顾你的数据科学项目 - 第七集(不可思议的投资组合网站)

摘要:这段文字主要讲述了作者Kenji对一位名为Pernab的潜在数据科学家的GitHub和个人网站进行了评价。Pernab的GitHub:Pernab的GitHub拥有大量代码仓库(超过50个),这说明他喜欢探索、动手实践和构建项目,这对于招聘经理来说是一个积极的信号。尽管GitHub上有很多代码仓库,但可能难以找到与数据科学相关的项目。Pernab的个人网站:个人网站美观且专...

2024-08-20 14:43:06 357

原创 如何构建网站 - 打造我的终极作品集网站

数据科学家个人网站的重要性:Kenneth Jay Lee 的网站建设经验分享Kenneth Jay Lee 是一位数据科学领域的知名博主和 YouTuber,他认为建立一个个人网站对于数据科学家或内容创作者至关重要。他的个人网站一直没有得到很好的发展,因此他决定使用 Wix 平台重新构建一个更完善的网站。他解释了个人网站的几个重要作用:集中展示内容: 一个个人网站可以将所有内容集中在一个...

2024-08-20 14:41:19 151

原创 我不会在2023年学习数据科学的方式。

数据科学学习的七个陷阱:别再像Ben一样迷茫!本文以Ben为例,描述了数据科学学习中常见的七个陷阱,并给出相应的建议。陷阱一:没有明确目标Ben虽然想成为数据科学家,但没有具体目标,导致他学习方向不明确,容易半途而废。作者建议明确学习目标,例如:想在谷歌工作,就研究谷歌的数据科学应用和课程,制定针对性的学习计划。陷阱二:没有学习计划即使有了目标,Ben也不能盲目学习,需要制定详细的学习计...

2024-08-20 14:40:45 199

原创 数据科学项目从哪里开始

数据科学项目:提升技能,打造简历亮点本文作者针对数据科学求职者,分享了如何利用业余时间进行数据科学项目,从而提升自身技能,并打造更具吸引力的简历。作者强调选择感兴趣的领域进行项目实践,并从数据来源、数据质量和项目类型三个方面进行详细阐述。数据来源: 作者建议从Kaggle、KD Nuggets等平台获取数据,或自行编写爬虫程序获取数据。数据质量: 作者建议优先选择已整理好的数据,减少数据清洗...

2024-08-20 14:37:01 252

原创 欢迎来到我的频道 | Ken Jee | 数据科学

该作者是一名数据科学领域的博主,致力于通过视频分享其个人经验,帮助更多人了解数据科学领域。其内容涵盖了数据科学工作内容、入行方法、提升工作效率等方面,并分享其个人项目。作者拥有商业和计算机科学双重背景,曾担任数据科学经理、管理咨询顾问和数据科学家等职位。其独特的视角将为观众提供商业和技术两方面的知识,助力观众的学习旅程。在我的频道上,我提供数据科学内容,可以使每个人更容易获得和享受这个...

2024-08-20 14:36:30 382

原创 你可能无法成为数据科学家的原因

成为数据科学家的挑战:机遇与现实这篇文章主要讨论了成为数据科学家的挑战,并给出了应对这些挑战的建议。作者坦诚地指出,数据科学是一个竞争激烈的领域,存在以下几方面挑战:1. 高门槛的教育要求: 数据科学融合了计算机科学、统计学和商业知识,需要学习大量的知识,可能需要花费数年时间才能达到雇主要求的资格。2. 激烈的竞争: 数据科学被誉为21世纪最性感的职业,导致大量求职者涌入,竞争十分激烈。...

2024-08-20 14:33:07 389

原创 预测 NBA 出场时间的最佳方法

这段文字介绍了作者进行的每日幻想篮球分析,目的是寻找最佳预测球员上场时间的指标。作者发现球员上场时间与幻想得分高度相关,并尝试通过多种方法进行预测。主要内容包括:背景介绍: 作者对每日幻想篮球和体育博彩感兴趣,并试图找到预测球员上场时间的最佳指标。数据来源: 作者使用2012年至2018年的NBA增强版盒装得分和排名数据,并提供数据访问方式。特征工程: 作者创建了几个新特征,包括球员在之...

2024-08-20 14:30:55 225

原创 为什么 API 对数据科学很重要?

数据科学家必备工具:API 的重要性这段视频深入浅出地讲解了 API 对数据科学家的重要性。视频首先通过软件开发者 Tiff 的讲解,解释了 API 的概念:API 是应用程序编程接口,它允许不同的程序相互通信,就像一个传递信息的信使,接收请求并发送响应。视频接着解释了 API 对数据科学家工作的意义:数据获取: API 是获取数据的重要途径,很多网站通过 API 提供数据访问权限,例如...

2024-08-20 14:29:19 223

原创 回顾你的数据科学项目 - 第 13 集(LinkedIn 回顾加餐)

这段文字是关于如何写简历的建议,主要针对学生群体,特别是拥有强劲GitHub 技能的学生。作者强调简历要简洁,不要超过一页,并建议将技能、教育和项目经历放在最显眼的位置。具体建议包括:简历长度: 除非你是博士生或有超过15年的工作经验,否则简历不要超过一页。个人简介: 个人简介可以省略,直接列出技能、教育和项目经历。技能: 将技能归类,例如将所有Python相关的技能归类在一起。教育...

2024-08-20 14:26:38 149

原创 回顾你的数据科学项目 - 第 19 集(一项重大改进)

这段文字主要介绍了视频博主Kenji对一位名叫Deepak的用户提交的简历、作品集和LinkedIn资料进行的点评。Kenji 对Deepak的作品集表示认可,认为它简洁明了,方便浏览。但他建议Deepak在作品集上加入一些个人信息,比如兴趣爱好、最近读过的书或今年想要学习的内容,以增加个人魅力,让雇主对他有更深的印象。Kenji 还点评了Deepak的GitHub页面,认为他将最相关的贡献置...

2024-08-20 14:25:00 165

原创 你所需要的唯一数据科学解释

数据科学:从历史到现实这段文字主要介绍了数据科学的起源、发展和现状,并解释了数据科学家所做工作的本质。1. 数据科学的历史:数据科学的概念最早可以追溯到1974年,当时计算机科学家Peter Nauer将其作为计算机科学的别名。1985年,统计学家CF Jeff Wu也在演讲中将“数据科学”作为统计学的替代名称。数据科学作为正式的职业头衔最早由LinkedIn的DJ Patil提出,他...

2024-08-20 14:23:53 217

原创 Kaggle 项目从零开始 - 第 1 部分(数据科学职业调查)

摘要:作者计划进行一个三部分的系列视频,分析2020年Kaggle开发者调查数据。这个项目旨在帮助观众了解数据科学领域现状,并以实际数据佐证相关建议。视频内容概览:第一部分: 介绍如何加入Kaggle竞赛,阅读竞赛信息,了解评估标准,使用Kaggle API获取数据,并开始初步分析其他用户的公开内核。第二部分: 进行探索性数据分析 (EDA)。第三部分: 回答第一部分中提出的问题...

2024-08-20 14:21:44 302

原创 数据科学的难题

数据科学家的职业困境:理想与现实的差距本文探讨了数据科学家在职业发展中面临的困境,即理想与现实的差距。作者指出,许多数据科学家在工作中感到不满足,因为他们期望从事尖端研究和解决复杂问题,却往往被安排到无聊且无法充分发挥技能的项目中,导致职业倦怠。作者分析了造成这种困境的两个主要原因:**企业盲目追逐数据科学:**许多公司认为需要数据科学来保持竞争力,因此招聘数据科学家,却缺乏明确的项目规划...

2024-08-20 14:16:17 165

原创 数据科学、机器学习和人工智能:有什么区别?

数据科学、机器学习和人工智能:三者关系及各自特点本文主要阐述了数据科学、机器学习和人工智能三者的定义、关系以及各自的特点。数据科学的目标是从数据中提取知识和洞察力。它融合了数学、统计学、计算机科学、信息科学等多个领域,是一个综合性的学科。数据科学的主要任务包括数据处理和评估、数据库操作、描述性统计、数据理解以及算法构建。机器学习被认为是数据科学的一个子集,专注于特定算法。这些算法主要分为监督...

2024-08-20 14:14:39 315

原创 回顾你的数据科学项目 - 第 17 集(最佳作品集网站?)

这段文字主要介绍了数据科学求职者如何打造个人品牌,并以 Alexander Kahanek 的求职案例为例,分享了如何制作个人网站、优化 LinkedIn 个人资料、展示项目等技巧。主要内容概括:强调打造个人品牌的重要性: 作者建议求职者利用个人网站、LinkedIn 个人资料、YouTube 频道、Instagram 频道、甚至发型等一切可以想到的途径来提升个人品牌,从而在竞争激烈的求职市...

2024-08-20 14:14:05 213

原创 如何获得数据科学经验(无须工作)

这篇文章主要探讨如何积累数据科学经验,即使没有相关工作。作者指出,许多人拥有数据科学技能,却缺乏实际工作经验,而这正是许多职位招聘的硬性要求。文章提出了三种方法来弥补经验不足:参与学校研究项目: 这不仅能丰富简历,还能让你接触真实的数据科学和机器学习项目,并有机会与教授合作,获得指导和推荐信。此外,研究项目可能提供报酬和学费减免等经济效益。进行个人项目: 个人项目展现了你的兴趣、主...

2024-08-20 14:11:56 142

原创 疯狂三月 - 我的机器学习模型能击败你的预测吗?

这段文字讲述了作者与朋友Bobby打赌,用机器学习模型预测NCAA男子篮球锦标赛结果,并与Bobby的预测和大众预测进行比较。作者为了完成这个目标,与朋友Andy和Jeff一起进行了一天的数据科学工作,首先定义了问题,然后分析了数据,最后构建了一个基于蒙特卡洛模拟的简单模型。这个模型通过模拟球队得分和失分来预测比赛结果,最终得到每个球队的获胜概率分布。作者还提到,这个模型可以在Kaggle平台和直...

2024-08-20 14:11:23 140

原创 第一个数据科学项目?看这个。

开始你的第一个数据科学项目:五点关键洞察本文作者认为,开始第一个数据科学项目是数据科学旅程中最重要的里程碑之一。作者鼓励大家不要害怕,即使项目并不完美,也能从中学到很多。以下是作者提供的五点关键洞察:第一个项目的唯一目标是学习。 不必担心项目是否完美或是否能得到反馈,重要的是从中获得经验。项目不必复杂或有创意。 作者以自己的第一个项目“泰坦尼克号数据集”为例,即使分析很糟糕,却学到了很多...

2024-08-20 14:09:10 275

原创 在另一个国家找到数据科学工作 (维杰·普拉文·马哈拉詹) - KNN 第 13 集

VJ Pravin Maharajan: 从电气工程到数据科学的转型之路本文是对VJ Pravin Maharajan的访谈摘要,他是一位来自印度的成功数据科学家,现居德国慕尼黑。访谈主要内容:从电气工程到数据科学的转型: VJ最初拥有电气工程硕士学位,并非数据科学专业。他通过自学的方式,利用YouTube课程、Udacity、Coursera、Udacity、LinkedIn等平台的在线...

2024-08-20 14:08:39 321

原创 七个行业的人工智能将积极颠覆

AI 的快速发展将颠覆多个行业,教育领域尤为显著本文作者首先展示了一张关于人工智能论文发表数量的图表,显示该数量呈指数级增长,每24个月翻倍,并指出这种增长趋势在 ChatGPT、GPT-4 和其他 AI 技术出现之前就已存在,表明 AI 正在以惊人的速度发展。作者认为,AI 的快速发展将对多个行业产生颠覆性影响,并列举了七个即将被 AI 改变的行业,其中教育领域尤为突出。作者指出,美国的教育...

2024-08-20 14:07:32 185

原创 现在学习数据科学的绝佳时机

这段文字主要表达了作者认为当前疫情期间是学习数据科学或其他技术技能的绝佳时机,并给出了三个理由:1. 时间充裕: 疫情期间,许多人拥有更多空闲时间,可以利用这段时间学习新技能,提升自我。作者建议学习数据科学、编程或其他技术技能,同时也提到了学习语言或乐器等其他选择。2. 远程工作趋势: 作者认为疫情可能会改变工作文化,远程工作将变得更加普遍,甚至被一些公司鼓励。数据科学家、程序员等技术岗位通常...

2024-08-20 14:06:27 245

原创 7个数据科学初学者最常犯的错误

数据科学学习的常见错误和应对方法这篇文章主要讨论了数据科学学习者常犯的错误以及如何避免这些错误。作者以自身经历和观察为例,分享了以下几点建议:1. 不要过度纠结于选择学习资源: 作者指出,数据科学学习资源众多,但质量普遍较高,不必过度追求“最佳”资源。建议尝试一些免费资源,找到适合自己的学习风格,然后开始学习。学习是累积的过程,可以从多个资源中学习,从不同角度理解知识。2. 不要只注重理论,...

2024-08-20 14:04:50 298

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除