神级-数据-科学-ML-全栈

 

路线图分为 16 个部分

持续时间:256 小时学习时间(8 个月)以及更多时间用于练习和项目构建。‌‌

第 1 个月 - 5 月

  1. Python 编程和逻辑构建
  2. 数据‌结构‌&‌算法‌

第 2 个月 - 6 月

  1. 熊猫 Numpy Matplotlib
  2. 统计数据

第 3 个月 - 7 月

  1. 机器学习
  2. 机器学习操作

第 4 个月 - 8 月

  1. 自然语言处理
  2. 计算机视觉

第 5 个月 - 9 月

  1. 使用 Tableau 进行数据可视化
  2. 结构‌d‌查询‌‌语言‌(SQL)‌

第 6 个月 - 10 月

  1. 数据工程
  2. 数据系统设计

第 7 个月 - 11 月

  1. 五个“主要”顶点项目
  2. 面试准备

第 8 个月 - 12 月

  1. Git 与 GitHub
  2. 个人品牌和投资组合

资源

技术栈

  • Python
  • 数据结构
  • NumPy‌
  • 熊猫‌‌
  • Matplotlib‌
  • Seaborn‌‌
  • Scikit-学习‌
  • 统计模型‌
  • 自然 ‌语言 ‌工具包(‌ ‌NLTK‌ ‌)‌
  • PyTorch‌
  • OpenCV‌
  • 画面
  • 结构‌‌查询‌‌语言‌‌(‌‌SQL‌‌)‌
  • PySpark‌
  • Azure 基础知识
  • Azure 数据工厂
  • 数据块
  • 5个“重大”项目
  • Git 和 GitHub

1 | Python编程和逻辑构建

我会更喜欢 Python 编程语言。Python 是开始您的编程之旅的最佳选择。这是python用于逻辑构建的路线图。

  • Python 基础、变量、运算符、条件语句
  • 列表和字符串
  • While 循环、嵌套循环、Else 循环
  • For 循环、中断和继续语句
  • 函数、返回语句、递归
  • 字典、元组、集合
  • 文件处理、异常处理
  • 面向对象编程
  • 模块和包

Python 深度路线图

2 | 数据结构与算法

数据结构不仅对数据科学家而且对所有从事计算机科学工作的人来说都是最重要的学习内容。通过数据结构,您可以深入了解软件中一切的工作原理。

了解这些主题

  • 算法分析的类型
  • 渐近符号、Big-O、Omega、Theta
  • 堆栈
  • 队列
  • 链表
  • 树木
  • 图表
  • 排序
  • 搜索中
  • 哈希

3 | 熊猫 Numpy Matplotlib

Python 通过 Numpy 支持 n 维数组。对于二维数据,Pandas 是最好的分析库。您可以使用其他工具,但工具具有拖放功能并且有限制。Pandas 可以根据需要进行定制,因为我们可以根据现实生活中的问题进行编码。

麻木的

  • 向量、矩阵
  • 矩阵运算
  • 均值、方差和标准差
  • 重塑数组
  • 矩阵的转置和行列式
  • 对角线操作,跟踪
  • 加、减、乘、点和叉积。

熊猫

  • 系列和数据框
  • 切片、行和列
  • DataFrame 上的操作
  • 创建 DataFrame 的不同方法
  • CSV 文件的读、写操作
  • 处理缺失值、替换值和正则表达式
  • GroupBy 和串联

Matplotlib

  • 图基础知识
  • 格式化图中的字符串
  • 标签参数,图例
  • 条形图、饼图、直方图、散点图

4 | 统计数据

描述性统计

  • 频率和集中趋势的度量
  • 色散测量
  • 概率分布
  • 高斯正态分布
  • 偏度和峰态
  • 回归分析
  • 连续和离散函数
  • 拟合优度
  • 正态性检验
  • 方差分析
  • 同方差性
  • 与回归的线性和非线性关系

推论统计

  • t检验
  • z检验
  • 假设检验
  • 第一类和第二类错误
  • t检验及其类型
  • 一种方差分析
  • 双向方差分析
  • 卡方检验
  • 连续和分类数据的实现

5 | 机器学习

掌握机器学习算法的最佳方法是使用 Scikit-Learn 框架。Scikit-Learn 包含预定义的算法,您只需生成类的对象即可使用它们。这些是您必须了解的算法,包括监督和无监督机器学习的类型:

  • 线性回归
  • 逻辑回归
  • 决策树
  • 梯度下降
  • 随机森林
  • 岭和套索回归
  • 朴素贝叶斯
  • 支持向量机
  • K均值聚类

机器学习的其他概念和主题

  • 测量精度
  • 偏差方差权衡
  • 应用正则化
  • 弹性网络回归
  • 预测分析
  • 探索性数据分析

6 | MLOps

您可以掌握来自 AWS、GCP 和 Azure 的任何一家云服务提供商。了解其中之一后,您可以轻松切换。

我们将首先关注 AWS - Amazon Web Services

  • 使用 Flask 部署 ML 模型
  • Amazon Lex - 自然语言理解
  • AWS Polly - 语音分析
  • Amazon Transcribe - 语音转文本
  • Amazon Textract - 提取文本
  • Amazon Rekognition - 图像应用程序
  • Amazon SageMaker - 构建和部署模型
  • 在 AWS 上使用深度学习

7 | 自然语言处理

如果您对使用文本感兴趣,您应该做一些 NLP 工程师所做的工作,并了解语言模型的工作原理。

  • 情绪分析
  • 词性标记、解析、
  • 文本预处理
  • 词干和词形还原
  • 使用朴素贝叶斯的情感分类
  • TF-IDF,N-gram,
  • 机器翻译,BLEU 分数
  • 文本生成、摘要、ROUGE 分数
  • 语言建模,困惑
  • 构建文本分类器
  • 识别性别

8 | 计算机视觉

要进行图像和视频分析,我们可以掌握计算机视觉。要从事计算机视觉工作,我们必须理解图像。

  • PyTorch 张量
  • 了解预训练模型,如 AlexNet、ImageNet、ResNet。
  • 神经网络
  • 建立一个感知器
  • 构建单层神经网络
  • 构建深度神经网络
  • 用于顺序数据分析的递归神经网络

卷积神经网络

  • 了解 ConvNet 拓扑
  • 卷积层
  • 池化层
  • 图片内容分析
  • 使用 OpenCV-Python 对图像进行操作
  • 检测边缘
  • 直方图均衡化
  • 检测角点
  • 检测SIFT特征点

9 | 使用 Tableau 进行数据可视化

如何使用视觉感知

  • 它是什么,它是如何工作的,为什么选择 Tableau
  • 连接到数据
  • 建筑图表
  • 计算
  • 仪表板
  • 分享我们的工作
  • 高级图表、计算字段、计算聚合
  • 条件计算,参数化计算

10 | 结构化查询语言 (SQL)

  • SQL语法和安装基础
  • 创建表、修改器
  • 插入和检索数据,SELECT INSERT UPDATE DELETE
  • 使用函数、过滤和 RegEX 聚合数据
  • 子查询,根据条件检索数据,数据分组。
  • 练习题
  • 连接
  • 高级 SQL 概念,例如事务、视图、存储过程和函数。
  • 数据库设计原则、规范化和 ER 图。
  • 练习、练习、再练习:练习在真实世界的数据集上编写 SQL 查询,并在项目中应用您的知识。

11 | 数据工程

大数据

  • 什么是大数据?
  • 大数据如何在业务中应用?

派斯帕克

  • 弹性分布式数据集
  • 图式
  • 拉姆达表达式
  • 转换
  • 动作

数据建模

  • 重复数据
  • 数据描述性分析
  • 可视化
  • 机器学习库
  • 机器学习包
  • 流水线

串流

  • 打包 Spark 应用程序

12 | 数据系统设计

什么是系统设计?

  • IP 和 OSI 模型
  • 域名系统 (DNS)
  • 负载均衡
  • 聚类
  • 缓存
  • 可用性、可扩展性、存储

数据库和数据库管理系统

  • SQL数据库
  • NoSQL 数据库
  • SQL 与 NoSQL 数据库
  • 数据库复制
  • 索引
  • 规范化和反规范化
  • CAP定理

系统设计面试

  • 网址缩短器
  • Whatsapp、推特、Netflix、优步

13 | 五大项目与Git

我们遵循基于项目的学习,我们将并行处理所有项目。

14 | 面试准备

15 | Git 与 GitHub

Git 和 GitHub 课程

  • 了解 Git
  • 命令和如何提交你的第一个代码?
  • 如何使用 GitHub?
  • 如何做出您的第一个开源贡献?
  • 如何与团队合作?- 第1部分
  • 如何创建令人惊叹的 GitHub 个人资料?
  • 如何建立自己的病毒库?
  • 免费为您的投资组合构建个人登陆页面
  • 如何在 GitHub 上增加粉丝?
  • 如何与团队合作?第 2 部分 - 问题、里程碑和项目

16 | 个人资料和投资组合

资源

数据集

1️⃣ 很棒的公共数据集 这个以主题为中心的高质量公共数据源列表。

2️⃣NLP 数据集 按字母顺序排列的免费/公共领域数据集列表,其中包含用于 NLP 的文本数据。

3️⃣很棒的数据集工具 精选的很棒的数据集工具列表。

4️⃣很棒的时间序列数据库 时间序列数据库的精选列表。

5️⃣Awesome-Cyber​​security-Datasets 精选的令人惊叹的网络安全数据集列表。

6️⃣Awesome Robotics Datasets 机器人数据集集合。

研究起点

机器学习

  1. 统计学习简介

深度学习

强化学习

项目

这是项目想法的列表

Data Science ML Full Stack Live Batch ->在这里注册

想加入 Live Batch 社区组吗?

https://chat.whatsapp.com/BSUPbYhzzM1BcJplcTTIxb

社交

加入 Telegram for Data Science ML AI 资源:

https://t.me/+sREuRiFssMo4YWJl

在这些平台上与我联系:

领英: https: //www.linkedin.com/in/hemansnation/

YouTube: https: //www.youtube.com/@Himanshu-Ramchandani

推特:https: //twitter.com/hemansnation

GitHub: hemansnation (Himanshu Ramchandani) · GitHub

Instagram: https: //www.instagram.com/masterdexter.ai/

AI 工作 LinkedIn 组:

Login | InCareer

中型博客:

https://medium.com/@hemansnation

关于数据、产品和 AI 的注释 - 时事通讯:

Login | InCareer

任何查询?

在这里给我发电子邮件:connect@himanshuramchandani.co

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值