什么是数据清洗、特征工程、数据可视化、数据挖掘与建模?

1.1什么是数据清洗、特征工程、数据可视化、数据挖掘与建模?

视频为《Python数据科学应用从入门到精通》张甜 杨维忠 清华大学出版社一书的随书赠送视频讲解1.1节内容。本书已正式出版上市,当当、京东、淘宝等平台热销中,搜索书名即可。内容涵盖数据科学应用的全流程,包括数据科学应用和Python的入门,数据清洗与特征工程,以及数据挖掘与建模、数据可视化等。

针对数据分析或机器学习推荐两本入门级的图书:《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)。这两本书的特色是在数据分析、机器学习各种算法的介绍方面通俗易懂,较少涉及数学推导,对数学基础要求相对不高,在python代码方面讲的很细致,看了以后根据自身需要选取算法、优化代码、科学调参。都有配套免费提供的源代码、数据文件和视频讲解,也有PPT、思维导图、习题等。

为什么说这两本书值得?首先说《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社),内容非常详实,包含了Python和机器学习,相当于一次获得了两本书。在讲解各类机器学习算法时,逐一详解用到的各种Python代码,针对每行代码均有恰当注释(这一点基本上是大多数书目做不到的)。这本书在出版之前曾开发成9次系列课程,在某股份制银行全行范围类开展培训,490人跟随杨维忠老师上课学习(课程限报490人),培训完成后课程在知鸟平台上回放超过3万人次。很多银行员工通过这些学习一下子就学会了Python,并且用于工作中开展数据分析、机器学习、数据可视化等,这本书也被多家商业银行选做数字化人才培训教材,成为银行员工的一本网红书。

《Python数据科学应用从入门到精通》一书,旨在教会读者实现全流程的数据分析,并且相对《Python机器学习原理与算法实现》一书增加了很多概念性、科普性的内容,进一步降低了学习难度。国务院发展研究中心创新发展研究部第二研究室主任杨超 ,山东大学经济学院金融系党支部书记、副主任、副教授、硕士生导师张博,山东管理学院信息工程学院院长 袁锋 教授、硕士生导师,山东大学经济学院刘一鸣副研究员、硕士生导师,得厚投资合伙人张伟民等一众大牛联袂推荐。书中全是干活,买这一本书相当于一下子得到了5本书(Python基础、数据清洗、特征工程、数据可视化、数据挖掘与建模),而且入门超级简单,不需要编程基础,也不需要过多数学推导,非常适用于零基础学生。全书内容共分13章。其中第1章为数据科学应用概述,第2章讲解Python的入门基础知识,第3章讲解数据清洗。第4~6章介绍特征工程,包括特征选择、特征处理、特征提取。第7章介绍数据可视化。第8~13章介绍6种数据挖掘与建模方法,分别为线性回归、Logistic回归、决策树、随机森林、神经网络、RFM分析。从数据科学应用和Python的入门,再到数据清洗与特征工程,最终完成数据挖掘与建模或数据可视化,从而可以为读者提供“从拿到数据开始,一直到构建形成最终模型或可视化报告成果”的一站式、全流程指导。

两本书随书赠送的学习资料也很多,包括全部的源代码、PPT、思维导图,还有10小时以上的讲解视频,每一章后面还有练习题及参考答案,还有学习群,相对于只看网络上的视频,一方面更加系统、高效,另一方面照着书一步步操作学起来也事半功倍。全网热销中,当当、京东等平台搜索“Python机器学习 杨维忠”“Python数据科学 杨维忠”即可。

《Python机器学习原理与算法实现》(杨维忠、张甜著,2023年2月,清华大学出版社),适用于学习Python/机器学习

《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)适用于学习数据分析、数据科学、数据可视化等。

创作不易,恳请多多点赞,感谢您的支持!也期待大家多多关注我,让我共同学习数据分析知识。

  • 24
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
数据科学与⼤数据技术是学什么 数据科学与⼤数据技术是学什么   ⾼考后选择时,数据科学与⼤数据技术是学什么是⼲⼤考⽣和家⻓们⽐较关⼼的问题之⼀。下⾯是由店铺⼩编为⼤家整理 的"数据科学与⼤数据技术是学什么",仅供参考,欢迎⼤家阅读。   数据科学与⼤数据技术是学什么   数据科学与⼤数据技术是学什么   数据科学与⼤数据技术课程教学体系涵盖⼤数据的发现、处理、运算、应⽤等核⼼理论与技术,具体课程包括:数学分 析、解析⼏何、⾼等代数、常微分⽅程、数学建模、数理统计等数学专业类课程,以及⼤数据概论、⼤数据存储与管理、⼤数 据挖掘、机器学习、⼈⼯智能基础、Python程序设计、统计学习、神经⺴络与深度学习⽅法、多媒体信息处理、数据可视化 技术、智能计算技术、分布式与并⾏计算、云计算与数据安全、数据库原理及应⽤、算法设计与分析、⾼级语⾔程序设计、优 化理论与⽅法等课程。   本专业旨在培养社会急需的具备⼤数据处理及分析能⼒的⾼级复合型⼈才。具体包括:掌握计算机科学、⼤数据科学与信 息技术的基本理论、⽅法和技能,受到系统的科学研究训练,具备⼀定的⼤数据科学研究能⼒与数据⼯程实施的基本能⼒,掌 握⼤数据⼯程项⺫的规划、应⽤、管理及决策⽅法,具有⼤数据⼯程项⺫设计、研发和实施能⼒的复合型、应⽤型卓越⼈才。   知识能⼒   1.具备扎实的数据基础理论和基础知识;   2.具有较强的思维能⼒、算法设计与分析能⼒;   3.系统掌握计算机科学与技术专业基本理论、基本知识和操作技能;   4.了解学科的知识结构、典型技术、核⼼概念和基本⼯作流程;   5.有较强的计算机系统的认知、分析、设计、编程和应⽤能⼒;   6.掌握⽂献检索、资料查询的基本⽅法、能够独⽴获取相关的知识和信息,具有较强的创新意识;   7.熟练掌握⼀⻔外语,能够熟读该专业外⽂书刊。   拓展阅读:数据科学与⼤数据技术专业就业⽅向   拓展阅读:数据科学与⼤数据技术专业就业⽅向   分析类岗位:   分析类⼯程师。使⽤统计模型、数据挖掘机器学习及其他⽅法,进⾏数据清洗数据分析、构建⾏业数据分析模型,为 客户提供有价值的信息,满⾜客户需求。   算法⼯程师。⼤数据⽅向,和专业⼯程师⼀起从系统应⽤的⾓度,利⽤数据挖掘/统计学习的理论和⽅法解决实际问题;⼈⼯ 智能⽅向,根据⼈⼯智能产品需求完成技术⽅案设计及算法设计和核⼼模块开发,组织解决项⺫开发过程中的重⼤技术问题。   研发类岗位:   架构⼯程师。负责Hadoop集群架构设计开发、搭建、管理、运维、调优,从数据采集到数据加⼯,从数据清洗到数据抽 取,从数据统计到数据分析,实现⼤数据全产业线上的应⽤分析设计。   开发⼯程师。基于hadoop、spark等构建数据分析平台,进⾏设计、开发分布式计算业务,负责机器学习、深度学习领域 的开发⼯作。   运维⼯程师。负责⼤数据基础平台的运维,保障平台的稳定可⽤,参与设计⼤数据⾃动化运维、监控、故障处理⼯具。   就业前景   随着⼤数据往各领域延伸发展,市场对统计学、数学⽅⾯的专业⼈才,数据分析数据挖掘、⼈⼯智能等偏软件领域的需 求加⼤。数据分析师/⼤数据分析培训,加⽶⾕⼤数据培训机构,可预约现场试听课,⼤数据开发零基础班预报中。   ⼤数据专业毕业⽣可以胜任⼤数据技术开发与应⽤,⼤数据运维和云计算等⼯作,可以去⼤型互联⺴公司就业,做前、后 端开发数据分析师、机器学习算法⼯程师,App开发、智能游戏设计与开发、数据科学家等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据科学作家

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值