本课程正在限时优惠中,请尽快购买
原价:¥350
优惠价:¥999.00
章节导航
课程大纲
第一章:python基础速过篇
开张课。我们直接开门见山,对着文档先把最基本的东西学一下。注意:关键看视频中的学习方法,而不是去死记硬背知识点.
这节课我们来理解一些很容易混淆的概念。以及面向对象的进一步学习
这节课我们来学习如何安装外部的库,很多同学系统做爬虫,那么我们来装个相关的解析库,如beautiful soup 。后面做实例用
这节课我们学到最基本的文件读取和异常处理。下节课是一个案例课,请大家做好复习工作
逐步的我们将完成初步的基础语法学习,要进入案例。在案例中学习更多的基础知识。这节课我们来逐步接触网络编程
这节课是套路训练课,把我们前面快速学到的知识来做个小程序。使用urllib和bs4来分析基金网站的数据。请大家根据课程内容加强课后练习
上节课学习了pymysql后,那么肯定我们实战中要使用ORM框架。手写SQL和ORM使用往往是共存的,没有哪个好哪个不好
本课时涉及知识点较多,请做好课后笔记和练习工作.由于我们抓取的网站第二页开始是ajax形式执行的。因此使用前面课时的方法肯定是不行的
今天我们介绍两个第三方库,用来实现网页的模拟自动点击、自动填充。也为了后面抓取基金网站JS地址做好知识准备。
上节课简单触摸了phantomjs+selenium,这节课我们正式来抓基金网站。同时我们顺手补一下基础知识点:装饰器
到今天我们已经具备了完整抓取JS内容的能力,本节课同时来实现一下多进程抓取。初步入门一下python的多进程编程
第一章即将进入尾声,我们开始逐步入手分析统计库,对我们的数据进行简单分析和统计。同时放出第二章和第三章的内容预告。本节课课后作业很重要
这节课我们继续来触碰pandas功能。我们通过抓取的基金明细数据来统计出下跌次数最多的月份
基础简单入门后,我们要即刻进行案例训练,而不是反复在那看基础,没用。这节课我们把pandas在web中的辅助场景进行模拟训练
以订单数据为例,有时候我们需要根据用户的消费对他们进行三六九等的划分。那么用pandas 就能非常方便的处理
为了更好的进行数据分析(挖掘)的可视化展现,今天我们来入手一个很知名的绘图库matplotlib
第二章:python机器学习入门篇(推荐算法)
这节课开始我们要适当的触碰下机器学习,从而完成对python的一个大概了解。里面涉及到的一些知识点如果懵懂可以适当囫囵吞枣。先有个大体概念为好
上节课入门了余弦相似性后,我们会发现这里面有一些问题。譬如喜欢打低分和高分的同学相似性竟然很一致,对于这种问题我们该怎么处理呢?
今天的课时很简单,用到了欧式距离。请大家区分之前讲的余弦相似性和欧式距离在实战中的使用差别
今天我们来对上节课讲到KNN做一些深入,请大家预习,到底如何把KNN集成到我们的推荐算法中
第三章:机器学习入门(分类算法:朴素贝叶斯)
这节课我们进入第三章分类算法的学习。首先我们将入门最经典的tf-idf计算方法。
学了两节课理论,那么这节课我们来做些代码了。内容很简单,手工创建些样本,然后搞一个测试文本。用sklearn试试它到底属于哪个类
这节课我们来个真实的数据集,我们使用搜狗实验室的新闻数据进行数据清洗、新闻分类,并且测试分类结果的准确性