Python数据挖掘
文章平均质量分 85
静妍
这个作者很懒,什么都没留下…
展开
-
Python数据挖掘课程 一.安装Python及爬虫入门介绍
最近因为需要给大数据金融学院的学生讲解《Python数据挖掘及大数据分析》的课程,所以在这里,我将结合自己的上课内容,详细讲解每个步骤。作为助教,我更希望这门课程以实战为主,同时按小组划分学生,每个小组最后都提交一个基于Python的数据挖掘及大数据分析相关的成果。但是前面这节课没有在机房上,所以我在CSDN也将开设一个专栏,用于对该课程的补充。 希望该文章对你有所帮助,尤其是对转载 2017-03-25 19:23:51 · 1076 阅读 · 0 评论 -
python数据挖掘课程 十三.WordCloud词云配置过程及词频分析
这篇文章是学习了老曹的微信直播,感觉WordCloud对我的《Python数据挖掘课程》非常有帮助,作者学习后准备下次上课分享给我的学生,让他们结合词频分析来体会下词云。希望这篇基础文章对你有所帮助,同时自己也是词云的初学者,强烈推荐老曹的博客供大家学习。如果文章中存在不足或错误的地方,还请海涵~ 老曹地址:10行python代码的词云 - 半吊子全栈工匠转载 2017-03-25 20:00:33 · 3746 阅读 · 1 评论 -
python数据挖掘课程 十二.Pandas、Matplotlib结合SQL语句对比图分析
这篇文章主要讲述Python常用数据分析包Numpy、Pandas、Matplotlib结合MySQL分析数据,前一篇文章 "【python数据挖掘课程】十一.Pandas、Matplotlib结合SQL语句可视化分析" 讲述了MySQL绘图分析的好处,这篇文字进一步加深难度,对数据集进行了对比分析。 数据分析结合SQL语句的效果真的很好,很多大神看到可能会笑话晚辈,但是如果转载 2017-03-25 19:58:33 · 871 阅读 · 0 评论 -
python数据挖掘课程 十一.Pandas、Matplotlib结合SQL语句可视化分析
这是非常好的一篇文章,可以认为是我做数据分析的转折点,为什么呢?因为这是我做数据分析第一次引入SQL语句,然后爱不释手;结合SQL语句返回结果进行数据分析的效果真的很好,很多大神看到可能会笑话晚辈,但是如果你是数据分析的新人,那我强烈推荐,尤其是结合网络爬虫进行数据分析的。希望这篇文章对你有所帮助,如果文章中存在错误或不足之处,还请高抬贵手~1.MySQL数据库知识首先在"[p转载 2017-03-25 19:56:24 · 855 阅读 · 0 评论 -
python数据挖掘课程 十.Pandas、Matplotlib、PCA绘图实用代码补充
这篇文章主要是最近整理《数据挖掘与分析》课程中的作品及课件过程中,收集了几段比较好的代码供大家学习。同时,做数据分析到后面,除非是研究算法创新的,否则越来越觉得数据非常重要,才是有价值的东西。后面的课程会慢慢讲解Python应用在Hadoop和Spark中,以及networkx数据科学等知识。如果文章中存在错误或不足之处,还请海涵~希望文章对你有所帮助。一. Pandas获取数据集转载 2017-03-25 19:53:29 · 1481 阅读 · 1 评论 -
Python数据挖掘课程 九.回归模型LinearRegression简单分析氧化物数据
这篇文章主要介绍三个知识点,也是我《数据挖掘与分析》课程讲课的内容。同时主要参考学生的课程提交作业内容进行讲述,包括: 1.回归模型及基础知识; 2.UCI数据集; 3.回归模型简单数据分析。 前文推荐: 【Python数据挖掘课程】一.安装Python及爬虫入门介绍 【Python转载 2017-03-25 19:50:43 · 2707 阅读 · 0 评论 -
Python数据挖掘课程 八.关联规则挖掘及Apriori实现购物推荐
这篇文章主要介绍三个知识点,也是我《数据挖掘与分析》课程讲课的内容。 1.关联规则挖掘概念及实现过程; 2.Apriori算法挖掘频繁项集; 3.Python实现关联规则挖掘及置信度、支持度计算。 前文推荐: 【Python数据挖掘课程】一.安装Python及爬虫入门介绍 【Python数据转载 2017-03-25 19:48:26 · 4249 阅读 · 0 评论 -
Python数据挖掘课程 七.PCA降维操作及subplot子图绘制
这篇文章主要介绍四个知识点,也是我那节课讲课的内容。 1.PCA降维操作; 2.Python中Sklearn的PCA扩展包; 3.Matplotlib的subplot函数绘制子图; 4.通过Kmeans对糖尿病数据集进行聚类,并绘制子图。 前文推荐: 【Python数据挖掘课程】一.安装P转载 2017-03-25 19:44:55 · 2441 阅读 · 1 评论 -
Python数据挖掘课程 六.Numpy、Pandas和Matplotlib包基础知识
前面几篇文章采用的案例的方法进行介绍的,这篇文章主要介绍Python常用的扩展包,同时结合数据挖掘相关知识介绍该包具体的用法,主要介绍Numpy、Pandas和Matplotlib三个包。目录: 一.Python常用扩展包 二.Numpy科学计算包 三.Pandas数据分析包 四.Matplotlib绘图包转载 2017-03-25 19:43:02 · 2246 阅读 · 0 评论 -
Python数据挖掘课程 五.线性回归知识及预测糖尿病实例
今天主要讲述的内容是关于一元线性回归的知识,Python实现,包括以下内容: 1.机器学习常用数据集介绍 2.什么是线性回顾 3.LinearRegression使用方法 4.线性回归判断糖尿病 前文推荐: 【Python数据挖掘课程】一.安装Python及爬虫入门介绍 【Py转载 2017-03-25 19:40:07 · 6778 阅读 · 0 评论 -
Python数据挖掘课程 四.决策树DTC数据分析及鸢尾数据集分析
今天主要讲述的内容是关于决策树的知识,主要包括以下内容: 1.分类及决策树算法介绍 2.鸢尾花卉数据集介绍 3.决策树实现鸢尾数据集分析 前文推荐: 【Python数据挖掘课程】一.安装Python及爬虫入门介绍 【Python数据挖掘课程】二.Kmeans聚类数据分析及Anaconda介绍转载 2017-03-25 19:36:49 · 1238 阅读 · 0 评论 -
Python数据挖掘课程 三.Kmeans聚类代码实现、作业及优化
这篇文章直接给出上次关于Kmeans聚类的篮球远动员数据分析案例,同时介绍这次作业同学们完成的图例,最后介绍Matplotlib包绘图的优化知识。 前文推荐: 【Python数据挖掘课程】一.安装Python及爬虫入门介绍 【Python数据挖掘课程】二.Kmeans聚类数据分析及Anaconda介绍 希望这篇文章对你有所帮助,尤转载 2017-03-25 19:33:42 · 2407 阅读 · 0 评论 -
Python数据挖掘课程 二.Kmeans聚类数据分析及Anaconda介绍
这次课程主要讲述一个关于Kmeans聚类的数据分析案例,通过这个案例让同学们简单了解大数据分析的基本流程,以及使用Python实现相关的聚类分析。 主要内容包括: 1.Anaconda软件的安装过程及简单配置 2.聚类及Kmeans算法介绍 3.案例分析:Kmeans实现运动员位置聚集 前文推荐:【Pytho转载 2017-03-25 19:29:17 · 1271 阅读 · 0 评论 -
大数据和高并发的解决方案
现在,软件架构变得越来越复杂了,好多技术层出不穷,令人眼花缭乱,解决这个问题呢,就是要把复杂问题简单化,核心就是要把握本质。软件刚开始的时候是为了实现功能,随着信息量和用户的增多,大数据和高并发成了软件设计必须考虑的问题,那么大数据和高并发本质是什么呢?本质很简单,一个是慢,一个是等。两者是相互关联的,因为慢,所以要等,因为等,所以慢,解决了慢,也就解决了等,解决了等,也就解决了慢原创 2017-03-31 21:39:02 · 859 阅读 · 0 评论