关闭
当前搜索:

【python数据挖掘课程】二十二.Basemap地图包安装入门及基础知识讲解

这是《Python数据挖掘课程》系列文章,也是我上课内容及书籍中的一个案例。本文主要讲述Matplotlib子包,负责地图绘制,即Basemap扩展包。在做数据挖掘或可视化分析时,常常需要将数据显示到地图上,比如城市人口、空气环境、GDP分布、资源销售、全球热图等。本文主要讲解安装入门以及官网介绍的基础知识,后面文章将结合实例深入讲解。内容包括:    1.Basemap安装过程    2.地图绘...
阅读(301) 评论(0)

【python数据挖掘课程】二十一.朴素贝叶斯分类器详解及中文文本舆情分析

这是《Python数据挖掘课程》系列文章,也是我上课内容及书籍中的一个案例。本文主要讲述朴素贝叶斯分类算法并实现中文数据集的舆情分析案例,希望这篇文章对大家有所帮助,提供些思路。内容包括:    1.朴素贝叶斯数学原理知识    2.naive_bayes用法及简单案例    3.中文文本数据集预处理    4.朴素贝叶斯中文文本舆情分析本篇文章为基础性文章,希望对你有所帮助,如果文章中存在错误或...
阅读(314) 评论(2)

【python数据挖掘课程】二十.KNN最近邻分类算法分析详解及平衡秤TXT数据集读取

这是《Python数据挖掘课程》系列文章,也是我这学期上课的部分内容及书籍的一个案例。本文主要讲述KNN最近邻分类算法、简单实现分析平衡秤数据集,希望这篇文章对大家有所帮助,同时提供些思路。内容包括: 1.KNN算法基础原理知识 2.最近邻分类算法分析预测坐标类型 3.Pandas读取TXT数据集 4.KNN分析平衡秤数据集 5.算法优化 本篇文章为基础性文章,希望对你有所帮助,如果文章中存在错误或不足支持,还请海涵~同时,推荐大家阅读我以前的文章了解基础知识。自己真...
阅读(750) 评论(4)

【python数据挖掘课程】十九.鸢尾花数据集可视化、线性回归、决策树花样分析

这是《Python数据挖掘课程》系列文章,也是我这学期上课的部分内容。本文主要讲述鸢尾花数据集的各种分析,包括可视化分析、线性回归分析、决策树分析等,通常一个数据集是可以用于多种分析的,希望这篇文章对大家有所帮助,同时提供些思考。内容包括: 1.鸢尾花数据集可视化分析 2.线性回归分析鸢尾花花瓣长度和宽度的关系 3.决策树分析鸢尾花数据集 4.Kmeans聚类分析鸢尾花数据集 本篇文章为基础性文章,希望对你有所帮助,如果文章中存在错误或不足支持,还请海涵~这也是自己书籍几章的...
阅读(1062) 评论(0)

【python数据挖掘课程】十八.线性回归及多项式回归分析四个案例分享

这是《Python数据挖掘课程》系列文章,也是我这学期大数据金融学院上课的部分内容。本文主要讲述和分享线性回归作业中,学生们做得比较好的四个案例,经过我修改后供大家学习,内容包括:    1.线性回归预测Pizza价格案例    2.线性回归分析波士顿房价案例    3.随机数据集一元线性回归分析和三维回归分析案例    4.Pizza数据集一元线性回归和多元线性回归分析本篇文章为初始篇,基础文章...
阅读(1071) 评论(4)

【python数据挖掘课程】十七.社交网络Networkx库分析人物关系(初识篇)

这是《Python数据挖掘课程》系列文章,也是我大数据金融学院上课的部分内容。本章主要讲述复杂网络或社交网络基础知识,通过Networkx扩展包绘制人物关系,并分析了班级学生的关系学院信息。本篇文章为初始篇,基础文章希望对你有所帮助,如果文章中存在错误或不足支持,还请海涵~...
阅读(1347) 评论(3)

[python爬虫] BeautifulSoup爬取+CSV存储贵州农产品数据

《勿忘心安》 勿要把酒倚寒窗,庭院枯叶已飞霜。 忘怀之前坎坷路,劝君一醉付流光。 心中愁苦漫翻滚,雪上寒鸦入画堂。 安知我辈庸庸过,双鬓飞白亦疏狂。 很喜欢这首诗,也享受在公交车上备课的日子,心很静很安,更享受和期待新装修的新家,人生漫漫,还是带着一丝微笑和她前行。接下来再忙还是挤点时间看看分布式爬虫和深度学习,十月这个节点终于结束啦。学生的笔记不错,有我的风范,大家也很认真。 Remember you are born to live. Don’t live because you are born! D...
阅读(1133) 评论(0)

[python爬虫] 正则表达式使用技巧及爬取个人博客实例

这篇博客是自己《数据挖掘与分析》课程讲到正则表达式爬虫的相关内容,主要简单介绍Python正则表达式爬虫,同时讲述常见的正则表达式分析方法,最后通过实例爬取作者的个人博客网站。希望这篇基础文章对您有所帮助,如果文章中存在错误或不足之处,还请海涵。真的太忙了,太长时间没有写博客了,抱歉~ 一.正则表达式 二.正则表达式抓取网络数据常见方法 1.抓取标签间的内容 2.抓取标签中的参数 三.实战...
阅读(6588) 评论(21)

【python数据挖掘课程】十六.逻辑回归LogisticRegression分析鸢尾花数据

回归算法作为统计学中最重要的工具之一,它通过建立一个回归方程用来预测目标值,并求解这个回归方程的回归系数。本篇文章详细讲解了逻辑回归模型的原理知识,结合Sklearn机器学习库的LogisticRegression算法分析了鸢尾花分类情况。更多知识点希望读者下来后进行拓展,也推荐大学从Sklearn开源知识官网学习最新的实例。 希望文章对你有所帮助,祝自己和娜老师教师节快乐~接着工作去了。...
阅读(2904) 评论(2)

【python数据挖掘课程】十五.Matplotlib调用imshow()函数绘制热图

前面系列文章讲过数据挖掘的各种知识,最近在研究人类时空动力学分析和幂率定律,发现在人类兴趣转移模型中,可以通过热图(斑图)来进行描述的兴趣转移,如下图所示。下一篇文章将简单普及人类动力学相关知识研究。这篇文章结合Matplotlib的imshow()函数,讲述热图(斑图)绘制及相关参数基础知识。希望文章对你有所帮助,如果文章中存在错误或不足之处,还请海涵。...
阅读(9520) 评论(11)

【python数据挖掘课程】十四.Scipy调用curve_fit实现曲线拟合

前面系列文章讲过各种知识,包括绘制曲线、散点图、幂分布等,而如何在在散点图一堆点中拟合一条直线,也变得非常重要。这篇文章主要讲述调用Scipy扩展包的curve_fit函数实现曲线拟合,同时计算出拟合的函数、参数等。希望文章对你有所帮助,如果文章中存在错误或不足之处,还请海涵~...
阅读(10523) 评论(17)

[python数据分析] 简述幂率定律及绘制Power-law函数

这篇文章主要是最近研究人类行为应用的内容,主要简单叙述下复杂网络的幂率分布以及绘制Power-law函数一些知识,同时是一篇在线笔记。希望对您有所帮助,如果文章中存在不足或错误的地方,还请海涵~ 1.幂率分布 2.Zipf定律 3.Scale free 4.Python绘制幂率分布 这篇文章基础知识转载了别人的内容,这里强烈推荐大家阅读原文。此篇文章主要是讲述代码部分,定律我也还在学习中,和大家共勉。...
阅读(3542) 评论(0)

【python数据挖掘课程】十三.WordCloud词云配置过程及词频分析

这篇文章是学习了老曹的微信直播,感觉WordCloud对我的《Python数据挖掘课程》非常有帮助,作者学习后准备下次上课分享给我的学生,让他们结合词频分析来体会下词云。希望这篇基础文章对你有所帮助,同时自己也是词云的初学者,强烈推荐老曹的博客供大家学习。如果文章中存在不足或错误的地方,还请海涵~ 一.安装WordCloud 二.简单词云代码 三.中文编码错误及解决 四.照片背景的词云代码...
阅读(6182) 评论(3)

【python数据挖掘课程】十二.Pandas、Matplotlib结合SQL语句对比图分析

这篇文章主要讲述Python常用数据分析包Numpy、Pandas、Matplotlib结合MySQL分析数据,前一篇文章 "【python数据挖掘课程】十一.Pandas、Matplotlib结合SQL语句可视化分析" 讲述了MySQL绘图分析的好处,这篇文字进一步加深难度,对数据集进行了对比分析。 数据分析结合SQL语句的效果真的很好,很多大神看到可能会笑话晚辈,但是如果你是数据分析的新人,那我强烈推荐,尤其是结合网络爬虫进行数据分析的。希望这篇文章对你有所帮助。...
阅读(3365) 评论(0)

【python数据挖掘课程】十一.Pandas、Matplotlib结合SQL语句可视化分析

这是非常好的一篇文章,可以认为是我做数据分析的转折点,为什么呢? 因为这是我做数据分析第一次引入SQL语句,然后爱不释手;结合SQL语句返回结果进行数据分析的效果真的很好,很多大神看到可能会笑话晚辈,但是如果你是数据分析的新人,那我强烈推荐,尤其是结合网络爬虫进行数据分析的。希望这篇文章对你有所帮助,如果文章中存在错误或不足之处,还请高抬贵手~...
阅读(3106) 评论(0)

【python数据挖掘课程】十.Pandas、Matplotlib、PCA绘图实用代码补充

这篇文章主要是最近整理《数据挖掘与分析》课程中的作品及课件过程中,收集了几段比较好的代码供大家学习。同时,做数据分析到后面,除非是研究算法创新的,否则越来越觉得数据非常重要,才是有价值的东西。后面的课程会慢慢讲解Python应用在Hadoop和Spark中,以及networkx数据科学等知识。 如果文章中存在错误或不足之处,还请海涵~希望文章对你有所帮助。...
阅读(2583) 评论(0)

【Python数据挖掘课程】九.回归模型LinearRegression简单分析氧化物数据

这篇文章主要介绍三个知识点,也是我《数据挖掘与分析》课程讲课的内容。同时主要参考学生的课程提交作业内容进行讲述,包括: 1.回归模型及基础知识; 2.UCI数据集; 3.回归模型简单数据分析。 希望这篇文章对你有所帮助,尤其是刚刚接触数据挖掘以及大数据的同学,这些基础知识真的非常重要。如果文章中存在不足或错误的地方,还请海涵~...
阅读(3927) 评论(3)

[置顶] 2016年总结:教师路的开启,爱情味的初尝 (上)

哎!2016年终于结束了,这一年感觉这是自己二十五年生命中最漫长的一年,发生的事情真的太多太多。有毕业母校、同学、老师和朋友的留念,毕竟在一个帝都待了六年,还是有太多的不舍与情怀的;有找工作、做毕业设计以及帮助二十多个陌生人完成毕业设计的艰辛,这些大多数都是从未谋面的过客,只是自己刚好会写点代码,多做点挺好的;有为了自己从小的教师梦,来回奔波京黔,最终为了梦想,放弃互联网、离开北京,虽然遗憾,但从...
阅读(15895) 评论(82)

【Python数据挖掘课程】八.关联规则挖掘及Apriori实现购物推荐

这篇文章主要介绍三个知识点,也是我《数据挖掘与分析》课程讲课的内容。        1.关联规则挖掘概念及实现过程;        2.Apriori算法挖掘频繁项集;        3.Python实现关联规则挖掘及置信度、支持度计算。关联规则(Association Rules)是反映一个事物与其他事物之间的相互依存性和关联性,如果两个或多个事物之间存在一定的关联关系,那么,其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术,用于从大量数据中挖掘出有价值的数据项之间的相关关系。...
阅读(11746) 评论(9)

【Python数据挖掘课程】七.PCA降维操作及subplot子图绘制

这篇文章主要介绍四个知识点,也是我那节课讲课的内容。 1.PCA降维操作; 2.Python中Sklearn的PCA扩展包; 3.Matplotlib的subplot函数绘制子图; 4.通过Kmeans对糖尿病数据集进行聚类,并绘制子图。 前文推荐,希望这篇文章对你有所帮助,尤其是我的学生和学习数据挖掘、机器学习、大数据的博友。...
阅读(6812) 评论(0)
27条 共2页1 2 下一页 尾页
    个人资料
    • 访问:2326259次
    • 积分:21610
    • 等级:
    • 排名:第413名
    • 原创:270篇
    • 转载:10篇
    • 译文:0篇
    • 评论:1651条
    个人博客
    作者:杨秀璋
    学历:本科-北京理工大学
               硕士-北京理工大学
    现任教于贵财财经大学信息学院
    http://www.eastmountyxz.com

    简介:自幼受贵州大山的熏陶,养成了诚实质朴的性格。经过寒窗苦读,考入BIT,为完成自己的教师梦,放弃IT、航天等工作,成为贵财一名大学教师,并想把自己所学所感真心传授给自己的学生,帮助更多陌生人。

    贵州纵美路迢迢,
    为负劳心此一遭。
    收得破书三四本,
    也堪将去教尔曹。

    娜美人生,醉美生活。
    他和她经历风雨,慢慢变老。
    博客专栏
    牛人博客
    最新评论