当前搜索:

【python数据挖掘课程】二十二.Basemap地图包安装入门及基础知识讲解

这是《Python数据挖掘课程》系列文章,也是我上课内容及书籍中的一个案例。本文主要讲述Matplotlib子包,负责地图绘制,即Basemap扩展包。在做数据挖掘或可视化分析时,常常需要将数据显示到地图上,比如城市人口、空气环境、GDP分布、资源销售、全球热图等。本文主要讲解安装入门以及官网介绍...
阅读(827) 评论(0)

【python数据挖掘课程】二十一.朴素贝叶斯分类器详解及中文文本舆情分析

这是《Python数据挖掘课程》系列文章,也是我上课内容及书籍中的一个案例。本文主要讲述朴素贝叶斯分类算法并实现中文数据集的舆情分析案例,希望这篇文章对大家有所帮助,提供些思路。内容包括:    1.朴素贝叶斯数学原理知识    2.naive_bayes用法及简单案例    3.中文文本数据集预...
阅读(917) 评论(6)

【python数据挖掘课程】二十.KNN最近邻分类算法分析详解及平衡秤TXT数据集读取

这是《Python数据挖掘课程》系列文章,也是我这学期上课的部分内容及书籍的一个案例。本文主要讲述KNN最近邻分类算法、简单实现分析平衡秤数据集,希望这篇文章对大家有所帮助,同时提供些思路。内容包括: 1.KNN算法基础原理知识 2.最近邻分类算法分析预测坐标类型 3.Pa...
阅读(991) 评论(4)

【python数据挖掘课程】十九.鸢尾花数据集可视化、线性回归、决策树花样分析

这是《Python数据挖掘课程》系列文章,也是我这学期上课的部分内容。本文主要讲述鸢尾花数据集的各种分析,包括可视化分析、线性回归分析、决策树分析等,通常一个数据集是可以用于多种分析的,希望这篇文章对大家有所帮助,同时提供些思考。内容包括: 1.鸢尾花数据集可视化分析 2.线性回归...
阅读(1502) 评论(0)

【python数据挖掘课程】十八.线性回归及多项式回归分析四个案例分享

这是《Python数据挖掘课程》系列文章,也是我这学期大数据金融学院上课的部分内容。本文主要讲述和分享线性回归作业中,学生们做得比较好的四个案例,经过我修改后供大家学习,内容包括:    1.线性回归预测Pizza价格案例    2.线性回归分析波士顿房价案例    3.随机数据集一元线性回归分析...
阅读(1811) 评论(4)

【python数据挖掘课程】十七.社交网络Networkx库分析人物关系(初识篇)

这是《Python数据挖掘课程》系列文章,也是我大数据金融学院上课的部分内容。本章主要讲述复杂网络或社交网络基础知识,通过Networkx扩展包绘制人物关系,并分析了班级学生的关系学院信息。本篇文章为初始篇,基础文章希望对你有所帮助,如果文章中存在错误或不足支持,还请海涵~
阅读(1819) 评论(3)

【python数据挖掘课程】十六.逻辑回归LogisticRegression分析鸢尾花数据

回归算法作为统计学中最重要的工具之一,它通过建立一个回归方程用来预测目标值,并求解这个回归方程的回归系数。本篇文章详细讲解了逻辑回归模型的原理知识,结合Sklearn机器学习库的LogisticRegression算法分析了鸢尾花分类情况。更多知识点希望读者下来后进行拓展,也推荐大学从Sklear...
阅读(3803) 评论(2)

【python数据挖掘课程】十四.Scipy调用curve_fit实现曲线拟合

前面系列文章讲过各种知识,包括绘制曲线、散点图、幂分布等,而如何在在散点图一堆点中拟合一条直线,也变得非常重要。这篇文章主要讲述调用Scipy扩展包的curve_fit函数实现曲线拟合,同时计算出拟合的函数、参数等。希望文章对你有所帮助,如果文章中存在错误或不足之处,还请海涵~
阅读(12486) 评论(17)

[python数据分析] 简述幂率定律及绘制Power-law函数

这篇文章主要是最近研究人类行为应用的内容,主要简单叙述下复杂网络的幂率分布以及绘制Power-law函数一些知识,同时是一篇在线笔记。希望对您有所帮助,如果文章中存在不足或错误的地方,还请海涵~ 1.幂率分布 2.Zipf定律 3.Scale fre...
阅读(4412) 评论(0)

【python数据挖掘课程】十二.Pandas、Matplotlib结合SQL语句对比图分析

这篇文章主要讲述Python常用数据分析包Numpy、Pandas、Matplotlib结合MySQL分析数据,前一篇文章 "【python数据挖掘课程】十一.Pandas、Matplotlib结合SQL语句可视化分析" 讲述了MySQL绘图分析的好处,这篇文字进一步加深难度,...
阅读(3759) 评论(0)

【Python数据挖掘课程】八.关联规则挖掘及Apriori实现购物推荐

这篇文章主要介绍三个知识点,也是我《数据挖掘与分析》课程讲课的内容。        1.关联规则挖掘概念及实现过程;        2.Apriori算法挖掘频繁项集;        3.Python实现关联规则挖掘及置信度、支持度计算。关联规则(Association Rules)是反映一个事物...
阅读(13793) 评论(9)

【Python数据挖掘课程】七.PCA降维操作及subplot子图绘制

这篇文章主要介绍四个知识点,也是我那节课讲课的内容。 1.PCA降维操作; 2.Python中Sklearn的PCA扩展包; 3.Matplotlib的subplot函数绘制子图; 4.通过Kmeans对糖尿病数据集进行聚类,并绘制子...
阅读(7750) 评论(0)

【Python数据挖掘课程】六.Numpy、Pandas和Matplotlib包基础知识

前面几篇文章采用的案例的方法进行介绍的,这篇文章主要介绍Python常用的扩展包,同时结合数据挖掘相关知识介绍该包具体的用法,主要介绍Numpy、Pandas和Matplotlib三个包。目录: 一.Python常用扩展包 二.Numpy科学计算包 ...
阅读(14556) 评论(5)

【Python数据挖掘课程】五.线性回归知识及预测糖尿病实例

今天主要讲述的内容是关于一元线性回归的知识,Python实现,包括以下内容: 1.机器学习常用数据集介绍 2.什么是线性回顾 3.LinearRegression使用方法 4.线性回归判断糖尿病 同时这篇文章是我上课的内容,所以参考了...
阅读(10365) 评论(11)

【Python数据挖掘课程】四.决策树DTC数据分析及鸢尾数据集分析

今天主要讲述的内容是关于决策树的知识,主要包括以下内容:        1.分类及决策树算法介绍        2.鸢尾花卉数据集介绍        3.决策树实现鸢尾数据集分析     决策树算法根据数据的属性采用树状结构建立决策模型, 决策树模型常用来解决分类和回归问题。常见的算法包括:分类及...
阅读(10128) 评论(6)

【Python数据挖掘课程】三.Kmeans聚类代码实现、作业及优化

这篇文章直接给出上次关于Kmeans聚类的篮球远动员数据分析案例,同时介绍这次作业同学们完成的图例,最后介绍Matplotlib包绘图的优化知识。希望这篇文章对你有所帮助,尤其是刚刚接触数据挖掘以及大数据的同学,同时准备尝试以案例为主的方式进行讲解。如果文章中存在不足或错误的地方,还请海涵~
阅读(17450) 评论(8)

【Python数据挖掘课程】二.Kmeans聚类数据分析及Anaconda介绍

这次课程主要讲述一个关于Kmeans聚类的数据分析案例,通过这个案例让同学们简单了解大数据分析的基本流程,以及使用Python实现相关的聚类分析。 主要内容包括: 1.Anaconda软件的安装过程及简单配置 2.聚类及Kmeans算法介绍 ...
阅读(12318) 评论(17)

[python] 基于k-means和tfidf的文本聚类代码简单实现

基本步骤包括: 1.使用python+selenium分析dom结构爬取百度|互动百科文本摘要信息; 2.使用jieba结巴分词对文本进行中文分词,同时插入字典关于关键词; 3.scikit-learn对文本内容进行tfidf计算并构造N*M矩阵(N...
阅读(39536) 评论(39)

Python简单实现基于VSM的余弦相似度计算

在知识图谱构建阶段的实体对齐和属性值决策过程中、判断一篇文章是否是你喜欢的文章、比较两篇文章的相似性等,都涉及到了向量空间模型(Vector Space Model,简称VSM)和余弦相似度计算相关知识。这篇文章主要是先叙述VSM和余弦相似度相关理论知识,然后引用阮一峰大神的例子进行解释,最后通过...
阅读(19202) 评论(3)

知识图谱相关会议之观后感分享与学习总结

目录:一.面向知识图谱的信息抽取技术 二.常识知识在结构化知识库构建中的应用 三.浅谈逻辑规则在知识图谱表示学习中的应用 四.大规模知识图谱表示学习 五.知识图谱中推理技术及工具介绍 六.多语言知识图谱中的知识链接 七.知识图谱关键技术和在企业中的应用 由于我毕设是与知识图谱、实体...
阅读(9740) 评论(6)
    个人资料
    专栏达人 持之以恒
    等级:
    访问量: 252万+
    积分: 2万+
    排名: 399
    牛人博客
    博客专栏
    最新评论