python数据挖掘实验报告_数据挖掘实验报告-决策树程序实验

最新推荐文章于 2024-05-30 22:11:10 发布

原创

最新推荐文章于 2024-05-30 22:11:10 发布 · 1k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python数据挖掘实验报告

这篇博客通过Python进行了数据挖掘实验，重点展示了决策树在收入范围、保险、性别和年龄属性上的信息增益计算。实验结果显示，收入范围的信息增益最高，其次是年龄、性别和保险。文章提及了ID3算法在处理离散值属性的优势和局限性。

E(S)=(-9/15)log2(9/15)-(6/15)log2(6/15)=0.971

Values(收入范围)={20-30K,30-40k,40-50K,50-60K}

E(S(20-30K))= (-2/4)log2(2/4)- (2/4)log2(2/4)=1

E(S(30-40K))= (-4/5)log2(4/5)- (1/5)log2(1/5)=0.7219

E(S(40-50K))= (-1/4)log2(1/4)- (3/4)log2(3/4)=0.8113

E(S(50-60K))= (-2/2)log2 (2/2)- (0/2)log2(0/2)=0

所以

E(S,收入范围)=(4/15) E(S(20-30K)) +(5/15) E(S(30-40K)) +(4/15) E(S(40-50K)) +(2/15) E(S(50-60K))=0.7236

Gain(S,收入范围)=0.971-0.7236=0.2474

同理：计算“保险”，“性别”，“年龄”的信息增益为：

E(S)=(-9/15)log2(9/15)-(6/15)log2(6/15)=0.971

Insurance(保险)={yes, no}

E(S(yes))= (-3/3)log2 (3/3)- (0/3)log2(0/3)=0

E(S(no))= (-6/12)log2 (6/12)- (6/12)log2(6/12)=1

E(S,保险)=(3/15) E(S(yes)) +(12/15) E(S(no)) =0.8

Gain(S,保险)=0.971-0.8=0.171

E(S)=(-9/15)log2(9/15)-(6/15)log2(6/15)=0.971

sex(性别)={male, female}

E(S(male))= (-3/7)log2 (3/7)- (4/7)log2(4/7)=0.9852

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39732716

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

python数据挖掘实验报告_Python数据挖掘实践—决策树

weixin_39828715的博客

11-24

2051

这几期和大家聊聊使用Python进行机器学习题外话：之前一期“ scrapy抓取当当网82万册图书数据 ” 的 Github 链接Python拥有强大的第三方库，使用Python进行科学计算和机器学习同样需要先配置运行环境。这里我们需要安装Anaconda，官方给出的下载链接太慢，而且经常下载到一半卡死，这里我提供我下载好的Numpy：提供数组支持，以及相应的高效处理函数；Scipy：提供矩阵支持...

python数据挖掘实验报告1

qq_42760920的博客

10-19

1万+

实验内容及步骤（包含简要的实验步骤流程） 1.使用Pandas_datareader获取任意两支股票近三个月的交易数据。做出收盘价的变动图像。 2.使用Pandas_datareader获取世界银行数据库中美国（USA）、瑞典（SWE）、瑞士（CHE）三个国家近20年的NY.GDP.PCAP.KD数据，作图分析。 3.对于泰坦尼克的数据集，试分析幸存与否与独立登船的相关性（alone数据列）。 1．取五粮液(000858.sz)和古井贡酒(000596.sz)两只股票的三个月交易数据，做出收盘的变动图像.

参与评论您还未登录，请先登录后发表或查看评论

python数据挖掘实验

04-11

python数据挖掘实验，内附有八个实验文档说明。实验一探索性数据分析演示、实验二常用概率分布演示、实验三置信区间和假设检验演示、实验四线性回归模型演示.................

基于python的数据挖掘实验报告_数据挖掘实验报告

weixin_39683598的博客

12-06

1745

市场购物篮分析经济管理学院企业管理专业1306122427杨欢欢一、实验背景随着社会进入信息化时代，现代化的企业搜集了大量数据或高维数据，包括市场、客户、供货商、竞争对手以及未来趋势等重要信息，但是信息超载与无结构化，使得企业决策部门无法有效利用现存的信息，甚至使决策行为产生混乱与误用。通过数据挖掘技术，可以从大量的数据中，挖掘出不同的信息与知识来支持决策，必能产生企业的竞争优势。数据挖掘和知识发...

决策树实验报告.doc

06-23

数据挖掘课设关于决策树算法的实验报告

python数据挖掘实验报告_数据挖掘实习报告

weixin_39860849的博客

11-24

3120

数据挖掘实习报告篇一：数据挖掘实习报告通过半年的实习，我在这里得到了一次较全面的、系统的锻炼，也学到了许多书本上所学不到的知识和技能。以下是我这次的实习鉴定。经历了实习，对社会也有了基本的实践，让我学到了书本以外的知识，实习期间，我努力尽量做到理论与实践相结合，在实习期间能够遵守工作纪律，不迟到、早退，认真完成领导交办的工作。在实习鉴定中，我参与了整个数据分析工作，从数据获取到数据清洗、数据报表的...

数据仓库与数据挖掘实验报告（python实现，包括关联规则、决策树、聚类分析、贝叶斯网络、神经网络和遗传算法的应用）

热门推荐

bluenight专栏

11-18

1万+

【摘要】众所周知，数据库技术从20世纪80年代开始，已经得到广泛的普及和应用。随着数据库容量的膨胀，特别是数据仓库以及web等新型数据源的日益普及，人们面临的主要问题不再是缺乏足够的信息可以使用，而是面对浩瀚的数据海洋如何有效地利用这些数据。从数据中生成分类器的一个特别有效的方法是生成一个决策树（Decision Tree）。决策树表示方法是应用最广泛的逻辑方法之一，它从一组无次序、无

基于python的数据挖掘实验报告_《基于Python语言的网络数据挖掘》实验指导书2014 -...

weixin_39747341的博客

12-06

1341

Python语言的网络数据挖掘》实验指导书电子科技大学信息与软件工程学院二○一四年6月《基于一、实验教学目的和要求：实验目的：本课程实验旨在加深学生对于网络大数据挖掘的理解，培养学生分析、设计、实现基于Python语言的网络数据挖掘算法，掌握科学的实验方法，为以后其他专业课的学习打下坚实的基础。该实验内容采用循序渐进的方式，从Python语言的基本语法入手，在加深学生对于Python语言熟悉的基...

数据挖掘实验报告

03-12

数据挖掘实验，老师布置的作业，希望能给你帮助

数据挖掘实验作业

04-24

大学数据挖掘实验作业。

生物数据挖掘-决策树实验报告.pdf

06-14

生物数据挖掘-决策树实验报告.pdf生物数据挖掘-决策树实验报告.pdf生物数据挖掘-决策树实验报告.pdf生物数据挖掘-决策树实验报告.pdf生物数据挖掘-决策树实验报告.pdf生物数据挖掘-决策树实验报告.pdf生物数据挖掘-决策树实验报告.pdf生物数据挖掘-决策树实验报告.pdf

python机器学习算法决策树和聚类分析实验报告

05-11

python机器学习算法决策树和聚类分析实验报告

Python与数据挖掘

11-03

Python与数据挖掘！

PHP与JSON的一些常用操作

HelloWorld

09-30

2272

PHP把数据写入JSON文件 <?php // 生成一个PHP数组 $data = array (); $data ["fruit"] = "apple" ; $data ["animal"] = "tiget"; // 把PHP数组转成JSON字符串,写入文件 $json_string = json_encode( $data ); ?> PHP读取JSON数据? <?php // 从文件中读取数据到PHP变量 $str = file_get_contents ( 'one

数据挖掘 | 实验三 决策树分类算法

猫天意的博客

05-30

2715

使用决策树进行决策的过程就是从根节点开始，测试待分类项中相应的特征属性，并按照其值选择输出分支，直到到达叶子节点，将叶子节点对应的类别作为决策结果。1、通过本次实验加深了我对决策树原理的理解，本次实验使用了4种分类算法进行分类，习了决策树模型的构建过程，分类算法，预测方法，以及决策树的可视化、最后进行交叉验证。了解pydotplus、GraphViz等相关库中决策树可视化方法的接口，结合上述构建方法中参数的设置，分析每次构建的树的层数及叶子数目。3）分别查看训练集、测试集上模型的评估指标（准确率）；

用python实现决策树分类-实验报告

Coral__的博客

12-29

2212

数据挖掘实验1，实验报告

python与数据挖掘 上机实验_python数据挖掘实验报告1

weixin_42412324的博客

03-01

2834

python数据挖掘实验报告1python数据挖掘实验报告1实验内容及步骤(包含简要的实验步骤流程)1.使用Pandas_datareader获取任意两支股票近三个月的交易数据。做出收盘价的变动图像。2.使用Pandas_datareader获取世界银行数据库中美国(USA)、瑞典(SWE)、瑞士(CHE)三个国家近20年的NY.GDP.PCAP.KD数据，作图分析。3.对于泰坦尼克的数据集，试分...

数据挖掘实战技巧与实验报告总结

学习者在掌握了《数据挖掘导论》中的理论知识后，通过实验报告的编写和相关技术的应用，能够更深入地理解和运用数据挖掘技术解决实际问题。此外，文件中还特别强调了数据挖掘中预测任务的重要性以及在进行预测时可能...