python
文章平均质量分 68
Xin Deng
我还能走多远呢?
展开
-
Apriori算法实现
前言:出自于学校课程数据挖掘与分析布置的实验小作业,案例经典,代码注释较全,供大家参考。题目:文件dataset.txt 中包含某超市的购物篮数据,编程实现关联规则,发现其中的主要规则,并提出提高销售额的方法。实验数据如下:要求:1、自行采用一种语言编程实现算法(注意:生成候选项集、生成频繁项集、产生关联规则等核心算法需自己编程实现)2、用课堂例子进行正确性检验3、用户界面友好,要考虑到输入输出4、分析结果,给出合理解释或建议python实现import numpy as.原创 2022-04-05 11:53:47 · 3755 阅读 · 7 评论 -
Python实现分类算法
前言:出自于学校课程数据挖掘与分析布置的实验小作业,案例经典,代码注释较全,供大家参考。题目:现有西瓜挑选数据文件:dataset.txt,编程实现朴素贝叶斯算法,并判断有如下特征的瓜是否好瓜:青绿,稍蜷,浊响,清晰,凹陷,硬滑。实验数据如下:要求:1、自行采用一种语言编程实现算法(注意:计算条件概率、判别分类等核心算法需自己编程实现)2、用课堂例子进行正确性检验3、用户界面友好,要考虑到输入输出4、分析结果,说明理论分析到数值计算的注意问题python实现源码impo.原创 2022-04-05 11:53:08 · 6087 阅读 · 2 评论 -
线性回归分析
前言:这是学校多元统计分析课程布置的实验(包括基于python的线性代数运算、线性回归分析实验、聚类分析、因子分析和主成分分析),这里分享出来,注解标注的比较全,供大家参考。1、读取文件“test2-1.csv”,数据为随机抽查的36个人的收入情况,包括当前年薪y(美元)与开始年薪x1(美元)、工作时间x2(月)、先前工作经验x3(月)和受教育年限x4(年)。使用数据完成以下内容。①用SPSS软件对数据进行相关系数、回归方程建模;相关系数:回归方程建模:②根据SPSS软件结果,用pytho.原创 2022-04-05 11:18:20 · 2104 阅读 · 0 评论 -
聚类分析实验
前言:这是学校多元统计分析课程布置的实验(包括基于python的线性代数运算、线性回归分析实验、聚类分析、因子分析和主成分分析),这里分享出来,注解标注的比较全,供大家参考。1、为比较10种红葡萄酒的质量,由5名品酒师对每种酒的颜色、香味、甜度、纯度和果味6项指标进行打分,最低分1分,最高分为10分,得到每种酒的每项指标的平均得分,数据见文件“test3-1.csv”。完成以下内容。① 使用SPSS软件对数据采用系统聚类法进行样本和变量聚类分析,系统聚类法实现最小距离、最大距离、重心距离、类平均距离.原创 2022-04-05 11:17:57 · 2945 阅读 · 0 评论 -
因子分析和主成分分析
前言:这是学校多元统计分析课程布置的实验(包括基于python的线性代数运算、线性回归分析实验、聚类分析、因子分析和主成分分析),这里分享出来,注解标注的比较全,供大家参考。1、文件“test4-1.csv”给出的是52名学生的数学(x1)、物理(x2)、化学(x3)、语文(x4)、历史(x5)和英语(x6)成绩。使用数据完成以下内容。①使用SPSS的因子分析功能对数据进行因子分析;②使用python语言编程实现因子分析的功能,并运行上述数据,输出结果:因子载荷和因子得分,与SPSS.原创 2022-04-05 11:17:14 · 3316 阅读 · 2 评论 -
基于python的线性代数运算
前言:这是学校多元统计分析课程布置的实验(包括基于python的线性代数运算、线性回归分析实验、聚类分析、因子分析和主成分分析),这里分享出来,注解标注的比较全,供大家参考。使用Python语言开发完成以下运算。1、已知有两个矩阵A和B,如下所示:①求A+B、A-B;import numpy as npimport pandas as pdfrom fractions import Fraction# 这里定义一个单位矩阵,作为结果判断依据temp = np.array([[1, 0.原创 2022-04-05 11:16:34 · 3064 阅读 · 2 评论 -
使用selenium爬取微博热门话题并写入文本文件
使用selenium爬取网页数据一、安装环境1.安装selenium2.配置ChromeDriver点击Google菜单 帮助 -> 关于Google Chrome -> 查看版本号对比自己浏览器版本下载相应版本的ChromeDriver:下载地址解压后把文件放到 python的script目录下:我的是在D盘下的python中最后需要配置环境变量二、测试from selenium import webdriver driver= webdriver.Chrome原创 2020-11-10 16:29:05 · 1140 阅读 · 3 评论 -
使用Python相关技术实现对一本中文小说(自选)进行词频分析,字数不低于10万字,显示小说中出现率前50的中文词组,并用图表展示。
将此题分为两个步骤:找出高频词汇首先我们需要使用python中的jieba库;目前最好的 Python 中文分词组件,它主要有以下 3 种特性:支持 3 种分词模式:精确模式、全模式、搜索引擎模式支持繁体分词支持自定义词典具体案例:https://www.jianshu.com/p/883c2171cdb5安装:使用管理员身份打开CMD:输入pip install jieba下载成功后打开pyCharm,如果没有jieba,点击右边的“+”号添加即可。读取文本文件,我们在第十章学到过原创 2020-06-13 16:26:10 · 4289 阅读 · 3 评论