![](https://img-blog.csdnimg.cn/2019092715111047.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
专业选修课系列
文章平均质量分 81
专业选修课系列
MorleyOlsen
a normal undergraduate student striving for a luck
展开
-
【数据挖掘】实验8:分类与预测建模
(train_confusion <- table(actual = traindata$流失, predictedclass = train_predict$class))(train_confusion <- table(actual = traindata$流失, predictedclass = train_predict$class))(train_confusion <- table(actual = traindata$流失, predictedclass = train_predict))原创 2024-04-17 19:28:11 · 1770 阅读 · 0 评论 -
【数据挖掘】课程大纲
2.2.2 RStudio窗口介绍。5.1.7 R语言主要分类与预测算法函数。5.4.5 R语言主要时序模式算法函数。5.3.4 htmlwidgets包。5.5.2 基于模型的离群点检测方法。5.5.3 基于聚类的离群点检测方法。3.3.1 统计特征函数。3.3.2 统计作图函数。3.1.1 缺失值分析。3.1.2 异常值分析。3.1.3 一致性分析。3.2.3 统计量分析。3.2.4 周期性分析。3.2.5 贡献度分析。3.2.6 相关性分析。4.3.3 连续属性离散化。1.4.1 定义挖掘目标。原创 2024-04-16 13:19:27 · 1138 阅读 · 0 评论 -
【数据挖掘】实验7:高级绘图(上)
qplot(Sepal.Length, Sepal.Width, data = iris, geom = c("point", "smooth"), facets = ~Species,colour = Species, main = "绘制分面板的散点图")qplot(Species, Sepal.Length, data = iris, geom = c("violin", "jitter"), fill = Species,main = "依据种类分组的花萼长度小提琴图")原创 2024-04-13 15:54:00 · 1314 阅读 · 0 评论 -
【数据挖掘】练习6:上机题目
小提琴图(Violin Plot):结合了箱线图和密度图的特点,展示了数据的分布形状和中位数。适用于比较多个组的分布,并观察它们之间的差异。箱线图(Box Plot):用于显示连续变量的分布情况,包括中位数、四分位数和异常值。数据标签(Data Labels):在图形中添加数据点的数值标签,使得读者可以直观地了解数据。坐标轴标签(Axis Labels):标明 x 轴和 y 轴的含义,提供数据的单位或范围。图例(Legend):用于解释图形中的颜色或图案代表的含义,特别适用于多组数据的比较。原创 2024-04-13 15:39:19 · 1435 阅读 · 0 评论 -
【数据挖掘】实验6:初级绘图
pie(table(cyl), labels = paste(c("4", "6", "8"), "cylinders:", percent, "%")) # 画饼图。legend("bottomleft", c("wt", "normal"), lty = 1, col = 2:3, bty = "n") # 添加图例。type <- c("p", "l", "b", "o", "c", "h", "s", "S", "n" ) # 图形类型向量。原创 2024-04-13 15:33:29 · 1527 阅读 · 0 评论 -
【数据挖掘】实验5:数据预处理(2)
【练习2:数据变换】PPT-07第24页——通过对一矩阵使用最小-最大规范化、零-均值规范化、小数定标规范化对其处理,对比结果。(i1原创 2024-03-29 08:26:44 · 1499 阅读 · 0 评论 -
【数据挖掘】实验5:数据预处理(1)
此时需要在这段代码之前加上【inputfile$date <- as.Date(inputfile$date, format = "%Y/%m/%d")】,并且重新运行一遍之前的所有代码,再进行之后的操作。inputfile <- data.frame(sales = inputfile$'销量', date = inputfile$'日期')result2 <- rbind(inputfile1, inputfile2) # 并入完成插补的数据。原创 2024-03-23 21:55:34 · 1548 阅读 · 0 评论 -
【数据挖掘】实验4:数据探索
脏数据主要包括:缺失值、异常值、不一致的值、重复数据和含有特殊符号的数据。space = 0, ylim = c(0, 10000), xlab = "菜品", ylab = "盈利:元")2:缺失值分析包括:(1)统计缺失值的变量个数;colnames(a) <- c("均值", "中位数", "极差", "标准差", "变异系数","1/4分位数", "3/4分位数", "四分位间距")4:数据的不一致性是数据的矛盾性和不相容性,不一致数据的产生主要发生在数据集成的过程中。原创 2024-03-23 21:50:06 · 1770 阅读 · 0 评论 -
【数据挖掘】实验3:常用的数据管理
或者通过例如【options(repos = c(CRAN = "https://cloud.r-project.org/"))】的方式更换。1:在变量的重命名中,rename函数可修改数据库和列表(不改变原数据集中的变量名),不能修改矩阵;reshape2和reshape不是一个依赖包,只载入reshape包而不载入reshape2包,无法调用reshape2中的封装功能。data<-c("2016年1月1日","2016年2月1日")strsplit(data,"年")[[1]][1]原创 2024-03-18 17:18:02 · 1574 阅读 · 0 评论 -
【数据挖掘】练习2:数据管理2
by、by.x和by.y指定合并的列;suffixes标明后缀出处。merge(data,pd,by.x = '名称',by.y = '姓名',all=TRUE,sort=TRUE,suffixes = c('.data','.pd'))merge(data,pd,by.x = '名称',by.y = '姓名',all=TRUE,sort=TRUE,suffixes = c('.x','.y'))武功 <- c('降龙十八掌',' 落英神剑掌','全真剑法','九阴白骨爪','蛤蟆功','一阳指')原创 2024-03-18 17:08:02 · 1372 阅读 · 0 评论 -
【数据挖掘】练习2:数据管理1
使用grep()函数,查找出植物名称(Plant)中含有" Qn "的行的位置,并将这些行储存于变量Plant_Qn中。# 应用aggregate()函数,计算不同植物(Plant)、不同的类型(Type)对应的uptake的平均值。# 使用gsub()函数,将CO2中植物名称(Plant)中的字符串" Qn "改为" QN "# 应用tapply()函数,计算不同的植物(Plant)对应的uptake的平均值。# 检验CO2中是否存在缺失值,若有,检测缺失值的位置并删除含有缺失值的行。原创 2024-03-18 16:41:58 · 911 阅读 · 0 评论 -
【数据挖掘】实验2:R入门2
练习1代码:创建向量y,y为重复序列:元素为“red”、“orange”、“green”,各元素重复两次,序列长度为5。练习2代码:使用matrix()函数,以向量形式输入矩阵中的全部元素,使用ncol和nrow设置矩阵的行和列数。Eg.1代码:创建3个不同类型的数据,展示3个辨别函数的区别,即mode<class<typeof。(2)返回z的结果;练习1代码:创建一个向量x,内含等差数列:首位为1.7,等差为0.1,长度为5。y <- c("女","男","男","女","女","女","男")原创 2024-03-13 12:58:21 · 1332 阅读 · 0 评论 -
【数据挖掘】练习1:R入门
输出函数包括绘图函数(如plot()、points()、lines()等)、统计函数(如hist()、boxplot()等)以及其他常用函数(如title()、legend()等)。载入R包是指在用户的R会话中将某个已经安装的R包加载到内存中,以便在当前会话中使用该包中的函数和数据。分析可知,该向量由(1 2 3 4 5)、(2 3 4 5 6)、(3 4 5 6 7)、(4 5 6 7 8)、(5 6 7 8 9)5个子向量组成,且后面一个子向量在前面一个子向量的基础上进行了+1操作。原创 2024-03-12 21:39:15 · 1146 阅读 · 0 评论 -
【数据挖掘】实验1:R入门(内含详细R和RStudio安装教程)
在R console中利用【installed.packages()[,c('Package','Version','LibPath')]】查看已经安装的扩展包,结果如下图所示(由于扩展包的数量过多,因此此处仅展示一部分扩展包内容)。同时,采用方法2更新R时,输入【installr::updateR(fast=TRUE,cran_mirror="https://mirrors.ustc.edu.cn/CRAN/")】,将出现以下结果。同时,也可通过【version】命令查看R语言的版本。原创 2024-03-12 21:33:59 · 1934 阅读 · 0 评论 -
【多媒体技术与实践】学习路线
(有空更新一下各个章节的复习内容,没空等着裸考了hh)ppt3:语音识别和语音合成技术简介。ppt3:photoshop高级处理。ppt1:多媒体个人计算机系统。ppt1:音频信息获取和处理。ppt2:数字图像处理和压缩。[实验:Photoshop]ppt2:Animate简介。ppt1:视频信息获取和处理。[实验:Audition]ppt1:图像获取和处理。ppt1:动画获取和处理。[实验:Animate][实验:Premier]ppt2:数字音频编码。ppt1:多媒体概述。原创 2023-11-09 13:18:07 · 337 阅读 · 0 评论 -
【多媒体技术与实践】使用OpenCV处理图像(实验三.上)
【多媒体技术与实践】使用OpenCV处理图像(实验三.上)原创 2023-10-15 13:54:03 · 792 阅读 · 0 评论 -
【多媒体技术与实践】图像信息获取和处理——编程题汇总
根据输入的图像分辨率及深度,计算图像的数据量。例如:输入:输出:17.02MB (保留小数点后2位)【代码块】【解析】公式在【chap4 Review of Image Processing and photoshop instruction】ppt中的46页处如果是采用位映射存储方式,则未经压缩的数字图像数据量(B/幅=分辨率×(图像深度/8)综上所述,图像数据量=height * width * depth / 8 (bit)同时1MB=1048576bit。原创 2023-10-13 13:41:39 · 247 阅读 · 0 评论 -
【多媒体技术与实践】课堂习题汇总(Chp1~Chp4)
国际电信联盟ITU把媒体分为5种类型,其中,【1】是直接用于人的感官,使人能产生感觉的一类媒体;【2】是为了表达、处理和传输而人为构造的一种媒体,是信息保存和表示的形式;【3】是表示和获取信息的物理设备,如键盘、鼠标和显示器;【4】是指媒体传输中电信号与媒体之间转换所用的一类媒体;【5】是传输数据的物理载体;而内存、磁盘和光盘属于【6】。【1】感觉【2】表示【3】显示【4】显示【5】传输【6】存储。原创 2023-10-04 09:44:43 · 190 阅读 · 7 评论 -
【多媒体技术与实践】数据无损压缩编码
现有5个待编码的符号,概率如图所示,计算该符号集的:(1)熵(2)霍夫曼编码(3)平均码长(4)编码前后的压缩比 (5)编码效率。按照香农的理论,在有限的互斥和联合穷举事件的集合中,熵为事件的信息量的平均值,也称事件的平均信息量。如果要求在编码过程中不丢失信息,即要求保存信息熵,这种信息保持编码又叫做熵保存编码,或者叫做熵编码。m7,它们的概率如所示,计算这些符号的霍夫曼码。3. 假设是由3个事件组成的集合,计算该集合的决策量。i)=1/256,计算这段音频数据的熵。1. 熵(entropy)是什么?原创 2023-10-02 20:50:14 · 331 阅读 · 0 评论 -
【多媒体技术与实践】多媒体计算机系统概述
Windows Media Player:Windows Media Player是Windows操作系统自带的媒体播放器,具有简单易用的界面和基本的播放功能。它还支持高级的媒体处理功能,如调整音频和视频效果、截图和录制等。它还支持高级的媒体处理功能,如调整音频和视频效果、截图和录制等。功能:捕捉(实时或者非实时)静态、动态画面,将采集的模拟信号转换成数字图像或者视频,进行加工和修改并保存到成标准文件。(2)高质量的音频卡。(1)超级链接能力(2)动画制作坏与演播(3)编程环境(4)模块化和面向对象化。原创 2023-10-02 20:39:19 · 260 阅读 · 0 评论 -
【多媒体技术与实践】多媒体技术基础
媒体中的哪种是为了加工、处理和传输感觉媒体而人为构造出来的一种媒体,借助此种媒体,便能更加有效的存储或传送感觉媒体。如语言编码、电报码等。(1)视频、音频信号的获取(2)多媒体数据压缩编码和解码技术(3)视频、音频数据的实时处理和特技(4)视频、音频数据的输出技术。关键技术:数字化技术、数据压缩技术、超大规模集成电路制造技术、大容量的光盘存储器、多媒体同步技术、超文本与超媒体。应用领域:教育培训、休闲旅游、商业广告、影视娱乐、电子出版、过程模拟、信息管理、军事模拟、远程医疗、网络世界。原创 2023-10-02 20:37:49 · 137 阅读 · 0 评论 -
【多媒体技术与实践】音频信息获取和处理——编程题汇总
已知采样频率(单位KHz)、量化位数、声道数及持续时间(单位分钟),求未压缩时的数据量(单位MB).例如:输入: 22.05 16 2 3 (空格分隔)输出:15.1MB(保留小数点后一位)注:此题注意最后需要加【MB】字样,否则无法ac。原创 2023-09-30 11:42:26 · 642 阅读 · 0 评论 -
【数学建模】期末样题(2021年真题)
数学建模原创 2023-06-04 14:50:10 · 3858 阅读 · 3 评论 -
【统计机器学习】考核标准 + 课堂练习题汇总
课堂练习汇总原创 2023-03-17 20:46:16 · 950 阅读 · 0 评论