机器学习
以西瓜书《机器学习》为理论基础,实现了《Python机器学习经典实例》中的主要内容。并对书中的代码做出了详细的讲解。
雨陌潇潇
学习永无止境!
展开
-
机器学习(七)音频可视化第二篇
将音频信号转换为频域实验内容将音频信号转换为频域原理(1)音频信号是不同频率、幅度和相位的正弦波的复杂混合。正弦波也称作正弦曲线。(2)音频信号的频率内容中隐藏了很多信息。事实上,一个音频信号的性质由其频率内容决定。世界上的语音和音乐都是基于这个事实的。(3)使用傅里叶变换可以将音频信号转换为频域实验过程1.详细步骤:(1) 创建一个Python文件,并导入以下程序包:(2) 读取input_freq.wav音频文件:(3) 对信号进行标准化:(4) 音频信号就是一个NumPy原创 2020-12-18 09:06:05 · 1467 阅读 · 0 评论 -
机器学习(七)音频可视化第一篇
读取音频文件并将该信号进行可视化展现实验内容读取音频文件并将该信号进行可视化展现。原理(1) 音频信号的基本结构,即音频信号的数字化形式是复杂的连续波形。(2) 为了将其保存成数字化形式,需要对音频信号进行采样并将其转换成数字。在进行采样时,语音语音通常以44100 Hz的频率进行采样,这也意味着每秒钟信号被分解成44,100份,然后这些抽样值被保存。(3) 如果采样率很高, 用媒体播放器收听音频时,会感觉到信号是连续的。实验过程详细步骤:(1) 创建一个Python文件,并导入以下程序包原创 2020-12-17 17:00:43 · 1647 阅读 · 0 评论 -
机器学习(六)推荐引擎之构建电影推荐引擎
构建电影推荐引擎简介推荐引擎是一个能预测用户兴趣点的模型。将推荐引擎应用于电影语境时,便成了一个电影 推荐引擎。我们通过预测当前用户可能会喜欢的内容,将相应的东西从数据库中筛选出来,这样的推荐引擎可以有助于将用户和数据集中的合适内容连接起来。为什么推荐引擎这么重要?设想 你有一个很庞大的商品目录,而用户可能或者不可能查找所有的相关内容。通过推荐合适的内容, 可以增加用户消费。推荐引擎通常用协同过滤(collaborative filtering)或基于内容的过滤(content-based filt原创 2020-12-17 16:51:30 · 559 阅读 · 0 评论 -
基于pandas的电影评分差异分析
基于pandas的电影评分差异分析实验内容数据来源详细步骤import pandas as pdimport numpy as npunames = ['user id','age','gender','occupation','zip code']users = pd.read_csv('ml-100k/u.user',sep ='|',names = unames) # sep定义的是每行数据间的分隔符rnames = ['user id','item id','rating'原创 2020-12-17 16:42:31 · 979 阅读 · 0 评论 -
机器学习(五)贝叶斯分类器之估算收入阶层
估算收入阶层实验内容本节将根据14个属性建立分类器评估一个人的收入等级。可能的输出类型是“高于50K”和“低 于或等于50K”。这个数据集稍微有点复杂,里面的每个数据点都是数字和字符串的混合体。数值 数据是有价值的,在这种情况下,不能用标记编码器进行编码。需要设计一套既可以处理数值数 据,也可以处理非数值数据的系统。我们将用美国人口普查收入数据集中的数据: https://archive.ics.uci.edu/ml/datasets/Census+Income 。知识链接分类与上一章介绍的回归不原创 2020-12-17 16:36:48 · 1435 阅读 · 0 评论 -
机器学习(四)SVM之根据相关数据预测交通流量
根据相关数据预测交通流量实验内容准备工作详细步骤实验结果实验内容我们将建立一个SVM来根据相关数据预测交通流量。准备工作我们将要使用的数据集可以在https://archive.ics.uci.edu/ml/datasets/Dodgers+Loop+Sensor下 载。这个数据集统计了洛杉矶道奇棒球队(Los Angeles Dodgers)进行主场比赛期间,体育场周 边马路通过的车辆数量,存放在traffic_data.txt文件中。每一行都包含用逗号分隔的字符串格式。详细步骤# 使用S原创 2020-12-17 16:29:44 · 3873 阅读 · 3 评论 -
机器学习(四)SVM之预测一栋大楼进出楼门的人数
预测一栋大楼进出楼门的人数实验内容详细步骤源代码和数据集实验结果总结实验内容我们将建立一个SVM来预测一栋大楼进出楼门的人数。详细步骤import numpy as npfrom sklearn import preprocessingfrom sklearn.svm import SVCinput_file = 'building_event_binary.txt'# input_file = 'building_event_multiclass.txt'# 读取数据X = [原创 2020-12-17 16:23:10 · 517 阅读 · 1 评论 -
机器学习(三)随机森林之根据汽车特征评估质量
随机森林之根据汽车特征评估质量实验内容准备工作实验步骤结果总结实验内容根据汽车特征评估质量接下来看看如何用分类技术解决现实问题。我们将用一个包含汽车多种细节的数据集,例如 车门数量、后备箱大小、维修成本等,来确定汽车的质量。分类的目的是把车辆的质量分成4种 类型:不达标、达标、良好、优秀。准备工作你可以从https://archive.ics.uci.edu/ml/datasets/Car+Evaluation下载数据集。 你需要把数据集中的每个值看成是字符串。考虑数据集中的6个属性,其取值原创 2020-12-17 16:09:32 · 2100 阅读 · 1 评论 -
机器学习(二)决策树的比较以房屋价格预测为例续-----计算特征的相对重要性
以房屋价格预测为例续-----计算特征的相对重要性实验内容实验步骤源代码实验结果总结实验内容在1.9节使用普通的决策树回归器和带AdaBoost算法的决策树回归器预测房屋价格的基础上,判断13个特征中哪个特征对结果的影响最大实验步骤(1) 创建一个新的Python文件housing.py,然后加入下面的代码import numpy as npfrom sklearn.tree import DecisionTreeRegressorfrom sklearn.ensemble import A原创 2020-12-17 15:51:21 · 678 阅读 · 0 评论 -
机器学习(二)决策树的比较以房屋价格预测为例
实验内容使用普通的决策树回归器和带AdaBoost算法的决策树回归器预测房屋价格,评价两种回归器的训练效果实验步骤(1) 创建一个新的Python文件housing.py,然后加入下面的代码import numpy as npfrom sklearn.tree import DecisionTreeRegressorfrom sklearn.ensemble import AdaBoostRegressorfrom sklearn import datasetsfrom sklearn.me原创 2020-12-17 15:37:50 · 914 阅读 · 0 评论 -
新浪新闻动态网页爬取+热点词云分析
新浪新闻动态网页爬取+热点词云分析实验内容这里不用管拓展视频是什么,视频涉及的内容很浅显。在日常生活中,我们经常见到“年度热词”,你会好奇这究竟是怎么得到的?我们最常见的思路就是,计算机通过分析大数据得到的。下面我用这个例子展示一下详细过程上代码代码都有注解,懂的都懂!from selenium import webdriverfrom selenium.common.exceptions import NoSuchElementExceptionimport jiebafrom w原创 2020-12-17 09:44:12 · 2363 阅读 · 0 评论 -
机器学习(二)决策树之儿童入学推荐
推荐入学预测实验内容一、详细步骤二、实现代码调试截图总结实验内容给定一个数据集合nursery.txt。该数据集包含12960个入学儿童的自身及家庭状况以及是否推荐他们入学,目标是找到决策树模型可以将这些数据拟合,从而对是否入学做出预测分析,同时通过计算它的均方误差来评价拟合的好坏。一、详细步骤(1) 从这个网址下载nursery.data,然后将修改扩展名,将其修改成Python容易处理的nursery.txt文件(2) 导入相关的包(3) 读取数据,加载到numpy数组中(4) 对数据原创 2020-12-16 21:19:32 · 1016 阅读 · 1 评论 -
机器学习(一)线性模型之多项式回归器
多项式回归器PolynomialFeatures前言一、特色二、详细步骤实验结果总结前言线性回归模型有一个主要的局限性,那就是它只能把输入数据拟合成直线,而多项式回归模型通过拟合多项式方程来克服这类问题,从而提高模型的准确性。一、特色我在算法中使用了Pipeline,Pipeline可以将许多算法模型串联起来,比如将特征提取、归一化、分类组织在一起形成一个典型的机器学习问题工作流。主要带来两点好处:1. 直接调用fit和predict方法来对pipeline中的所有算法模型进行训练和预测。2原创 2020-12-15 21:38:52 · 629 阅读 · 1 评论 -
机器学习(一)线性模型之岭回归器RidgeRegressor
创建岭回归器创建目的一、目标函数、损失函数和正则化是什么?二、详细步骤结果总结源代码和数据集下载创建目的在上一篇博客中我们实现了线性回归器模型,但是线性回归器模型具有一个致命的缺点,那就是对异常值敏感。所谓异常值敏感就是线性模型由于考虑到了那些异常店,会使线性模型向异常点“靠拢”,用图片表示就是可以从图中看到:在没有右下方异常点的时候线性模型拟合成实线的模样,在添加了两个异常值后,原先的实线为了“照顾”那两个异常点,发生了向右下方偏移的情况。这就叫做异常值敏感。产生敏感的原因在于最小二乘法“照顾原创 2020-12-15 21:05:30 · 738 阅读 · 0 评论 -
机器学习(一)线性模型LinearRegression
创建线性回归器实验内容实验准备实验步骤步骤总结答疑实验结果实验内容给定一个数据集合data_singlevar.txt。目标是找到一个线性模型可以将这些数据拟合。我们称之为线性回归,同时通过计算它的均方误差来评价拟合的好坏。在命名时,singlevar表示y的值x确定,这里的x仅包含一个属性。实验准备源文件和数据集请前往百度网盘下载链接:https://pan.baidu.com/s/1eXQvwhsr4E4CIpyy4qoPiQ提取码:891j复制这段内容后打开百度网盘手机App,操作更方原创 2020-12-15 19:33:56 · 1716 阅读 · 0 评论