自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 集成学习

一,简介集成学习是指使用多种兼容的学习算法/模型来执行单个任务的技术,目的是为了得到更佳的预测表现。集成学习的主要方法可归类为三大类: 堆叠(Stacking)、提升算法 Boosting 和 Bootstrap Aggregating(装袋,缩写为Bagging)。在这些集成技术中最流行的方法包括随机森林、梯度提升、AdaBoost、**梯度提升决策树(GBDT)**和 XGBoost。集成学习就是训练多个模型,根据每个模型的投票做预测二,优缺点优点: 提高预测性能,直接级联不同模型,容易

2021-04-21 23:24:27 3795

原创 零基础语音识别--Keras--入门

一, 简介Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。Keras 的开发重点是支持快速的实验。能够以最小的时延把你的想法转换为实验结果,是做好研究的关键。允许简单而快速的原型设计(由于用户友好,高度模块化,可扩展性)。同时支持卷积神经网络和循环神经网络,以及两者的组合。在 CPU 和 GPU 上无缝运行。Keras 兼容的 Python 版本: Python 2.7-3.6。Keras 的核心数

2021-04-19 23:22:31 759

原创 天池--零基础入门语音识别之食物声音识别--task02

1,过零率过零率(zero crossing rate)是一个信号符号变化的比率,即,在每帧中,语音信号从正变为负或从负变为正的次数。 这个特征已在语音识别和音乐信息检索领域得到广泛使用,通常对类似金属、摇滚等高冲击性的声音的具有更高的价值。一般情况下,过零率越大,频率近似越高。librosa.feature.zero_crossing_rate(y,frame_length = 2048,hop_length = 512,center = True,** kwargs)参数:

2021-04-18 00:23:25 361

原创 天池--零基础入门语音识别之食物声音识别--task02

Python 音频信号处理库 librosa–入门1,音频处理filename = librosa.example('nutcracker')获取librosa随附的音频示例文件的路径。在此步骤之后, filename将是一个字符串变量,其中包含示例音频文件的路径。y, sr = librosa.load(filename)librosa.load()以时间序列的 y形式加载和解码音频,以一维NumPy浮点数组表示y。可变SR包含采样速率的 y,即,每秒音频的样本的数目。默认情况

2021-04-15 23:47:24 295

原创 天池--零基础入门语音识别之食物声音识别--task01

一,Python的Tqdm模块——进度条配置tqdm官网地址:https://pypi.org/project/tqdm/Tqdm模块是一个快速,可扩展的Python进度条,可以在Python长循环中添加一个进度提示信息,用户只需要封装任意的迭代器tqdm(iterator)即可完成进度条。相比ProgressBar来说Tqdm的开销非常低,同时Tqdm可以在任何环境中不需要任何依赖运行。1,Tqdm安装pip install tqdm或者安装了Anaconda,使用conda来安装conda

2021-04-14 00:01:55 411 2

原创 python--批量离线安装python包

针对内网无法直接使用pip安装的情况, 在win上使用 pip 根据requirements文件下载安装包,到离线环境中再使用 pip 安装1. 首先,在项目中分析出所有依赖的库pip freeze > requirements.txt # 该方法仅可以使用在虚拟环境中,会将python 解释器下的所有包都导出2. 将所有包下载到DIR这个目录中pip download -r requirements.txt -d /tmppip wheel -w DIR -r requi.

2021-01-07 16:00:39 2080 1

原创 pandas--缺失数据

一、缺失值的统计和删除1. 缺失信息的统计缺失数据可以使用isna或isnull(两个函数没有区别)来查看每个单元格是否缺失,结合mean可以计算出每列缺失值的比例:df = pd.read_csv('../data/learn_pandas.csv', usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight', 'Transfer'])df.isna().head()df.isna().mean() # 查看缺失的比例如果想

2021-01-03 22:58:29 965

原创 pandas基础--连接

一、关系型连接1. 连接的基本概念把两张相关的表按照某一个或某一组键连接起来是一种常见操作,例如学生期末考试各个科目的成绩表按照姓名\color{red}{姓名}姓名和班级\color{red}{班级}班级连接成总的成绩表,又例如对企业员工的各类信息表按照员工ID号\color{red}{员工ID号}员工ID号进行连接汇总。由此可以看出,在关系型连接中,键\color{red}{键}键是十分重要的,往往用on参数表示。另一个重要的要素是连接的形式。在pandas中的关系型连接函数merge和j

2020-12-29 23:05:33 134

原创 matplotlib基础--场景案例

不同场景适合的可视化图表类型,使用注意事项,以及如何用现成的绘图接口来呈现。 我们将常见的场景分为5大类:1)展示趋势变化(Evolution)2)展示分布关系(Distribution)3)展示相关关系(Correlation)4)展示排序信息(Ranking)5)展示组成关系(Part of a whole)一、展示趋势变化(Evolution)1. 折线图 - Line chart线图(也叫折线图)是众多图表中的基本图形。它由一系列的数据点和连接这些数据点的线段组成。它的.

2020-12-27 22:56:08 717

原创 pandas基础--变形

一、长宽表的变形1. pivotpivot 是一种典型的长表变宽表的函数,对于一个基本的长变宽的操作而言,最重要的有三个要素,分别是变形后的行索引、需要转到列索引的列,以及这些列和行索引对应的数值,它们分别对应了pivot方法中的index, columns, values参数。新生成表的列索引是columns对应列的unique值,而新表的行索引是index对应列的unique值,而values对应了想要展示的数值列。利用pivot进行变形操作需要满足唯一性的要求,即由于在新表中的行列索引

2020-12-27 22:26:05 164

原创 pandas基础--分组

一、分组模式及其对象1. 分组的一般模式想要实现分组操作,必须明确三个要素:分组依据\color{#FF0000}{分组依据}分组依据、数据来源\color{#00FF00}{数据来源}数据来源、操作及其返回结果\color{#0000FF}{操作及其返回结果}操作及其返回结果。同时从充分性的角度来说,如果明确了这三方面,就能确定一个分组操作,从而分组代码的一般模式即:df.groupby(分组依据)[数据来源].使用操作现在返回到学生体测的数据集上,如果想要按照性别统计身高中位数,就可以如

2020-12-25 21:54:47 3823

原创 matplotlib的绘图样式与色彩设置

一、matplotlib的绘图样式(style)matplotlib库提供了四种批量修改全局样式的方式, 而不用对每张图一张张修改1.matplotlib预先定义样式matplotlib提供了许多内置的样式供用户使用,在python脚本的最开始输入想使用style的名称即可调用import matplotlib as mplimport matplotlib.pyplot as pltimport numpy as npplt.style.use('default')plt.plot

2020-12-24 23:14:09 9126

原创 matplotlib--文字图例

一、Figure和Axes上的文本Matplotlib具有广泛的文本支持,包括对数学表达式的支持、对栅格和矢量输出的TrueType支持、具有任意旋转的换行分隔文本以及Unicode支持。下面的命令是介绍了通过pyplot API和objected-oriented API分别创建文本的方式。1.textpyplot API:matplotlib.pyplot.text(x, y, s, fontdict=None, **kwargs)OO API:Axes.text(self, x, y

2020-12-22 22:25:07 429

原创 pandas--索引

一、索引器1. 表的列索引列索引是最常见的索引形式,一般通过 [] 来实现。通过 [列名] 可以从 DataFrame 中取出相应的列,返回值为 Series, 等价于用 .列名 取出单列,且列名中不包含空格df.Name.head() # 等价于 df['Name'].head()请不要把纯浮点以及任何混合类型(字符串、整数、浮点类型等的混合)作为索引,否则可能会在具体的操作时报错或者返回非预期的结果, 最好用[ ]来实现如果要取出多个列,则可以通过 [列名组成的列表] ,其返回值为一

2020-12-22 22:08:36 388

原创 matplotlib的布局格式

一、子图1. 使用 plt.subplots 绘制均匀状态下的子图返回元素分别是画布和子图构成的列表,第一个数字为行,第二个为列figsize 参数可以指定整个画布的大小sharex 和 sharey 分别表示是否共享横轴和纵轴刻度tight_layout 函数可以调整子图的相对大小使字符不会重叠除了常规的直角坐标系,也可以通过projection方法创建极坐标系下的图表N = 150r = 2 * np.random.rand(N)theta = 2 * np.

2020-12-20 23:24:19 182

原创 pandas基础

pandas基础一、文件的读取和写入1. 文件读取pandas 可以读取的文件格式有很多,这里主要介绍读取 csv, excel, txt 文件。pd.read_csvpd.read_tablepd.read_excel上面三者的常用的公共参数:header=None 表示第一行不作为列名index_col 表示把某一列或几列作为索引usecols 表示读取列的集合,默认读取所有的列parse_dates 表示需要转化为时间的列,nrows 表示读取的数

2020-12-19 23:45:11 1027 2

原创 matplotlib的api

一、概述1. matplotlib的三层apimatplotlib的原理:用Artist对象在画布(canvas)上绘制(Render)图形。matplotlib.backend_bases.FigureCanvas:代表了绘图区,所有的图像都是在绘图区完成的matplotlib.backend_bases.Renderer:代表了渲染器,可以近似理解为画笔,控制如何在 FigureCanvas 上画图。matplotlib.artist.Artist:代表了具体的图表组件,即调用了Re

2020-12-18 23:19:15 307 1

原创 Python基础和Numpy基础

一、Python基础1, 列表推导式与条件赋值[* for i in *] 。其中,第一个 * 为映射函数,其输入为后面 i 指代的内容,第二个 * 表示迭代的对象。value = a if condition else b :2. 匿名函数与map方法map 函数来完成,它返回的是一个 map 对象,需要通过 list 转为列表:3. zip对象与enumerate方法zip函数能够把多个可迭代对象打包成一个元组构成的可迭代对象,它返回了一个 zip 对象,通过.

2020-12-16 23:42:31 309 2

原创 matplotlib初识

MatplotlibMatplotlib是一个Python 2D绘图库,能够以多种硬拷贝格式和跨平台的交互式环境生成出版物质量的图形,用来绘制各种静态,动态,交互式的图表。Matplotlib可用于Python脚本,Python和IPython Shell、Jupyter notebook,Web应用程序服务器和各种图形用户界面工具包等。Matplotlib是Python数据可视化库中的泰斗,它已经成为python中公认的数据可视化工具,我们所熟知的pandas和seaborn的绘图接口其实也是基于m

2020-12-14 22:52:30 123

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除