自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 CSS中margin和padding属性的区别

在CSS中,margin和padding两个属性都可以调整位置,因此比较容易混淆。这篇文章详细分析两者的不同,希望对学习CSS的朋友有帮助。padding的作用是调整当前元素内容(例如文本内容)在元素中的位置。默认内容应该是紧贴元素的边界显示,增加padding后可以增大内容和边界的距离。可看如下代码:div.y未设置padding,而div.x设置了四个padding属性,其效果如下图: 大家可以看到在风格为div.y中,文字是紧贴div这个元素范围的边界的,也就是默认文字的高度和所覆盖的...

2022-06-24 01:56:26 7512

原创 让你的网页可以同时显示html和Latex数学公式—— ReactHtmlParser 和 React Mathjax

React html Parser + MathJax

2022-06-10 00:34:03 2920

原创 字节算法工程师一面凉经

1.针对实习提问: 数据分析内容?清洗数据的步骤?缺失值怎么处理?异常值的判断方式?箱型图原则和3σ原则有什么区别?异常值怎么处理?怎么替代?2.针对项目提问: Le-Net 5和VGG-16有什么区别?dropout效果如何,在测试阶段怎么处理?还有什么其他正则化方法?什么是感知域(没听懂,跳过去了)? 你了解1*1的卷积块有什么作用吗(bottleneck layer)?VGG-16过于复杂,是否尝试更简单的模型,效果如何?3.针对项目提问: 聊聊sklearn的vectorizer函数,怎么生

2021-08-02 13:34:05 302

原创 算法工程师面试题总结

1.Python is 和 == 有什么区别?a==b判断两个对象a和b的内容是否相等,默认调用__eq__()函数a is b判断a和b是否为同一个地址,即判断id(a)==id(b)。例如:a = 2, b =2 a==b输出[True] a is b输出[True]c = 257 d = 257 c==d输出[True] c is d输出[False]对于整数对象,Python把一些频繁使用的整数对象缓存起来,保存到一个叫small_ints的链表中,在Python的整个生命...

2021-07-31 04:28:26 4483

原创 说话人识别(speaker Recognition/Verification)简介

1.分类

2021-06-07 07:32:19 4685

原创 语音识别之向量量化、期望最大化算法

1. 向量量化 Vector Quantization所谓Vector Quantization,即大家熟知的K-means。运用VQ之前,需要定义一个距离的

2021-06-06 16:15:34 945 1

原创 宽带语谱图(wideband spectrogram)和窄带语谱图(narrowband spectrogram)的区别

1.概念区分宽带spectrogram:以3ms(或300Hz左右的带宽)左右进行分帧之后制成的spectrogram窄带spectrogram:以20ms(或45Hz左右的带宽)左右进行分帧之后制成的spectrogram首先3ms和25ms大家都理解,就是每一帧持续的时间分别是3ms和25ms,但是后面对应的带宽是啥意思呢?原来,所谓的分帧,相当于加了一个矩形窗函数,而加窗也就是信号和窗函数相乘,在频域中对应的是窗函数和原信号的频谱进行卷积。矩形窗的傅里叶变换大家应该很熟悉了:..

2021-05-27 15:31:03 8901

原创 语音特征提取: 看懂梅尔语谱图(Mel-spectrogram)、梅尔倒频系数(MFCCs)的原理

本文内容主要来自于:Speech Processing for Machine Learning: Filter banks, Mel-Frequency Cepstral Coefficients (MFCCs) and What’s In-Between | Haytham Fayek1. 什么是梅尔语谱图和梅尔倒频系数?机器学习的第一步都是要提取出相应的特征(feature),如果输入数据是图片,例如28*28的图片,那么只需要把每个像素(pixel)作为特征,对应的像素值大小(代表颜色的强.

2021-05-27 09:11:08 49978 32

原创 Python利用正则表达式来对数据中的日期进行处理

在数据分析中,经常要对日期字符串进行相应的处理。日期常见的格式为xxxx/xx/xx或xxxx-xx-xx等1.如何去掉中间的分隔符号?可以用以下代码正则表达式'\d+'表示提取所有数字(至少一位数字或以上)。import pandas as pdimport redata = pd.read_csv('数据')riqi = data['日期'].apply(lambda x: re.findall(r'\d+', x)) #riqi得到的是所有的日期数据,每一行是一个列表,比如202

2021-05-19 08:26:15 1621

原创 Python利用正则表达式去除特定字符中内容返回值为None的情况

问题:今天在用正则处理一段字符串的时候出现一个问题,字符内容是这样的: try{...}catch(e){},我想取出try里面的内容,具体代码如下:s = 'try{00000000}catch(e){}'x = r'try{(.*)}catch(e){}'ss = re.findall(x,s)print(ss)结果返回值为None.解决:问题是由正则表达x中出现了(e)导致的,这个(e)会和(.*)一起作用,s中不存在x对应的内容。解决办法如下:x = u'tr

2021-05-16 04:03:16 1353 1

原创 Python爬取带有线图的数据——以百度疫情网页为例

比方说,我现在想爬实时更新:新型冠状病毒肺炎疫情地图 (baidu.com)里面美国日增病例数据,但这里面美国日增数据是以线图的形式展现的,如图所以我们要先分析一下它的html文本内容,看看网页有没有完整的线图中的数据,首先用如下代码获得网页的htmlimport requests as rq #获得网页的htmlfrom bs4 import BeautifulSoup #利用soup进行指定搜索url = 'https://voice.baidu.com/act/newpneumoni

2021-05-15 15:22:59 738 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除