自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 资源 (3)
  • 收藏
  • 关注

原创 【笔记】WebGL编程指南学习(4)

WebGL编程指南学习(4)4. 最后一块拼图在学会处理顶点,包括处理顶点的坐标、Javascript和WebGL管线的数据通信、坐标变换之后,还需要处理顶点的其他数据——如颜色等。此外,还需要处理将图像(或纹理)映射到图形或三维对象表面上。这就是WebGL的最后一块拼图。将顶点的其他(非坐标)数据(如颜色)传入顶点着色器发生在顶点着色器和片元着色器之间的从图形到片元的转化,又称为图元光栅化将图像(或称纹理)映射到图形或三维对象的表面上4.1 将非坐标数据传入顶点着色器4.1.1 第一个例

2022-03-20 22:16:10 1447

原创 【笔记】Polygon mesh processing 读书笔记(3)

文章目录3. 微分几何曲线弧长曲率表面表面的参数化表示度量性质**第一基本形式****各向异性**表面曲率**Euler定理****曲率张量****固有几何(Intrinsic Geometry)****Laplace算子**离散微分算子局部平均区域法向量梯度**离散Laplace-Meltrami算子****Uniform Laplacian****余切形式**离散曲率离散曲率张量3. 微分几何曲线光滑平面曲线,可认为是可微的一维流形,参数化为:x:[a,b]→R2,x(u)=(x(u),y(

2022-03-19 12:47:11 1149

原创 【笔记】Polygon mesh processing读书笔记(2)

多边形网格处理系列第二篇文章目录@[toc]2. 网格数据结构基于面的数据结构基本情况优缺点改进的face-based数据结构基于边的数据结构基于半边的数据结构基于有向边的数据结构小结2. 网格数据结构判断一种数据结构的好坏标准包括(但不限于):构建它的时间响应特定查找的时间执行特定操作的时间存储消耗与冗余基于面的数据结构基本情况每个面包含3个顶点位置,不能表示网格连接关系也被称为triangle soup或者polygon soup一些数据转换格式,如stereolig

2022-03-19 12:39:20 954

原创 【笔记】Polygon mesh processing 读书笔记(1)

参考书籍:Polygon mesh processing,2010大约分8篇,这是第一篇0. 前言3D 获取技术计算机断层扫描(computer tomography)核磁共振成像(MR,magnetic resonance imaging)3D 激光扫描 (3D laser scanning)超声 (ultrasound)雷达 (radar)显微成像(microscopy)Botsch的几何处理管线输入数据–>移除拓扑和几何错误–>分析表面质量–>表面平滑(.

2022-03-14 13:33:25 1494

原创 【笔记】《WebGL编程指南》学习(3)

WebGL编程指南学习(3),界明城,2022-3-33. 再来一点点数学关于视点,除了Viewpoint-LookAt-UpDirection之外,还有更多需要考虑的东西,比如视场,比如深度3.1 可视范围(Orthographic)类似人眼,在渲染场景的时候,定义了可视空间(view volume)3.1.1 可视空间两类常用的可视空间:长方体可视空间,由**正射投影(orthographic projection)产生;四棱锥可视空间,由透视投影(perspective projectio

2022-03-03 12:18:36 478

原创 【笔记】《WebGL编程指南》学习(2)

WebGL编程指南学习(2),界明城,2022-3-22. 只是一点数学罢了其实困扰我的,不是代码,而是数学——by某计算机科研狗2.1 WebGL坐标系统WebGL的X轴水平(正方向向右),Y轴垂直(正方向向上,书中有误),Z轴垂直于屏幕(正方向向外)但WebGL好像是右手坐标系,又好像不完全是2.2 移动、旋转和缩放可以使用右手法则确定旋转方向逆时针:观察者沿Z轴负方向进行观察,看到的物体是逆时针旋转的,这种情况又可称为正旋转2.2.1 4×4的变换矩阵数组存储矩阵元素可以按行主序,

2022-03-02 13:20:18 649

原创 【笔记】《WebGL编程指南》学习(1)

WebGL编程指南学习,界明城,2022-3-11. 只是简单的迁移罢了——在JavaScript中调用WebGL在JavaScript中调用WebGL,类似于在C++中调用OpenGL,也类似在Java中调用NDK,是一种类似客户端-服务器的请求-返回两层机制。API就起到了通信的作用。因此,难点在于:如何在JavaScript中获取WebGL传来的数据,主要是指WebGL里的变量(属性)及相关内容;如何将JavaScript中的数据传到WebGL1.1 着色器与JavaScript的数据“

2022-03-01 22:57:52 792

原创 【笔记】《WebGL编程指南》学习(0)

WebGL编程指南学习,界明城,2022-3-10. WebGL编程,从入坑到放弃知识路径《WebGL编程指南》环境搭建WebGL编程范式0.1 知识路径Level 1:了解计算机图形学,尤其是渲染相关概念Level 2:用过OpenGL,知道0.2 《WebGL编程指南》环境搭建0.2.1 TODO对本书的评价,将在整本书读完后更新0.2.2 代码运行环境本机运行环境:MacOS Monterey 12.2.1编辑器:VS Code本书对WebGL特性的支持:WebG

2022-03-01 20:17:14 1139 1

原创 【从零开始】windows配置glfw与glad

目标后知后觉发现windows上可以跑openGL 4.x(也许是我脑子混乱,总感觉windows不支持openGL)。于是重操旧业,配置一下。没想到,这一配就是半个多小时,记录一下踩的雷。初始环境VS 2022, 这个无所谓。cmake 3.22, 这个也无所谓,但是不要太低了,建议在3.20以上。glfw3.3.6, 官网下载最新的即可,下载下来以后是source code,得稍微编译一下。glad,这个官网上自带编译,扒编译好的文件即可。Step 1:glfw的编译这个编译很简单,

2022-02-05 21:33:24 2271

原创 ESC-50数据集的分析(1)

单个音频波形图和对应声谱图的可视化|特征可视化原始资料来自原作者的jupyter notebook[jupyter]这里的一些可视化工具,可能可以用来新的数据集分析,以及算法性能比较。本人誊写的代码在这里[source]单个音频波形图和对应声谱图的可视化特征可视化这里是用来分析所使用的音频特征的区分度(有效性)。可视化的方法有很多,但是背后其实是降维。以常用的音频特征MFCC为例,首先看一下在单个音频clip上的分布表现。这里用的seaborn的boxplot实现了一个特征分布的箱图。箱图.

2020-05-25 20:58:46 4649 3

原创 基于深度学习的语音识别技术综述(2)

书接上文,上一回说到这个front-end技术,这里就继续说back-end技术。Back-end techniques现在看看后端技术。这块对应语音处理的第二步,就是通过比较输入语音(语音特征)与预设的语音模型,来完成某项任务。在综述里,后端技术是指,输入的就是未经处理的带噪信号,直接通过神经网络来完成语音任务。和使用前端技术的方法相比,网络结构,甚至包括语音模型(acoustic model)都可能要改变。我们知道传统语音任务这块是构建GMM-HMM模型,学习输入语音特征和预设语音模型的关系。这是

2020-05-20 16:44:41 868

原创 基于深度学习的语音识别技术综述(1)

Deep learning for automatic speech recognition survey[1]这篇综述质量尚可(废话,TIST的文章能不好,你有本事发一个)。TIST是什么?PIA打飞,百度去。通讯作者是Schuller,被引次数超过3万的大佬。听大佬的,少走弯路(Doge脸)。那这篇文章的关注点其实很聚焦:鲁棒的语音识别,也就是对有噪声语音的识别。所关注的技术是当红炸子鸡deep learning。有噪语音的识别,可以类比失真图像的识别。因为图像也好,语音也罢,本质上都是信号。那么

2020-05-18 22:12:45 3662

原创 ECS-50语音识别数据集baseline模型

"Envorinmental Sound Classification using Deep Learning"的复现报告说明|实验结果|讨论|下一步工作说明复现的工作是github上audio-classification。因为这个project的源码比较清楚,所以复现难度几乎为0. 所做的贡献:改写了数据集读取部分,因为原始代码是为esc-10工作的,而esc现在只有esc-50数据...

2020-04-29 16:40:37 3119 4

原创 深度数字语音处理

深度数字语音处理引言|有用的工具|知识体系|数学|传统特征   引言有用的工具语音数据集|奇怪的网站|开发环境|第三方库语音数据集数据集描述ESC-50 dataset该数据集由2000条语音组成,每条语音5秒,共分为50个语义类别(每个语义类别40条)奇怪的网站shields.io : 一个用来生成各种...

2020-04-26 09:57:04 3678

原创 H.265 3D视频编码

实验目的    对单视点视频+深度使用HEVC编码,编码使用不同量化步长。  2. 方案1-HTM    使用HTM-16.2-dev编码,选用3-view+depth, Nview+depth+qp, seqContent,联合编码,注意修改3-view-depth里面的文件路径,这里还需要camera parameter;    优势:参数可控;    劣势:编码速度太慢,500帧,3视点+d...

2018-06-15 15:56:52 2929 1

原创 线性代数笔记(网易公开课)

Linear Algebra Handnote(1)If LL is lower triangular with 1’s on the diagonal, so is L−1L^{-1}Elimination = Facotization: A=LUA=LUATA^T is the matrix that makes these two inner products equal for eve

2017-11-07 18:16:49 2859

原创 机器学习(Machine learning: a probabilistic perspective) 第三章阅读笔记

Table of Contents1  机器学习(Machine learning: a probabilistic perspective) 第三章阅读笔记1.1  生成式分类器(generative classifiers)1.2  离散数据的生成式模型1.2.1  似然(likelihood)1.2.2  先验(prior)1.2.3  后验(posterior)1.2.4  后验预测分布(p

2017-09-18 10:07:23 2276

原创 openGL SuperBible 7th 初编译

openGL SuperBible 6th的源码中使用的还是glfw2.x版本库,而glfw升级到3.x之后,直接停止了对2.x中函数的支持(轻量级库的好处是简洁明快,缺点是版本维护),因此当初编译时费了好大的劲儿。这次通过百度找到了sb7的源码,里面的glfw库也随之升级为3.x了。于是再次编译。源码中的gl3w.h是一个轻量级的openGL扩展库,功用类似glew,因为我之前编

2016-01-29 14:18:20 2720 4

Time of flight and depth imaging

Tof相机及深度应用,2014年最新出版,GCPR会议集

2015-03-30

软件成本估算报告实例

软件成本估算报告,管理方面的,采用的FP的方法进行项目估算。

2010-01-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除