-
- 参数说明
-
- A WaitForTargetFPS
- B Overhead
- C PhysicsSimulate
- D CameraRender
- E RenderTextureSetActive
- F MonobehaviourOnMouse_
- G HandleUtilitySetViewInfo
- H GUIRepaint
- I EventInternal_MakeMasterEventCurrent
- J Cleanup Unused Cached Data
- K ApplicationIntegrate Assets in Background
- L ApplicationLoadLevelAsync Integrate
- M UnloadScene
- N CollectGameObjectObjects
- O Destroy
- P AssetBundleLoadAsync Integrate
- Q LoadingAwakeFromLoad
-
- CPU Usage
- Memory Profiler
- Detail Memory Profiler
- 优化重点
- 项目中可能遇到的问题
-
- A DevicePresent
- B StackTraceUtilityPostprocessStacktrace 与 StackTraceUtilityExtractStackTrace
- C Overhead
- D GCCollect
- E GarbageCollectAssetsProfile
- F 少用foreach因为每次foreach为产生一个enumerator约16B的内存分配尽量改为for 但如果是泛型字典集合的话直接采用foreach遍历链表直接用for
- G Lambda表达式使用不当会产生内存泄漏
- H 尽量少用LINQ
- I 控制StartCoroutine的次数
- J 使用StringBuilder替代字符串直接连接
- K 缓存组件
-
- 参数说明
1.参数说明
A. WaitForTargetFPS:
Vsync(垂直同步)功能锁,即显示当前帧的CPU等待时间 。
该参数一般出现在 CPU开销过低,且通过设定了目标帧率的情况下(Application.targetFrameRate)。当上一帧低于目标帧率时,将会在本帧产生一个WaitForTargetFPS的空闲等待耗时,以维持目标帧率。该项在Unity引擎的主循环中其实是最早执行的,即引擎实际上是根据上一帧的CPU耗时,在当前帧中通过增补WaitForTargetFPS的方式来将运行FPS维持到目标值。比如,目标帧率为30帧/秒,上一帧耗时15ms,那么当前帧中WaitForTargetFPS将会是18(33-15)ms,但是这一帧中其他耗时为28ms,那么在Profiler中这一帧的总耗时就变成了46(18+28)ms。
B. Overhead:
Profiler总体时间-所有单项的记录时间总和。用于记录尚不明确的时间消耗,以帮助进一步完善Profiler的统计。
C. Physics.Simulate:
当前帧物理模拟的CPU占用时间。
D. Camera.Render:
相机渲染准备工作的CPU占用量
E. RenderTexture.SetActive:
设置RenderTexture操作.
底层实现:
- 比对当前帧与前一帧的ColorSurface和DepthSurface.
- 如果这两个Buffer一致则不生成新的RT,否则则生成新的RT,并设置与之相对应的Viewport和空间转换矩阵.
F. Monobehaviour.OnMouse_ :
用于检测鼠标的输入消息接收和反馈,主要包括:SendMouseEvents和DoSendMouseEvents。(只要Edtor开起来,这个就会存在)
G. HandleUtility.SetViewInfo:
仅用于Editor中,作用是将GUI和Editor中的显示看起来与发布版本的显示一致。
H. GUI.Repaint:
GUI的重绘(说明在有使用原生的OnGUI)
I. Event.Internal_MakeMasterEventCurrent:
负责GUI的消息传送
J. Cleanup Unused Cached Data:
清空无用的缓存数据,主要包括RenderBuffer的垃圾回收和TextRendering的垃圾回收。
- RenderTexture.GarbageCollectTemporary:存在于RenderBuffer的垃圾回收中,清除临时的FreeTexture.
- TextRendering.Cleanup:TextMesh的垃圾回收操作
K. Application.Integrate Assets in Background:
遍历预加载的线程队列并完成加载,同时,完成纹理的加载、Substance的Update等.
L. Application.LoadLevelAsync Integrate:
加载场景的CPU占用,通常如果此项时间长的话70%的可能是Texture过长导致.
M. UnloadScene:
卸载场景中的GameObjects、Component和GameManager,一般用在切换场景时.
N. CollectGameObjectObjects:
执行上面M项的同时,会将场景中的GameObject和Component聚集到一个Array中.然后执行下面的Destroy.
O. Destroy:
删除GameObject和Component的CPU占用.
P. AssetBundle.LoadAsync Integrate:
多线程加载AwakeQueue中的内容,即多线程执行资源的AwakeFromLoad函数.
Q. Loading.AwakeFromLoad:
在资源被加载后调用,对每种资源进行与其对应用处理.
2. CPU Usage
A. Device.Present:
Device.PresentFrame的耗时显示,该选项出现在发布版本中.
B. Gfx.WaitForPresent &&Graphics.PresentAndSync:
GPU上的显示和垂直同步耗时.该选项出现在发布版本中. 是CPU和GPU之间的垂直同步(VSync)导致的,之所以会有两种参数,主要是与项目是否开启多线程渲染有关。当项目开启多线程渲染时,你看到的则是Gfx.WaitForPresent;当项目未开启多线程渲染时,看到的则是Graphics.PresentAndSync。
造成这两个参数的CPU占用较高的原因主要有以下三种原因:
- CPU开销非常低,所以CPU在等待GPU完成渲染工作或等待VSync的到来;
- CPU开销很高,使Present错过了当前帧的VSync,即不得不等待下一次VSync的到来;
- GPU开销很高,CPU的Present需要等待GPU上一帧渲染工作的完成。
C. Mesh.DrawVBO:
GPU中关于Mesh的Vertex Buffer Object的渲染耗时.
D. Shader.Parse:
资源加入后引擎对Shader的解析过程.
E. Shader.CreateGPUProgram:
根据当前设备支持的图形库来建立GPU工程.
3. Memory Profiler
A. Used Total:
当前帧的Unity内存、Mono内存、GfxDriver内存、Profiler内存的总和.
B. Reserved Total:
系统在当前帧的申请内存.
C. Total System Memory Usage:
当前帧的虚拟内存使用量.(通常是我们当前使用内存的1.5~3倍)
D. GameObjects in Scene:
当前帧场景中的GameObject数量.
E. Total Objects in Scene:
当前帧场景中的Object数量(除GameObject外,还有Component等).
F. Total Object Count:
Object数据 + Asset数量.
4. Detail Memory Profiler
A. Assets:
Texture2d:记录当前帧内存中所使用的纹理资源情况,包括各种GameObject的纹理、天空盒纹理以及场景中所用的Lightmap资源.
B. Scene Memory:
记录当前场景中各个方面的内存占用情况,包括GameObject、所用资源、各种组件以及GameManager等(天般情况通过AssetBundle加载的不会显示在这里).
5. Other:
ManagedHeap.UseSize:代码在运行时造成的堆内存分配,表示上次GC到目前为止所分配的堆内存量.
SerializedFile(3):
WebStream:这个是由WWW来进行加载的内存占用.
System.ExecutableAndDlls:不同平台和不同硬件得到的值会不一样。
5. 优化重点
A. CPU-GC Allow:
关注原则:
- 检测任何一次性内存分配大于2KB的选项
- 检测每帧都具有20B以上内存分配的选项.
B. Time ms:
记录游戏运行时每帧CPU占用(特别注意占用5ms以上的).
C. Memory Profiler-Other:
- ManagedHeap.UsedSize: 移动游戏建议不要超过20MB.
- SerializedFile: 通过异步加载(LoadFromCache、WWW等)的时候留下的序列化文件,可监视是否被卸载.
- WebStream: 通过异步WWW下载的资源文件在内存中的解压版本,比SerializedFile大几倍或几十倍,重点监视.
D. Memory Profiler-Assets:
- Texture2D: 重点检查是否有重复资源和超大Memory是否需要压缩等.
- AnimationClip: 重点检查是否有重复资源.
- Mesh: 重点检查是否有重复资源.
6. 项目中可能遇到的问题
A. Device.Present:
- GPU的presentdevice确实非常耗时,一般出现在使用了非常复杂的shader.
- GPU运行的非常快,而由于Vsync的原因,使得它需要等待较长的时间.
- 同样是Vsync的原因,但其他线程非常耗时,所以导致该等待时间很长,比如:过量AssetBundle加载时容易出现该问题.
- Shader.CreateGPUProgram:Shader在runtime阶段(非预加载)会出现卡顿(华为K3V2芯片).
B. StackTraceUtility.PostprocessStacktrace() 与 StackTraceUtility.ExtractStackTrace():
- 一般是由Debug.Log或类似API造成.
- 游戏发布后需将Debug API进行屏蔽.
C. Overhead:
- 一般情况为Vsync所致.
- 通常出现在Android设备上.
D. GC.Collect:
原因:
- 代码分配内存过量(恶性的)
- 一定时间间隔由系统调用(良性的).
占用时间:
- 与现有Garbage size相关
- 与剩余内存使用颗粒相关(比如场景物件过多,利用率低的情况下,GC释放后需要做内存重排)
E. GarbageCollectAssetsProfile:
- 引擎在执行UnloadUnusedAssets操作(该操作是比较耗时的,建议在切场景的时候进行).
- 尽可能地避免使用Unity内建GUI,避免GUI.Repaint过渡GC Allow.
- if(other.tag == GearParent.MogoPlayerTag)改为other.CompareTag(GearParent.MogoPlayerTag).因为other.tag为产生180B的GC Allow.
F. 少用foreach,因为每次foreach为产生一个enumerator(约16B的内存分配),尽量改为for. 但如果是泛型字典集合的话直接采用foreach遍历。链表直接用for
G. Lambda表达式,使用不当会产生内存泄漏.
H. 尽量少用LINQ:
- 部分功能无法在某些平台使用.
- 会分配大量GC Allow.
I. 控制StartCoroutine的次数:
- 开启一个Coroutine(协程),至少分配37B的内存.
- Coroutine类的实例 – 21B.
- Enumerator – 16B.
J. 使用StringBuilder替代字符串直接连接.
K. 缓存组件:
- 每次GetComponent均会分配一定的GC Allow.
- 每次Object.name都会分配39B的堆内存.