stlin256-CSDN博客

原创对Tesla V100的理论性能测评和与5060Ti的对比

NVIDIA Tesla V100 SXM2 16G评测摘要 Tesla V100作为2017年发布的Volta架构计算卡，曾凭借640个Tensor Core和815mm²大核心在AI计算领域占据重要地位。测试显示其FP64性能达6.93TFLOPS，FP16性能高达105TFLOPS，显存带宽900GB/s。但与新一代RTX 5060Ti对比发现：V100在FP64保持20倍优势，但新卡在BF16性能领先4.5倍，INT8稀疏计算达6倍优势。尽管V100现仅售400元且算力强劲，但面临300W高功耗、缺

2025-12-15 00:44:10 3060

原创在Windows系统编译llama-cpp-python

本文分享了在Windows系统下编译安装Llama-cpp-python库的经验。作者详细介绍了从Ubuntu迁移到Windows时遇到的编译问题，指出相比Pytorch，Llama-cpp-python的安装更为复杂。文中提供了具体的操作步骤：安装Visual Studio的C++开发组件、配置CUDA环境变量、使用VS命令提示窗设置编译参数并安装。文章还特别提到Windows下的编译效率问题，指出CPU占用率仅12%，导致编译耗时长达20多分钟。作者的环境配置为Win11 24H2系统、RTX4060显

2025-09-18 20:17:00 628

weixin_45737474的博客

原创对Tesla V100的理论性能测评和与5060Ti的对比

原创在Windows系统编译llama-cpp-python

原创【踩坑日记】在Ubuntu Linux上部署Local Deep Researcher

原创 RTX5060TI 16G运行大语言模型的速度实测（Qwen3）

原创解决flash attention提示model not initialized on GPU的方法

原创 RTX50系列显卡安装flash attention 2 基于Ubuntu24.04

空空如也

空空如也

原创 对Tesla V100的理论性能测评和与5060Ti的对比

原创 在Windows系统编译llama-cpp-python

原创 【踩坑日记】在Ubuntu Linux上部署Local Deep Researcher

原创 RTX5060TI 16G运行大语言模型的速度实测 （Qwen3）

原创 解决flash attention提示model not initialized on GPU的方法

原创 RTX50系列显卡安装flash attention 2 基于Ubuntu24.04

空空如也

空空如也

原创对Tesla V100的理论性能测评和与5060Ti的对比

原创在Windows系统编译llama-cpp-python

原创【踩坑日记】在Ubuntu Linux上部署Local Deep Researcher

原创 RTX5060TI 16G运行大语言模型的速度实测（Qwen3）

原创解决flash attention提示model not initialized on GPU的方法