- 博客(373)
- 收藏
- 关注
原创 大模型时代,为什么模型都是多少B?
在大模型领域,“B”代表的是“billion”,即十亿。当我们说一个模型是多少B时,通常指的是该模型所包含的参数数量达到了几十亿级别。
2025-03-10 11:40:49
616
原创 大模型时代,什么是tokens?
在大模型不断发展创新的今天,深入研究tokens这一基础概念,对于推动人工智能在语言领域的应用和发展具有不可忽视的重要性。
2025-03-09 14:56:07
910
原创 DeepSeek提问秘籍:“榨干”AI的潜力,轻松搞定复杂问题!
DeepSeek提问秘籍:1000字教你如何“榨干”AI的潜力,轻松搞定复杂问题!
2025-03-08 17:44:06
659
原创 字节AI编程神器Trae横空出世,效率提升十倍!
温馨提示:在处理敏感数据时,建议先进行脱敏处理再提供给AI,以确保数据安全。需求建议:提需求时,尽量详细描述,这样AI生成的结果会更加精准哦!在这个AI迅速发展的时代,不必惊慌或焦虑。如果觉得难以应对,不妨选择加入AI的行列。即使我们是乙方(比如我),也可以成为AI的甲方,掌握主动权!
2025-03-07 18:47:37
813
原创 Oumi :AI开发的未来?
Oumi以其强大的功能和灵活的架构,正在成为AI开发领域的重要工具。无论你是研究人员、开发者还是企业用户,Oumi都能为你提供所需的工具和工作流程,帮助你构建最先进的AI模型。
2025-03-06 18:52:57
1185
原创 MCP:重塑AI与数据交互的新标准
MCP作为开放协议,通过标准化设计解决AI与外部数据源集成挑战,降低开发复杂性,增强安全与隐私。采用C/S架构,支持多场景应用。预计未来将成为AI领域重要基础设施。
2025-03-05 22:32:40
1130
1
原创 智能模型轻量化:知识蒸馏技术如何重塑AI部署格局
知识蒸馏技术通过构建“师生传承”框架实现模型智能迁移,应用于AI普惠化。其实现包括概率蒸馏、结构进化、多模态融合。产业落地案例显著,但仍面临异构适配、知识量化挑战,未来发展将向自演进、量子化、伦理化迈进。
2025-03-04 16:08:06
662
原创 HiveChat:为中小团队量身打造的 AI 聊天应用
HiveChat是专为中小团队设计的AI聊天应用,支持多种AI模型,提供LaTeX/Markdown渲染、DeepSeek思维链、图像理解等功能,支持本地、Docker、Vercel部署,提高沟通效率,促进知识共享和创新思维。
2025-03-03 09:12:29
630
原创 注意力机制:让机器学会“挑重点”
注意力机制让机器识别并聚焦关键信息,分全局、局部、自注意力和多头注意力等,应用于机器翻译、文本生成、图像识别和推荐系统,提升模型效率和任务表现。
2025-03-02 09:45:06
448
原创 DeepSeek开源周:技术革新与社区共享的力量
DeepSeek开源周推出五个项目:FlashMLA(GPU解码内核)、DeepEP(通信库)、DeepGEMM(FP8矩阵乘法库)、DualPipe&EPLB(分布式训练优化)、3FS&Smallpond(数据存储处理),全方位支持AI开发部署。
2025-03-01 00:14:03
1491
原创 Deepseek开源周第五天:3FS-AI界的“数据高速公路“
Deepseek开源周第五天发布3FS和Smallpond。3FS是高性能分布式文件系统,速度快,有智能缓存和数据一致性功能。Smallpond是基于3FS的数据处理框架。两者助力AI训练和推理更高效。
2025-02-28 14:17:08
983
原创 Deepseek开源周第四天:从 DualPipe 到 EPLB
DeepSeek开源周第四天发布DualPipe(双向流水线并行算法)、EPLB(专家并行负载均衡器)和ProfileData(性能分析数据),支持V3/R1模型训练与推理,优化计算-通信重叠和负载均衡,提高效率,降低成本。、
2025-02-27 21:26:47
1238
原创 Deepseek开源周第三天:DeepGEMM发布
Deepseek发布DeepGEMM,专注FP8矩阵乘法,利用NVIDIA Hopper架构,采用JIT技术,支持分组矩阵乘法,提升深度学习和高性能计算效率,为研究和开发提供优化资源。
2025-02-26 21:52:39
1003
原创 Deepseek开源周第二天:DeepEP发布
DeepSeek团队开源DeepEP,专为MoE和EP设计的高效通信库,优化GPU间通信,实现高吞吐量和低延迟,加速大规模模型训练和推理,适用于实时推理场景,已获4.1K star。
2025-02-25 19:27:29
1209
原创 Deepseek开源周第一天:FlashMLA来袭
Deepseek开源周首日发布FlashMLA项目,专为HopperGPU打造的高效MLA解码内核,优化解码过程,支持可变长度序列服务。安装便捷,性能卓越,需配备HopperGPU及CUDA12.3+和PyTorch2.0+。
2025-02-24 18:46:19
825
原创 如何在 Mac 上刻录光盘?
Mac刻录光盘需准备光驱(或外接USB光驱)、空白光盘及待刻文件,使用系统自带工具按步骤操作,注意刻录速度、电脑稳定性及电源充足,完成后妥善保管光盘。
2025-02-23 22:27:03
400
原创 DeepSeek-R1本地化部署的硬件要求
DeepSeek-R1不同版本硬件要求各异,小型模型适合个人测试,中型适合轻量级任务,大型适合专业领域,超大型适合高复杂度任务。用户应根据需求和预算选择合适版本。
2025-02-22 21:19:14
881
原创 Redis多线程技术助力向量数据库性能飞跃
Redis 的新查询引擎通过引入多线程技术,显著提升了查询吞吐量和系统可扩展性,为生成式 AI 应用提供了强有力的支持。
2025-02-21 20:42:43
852
原创 解决本地模拟IP的DHCP冲突问题
解决DHCP冲突导致多IP绑定失效,可将原IP设静态(推荐),或修改注册表允许混合模式。注意IP冲突检查、网关一致性和服务绑定正确IP。确保网络设备支持跨子网通信。
2025-02-20 23:38:29
1032
原创 如何在本机上模拟IP地址
在Windows和macOS上模拟指定IP,需配置路由规则、防火墙和服务绑定。通过netsh/ifconfig添加IP,配置静态路由,允许指定端口访问,服务绑定到模拟IP,实现局域网内设备访问。
2025-02-19 22:34:30
742
原创 Axure RP11 新功能:为设计师插上“翅膀”
AxureRP11优化界面,增快速搜索、交互事件改样式、栅格布局及交互样式功能,提升设计效率和质量,为设计师提供创意空间。
2025-02-18 16:54:13
743
原创 Windows 下 Ollama 安装deepseek本地模型
Windows下Ollama安装需下载并安装,设置环境变量如OLLAMA_MODELS等以优化体验。安装本地模型后,即可使用。
2025-02-17 11:51:51
842
原创 Ubuntu 系统 LVM 逻辑卷扩容教程
Ubuntu系统LVM扩容教程:备份数据,检查磁盘空间,扩展物理卷和卷组,扩展逻辑卷,调整文件系统。完成后无需重启,注意备份和命令名称一致。
2025-02-16 00:21:35
1032
原创 Ubuntu中离线安装Docker
Ubuntu22.04离线安装DockerCE、CLI和Compose教程,需先下载.deb包到联网机器,传输至目标服务器后安装并配置服务,验证安装成功,最后运行测试容器验证功能。
2025-02-15 15:58:02
1861
原创 Docker 完整示例以及常见问题
Docker示例展示dockercommit、dockersave和dockerload用法,备份、迁移和恢复镜像。注意镜像大小、跨平台兼容性及容器状态。解决容器启动失败和端口冲突问题。
2025-02-14 09:43:35
494
原创 Docker compose 以及镜像使用
DockerCompose定义多容器应用,配置数据卷和网络。dockercommit、dockersave、dockerload分别用于生成镜像、保存为tar文件、加载镜像,适用于容器和镜像管理。
2025-02-13 11:02:27
954
原创 Docker 的打包及基本使用
Docker打包使用Dockerfile封装应用及依赖,构建镜像并运行容器。关键指令包括FROM、RUN、WORKDIR、COPY、EXPOSE、CMD。掌握Docker打包使用是现代化应用部署的核心技能。
2025-02-12 10:36:19
535
原创 Docker 初学者教程
Docker是轻量级应用容器引擎,包含镜像、容器等基本概念。本文介绍在Ubuntu上安装Docker的步骤及基本操作,如拉取镜像、运行容器等。Docker可简化应用部署和管理,建议探索高级功能。
2025-02-11 10:07:58
634
原创 生产环境超实用Shell脚本 - 四
本文介绍七个超实用Shell脚本,涵盖自动化测试、性能、代码格式化、依赖管理、版本控制、文档生成和邮件发送,助力生产环境管理和维护,提高效率和系统稳定性。
2025-02-10 09:23:48
365
原创 生产环境超实用Shell脚本三
本文介绍生产环境中实用的Shell脚本,包括安全加固、数据同步、数据库备份、网站监控和日志分析脚本,提供示例代码,可自动化运维任务,提高系统安全性、数据备份迁移、网站监控及日志分析效率。
2025-02-09 09:38:48
363
原创 生产环境超实用Shell脚本二
Shell脚本实现自动化运维,包括自动化部署、用户管理、软件安装和网络配置,提高运维效率,减少错误。示例代码展示各脚本功能及应用场景。
2025-02-08 10:21:42
287
原创 生产环境超实用shell脚本一
Shell脚本助力运维,涵盖服务器健康检查、日志清理、备份和监控。各脚本功能包括资源监控、日志管理、数据保护和告警通知,提升运维效率,确保生产环境稳定运行。
2025-02-07 00:01:03
455
原创 高效 MyBatis SQL 写法二
MyBatis动态SQL优质写法分享,包括if+where/set标签、trim标签、foreach标签及SQL片段复用,提升代码可读性、维护性,减少错误,适用于多种开发场景。
2025-02-06 21:58:17
335
原创 高效 MyBatis SQL 写法一
MyBatis动态SQL优质写法分享,包括forEach循环、模糊查询、choose多条件判断、selectKey主键生成和if动态条件,提升代码可读性和维护性,减少错误,适用于多种开发场景。
2025-02-05 22:52:49
1299
原创 Java 数据库连接池:HikariCP 与 Druid 的对比
HikariCP以卓越性能和易用配置著称,适用于高性能应用;Druid功能丰富,监控强大,适用于复杂企业应用。两者各有优势,选择取决于具体需求。
2025-02-04 21:43:56
1594
2
原创 为什么尽量避免使用 IN 和 NOT IN?
SQL中IN和NOTIN可能导致效率低或结果不准,建议使用NOTEXISTS、EXISTS或JOIN替代。IN和NOTIN需注意列名错误和NULL值问题,在确定有限集合中仍可使用。
2025-02-03 12:26:56
914
原创 在实际开发中,如何正确使用 INT(1) 和 INT(10)
MySQL中INT(N)的N不影响存储空间和数值范围,仅用于显示宽度。N在ZEROFILL时指定显示最小宽度。实际开发中,通常无需关注N,除非有特定显示需求。
2025-02-02 00:17:48
479
原创 FFmpeg:多媒体处理的瑞士军刀
FFmpeg是跨平台开源多媒体框架,支持编解码、转码、流处理等。核心组件包括libavcodec、libavformat等。广泛应用于视频编辑、流媒体、监控和移动应用,具有开源免费、跨平台等优势,但学习曲线陡峭,配置复杂。
2025-02-01 00:01:42
1022
原创 Reqable:现代化 API 调试工具
Reqable是现代化API调试工具,支持多协议,界面简洁,高性能,提供请求构建、响应分析等功能,支持跨平台,轻量级高效,适用于API开发、自动化测试、团队协作与学习,助力开发者高效完成任务。
2025-01-31 10:06:19
1189
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人