- 博客(2)
- 资源 (3)
- 收藏
- 关注
DeepSeek:国产AI推理模型的应用与优化指南
内容概要:本文详细介绍了一款由清华大学新闻与传播学院新媒体研究中心及元宇宙文化实验室推出的名字叫DeepSeek的国产人工智能推理模型。它专注于通用人工智能的研发,尤其是推理模型DeepSeek-R1的特性及其应用场景。该模型不仅能够处理诸如智能对话、文本生成等复杂任务,还可以支持文件上传的文字提取,甚至能够联网搜索进行深度思考。除此之外,本文还对比了推理大模型与非推理大模型各自的优势,并针对如何优化提示语策略以提高DeepSeek模型的表现给出了具体指导。
适合人群:对人工智能技术,特别是通用人工智能(AGI)有兴趣和技术从业者;希望通过深入了解推理模型提升工作效率的研发工程师。
使用场景及目标:为那些正在学习或希望了解更多关于国产AI推理模型的企业和科研机构工作人员、高校师生提供了有价值的资料和实用技巧。主要目的是帮助他们了解和掌握如何更好地利用DeepSeek来进行智能文本生成、数据分析及其他智能化操作。
其他说明:文中强调了掌握良好提示语设计对于充分利用这类先进技术工具至关重要。这不仅仅是一份简单的工具手册,更是引导使用者深刻理解并创造性地应用AI推理技术的教学指南。此外,文章还提及了一些常见的设计误区和应对这些挑战的方法,这对于确保模型的有效性和可靠性尤为重要。
2025-02-10
parquet 查看内容工具,可以看到编码格式等内容
parquet CLI 是 用于检查 Parquet 文件的强大工具。我在 Starburst 的工作中经常使用它,但我没有找到太多文档 说明如何理解该工具提供的所有输出。
通常,我有兴趣从 parquet 文件中收集的信息是:
文件中有多少个行组,以及行组的大小是多少
每列使用什么编码
列统计信息
如果对列使用了字典编码,则是否回退到纯文本 发生编码
列索引
使用方法:
sh parquet-cli_install-1.12.3.run
要使用 parquet CLI 查看 parquet 文件的元数据,我们执行:
parquet-cli meta <path-to-parquet-file>
此输出将首先显示一个包含文件信息的标头:
File path: 128_row_group.parquet
Created by: parquet-mr version 1.12.2 (build 77e30c8093386ec52c3cfa6c34b7ef3321322c94)
Properties:
writer.time.zone: GMT
接下来,它将显示 parqu
2024-01-05
可以查询Parquet文件内容的工具 pqrs
简单的命令可以查看parquet文件格式的内容
❯ pqrs --help
pqrs 0.2.1
Manoj Karthick
Apache Parquet command-line utility
USAGE:
pqrs [FLAGS] [SUBCOMMAND]
FLAGS:
-d, --debug Show debug output
-h, --help Prints help information
-V, --version Prints version information
SUBCOMMANDS:
cat Prints the contents of Parquet file(s)
head Prints the first n records of the Parquet file
help Prints this message or the help of the given subcommand(s)
merge
2024-01-05
TPC-DS tools v3.2.0最新修复版
采用星型、雪花型等多维数据模式。它包含7张事实表,17张纬度表平均每张表含有18列。其工作负载包含99个SQL查询。
对官网版V3.2.0版本进行修复,防止编译失败。
2023-01-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅