作者:算力魔方创始人/英特尔创新大使刘力
根据研究数据显示,超过50%的中小企业主对公司的实际财务情况缺乏清晰认知,具体表现为:
-
财务报表理解不足:部分企业主仅关注“账面利润”,忽略现金流、资产负债结构等关键数据,导致经营决策与实际资金能力脱节;
-
财务制度执行松散:约40%的中小企业未建立标准财务管理制度,甚至依赖亲属或非专业人员管理财务,数据可靠性存疑;
-
风险感知滞后:因缺乏定期财务分析,许多企业主难以及时发现资金链断裂、应收账款逾期等风险,最终引发经营危机。
若中小企业主能通过AI财务智能体,以每日财务简报形式跟踪关键财务指标(如现金流日报、应收/应付/逾期...),并建立预警阈值则可消除对企业财务情况两眼一抹黑的窘境。
本文将从零开始实现AI财务智能体的关键技术——在算力魔方®4060上,构建全自动发票和合同信息精准提取系统。
一,搭建开发环境
首先,请在算力魔方®4060上创建虚拟环境,并安装magic-pdf,如下所示:
conda create -n mineru python=3.11
conda activate mineru
pip install -U magic-pdf[full]
然后,输入命令“magic-pdf --version”,若输出magic-pdf版本1.3.0,则表明安装成功!
二,下载模型&配置GPU运行
运行下面的命令,完成模型下载。
pip install huggingface_hub
pip install transformers==4.49.0
wget https://github.com/opendatalab/MinerU/raw/master/scripts/download_models_hf.py -O download_models_hf.py
python download_models_hf.py
模型下载成功后,会自动生成一个名为“magic-pdf.json”的文件。开打magic-pdf.json,把device-mode配置从“cpu”修改为“cuda”:
{
"device-mode": "cuda"
}
三,提取发票和合同信息
首先,输入命令:magic-pdf --help,获得magic-pdf的命令参数。
然后,输入magic-pdf -p fapiao.pdf -o ./output,精准提取发票/合同信息。
自动提取发票和合同信息
四,总结
在算力魔方®4060上,基于magic-pdf(MinerU)可以轻松构建全自动发票和合同信息精准提取系统!
如果你有更好的文章,欢迎投稿!
稿件接收邮箱:nami.liu@pasuntech.com
更多精彩内容请关注“算力魔方®”!