BizFinBench任务解析

BizFinBench 6781个中文查询,涵盖数值计算、推理、信息抽取、预测识别和知识问答等维度。

BizFinBench测试例突破传统考题限制,采用如下更接近业务实践的内容。

Fin-Eva Version 1.0测试例

Question:

陈先生将100000元存入银行,年利率为1.5%,2年后,他将获得多少元利息?

A: 3000 B: 23173 C: 27754 D: 10943

Answer: A

BizFinBench测试例

Question: 你是一位经验丰富的金融数据分析师,请根据以下,回答出,并给出你的理由。你需要以指定 的回答。

### 数据参考

编号: 1

取数问句: 百度2024年8月每日的收盘价

股票代码 股票简称 收盘价(20240801)   ……     收盘价(20240830)

BIDU.O   百度        86.42美元                 ……    84.62美元

编号: 2

取数问句: 百度2024年9月每日的收盘价 ... 

### 用户问题

question: 在2024年8月至2024年9月期 间,百度的收盘价大于90.00美元的天数 有几天?

### 输出格式

...

Answer: 6

这里从BizFinBench涵盖的5个维度出发,细分为9个子类别分别示例测试例。


1 数值计算

金融数值计算(Financial Numerical Computation)

2. 推理

 异常事件检测(Anomalous Event Attribution)

金融时间序列分析(Financial Time Reasoning)

 金融工具使用(Financial Tool Usage)

3. 信息抽取

金融命名实体抽取(Financial Named Entity Recognition)

4. 预测识别

股价预测(Stock Price Prediction)

市场情绪预测(Emotion Recognition)

5. 知识问答


金融知识问答(Financial Knowledge QA)


 

 金融数据描述(Financial Data Description)

reference

---

1. BizFinBench. 
https://github.com/HiThink-Research/BizFinBench

https://huggingface.co/datasets/HiThink-Research/BizFinBench

2. BizFinBench: A Business-Driven Real-World Financial Benchmark for Evaluating LLMs

[2505.19457] BizFinBench: A Business-Driven Real-World Financial Benchmark for Evaluating LLMs

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值