GraphRAG使其生成的三元组、实体、描述为中文

因为工作需要接触微软的GraphRAG,代码使用过程中,使用中文的llm,虽然可以使得local、global search返回的文本是中文,但是在进行可视化展示中,他的实体以及关系的文本还是中文,有的朋友可能注意到,在prompt文件夹中的四个提示词文件中有指定以英文返回(默认情况),修改完成后还是会出现英文文本,我后来尝试,将英文的提示词,通过llm进行翻译,后续再进行检索构建时,返回的文本才是全部中文,希望对大家使用过程中有帮助,下面附上我的中文提示词

-Target activity-
你是一个智能助手,帮助人类分析师分析文本文件中针对某些实体的声明。并且全部使用中文进行描述。

-Goal-
给定一个可能与此活动相关的文本文件,实体规范和声明描述,提取所有符合实体规范的实体以及针对这些实体的所有声明。

-Steps-

提取所有符合预定义实体规范的命名实体。实体规范可以是实体名称列表或实体类型列表。
对于步骤1中识别的每个实体,提取与实体相关的所有声明。声明需要符合指定的声明描述,且实体应是声明的主体。 对于每个声明,提取以下信息:
主体:声明主体的实体名称,大写。主体实体是描述声明中行动的实体。主体需要是步骤1中识别的命名实体之一。
客体:声明对象的实体名称,大写。对象实体是报告/处理或受描述行动影响的实体。如果对象实体未知,使用 NONE。
声明类型:声明的总体类别,大写。以可以跨多个文本输入重复的方式命名,以便类似的声明共享相同的声明类型。
声明状态:TRUE,FALSE 或 SUSPECTED。TRUE 表示声明已确认,FALSE 表示声明被认定为错误,SUSPECTED 表示声明未经验证。
声明描述:详细描述声明背后的理由,包括所有相关证据和引用。
声明日期:声明作出的时期(开始日期,结束日期)。开始日期和结束日期都应使用 ISO-8601 格式。如果声明是在单一日期而不是日期范围内作出的,将同一日期设置为开始日期和结束日期。如果日期未知,返回 NONE。
声明源文本:原始文本中与声明相关的所有引用列表。
将每个声明格式化为 (<subject_entity>{tuple_delimiter}<object_entity>{tuple_delimiter}<claim_type>{tuple_delimiter}<claim_status>{tuple_delimiter}<claim_start_date>{tuple_delimiter}<claim_end_date>{tuple_delimiter}<claim_description>{tuple_delimiter}<claim_source>)

以中文返回输出,作为所有在步骤1和2中识别的声明的单个列表。使用 {record_delimiter} 作为列表分隔符。

完成后,输出 {completion_delimiter}

-Examples-

-Real Data-
使用以下输入回答你的答案。
Entity specification: {entity_specs}
Claim description: {claim_description}
Text: {input_text}
Output:









您是一个帮助人类分析师执行一般信息发现的人工智能助手。信息发现是指在网络中识别和评估与某些实体(例如组织和个人)相关的相关信息的过程。并且使用中文进行描述。

目标
编写一份关于社区的综合报告,报告中包含属于该社区的一系列实体以及它们之间的关系和可选的相关声明。该报告将用于向决策者通报与社区相关的信息及其潜在影响。这份报告的内容包括对社区关键实体的概述、它们的法律遵从性、技术能力、声誉和值得注意的声明。

报告结构
报告应包括以下部分:

标题:代表社区关键实体的社区名称——标题应简短但具体。如果可能的话,在标题中包含有代表性的命名实体。
摘要:关于社区的整体结构、实体之间如何相互关联以及与其实体相关的重要信息的执行摘要。
影响严重程度评分:一个介于0-10之间的浮点数,表示由社区内的实体所造成的影响力严重程度。影响力是社区重要性的评分。
评分解释:给出影响严重程度评分的一个句子解释。
详细发现:列出5-10个关于社区的关键见解。每个见解应有一个简短的总结,然后是根据下面的依据规则进行解释的多个段落。应详尽无遗。
输出应为格式良好的JSON字符串,格式如下:
{{
"title": <report_title>,
"summary": <executive_summary>,
"rating": <impact_severity_rating>,
"rating_explanation": <rating_explanation>,
"findings": [
{{
"summary":<insight_1_summary>,
"explanation": <insight_1_explanation>
}},
{{
"summary":<insight_2_summary>,
"explanation": <insight_2_explanation>
}}
]
}}

依据规则
由数据支持的观点应列出其数据参考如下:

"这是一个由多个数据参考支持的例子句子 [Data: <数据集名称> (记录ID); <数据集名称> (记录ID)]."

在单一引用中不要列出超过5个记录ID。相反,列出最相关的前5个记录ID,并添加"+more"以表明还有更多。

例如:
"X先生是Y公司的所有者,并且面临许多不当行为的指控 [Data: Reports (1), Entities (5, 7); Relationships (23); Claims (7, 2, 34, 64, 46, +more)]."

其中1, 5, 7, 23, 2, 34, 46, 和 64代表相关数据记录的ID(而非索引)。

不要包含没有提供支持证据的信息。

示例输入
文本:

实体

id,entity,description
5,VERDANT绿洲广场,Verdant绿洲广场是团结游行的地点
6,HARMONY ASSEMBLY,Harmony Assembly 是在 Verdan 绿洲广场举行游行的组织

关系

id,source,target,description
37,VERDANT绿洲广场,团结游行,Verdant绿洲广场 是团结游行的地点
38,VERDANT绿洲广场,HARMONY ASSEMBLY,Harmony Assembly 在 Verdant绿洲广场举行游行
39,VERDANT绿洲广场,团结游行,团结游行正在 Verdant绿洲广场举行
40,VERDANT绿洲广场,TRIBUNE SPOTLIGHT,Tribune Spotlight 正在报道在 Verdant绿洲广场举行的团结游行
41,VERDANT绿洲广场,BAILEY ASADI,Bailey Asadi 在 Verdant绿洲广场关于游行发表讲话
43,HARMONY ASSEMBLY,团结游行,Harmony Assembly 正在组织团结游行

输出:
{{
"title": "Verdant绿洲广场 和团结游行",
"summary": "这个社区围绕着 Verdant绿洲广场 展开,这是团结游行的地点。广场与 Harmony Assembly、团结游行和 Tribune Spotlight 都有关联,这些都与游行活动相关。",
"rating": 5.0,
"rating_explanation": "影响严重程度评分适中,因为团结游行期间可能出现动乱或冲突。",
"findings": [
{{
"summary": "Verdant绿洲广场作为中心位置",
"explanation": "Verdant绿洲广场是这个社区中的核心实体,是团结游行的举办地。这个广场是所有其他实体之间的共同联系点,表明它在社区中的重要性。广场与游行的关系可能会导致诸如公共秩序混乱或冲突等问题,这取决于游行的本质以及它引发的反应。[Data: Entities (5), Relationships (37, 38, 39, 40, 41,+more)]"
}},
{{
"summary": "Harmony Assembly 在社区中的角色",
"explanation": "Harmony Assembly 是这个社区中的另一个关键实体,是 Verdant绿洲广场上游行的组织者。Harmony Assembly 及其游行的性质可能是威胁的来源,这取决于他们的目标以及他们引发的反应。了解 Harmony Assembly 与广场之间的关系对于理解社区动态至关重要。[Data: Entities(6), Relationships (38, 43)]"
}},
{{
"summary": "团结游行作为一个重要事件",
"explanation": "团结游行是在 Verdant绿洲广场举行的一个重要事件。这一事件是社区动态中的重要因素,并可能成为一个威胁源,这取决于游行的本质以及它引发的反应。游行与广场之间的关系对于理解社区动态至关重要。[Data: Relationships (39)]"
}},
{{
"summary": "Tribune Spotlight 的作用",
"explanation": "Tribune Spotlight 正在报道在 Verdant绿洲广场举行的团结游行。这表明该事件吸引了媒体的关注,可能会放大其对社区的影响。Tribune Spotlight 在塑造公众对该事件及涉及实体的看法方面可能具有重要意义。[Data: Relationships (40)]"
}}
]
}}

实际数据
使用以下文本回答您的问题。不要编造任何信息。

文本:
{input_text}

报告应包括以下部分:

标题:代表社区关键实体的社区名称——标题应简短但具体。如果可能的话,在标题中包含有代表性的命名实体。
摘要:关于社区的整体结构、实体之间如何相互关联以及与其实体相关的重要信息的执行摘要。
影响严重程度评分:一个介于0-10之间的浮点数,表示由社区内的实体所造成的影响力严重程度。影响力是社区重要性的评分。
评分解释:给出影响严重程度评分的一个句子解释。
详细发现:列出5-10个关于社区的关键见解。每个见解应有一个简短的总结,然后是根据下面的依据规则进行解释的多个段落。应详尽无遗。
输出应为格式良好的JSON字符串,格式如下:
{{
"title": <report_title>,
"summary": <executive_summary>,
"rating": <impact_severity_rating>,
"rating_explanation": <rating_explanation>,
"findings": [
{{
"summary":<insight_1_summary>,
"explanation": <insight_1_explanation>
}},
{{
"summary":<insight_2_summary>,
"explanation": <insight_2_explanation>
}}
]
}}

依据规则
由数据支持的观点应列出其数据参考如下:

"这是一个由多个数据参考支持的例子句子 [Data: <数据集名称> (记录ID); <数据集名称> (记录ID)]."

在单一引用中不要列出超过5个记录ID。相反,列出最相关的前5个记录ID,并添加"+more"以表明还有更多。

例如:
"X先生是Y公司的所有者,并且面临许多不当行为的指控 [Data: Reports (1), Entities (5, 7); Relationships (23); Claims (7, 2, 34, 64, 46, +more)]."

其中1, 5, 7, 23, 2, 34, 46, 和 64代表相关数据记录的ID(而非索引)。

不要包含没有提供支持证据的信息。

输出:









-目标-
给定一个可能与此活动相关的文本文件和一系列实体类型,识别文本中所有这些类型的实体以及所有已识别实体之间的关系。并且使用中文进行描述。

-步骤-
1. 识别所有实体。对于每个已识别的实体,提取以下信息:
- entity_name: 实体的名称,首字母大写
- entity_type: 以下类型之一:[{entity_types}]
- entity_description: 实体属性和活动的全面描述
将每个实体格式化为 ("entity"{tuple_delimiter}<entity_name>{tuple_delimiter}<entity_type>{tuple_delimiter}<entity_description>)

2. 从第1步中识别的实体中,识别所有(源头实体,目标实体)对,这些实体彼此之间*明显相关*。
对于每一对相关实体,提取以下信息:
- source_entity: 源实体的名称,如第1步中所识别
- target_entity: 目标实体的名称,如第1步中所识别
- relationship_description: 解释为什么认为源实体和目标实体彼此相关
- relationship_strength: 表示源实体和目标实体之间关系强度的数值分数
将每个关系格式化为 ("relationship"{tuple_delimiter}<source_entity>{tuple_delimiter}<target_entity>{tuple_delimiter}<relationship_description>{tuple_delimiter}<relationship_strength>)

3. 使用**{record_delimiter}**作为列表分隔符,返回步骤1和2中识别的所有实体和关系的单个列表。
 
4. 完成后,输出 {completion_delimiter}

######################
-例子-
######################
例1:
Entity_types: ORGANIZATION, PERSON
文本:
英国的中央机构计划在周一和周四开会,并打算在周四下午1:30 PDT发布最新的政策决定,随后将召开新闻发布会,中央机构主席马丁·史密斯将在会上回答提问。投资者预计市场策略委员会将维持其基准利率在3.5%-3.75%的范围内不变。
######################
输出:
("entity"{tuple_delimiter}中央机构{tuple_delimiter}ORGANIZATION{tuple_delimiter}英国的中央机构负责设定周一和周四的利率)
{record_delimiter}
("entity"{tuple_delimiter}马丁·史密斯{tuple_delimiter}PERSON{tuple_delimiter}马丁·史密斯是中央机构的主席,并将在新闻发布会上回答提问)
{record_delimiter}
("entity"{tuple_delimiter}中央机构委员会{tuple_delimiter}ORGANIZATION{tuple_delimiter}中央机构委员会就英国货币供应的增长作出关键决策)
{record_delimiter}
("relationship"{tuple_delimiter}马丁·史密斯{tuple_delimiter}CENTRAL INSTITUTION{tuple_delimiter}马丁·史密斯是中央机构的主席,并将在新闻发布会上回答提问{tuple_delimiter}9)
{completion_delimiter}

######################
例2:
Entity_types: ORGANIZATION
文本:
科技全球 (TG) 的股票在其在环球交易所上市的第一天飙升。但是IPO专家警告说,这家半导体公司的首次公开上市的表现并不能代表其他新上市公司可能的表现。

科技全球l是一家曾经公开上市的公司,于2014年被Vision Holdings私有化。这家知名的芯片设计公司声称其产品占了85%的高端智能手机市场份额。
######################
输出:
("entity"{tuple_delimiter}科技全球{tuple_delimiter}ORGANIZATION{tuple_delimiter}科技全球是一家现在在环球交易所上市的公司,其产品占了85%的高端智能手机市场份额)
{record_delimiter}
("entity"{tuple_delimiter}VISION HOLDINGS{tuple_delimiter}ORGANIZATION{tuple_delimiter}Vision Holdings是一家此前拥有科技全球的公司)
{record_delimiter}
("relationship"{tuple_delimiter}科技全球{tuple_delimiter}VISION HOLDINGS{tuple_delimiter}Vision Holdings从2014年起至现在一直拥有科技全球{tuple_delimiter}5)
{completion_delimiter}

######################
例3:
Entity_types: ORGANIZATION, GEO, PERSON
文本:
五名在菲鲁扎巴德被关押了8年的奥里利安,并普遍被认为是人质的,正在返回奥瑞莉亚的路上。

由金塔拉策划的交换在价值80亿美元的菲鲁兹资金转移到金塔拉首都克罗哈拉的金融机构之后完成。

在菲鲁扎巴德首都蒂鲁齐亚开始的交换导致四名男子和一名女子,他们同时也是菲鲁兹国民,登上了前往克罗哈拉的包机。

他们受到了高级奥勒良官员的欢迎,并正在前往奥瑞莉亚首都Cashion的路上。

这些奥里利安包括39岁的商人塞缪尔·纳马拉,他在蒂鲁齐亚的阿尔哈米亚监狱服刑,以及59岁的记者杜尔克·巴塔格拉尼和53岁的环保人士梅吉·塔兹巴,后者也持有布拉廷国籍。
######################
输出:
("entity"{tuple_delimiter}菲鲁扎巴德{tuple_delimiter}GEO{tuple_delimiter}菲鲁扎巴德关押奥里利安作为人质)
{record_delimiter}
("entity"{tuple_delimiter}奥瑞莉亚{tuple_delimiter}GEO{tuple_delimiter}寻求释放人质的国家)
{record_delimiter}
("entity"{tuple_delimiter}金塔拉{tuple_delimiter}GEO{tuple_delimiter}谈判金钱交换人质的国家)
{record_delimiter}
{record_delimiter}
("entity"{tuple_delimiter}蒂鲁齐亚{tuple_delimiter}GEO{tuple_delimiter}菲鲁扎巴德的首都,奥里利安被关押的地方)
{record_delimiter}
("entity"{tuple_delimiter}克罗哈拉{tuple_delimiter}GEO{tuple_delimiter}金塔拉的首都城市)
{record_delimiter}
("entity"{tuple_delimiter}CASHION{tuple_delimiter}GEO{tuple_delimiter}奥瑞莉亚的首都城市)
{record_delimiter}
("entity"{tuple_delimiter}塞缪尔·纳马拉{tuple_delimiter}PERSON{tuple_delimiter}在蒂鲁齐亚的阿尔哈米亚监狱服刑的奥勒良)
{record_delimiter}
("entity"{tuple_delimiter}阿尔哈米亚 PRISON{tuple_delimiter}GEO{tuple_delimiter}位于蒂鲁齐亚的监狱)
{record_delimiter}
("entity"{tuple_delimiter}杜尔克·巴塔格拉尼{tuple_delimiter}PERSON{tuple_delimiter}被关押为人质的奥勒良记者)
{record_delimiter}
("entity"{tuple_delimiter}梅吉·塔兹巴{tuple_delimiter}PERSON{tuple_delimiter}被关押为人质并持有布拉廷国籍的环保人士)
{record_delimiter}
("relationship"{tuple_delimiter}菲鲁扎巴德{tuple_delimiter}奥瑞莉亚{tuple_delimiter}菲鲁扎巴德与奥瑞莉亚协商了一次人质交换{tuple_delimiter}2)
{record_delimiter}
("relationship"{tuple_delimiter}金塔拉{tuple_delimiter}奥瑞莉亚{tuple_delimiter}金塔拉促成了菲鲁扎巴德与奥瑞莉亚之间的人质交换{tuple_delimiter}2)
{record_delimiter}
("relationship"{tuple_delimiter}金塔拉{tuple_delimiter}菲鲁扎巴德{tuple_delimiter}金塔拉促成了菲鲁扎巴德与奥瑞莉亚之间的人质交换{tuple_delimiter}2)
{record_delimiter}
("relationship"{tuple_delimiter}塞缪尔·纳马拉{tuple_delimiter}阿尔哈米亚 PRISON{tuple_delimiter}塞缪尔·纳马拉是阿尔哈米亚监狱的囚犯{tuple_delimiter}8)
{record_delimiter}
("relationship"{tuple_delimiter}塞缪尔·纳马拉{tuple_delimiter}梅吉·塔兹巴{tuple_delimiter}塞缪尔·纳马拉和梅吉·塔兹巴在同一人质释放中被交换{tuple_delimiter}2)
{record_delimiter}
("relationship"{tuple_delimiter}塞缪尔·纳马拉{tuple_delimiter}杜尔克·巴塔格拉尼{tuple_delimiter}塞缪尔·纳马拉和杜尔克·巴塔格拉尼在同一人质释放中被交换{tuple_delimiter}2)
{record_delimiter}
("relationship"{tuple_delimiter}梅吉·塔兹巴{tuple_delimiter}杜尔克·巴塔格拉尼{tuple_delimiter}梅吉·塔兹巴和杜尔克·巴塔格拉尼在同一人质释放中被交换{tuple_delimiter}2)
{record_delimiter}
("relationship"{tuple_delimiter}塞缪尔·纳马拉{tuple_delimiter}菲鲁扎巴德{tuple_delimiter}塞缪尔·纳马拉是菲鲁扎巴德的人质{tuple_delimiter}2)
{record_delimiter}
("relationship"{tuple_delimiter}MEGGIE TAZBAH{tuple_delimiter}菲鲁扎巴德{tuple_delimiter}Meggie Tazbah是菲鲁扎巴德的人质{tuple_delimiter}2)
{record_delimiter}
("relationship"{tuple_delimiter}杜尔克·巴塔格拉尼{tuple_delimiter}菲鲁扎巴德{tuple_delimiter}杜尔克·巴塔格拉尼是菲鲁扎巴德的人质{tuple_delimiter}2)
{completion_delimiter}

######################
-真实数据-
######################
Entity_types: {entity_types}
文本:{input_text}
######################
输出:










你是一个乐于助人的助手,负责生成以下提供的数据的综合摘要。
给定一个或两个实体,以及与同一实体或实体组相关的描述列表。
请将所有这些合并成一个综合描述。确保包含从所有描述中收集的信息。
如果提供的描述有矛盾,请解决这些矛盾并提供一个连贯的摘要。
确保使用第三人称书写,并包含实体名称以便我们了解完整背景。并且使用中文进行描述。

#######
-数据-
实体:{entity_name}
描述列表:{description_list}
#######
输出:


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值