植物三萜皂苷生物合成途径及调控机制研究进展-文献精读48

摘要

三萜皂苷(triterpenoids saponins)是由三萜皂苷元和一个或多个糖基和/或其他化学基团缩合而成的一系列结构多样的天然化合物[1], 主要分布在五加科、蝶形花科、石竹科、桔梗科、毛茛科、玄参科、葫芦科等植物中[2]. 植物中三萜皂苷常分布在特定的器官和组织, 如人参(Panax ginseng)、桔梗(Platycodon grandiflorus)的根, 麦蓝菜(Vaccaria hispanica)的种子, 罗汉果(Siraitia grosvenori)的果实和积雪草(Centella asiatica)的茎、叶等部位均积累着丰富的三萜皂苷. 三萜皂苷元的骨架由30个碳原子构成, 常见的为四环三萜和五环三萜, 其中最常见的三萜母核类型为达玛烷型(dammarane)和齐墩果烷型(oleanane). 三萜皂苷不仅参与植物的通讯、防御和感觉调控, 还具有抗炎、抗癌、抗菌、抗病毒等多种生物活性[3,4]. 甘草(Glycyrrhiza uralensis)中的甘草酸、罗汉果中的罗汉果苷的甜味分别约为蔗糖的941倍和300倍[5,6], 可用作天然甜味剂. 此外, 三萜皂苷是一种两亲性化合物, 在水中可以形成稳定的泡沫[7], 常被用于制作清洁剂、发泡剂和乳化剂等. 三萜皂苷的这些特性, 使其在医药、食品、日化、农业等领域受到了广泛关注, 这均得利于三萜皂苷的结构多样性. 然而, 由于三萜皂苷结构复杂、含量低, 使得直接提取、分离, 或通过化学合成等方法间接获取三萜皂苷都相对困难, 限制了其广泛应用[8]. 利用生物技术对三萜皂苷生物合成途径进行研究, 从而提高目标代谢产物的含量, 或利用合成生物学方法生产三萜皂苷, 已成为当前研究热点. 现今在三萜皂苷生物合成途径解析、转录调控机制及微生物细胞工程方面取得了一定进展, 进一步阐明三萜皂苷生物合成的分子机制, 将有助于实现其在植物或微生物中的人工调控, 以提高产量. 因此, 本文总结了三萜皂苷生物合成途径研究中的新技术、新方法, 综述了三萜皂苷生物合成途径、关键酶基因、转录调控以及三萜皂苷微生物细胞工程方面的最新进展, 并对今后的发展方向进行了展望, 以期为相关领域的研究提供参考.

1 三萜皂苷生物合成途径中的新技术和新方法

近年来, 随着高通量测序技术的发展, 许多植物的基因组和转录组信息被在线解码和发布, 为植物三萜皂苷合成途径的解析提供了许多有价值的信息. 多组学关联分析或利用大数据发掘三萜皂苷生物合成相关基因已成为当前研究的热点. 研究人员已通过转录组学分析对多种植物的三萜皂苷合成途径进行了初步探究, 如甘草[9]、人参[10]、罗汉果[11]、岗梅(Ilex asprella)[12]、刺五加(Eleutherococcus senticosus)[13]、桔梗[14]、毛冬青(Ilex pubescens)[15]、皂荚(Gleditsia sinensis)[16]和细风轮菜(Clinopodium gracile)[17]等, 这些研究丰富了三萜皂苷生物合成关键元件的基因库资源. Zhang等人[18]采用靶向代谢组学和转录组学关联分析对远志(Polygala tenuifolia)中的三萜皂苷生物合成相关基因进行了初步筛选. Zhan等人[19]以鹅掌草(Anemone flaccida)为材料, 对其进行转录组学和蛋白组学数据关联分析, 发现了与三萜皂苷生物合成相关的126个CYP450s(cytochrome P450-dependent monooxygenases)和32个UGTs(uridine diphosphate (UDP)-glucosyltransferases)基因. 中国农业科学院蔬菜花卉研究所黄三文课题组[20]开展了黄瓜(Cucumis sativus)全基因组关联分析, 发现了调控葫芦素(cucurbitacin)合成途径的转录因子(Bl, Bt)和相关的基因簇. Yan等人[21]对美国国立生物技术信息中心(National Center for Biotechnology Information, NCBI)数据库中的9个人参属EST(Expressed Sequence Tag)文库数据进行组装和数据分析, 筛选出16条UGTs序列进行实验验证, 获得了催化人参皂苷合成的第一个糖基转移酶UGTPg1. 多组学、大数据及合成生物学的联合使用为三萜皂苷代谢途径的解析提供了新的突破口(图1), 整合基因共表达分析、基因簇鉴定等方法鉴定三萜皂苷生物合成结构基因、转录因子等, 同时利用酵母表达系统和高效的烟草瞬时表达体系等进行功能分析[22]. 新途径和新基因的发掘不仅有助于三萜皂苷在底盘植物或微生物中高效合成, 还能为分子设计育种等方面的研究奠定基础.

2 植物三萜皂苷生物合成途径
2.1 三萜皂苷生物合成途径

植物中的三萜均来自异戊烯基焦磷酸(isopentenyl pyrophosphate, IPP, C5)和二甲基烯丙基焦磷酸(dimethylallyl pyrophosphate, DMAPP, C5). IPP和DMAPP可以由两条不同的途径合成: 细胞质中的甲羟戊酸(mevalonate, MVA)途径和质体中的2-C-甲基-D-赤藓醇-4-磷酸(2-C-methl-D-erythritol-4-phospate, MEP)途径. MVA途径以乙酰辅酶A(acetyl-CoA)为起始底物, 经过六步缩合反应生成IPP; MEP途径则是以丙酮酸和甘油醛3-磷酸为起始底物, 经过七步反应合成IPP[5](图2B). 其中, MVA途径在三萜皂苷的生物合成中起到主导作用[1,3,5,23]. IPP和DMAPP在香叶基焦磷酸合成酶(geranylpyrophosphate synthetase, GPS)的作用下经过缩合生成香叶基焦磷酸(geranylpyrophosphate, GPP, C10); GPP在法呢基焦磷酸合酶(farnesyl pyrophosphate synthetase, FPS)的催化下再加入第二个IPP单元生成法呢基焦磷酸(farnesyl pyrophosphate, FPP, C15); 然后两个FPP经鲨烯合成酶(squalene synthase, SS)缩合形成角鲨烯(squalene, C30), 随后在鲨烯氧化酶(squalene epoxidase)的作用下环氧化生成2,3-氧化鲨烯(2,3-oxidosqualene, C30)[5](图2B). 2,3-氧化鲨烯经环化、羟基化、糖基化等结构修饰可以合成各种三萜皂苷, 介导这些反应的酶有氧化鲨烯环化酶(OSCs)、细胞色素P450(CYP450s)和糖基转移酶(UGTs)等(图2A).

2.2 三萜皂苷生物合成中的关键酶

植物三萜皂苷种类繁多、结构复杂, 虽然它们有着共同的前体合成途径, 但后修饰具有高度特异性和多样性, 而且相关元件的编码基因分布在整个基因组中, 以网状途径作用产生化合物阵列而非单一化合物, 这大大增加了解析三萜皂苷生物合成途径的难度[1,3]. 植物中三萜皂苷的积累具有器官和组织特异性, 而且生物或非生物胁迫均可诱导植物三萜皂苷的合成. 三萜皂苷生物合成途径包含了20余步连续的酶促反应, 其中从乙酰辅酶A到2,3-氧化鲨烯的上、中游代谢途径已研究得比较清晰(图2B), 该过程中研究得比较多的酶有3-羟基-3-甲基戊二酰辅酶A还原酶(HMGR, EC1.1.1.34)、法呢基焦磷酸合酶(FPS, EC2.5.1.1/EC2.5.1.10)、鲨烯合成酶(SS, EC2.5.1.21)、鲨烯环氧酶(SE, EC1.14.99.7), 这些酶在植物中均以基因家族的形式存在. HMGR是植物MVA途径的第一个限速酶[24]; FPS, SS和SE均处在三萜皂苷合成途径的分支点上[25]. 目前, 仅有少数几种参与三萜皂苷生物合成的HMGR, FPS, SS和SE基因被克隆和鉴定(表1).

Overview of HMGR, FPS, SS, and SE related to triterpenoid saponin biosynthesis reported in literaturesa)

关键酶

基因

GenBank登记号

植物来源

功能分析方法

参考文献

HMGR

PgHMGR1

KM386694

人参

拟南芥突变体/人参(超表达)

[26]

PnHMGR

KJ578757

三七

三七细胞株系(超表达)

[27]

HMGR

JN377411

灵芝

灵芝(超表达)

[28]

FPS

PgFPS

DQ087959

人参

大肠杆菌/积雪草/人参毛状根(超表达)

[29]

SS

PgSS1

AB115496

人参

刺五加合子胚愈伤组织

[30]

GuSQS1

AM182329

甘草

甘草毛状根

[31]

PnSS

KC953033

三七

三七细胞株系(超表达)

[27]

SE

NSSQE1

FJ232947

黑种草

酵母

[32]

PgSQE1

AB122078

人参

人参(RNAi)

[33]

CpSE2

西葫芦

酵母/烟草/西葫芦毛状根

[34]

然而, 三萜皂苷生物合成下游代谢通路从2,3-氧化鲨烯到最后的三萜皂苷形成在不同植物中都有各自的规律(图2A), 接下来本文将对后修饰过程中涉及的OSCs, CYP450s和UGTs这三大酶类进行具体阐述.

(1) 氧化鲨烯环化酶.

氧化鲨烯环化酶(oxidosqualene cyclase, OSCs, EC5.4.99.x)是三萜皂苷下游合成阶段的第一个限速酶, 也是三萜皂苷和甾醇生物合成途径的分支点, 引导2,3-氧化鲨烯经质子化、环化、重排和去质子化等完成环化过程生成三萜骨架[7]. 该酶形成了一个超基因家族, 家族成员氨基酸同源性较高, 含有DDTAEA序列(参与底物结合)和QW特征序列(与蛋白质结构稳定性相关)这两个高度保守序列[35]. 理论上, 2,3-氧化鲨烯环化能形成100余种三萜骨架, 其结构多样性可能与相关酶的灵活多变核心部位有关, OSC上一个氨基酸序列的改变都可能导致产物发生改变[7,36~38]. 然而, 迄今发现的OSCs产物仅有数十种. 在不同OSCs的作用下, 2,3-氧化鲨烯通过“椅-船-椅”式构象变化, 可以转化为protosteryl阳离子, 导致羊毛甾醇(lanosterol)、环阿屯醇(cycloartenol)、葫芦二烯醇(cucurbitadienol)、帕克醇(parkeol)等物质的形成(图2A), 这些物质又可以进一步衍生为植物甾醇、甾体糖苷生物碱、甾体皂苷等; 然而, 羊毛甾醇、环阿屯醇、葫芦二烯醇等物质在植物中也可以作为三萜的前体[38,39], 在相应酶的催化作用下分别衍生成羊毛脂烷型(lanostane)、环阿屯烷型(cycloartane)和葫芦烷型(cucurbitane)四环三萜皂苷, 如灵芝酸C(ganoderic acid C)、黄芪苷IV(asteagalosid IV)、罗汉果苷IE(mogroside IE)等. 2,3-氧化鲨烯通过“椅-椅-椅”式构象变化, 则导致了各种三萜皂苷苷元的形成, 该过程中的第一个中间产物是dammarenyl阳离子, dammarenyl阳离子可以直接生成达玛烯二醇(dammarenediol-II); 同时, dammarenyl阳离子可以进一步被转化为tirucallanyl阳离子(生成甘遂烷型皂苷元, tirucallane)或baccharenyl阳离子; baccharenyl阳离子又能被转化为五环的lupanyl阳离子, 从而形成羽扇豆醇(lupeol); lupanyl阳离子的五元环E环重新打开、扩展成六元环的过程中, 产生了中间环化产物germanicyl阳离子, 该阳离子能进一步生成oleanyl阳离子(生成β-amyrin)和ursanyl阳离子(生成α-amyrin)(图2A)[3,7]. 介导这些反应的酶主要有达玛烯二醇合成酶(dammarenediol-II synthase, DS)、羽扇豆醇合成酶(lupeol synthase, LuS)、α-香树素合成酶(α-amyrin synthase, αAS)和β-香树素合成酶(β-amyrin synthase, βAS)等, 分别催化2,3-氧化鲨烯形成达玛烷型、甘遂烷型等四环三萜骨架和齐墩果烷型、乌苏烷型(ursane)、羽扇豆烷型(lupine)等五环三萜类骨架, 这些三萜骨架经过进一步修饰可以生成人参皂苷Rh2(ginsenoside Rh2)、flindissone、甘草甜素(glycyrrhinzin)、28-葡萄糖基-积雪草酸(28-Glc-asiatic acid)、桦木酸(betulinic acid)等三萜皂苷元或皂苷. 此外, Xue等人[40]在籼稻(Oryza sativa Japonica)中发现了一种新的多功能OsOSC7(GenBank accession number: ABG22399), 该酶可以使2,3-氧化鲨烯通过“椅-半椅-椅”式构象变化转化为一种新的阳离子orysatinyl, 然后进一步生成一种新的五环三萜籼稻醇(orysatinol)(图2A).

研究人员已经从多种植物中克隆得到85条与三萜皂苷生物合成相关的OSCs基因, 并且在酵母、同源或异源植物宿主中进行了功能分析(表2). 进化树分析结果表明, “椅-半椅-椅”式构象变化在系统发育树上介于“椅-船-椅”式构象变化和“椅-椅-椅”式构象变化之间, 常见的不同功能的OSCs(如CS, LuS, DS, βAS和αAS等)分别聚集在发育树的不同分枝上(图3), 可见具有相同功能的OSC序列相似性较高.

Table 2  Overview of OSCs related to triterpenoid saponin biosynthesis reported in literaturesa)

类别

基因

GenBank登记号

植物来源

产物

功能分析方法

参考文献

DS

PNA

AB265170

人参

dammarenediol-II

酵母

[41]

DDS

AB122080

人参

dammarenediol-II

酵母/人参(RNAi)

[42]

CaDDS

AY520818

积雪草

dammarenediol-II

酵母

[43]

PgDDS

AB122080

人参

dammarenediol-II

烟草

[44]

PnDS

KC422652

三七

dammarenediol-II

酵母

[45]

PqDS

KC316048

西洋参

dammarenediol-II

酵母

[46]

LuS

OeOEW

AB025343

油橄榄

lupeol

酵母

[47]

ToTRW

AB025345

蒲公英

lupeol

酵母

[47]

BPW

AB055511

白桦

lupeol

酵母

[48]

GgLUS1

AB116228

光果甘草

lupeol

酵母

[49]

OSC3

AB181245

百脉根

lupeol

酵母

[50]

RcLUS

DQ268869

蓖麻

lupeol

酵母

[51]

BgLUS

AB289586

木榄

lupeol

酵母

[52]

WsOCS/LS

JQ728552

南非醉茄

lupeol

酵母

[53]

LUP2

KP784688

欧洲山芥

lupeol

酵母/烟草

[54]

LsOSC1

MG708182

大花紫薇

lupeol

酵母/烟草

[55]

TaOSC4

MK547514

阿江榄仁

lupeol

酵母

[56]

ItOSC6

鸢尾

lupeol

酵母

[57]

αAS

PSM

AB034803

豌豆

α-amyrin/β-amyrin

酵母

[58]

IaAS3079

岗梅

α-amyrin/β-amyrin

酵母

[59,60]

IaAS481

岗梅

α-amyrin/β-amyrin

酵母

[59,60]

BvLUP5G

KP784690

欧洲山芥

α-amyrin/β-amyrin

酵母/烟草

[54]

LsOSC2

MG708183

大花紫薇

α-amyrin/β-amyrin

酵母/烟草

[55]

TaOSC2

MK547512

阿江榄仁

α-amyrin/β-amyrin

酵母

[56]

CrAS

JN991165

长春花

α-amyrin/β-amyrin

酵母

[61]

EjAS

JX173279

枇杷

α-amyrin/β-amyrin

酵母

[62]

ObAS2

JQ809437

罗勒

α-amyrin/β-amyrin

酵母

[63]

OSC9

LC485316

百脉根

α-amyrin

酵母

[64]

ItOSC2

鸢尾

α-amyrin/β-amyrin/δ-amyrin

酵母

[57]

βAS

PNY1

AB009030

人参

β-amyrin

酵母

[65]

PNY2

AB014057

人参

β-amyrin

酵母

[65]

PSY

AB034802

豌豆

β-amyrin

酵母

[58]

GgbAS1

AB037203

光果甘草

β-amyrin

酵母

[66]

AsbAS1

AJ311789

燕麦

β-amyrin

酵母

[67]

BPY

AB055512

白桦

β-amyrin

酵母

[48]

MtAMY1

AF78453

蒺藜苜蓿

β-amyrin

酵母

[68]

EtAS

AB206469

绿玉树

β-amyrin

酵母

[69]

LjAMY1/cOSC1

AB181244

百脉根

β-amyrin

酵母

[50]

βAS

BgbAS

AB289585

木榄

β-amyrin

酵母

[52]

VhBS

DQ915167

麦蓝菜

β-amyrin

酵母

[70]

NsbAS1

FJ013228

黑种草

β-amyrin

酵母

[71]

AtBAS

AB374428

拟南芥

β-amyrin

酵母

[72]

β-AS

HM219225

辽东楤木

β-amyrin

大肠杆菌/酵母

[73]

SlTTS1

HQ266579

番茄

β-amyrin

酵母/番茄(超表达)

[74]

ObAS1

KF636411

罗勒

β-amyrin

酵母

[63]

MlbAS

KF425519

非洲灌木

β-amyrin

酵母/非洲灌木(RNAi)

[75]

KsBAS

KT150523

刺楸

β-amyrin

酵母

[76]

EsBAS

KX378998

刺五加

β-amyrin

酵母/烟草

[77]

LsOSC3

MG708184

大花紫薇

β-amyrin

酵母/烟草

[55]

LsOSC4

MG708185

大花紫薇

β-amyrin

酵母/烟草

[55]

TaOSC1

MK547511

阿江榄仁

β-amyrin

酵母

[56]

CqbAS1

KX343074

藜麦

β-amyrin

酵母

[78]

CS

CPQ

AB116238

西葫芦

cucurbitadienol

酵母

[79]

CsBi/CsCPQ

KM655855

黄瓜

cucurbitadienol

酵母

[20]

CcCDS2

KM821405

药西瓜

cucurbitadienol

酵母

[80]

SgCBQ

HQ128567

罗汉果

cucurbitadienol

酵母

[81]

CmBi/CmCPQ

XM_008461716

香瓜

cucurbitadienol

酵母

[82]

多功能OSC

BvLUP5P

KP784689

欧洲山芥

α-amyrin/β-amyrin/lupeol

酵母/烟草

[54]

KcMS

AB257507

秋茄

α-amyrin/β-amyrin/lupeol

酵母

[83]

MdOSC1

FJ032006

苹果

α-amyrin/β-amyrin/lupeol

酵母

[62,84,85]

MdOSC3

FJ032008

苹果

α-amyrin/β-amyrin/lupeol

酵母/烟草

[84,85]

BfOSC1

LC464978

紫荆

α-amyrin/β-amyrin/lupeol

酵母/烟草

[86]

AtLUP2

NM_106545

拟南芥

tirucalla-7,24-dien-3β-ol/α-amyrin/β-amyrin/lupeol/taraxasterol/ψ-taraxasterol/bauerenol

酵母

[87]

CsOSC2

AB058508

闭鞘姜

β-amyrin/lupeol/germanicol

酵母

[88]

LjAMY2

AF478455

百脉根

lupeol/β-amyrin/20-hydroxylupeol

酵母/烟草/百脉根(毛状根)

[89]

RsM1

AB263203

木榄

germanicol/β-amyrin/lupeol

酵母

[52]

RsM2

AB263204

木榄

taraxerol/β-amyrin/lupeol

酵母

[52]

MdOSC4

KT383435

苹果

β-amyrin/lupeol/germanicol

酵母/烟草

[84]

MdOSC5

KT383436

苹果

β-amyrin/lupeol

酵母/烟草

[84]

SlTTS2

HQ266580

番茄

α-amyrin/β-amyrin/taraxasterol/δ-amyrin

酵母/番茄(超表达)

[74]

BfOSC2

LC464979

紫荆

β-amyrin/lupeol/germanicol

酵母/烟草

[86]

AtBARS1

NM_117625

拟南芥

baruol/β-amyrin

酵母

[90]

AtCAMS1

NM_148667

拟南芥

β-amyrin/camelliol C/achilleol A

酵母

[91]

AtLUP1

U49919

拟南芥

β-amyrin/lupeol

酵母

[92]

多功能OSC

AtMRN1

NM_123624

拟南芥

marneral/marnerol/camelliol C/achilleol A/δ8-polypodatetraenol

酵母

[93]

AtTHAS1

NM_124175

拟南芥

thalianol, thalianol-21,22-epoxide

酵母

[94]

AtPEN1

NM_117622

拟南芥

arabidiol, arabidiol-20,21-epoxide

酵母

[93]

OsOSC6

KC416147

水稻

α-amyrin/β-amyrin

酵母/水稻

[95]

OsOSC7

ABG22399

水稻

orysatinol/orysaspirol

酵母

[40]

OsPS/OsOSC7

AK066327

水稻

parkeol

酵母

[96]

OsOSC8

AK070534

水稻

achilleol B/tirucalla-7,24-dien-3β-ol/α-amyrin/β-amyrin/ψ-taraxasterol/butyrospermol/dammara-20,24-dien-3β-ol

酵母

[96,97]

其他

OsOSC10

水稻

friedelin

酵母

[97]

OsIAS/OsOSC11

AK067451

水稻

isoarborinol

酵母/拟南芥(超表达)

[39]

OsOSC12/OsPTS1

水稻

poaceatapetol

酵母/水稻

[98]

AtLAS1

NM_114382

拟南芥

lanosterol

酵母

[99]

(2) 细胞色素P450.

细胞色素P450依赖性单加氧酶(CYP450s, EC1.14.x.x)是三萜皂苷生物合成途径中的关键酶, 催化三萜骨架进行羟基化、羧基化、醛基化、酮基化和脱氢脱水等结构修饰, 形成三萜皂苷的中间体[1,3,100]. 典型的CYP450s具有A、B、C、D四个特征性结构域, 其中结构域A上的(A/G)GX(D/E)T(T/S)序列是底物和氧分子连接的部位, 结构域D上的PFG(A/S/V)GRRXC(P/A/V)G序列是铁血红素通过共价键连接的部位.

CYP450s约占植物基因组蛋白编码基因的1%, 是参与植物代谢的酶中最大的家族[101]. 根据氨基酸序列同源性和系统发育标准, 将同源性>40%和>55%的CYP450s分别归为同一家族和亚家族. CYP450s的命名规则为: CYP及其后面的数字、字母分别表示细胞色素P450、家族、亚家族和同工酶, v1、v2表示等位基因, P代表假基因. 已知植物中有127个CYP450家族, 其中陆生植物CYP450s被进一步划分为11个家系[101], 参与植物三萜皂苷生物合成的CYP450s主要来自CYP51, CYP71, CYP72和CYP85家系[102]. CYP85家系中的CYP716家族酶被认为是双子叶植物三萜生物合成多样性的主要贡献者, 其亚家族CYP716A/-C/-E/-Y成员主要参与双子叶植物中五环三萜骨架的氧化; 而来自CYP51家系中的CYP51H亚家族负责单子叶植物中五环三萜骨架的修饰[101,103,104]. CYP71家系中的CYP93E、CYP72家系中的CYP72A和CYP85家系中的CYP88D亚家族成员与豆科植物中三萜骨架的氧化密切相关[105]. 此外, CYP71家系(成员: CYP705A, CYP71A, CYP71D, CYP81Q)和CYP85家系(成员: CYP87D, CYP88L, CYP708A, CYP716U, CYP716S)也参与了三萜皂苷的生物合成[104].

CYP450s数量庞大、底物特异性强、序列相似度低, 而且表达的产物物理性质十分相似难以分开, 这大大加深了解析其生物转化步骤的难度[106]. 目前, 仅有73个参与三萜皂苷生物合成的CYP450s被成功鉴定(表3). 通过对这些CYP450s基因的系统发育分析, 发现不同家系、家族的CYP450s在发育树上被明显的区分(图4), 不同家系中的CYP450s多数具有相似功能. 例如, 在这73个CYP450s中, 大约有30个CYP716A家族成员具有C-28氧化酶活性, 它们中大多数催化α-amyrin/β-amyrin/lupeol骨架C-28位连续三步氧化形成羟基、醛和羧基[106,118,120,124]. 而CYP716E和CYP716S家族成员分别催化三萜C-6、C-2α羟基化, CYP93E家族主要在C-24位催化三萜氧化. 此外, CYP450s还具有催化三萜骨架C-3, C-11, C-12, C-16, C-19, C-20, C-21, C-22, C-23, C-25, C-30等位置氧化的作用.

Table 3  Overview of CYP450s related to triterpenoid saponin biosynthesis reported in literaturesa)

编号

基因

GenBank登录号

植物来源

底物

反应

产物

功能分析方法

参考文献

1

CYP51H10

DQ680852

燕麦

β-amyrin

C12,C13β环氧化/C16β羟基化

12,13β-epoxy-16β-hydroxy-β-amyrin

酵母

[107]

2

CYP71D353

KF460438

百脉根

dihydro-lupeol/20-hydroxy-lupeol

C-20羟基化/C-28氧化

20-hydroxy-lupeol/20-hydroxy-betulinic acid

烟草/百脉根(毛状根)

[89]

3

CYP81Q58

KM655862

黄瓜

19-hydroxy-cucurbitadienol

C-25羟基化/双键位移

19,25-dihydroxy cucurbitadienol

酵母/黄瓜

[20]

4

CYP81Q59

香瓜

11-carbonyl-20β-hydroxy-cucurbitadienol

C-2β羟基化

11-carbonyl-2β,20β-dihydroxy-cucurbitadienol

酵母

[82]

5

LjCYP93E1

LC414182

百脉根

β-amyrin

C-24羟基化

24-hydroxy-β-amyrin

酵母/Lotus retrotransposon 1 (LORE1)-tagged lines

[64]

6

CYP93E1

AF135485

大豆

β-amyrin/24-hydroxy-β-amyrin/sophoradiol

C-24羟基化/C-24氧化

24-hydroxy-β-amyrin/24-carboxy-β-amyrin/soyasapogenol B

酵母

[108]

7

CYP93E2

DQ335790

蒺藜苜蓿

β-amyrin

C-24羟基化

24-hydroxy-β-amyrin

酵母

[106,108]

8

CYP93E3

AB437320

甘草

β-amyrin/24-hydroxy-β-amyrin

C-24羟基化/C-24氧化

24-hydroxy-β-amyrin/24-carboxy-β-amyrin

酵母

[108,109]

9

CYP93E4

KF906535

花生

β-amyrin/24-hydroxy-β-amyrin

C-24羟基化/C-24氧化

24-hydroxy-β-amyrin/24-carboxy-β-amyrin

酵母

[108]

10

CYP93E5

KF906536

鹰嘴豆

β-amyrin/24-hydroxy-β-amyrin

C-24羟基化/C-24氧化

24-hydroxy-β-amyrin/24-carboxy-β-amyrin

酵母

[108]

11

CYP93E6

KF906537

光果甘草

β-amyrin/24-hydroxy-β-amyrin

C-24羟基化/C-24氧化

24-hydroxy-β-amyrin/24-carboxy-β-amyrin

酵母

[108]

12

CYP93E7

KF906538

小扁豆

β-amyrin

C-24羟基化

24-hydroxy-β-amyrin

酵母

[108]

13

CYP93E8

KF906539

豌豆

β-amyrin/24-hydroxy-β-amyrin

C-24羟基化/C-24氧化

24-hydroxy-β-amyrin/24-carboxy-β-amyrin

酵母

[108]

14

CYP93E9

KF906540

菜豆

β-amyrin/24-hydroxy-β-amyrin

C-24羟基化/C-24氧化

24-hydroxy-β-amyrin/24-carboxy-β-amyrin

酵母

[108]

15

CYP72A67

DQ335780

蒺藜苜蓿

oleanolic acid/hederagenin/ gypsogenic acid/gypsogenin

C-2β羟基化

2β-hydroxy-oleanolic acid/bayogenin/medicagenic acid/2β, 3β-dihydroxyolean-12-en-23-oxo-28-oic acid

酵母/蒺藜苜蓿(突变株系)

[110]

16

CYP72A61v2

AB558145

蒺藜苜蓿

24-hydroxy-β-amyrin

C-22β羟基化

soyasapogenol B

酵母

[111]

17

CYP72A69

LC143440

大豆

soyasapogenol B

C-21β羟基化

soyasapogenol A

酵母/大肠杆菌

[112]

18

CYP72A475

MH539812

燕麦

12,13β-epoxy, 16β-hydroxy-β-amyrin

C-21β羟基化

12,13β-Epoxy, 16β,21β-dihydroxy-β-amyrin

烟草

[113]

19

CYP72A63

AB558146

蒺藜苜蓿

β-amyrin

C-30氧化

11-deoxoglycyrrhetinic acid

酵母

[114]

20

CYP72A154

AB558153

甘草

β-amyrin/11-oxo-β-amyrin

C-30氧化

30-hydroxy-β-amyrin/glycyrrhetinic acid

酵母

[114]

21

CYP72A68v2

DQ335782

蒺藜苜蓿

oleanolic acid

C-23氧化

gypsogenic acid

酵母

[111]

22

CYP72A397

KT150517

刺楸

oleanolic acid

C-23羟基化

hederagenin

酵母

[76]

23

CYP72A552

欧洲山芥

oleanolic acid

C-23羟基化

hederagenin

酵母/烟草

[115]

24

CYP714E19

KT004520

积雪草

oleanolic acid/ursolic acid

C-23羟基化

hederagenin/23-hydroxy ursolic acid

酵母

[116]

25

CYP716A1

NM_123002

拟南芥

α-amyrin/β-amyrin/lupeol

C-28氧化

ursolic acid/oleanolic acid/betulinic acid

酵母

[117]

26

CYP716A12

DQ335781

蒺藜苜蓿

α-amyrin/β-amyrin/lupeol

C-28氧化

ursolic acid/oleanolic acid/betulinic acid

酵母

[106,118]

27

CYP716A15

AB619802

葡萄

α-amyrin/β-amyrin/lupeol

C-28氧化

ursolic acid/oleanolic acid/ betulinic acid

酵母

[106]

28

CYP716A51

AB706297

百脉根

α-amyrin/β-amyrin/lupeol

C-28氧化

ursolic acid/oleanolic acid/betulinic acid

酵母/百脉根毛状根(CRISPR/Cas9)

[64]

29

CYP716A154/CYP716AL1

JN565975

长春花

α-amyrin/β-amyrin/lupeol

C-28氧化

ursolic acid/oleanolic acid/ betulinic acid

酵母

[119]

30

CYP716A175

XM_008392874

苹果

α-amyrin/β-amyrin/lupeol

C-28氧化

ursolic acid/oleanolic acid/ betulinic acid

酵母

[84]

31

CYP716A265

MG708187

大花紫薇

α-amyrin/β-amyrin/lupeol

C-28氧化

ursolic acid/oleanolic acid/betulinic acid

酵母/烟草

[55]

32

CYP716A266

MG708188

大花紫薇

α-amyrin/β-amyrin/lupeol

C-28氧化

ursolic acid/oleanolic acid/betulinic acid

酵母/烟草

[55]

33

CYP716A2

LC106013

拟南芥

α-amyrin/β-amyrin/lupeol

C-16/C-22α/C-28羟基化

22α-hydroxy-α-amyrin/22α-hydroxy-β-amyrin/16-hydroxy-β-amyrin/betulin

酵母

[117]

34

CYP716A179

LC157867

甘草

α-amyrin/β-amyrin/lupeol

C-28氧化/C-22α 羟基化

ursolic acid/oleanolic acid/betulinic acid

酵母

[120]

35

CYP716A259

LC325360

白骨壤

α-amyrin/β-amyrin/lupeol

C-28氧化

ursolic acid/oleanolic acid/ betulinic acid

酵母

[121]

36

CYP716A140

KU878853

桔梗

β-amyrin/16β-hydroxy-β-amyrin/12,13α-epoxy-β-amyrin

C-28氧化

oleanolic acid/16β-hydroxy-oleanolic acid/12,13α-epoxy-oleanolic acid

酵母

[103]

37

CYP716A14v2

KF309251

黄花蒿

α-amyrin/β-amyrin/δ-amyrin

C-3氧化

α-amyrone/β-amyrone/δ-amyrone

酵母/烟草/黄花蒿(RNAi)

[122]

38

CYP716A44

AK329870

番茄

α-amyrin/β-amyrin

C-28氧化

ursolic acid/oleanolic acid

酵母

[123]

39

CYP716A46

XM_004243858

番茄

α-amyrin/β-amyrin

C-28氧化

ursolic acid/oleanolic acid

酵母

[123]

40

CYP716A83

KU878849

积雪草

α-amyrin/β-amyrin

C-28氧化

ursolic acid/oleanolic acid

酵母

[103]

41

CYP716A86

KU878848

积雪草

α-amyrin/β-amyrin

C-28氧化

ursolic acid/oleanolic acid

酵母

[103]

42

CYP716A252

JQ958967

罗勒

α-amyrin/β-amyrin

C-28氧化

ursolic acid/oleanolic acid

酵母/罗勒(VIGS)

[124]

43

CYP716A253

JQ958968

罗勒

α-amyrin/β-amyrin

C-28氧化

ursolic acid/oleanolic acid

酵母/罗勒 (VIGS)

[124]

44

CYP716A80

KP795926

欧洲山芥

β-amyrin/lupeol

C-28氧化

oleanolic acid/betulinic acid

酵母/烟草

[54]

45

CYP716A81

KP795925

欧洲山芥

β-amyrin/lupeol

C-28氧化

oleanolic acid/betulinic acid

酵母/烟草

[54]

46

CYP716A141

LC209200/KU8878855

桔梗

β-amyrin/oleanolic acid

C-28氧化/C-16β羟基化

oleanolic acid/16β-hydroxy-oleanolic acid

酵母

[103,105]

47

CYP716A180

KJ452328

白桦

lupeol

C-28氧化

betulinic acid

酵母

[125]

48

CYP716A17

AB619803

葡萄

β-amyrin

C-28氧化

oleanolic acid

酵母

[106]

49

CYP716A52v2

JX036032

人参

β-amyrin

C-28氧化

oleanolic acid

酵母

[126]

50

CYP716A75

KF318733

非洲灌木

β-amyrin

C-28氧化

oleanolic acid

酵母/非洲灌木/蒺藜苜蓿

[75]

51

CYP716A78

KX343075

藜麦

β-amyrin

C-28氧化

oleanolic acid

酵母

[78]

52

CYP716A79

KX343076

藜麦

β-amyrin

C-28氧化

oleanolic acid

酵母

[78]

53

CYP716A94

KT150521

刺楸

β-amyrin

C-28氧化

oleanolic acid

酵母

[76]

54

CYP716A110

KU878864

洛杉矶耧斗菜

β-amyrin

C-28氧化

oleanolic acid

酵母

[103]

55

CYP716A140v2

LC209199

桔梗

β-amyrin

C-28氧化

oleanolic acid

酵母

[105]

56

CYP716A244

KX354739

刺五加

β-amyrin

C-28氧化

oleanolic acid

酵母/烟草

[77]

57

CYP716A254

鹅掌草

β-amyrin

C-28氧化

oleanolic acid

酵母

[127]

58

CYP716A111

KY047600

洛杉矶耧斗菜

β-amyrin

C-16β羟基化

16β-hydroxy-β-amyrin

酵母

[103]

59

CYP716C11

KU878852

积雪草

ursolic acid/oleanolic acid/6β-hydroxy-oleanolic acid

C-2α羟基化

corosolic acid /maslinic acid/6β-hydroxy-maslinic acid

酵母

[103]

60

CYP716C53

LC325362

白骨壤

oleanolic acid/ursolic acid

C-2α羟基化

maslinic acid/corosolic acid

酵母

[121]

61

CYP716C55

MG708191

大花紫薇

ursolic acid/oleanolic acid

C-2α羟基化

corosolic acid/maslinic acid

酵母/烟草

[55]

62

CYP716E26

XM_004241773

番茄

α-amyrin/β-amyrin

C-6β羟基化

6β-hydroxy-α-amyrin/daturadiol

酵母

[123]

63

CYP716E41

KU878851

积雪草

ursolic acid/oleanolic acid/maslinic acid

C-6β羟基化

6β-hydroxy-ursolic acid/6β-hydroxy-oleanolic acid/6β-hydroxy-maslinic acid

酵母

[103]

64

CYP716S1v2/CYP716A53v2

JX036031

人参

protopanaxadiol

C-6羟基化

protopanaxatriol

酵母/人参

[119,128]

65

CYP716S5

KU878856

桔梗

β-amyrin/oleanolic acid

C-12,13α环氧化

12,13α-epoxy-β-amyrin/12,13α-epoxy-oleanolic acid

酵母

[103]

66

CYP716U1/CYP716A47

JN604536

人参

dammarenediol-II

C-12羟基化

protopanaxadiol

酵母/人参

[129]

67

CYP716Y1

KC963423

柴胡

α-amyrin/β-amyrin

C-16α羟基化

16α-hydroxy-α-amyrin/16α-hydroxy-β-amyrin

酵母

[100,103]

68

CYP87D16

KF318735

非洲灌木

β-amyrin

C-16α羟基化

16α-hydroxy-β-amyrin

酵母/非洲灌木/蒺藜苜蓿

[75]

69

CYP87D18

HQ128570

罗汉果

11α-hydroxy-cucurbitadienol/24,25-epoxy-cucurbitadienol/24,25-dihydroxy-cucurbitadienol

C-11羟基化/氧化

11-oxo-cucurbitadienol/11-oxo-24,25-epoxy-cucurbitadienol/mogrol

酵母

[6,130]

70

CYP87D20

KM655862

黄瓜

cucurbitadienol/11-oxo-cucurbitadienol

C-11氧化/C-20β羟基化

11-oxo-cucurbitadienol/11-carbonyl-20β-hydroxy-cucurbitadienol

酵母

[82]

71

CYP88D6

AB433179

甘草

β-amyrin

C-11氧化

11-oxo-β-amyrin

酵母

[109]

72

CYP88L2

NP_001295866

黄瓜

cucurbitadienol

C-19羟基化

19-hydroxy-cucurbitadienol

酵母/黄瓜(RNAi)

[20,82]

73

CYP88A13

MN200611

蒺藜苜蓿

medicagenic acid

C-16α羟基化

zanhic acid

酵母/烟草/蒺藜苜蓿根毛

[131]

(3) 糖基转移酶.

来自糖基转移酶家族1的糖基转移酶(UGTs, EC2.4.1.x), 主要参与植物中天然产物的糖基化, 能将尿嘧啶核苷二磷酸糖上的活性糖基转移到植物中的小分子化合物受体上[132], 与三萜皂苷生物合成相关的糖基转移酶属于这一类. UGTs催化进行的三萜糖基化通常被认为是三萜皂苷生物合成的最后一步, 是三萜皂苷的多样性和生物活性形成的关键环节[3]. 典型的三萜皂苷含有2~5个糖元, 通常在皂苷元的C-3和/或C-28位置上形成糖链; 也存在C-4, C-16, C-20, C-21, C-22和/或C-23位置糖基化的三萜皂苷[1,132]. 常见的糖元有葡萄糖(glucose, Glc)、半乳糖(galactose, Gal)、葡萄糖醛酸(glucoronic acid, GlcA)、鼠李糖(rhamnose, Rha)、木糖(xylose, Xyl)和阿拉伯糖(arabinose, Ara)等五元糖或六元糖. 糖链的数量、组成及其在三萜骨架上的位置, 均影响着三萜皂苷的生物活性、稳定性、溶解性和细胞分隔性[102].

UGTs也以基因家族的形式存在于植物体内. 根据氨基酸序列的同源性及其催化特征, UGTs被分为不同的家族(同源性>40%)和亚家族(同源性>60%)[3,133]. 尽管序列同源性不高, 但典型的植物次级代谢性UGTs具有相似的结构域, 拥有PSPG(plant secondary product glycosyltransferase)基序, 该基序是UGTs中与底物结合的区域[2,25].

随着高通量测序技术的不断发展, 越来越多植物的UGT基因序列被公布, 但仅有少数几种植物中的UGTs基因被克隆和鉴定, 其中有44个参与了三萜皂苷的生物合成, 总结在表4中, 这些UGTs主要来自UGT71, 73, 74, 85, 91和94家族[2]. 对这些UGT基因进行系统发育分析, 结果显示, 不同家族的UGTs处在发育树的不同分枝上(图5), 且具有相似的功能. 例如, UGT73家族的成员多数具有C-3或C-28位葡萄糖糖基化活性, 而UGT74s和UGT94s常表现出C-3位葡萄糖糖基化作用. 来自不同家族的UGTs可能具有相同的区域选择性, 不同的UGTs在不同底物的同一位置可以有相同的功能[2]. 然而, 植物UGTs具有很大程度的底物混乱性, 所以仅通过序列分析和体外生化研究来预测UGTs的生物功能仍不够准确[3,134]. Ribeiro等人[131]还发现, 已鉴定的皂苷生物合成酶基因在蒺藜苜蓿基因组上常常表现为重复簇状排列, 该特征在糖基转移酶编码基因中尤为明显, 这或许是皂苷代谢进化的驱动力之一.

Table 4  Overview of UGTs related to triterpenoid saponin biosynthesis reported in literaturesa)

编号

基因

GenBank登录号

植物来源

底物

反应

产物

功能分析方法

参考文献

1

UGT71G1

AY747627

蒺藜苜蓿

medicagenic acid,UDP-Glc

糖基化

medicagenic acid-Glc

大肠杆菌

[134]

2

UGT73AD1

KP195716

积雪草

asiatic acid/madecassic acid, UDP-Glc

C-28β糖基化

28β-Glc-asiatic acid/28β-Glc-madecassic acid

大肠杆菌

[135]

3

UGT73AE1

KJ956788

红花

glycyrrhetinic acid, UDP-Glc

O/S/N-糖基化

glycyrrhizin

大肠杆菌

[136]

4

UGT73AH1

MF471454

积雪草

asiatic acid, UDP-Glc

C-28糖基化

28-Glc-asiatic acid

大肠杆菌

[137]

5

UGT73AM3

黄瓜

cucurbitacin C,UDP-Glc

C-3糖基化

3-O-β-D-Glc- cucurbitacin C

大肠杆菌/黄瓜

[138]

6

UGT73C10

JQ291613

欧洲山芥

β-amyrin/oleanolic acid/betulinic acid/hederagenin/3-Glc-oleanolic acid, UDP-Glc

C-3/C-28糖基化

3-Glc-β-amyrin/3-Glc-oleanolic acid/3-Glc-betulinic acid/28-Glc-betulinic acid/3-Glc-hederagenin/3-Glc-28-Glc-oleanolic acid

大肠杆菌

[139]

7

UGT73C11

JQ291614

欧洲山芥

β-amyrin/oleanolic acid/betulinic acid/hederagenin, UDP-Glc

C-3/C-28糖基化

3-Glc-β-amyrin/3-Glc-oleanolic acid/3-Glc-betulinic acid/3-Glc-hederagenin/28-Glc-betulinic acid

大肠杆菌/烟草

[139,140]

8

UGT73C12

JQ291615

欧洲山芥

β-amyrin/oleanolic acid/betulinic acid/hederagenin/3-Glc-oleanolic acid/3-Glc-hederagenin, UDP-Glc

C-3/C-28糖基化

3-Glc-β-amyrin/3-Glc-oleanolic acid/3-Glc-betulinic acid/28-Glc-betulinic acid/3-Glc-hederagenin/3-Glc-28-Glc-oleanolic acid/3-Glc-28-Glc-hederagenin/3-Glc-28-Glc-betulinic acid

大肠杆菌

[139]

9

UGT73C13

JQ291616

欧洲山芥

β-amyrin/oleanolic acid/betulinic acid/hederagenin/3-Glc-oleanolic acid/3-Glc-hederagenin, UDP-Glc

C-3/C-28糖基化

3-Glc-β-amyrin/3-Glc-oleanolic acid/3-Glc-betulinic acid/28-Glc-betulinic acid/3-Glc-hederagenin/3-Glc-28-Glc-oleanolic acid/3-Glc-28-Glc-hederagenin/3-Glc-28-Glc-betulinic acid

大肠杆菌/烟草

[139]

10

UGT73C22

MF448363

欧洲山芥

oleanolic acid/hederagenin, UDP-Glc

C-3/C-28糖基化

3-Glc-oleanolic acid/3-Glc-28-Glc-oleanolic acid/3-Glc-28-Glc-hederagenin/28-Glc-hederagenin/28-Glc-oleanolic acid

大肠杆菌/烟草

[139]

11

UGT73C23

MF448369

欧洲山芥

oleanolic acid/hederagenin, UDP-Glc

C-3/C-28糖基化

3-Glc-oleanolic acid/3-Glc-28-Glc-oleanolic acid/3-Glc-hederagenin/3-Glc-28-Glc-Hederagenin/3-glc-23-glc-hederagenin

大肠杆菌/烟草

[140]

12

UGT73C25

MF448366

欧洲山芥

oleanolic acid/hederagenin, UDP-Glc

C-3/C-23/C-28糖基化

3-Glc-oleanolic acid/3-Glc-28-Glc-oleanolic acid/3-Glc-hederagenin/3-glc-23-glc-hederagenin

大肠杆菌/烟草

[140]

13

UGT73C21

MF448360

欧洲山芥

oleanolic acid/hederagenin, UDP-Glc

C-3糖基化

3-Glc-oleanolic acid/3-Glc-hederagenin

大肠杆菌/烟草

[140]

14

UGT73C26

MF448353

欧洲山芥

oleanolic acid/hederagenin, UDP-Glc

C-3糖基化

3-Glc-oleanolic acid/3-Glc-hederagenin

大肠杆菌/烟草

[140]

15

UGT73C27

MF448357

欧洲山芥

oleanolic acid/hederagenin, UDP-Glc

C-3糖基化

3-Glc-oleanolic acid/3-Glc-hederagenin

大肠杆菌/烟草

[140]

16

UGT73F18

MN200615

蒺藜苜蓿

medicagenic acid

C-3糖基化

3-Glc-medicagenic acid

酵母/烟草

[131]

17

UGT73F19

MN200616

蒺藜苜蓿

medicagenic acid/gypsogenic acid

C-3糖基化

3-Glc-medicagenic acid/3-Glc-gypsogenic acid

酵母/烟草

[131]

18

PjOAGT

MH819287

竹节参

oleanolic acid,UDP-GlcA

C-3糖基化

oleanolic acid 3-O-glucoronide

大肠杆菌

[141]

19

PzOAGT1

MH819284

姜状三七

oleanolic acid,UDP-GlcA

C-3糖基化

oleanolic acid 3-O-glucoronide

大肠杆菌

[141]

20

PzOAGT2

MH819285

姜状三七

oleanolic acid,UDP-GlcA

C-3糖基化

oleanolic acid 3-O-glucoronide

大肠杆菌

[141]

21

PzOAGT3

MH819286

姜状三七

oleanolic acid,UDP-GlcA

C-3糖基化

oleanolic acid 3-O-glucoronide

大肠杆菌

[141]

22

GuUGAT

KT759000

甘草

glycyrrhetinic acid/3-GlcA-glycyrrhetinic acid, UDP-GlcA

C-3糖基化

3-GlcA-glycyrrhetinic acid/glycyrrhizin

大肠杆菌

[142]

23

UGT73F2

AB628089

大豆

saponin A0-gα,UDP-Glc

C-22糖基化

saponin Ab

大肠杆菌/定点突变分析/转基因互补试验

[143]

24

UGT73F3

FJ477891

蒺藜苜蓿

hederagenin/soyasapogenol A/soyasapogenol B/bayogenin/medicagenic acid, UDP-Glc

C-28/C-3糖基化

hederagenin-C28-O-Glc/ soyasapogenol A-Glc /soyasapogenol B-Glc/ bayogenin-C28-O-Glc/ medicagenic acid-C28-O-Glc

大肠杆菌/蒺藜苜蓿(基因功能缺失分析)

[144]

25

UGT73F4

AB628091

大豆

saponin A0-αg,UDP-Xyl

C-22糖基化

saponin Aa

大肠杆菌/定点突变分析/转基因互补试验

[143]

26

UGT73B4

NM_001367432

大豆

soyasapogenol B/soyasaponin I, UDP-Glc/UDP-Gal

C-22糖基化

22-Glc-soyasapogenol B,22-Gal-soyasapogenol B,22-Glc-soyasaponin I, 22-Gal-soyasaponin I

大肠杆菌

[145]

27

UGT73F17

MH049688

甘草

glycyrrhizin, UDP-Glc

C-30/C-29糖基化

licorice-saponin A3

大肠杆菌

[146]

28

UGT73K1

AY747626

蒺藜苜蓿

hederagenin/soyasapogenol B/soyasapogenol E, UDP-Glc

糖基化

hederagenin-Glc,soyasapogenol B-Glc,soyasapogenol E-Glc

大肠杆菌

[134]

29

UGT74AE2

JX898529

人参

protopanaxadiol/ginsenoside compound K, UDP-Glc

C-3糖基化

ginsenoside Rh2/ginsenoside F2

酵母

[147]

30

UGT74M1

DQ915168

麦蓝菜

gypsogenic acid/betulinic acid/hederagenin/gypsogenin/echinocystic acid/16α-hydroxygypsogenic acid/quillaic acid, UDP-Glc

C-28糖基化

28-Glc-gypsogenic acid/28-Glc-betulinic acid/28-Glc-hederagenin/28-Glc-gypsogenin/28-Glc-echinocystic acid/28-Glc-16α-hydroxygypsogenic acid/28-Glc-quillaic acid

大肠杆菌

[70]

31

UGT94Q2

JX898530

人参

ginsenoside Rh2/ginsenoside F2, UDP-Glc

C-3糖基化

ginsenoside Rg3/ginsenoside Rd

酵母/西洋参/人参(RNAi)

[147,148]

32

UGT71A27 /UGTPg1

KM491309

人参

dammarenediol-II/protopanaxadiol/protopanaxatriol/ginsenoside Rh2/ginsenoside Rg3,UDP-Glc

C-20糖基化

20S-O-β-(D-glucosyl)-dammarenediol II(DMG)/ginsenoside compound K/ginsenoside F1/ginsenoside F2/ginsenoside Rd

酵母

[21]

33

UGTPg100

KP795113

人参

protopanaxatriol,UDP-Glc

C-6糖基化

ginsenoside Rh1

酵母

[149]

34

UGTPg101

KP795114

人参

protopanaxatriol/ginsenoside F1,UDP-Glc

C-20/C6糖基化

ginsenoside F1/ginsenoside Rg1

酵母

[149]

35

UGTPg45

KM401918

人参

protopanaxadiol/ginsenoside compound K, UDP-Glc

C-3糖基化

ginsenoside Rh2/ ginsenoside F2

酵母/大肠杆菌

[150]

36

UGTPg29

KM401911

人参

ginsenoside Rh2/ginsenoside F2, UDP-Glc

C-3糖基化

ginsenoside Rg3/ginsenoside Rd

酵母/大肠杆菌

[150]

37

Pq3-O-UGT2 (UGT94)

KR106207

西洋参

ginsenoside Rh2/ginsenoside F2, UDP-Glc

C-3糖基化

ginsenoside Rg3/ginsenoside Rd

酵母/西洋参/人参毛状根(RNAi)

[148]

38

Pq3-O-UGT1 (UGT74)

KiR028477

西洋参

protopanaxadiol, UDP-Glc

C-3糖基化

ginsenoside Rh2

酵母/西洋参毛状根(超表达/RNAi)

[151]

39

UGT73P2/GmSGT2

AB473730

大豆

soyasapogenol B/3-O-glucuronide, UDP-Gal

C-3糖基化

soyasaponin III

大肠杆菌

[152]

40

UGT91H4/GmSGT3

AB473731

大豆

soyasaponin III, UDP-Rha

C-3糖基化

soyasaponin I

大肠杆菌

[152]

41

UGRdGT

三七

ginsenoside Rd, UDP-Glc

糖基化

ginsenoside Rb1

体外生物转化

[153]

42

UGT74AC1

HQ259620

罗汉果

mogrol, UDP-Glc

C-3糖基化

mogroside IE

大肠杆菌

[81]

43

UGT720-269-1

罗汉果

mogrol/mogroside I-A1, UDP-Glc

C-3/C-24糖基化

mogroside I-A1/mogroside IIE

酵母/大肠杆菌

[6]

44

UGT94-289-3

罗汉果

mogroside IIE/mogroside IIIx/mogroside IV-A/siamenoside, UDP-Glc

C-3/C-24糖基化

mogroside IIIx/mogroside IV-A/siamenoside/mogroside V

酵母/大肠杆菌

[6]

3 三萜皂苷生物合成的调控

植物中, 三萜皂苷的生物合成受基因调控的影响. 通过增加基因拷贝数或沉默竞争代谢通路基因, 可人为改变三萜生物合成途径基因的表达, 提高三萜皂苷化合物的含量[8]. 研究表明, 通过HMGR, FPS, SS和SE基因的过表达或RNAi(RNA interference)可实现人参、三七等植物中三萜皂苷生物合成的调控[27,33,154,155]. 此外, 茉莉酸衍生物(如茉莉酸甲酯, methyl jasmonate, MeJA)的外源处理能影响植物中三萜皂苷的积累. 在人参、积雪草、三七、西洋参、藜麦等植物中, MeJA处理能提高植物体内、离体组织或细胞内FPS, SS, SE, OSCs, CYP450s及UGTs等酶基因的表达活性, 从而影响其皂苷的积累[2,29,33,42,78,119,129,151,156~158], 但不同酶对MeJA的响应存在差异. 三萜皂苷的生物合成除了受相关酶基因调控外, 还受到转录因子和microRNA(miRNA)等在转录或转录后水平上的调控. 因此, 下文将对植物三萜皂苷生物合成中已报道的转录因子和miRNA进行总结.

3.1 转录因子

转录因子(transcription factors, TFs)是一类DNA结合蛋白, 可以通过自身或与其他蛋白的相互作用激活或抑制基因转录[159]. TFs在植物次生代谢产物生物合成过程中可以同时控制多个关键基因的表达. 目前, 已报道调控植物三萜生物合成的TFs类型有bHLH(basic helix-loop-helix)、AP2/ERF(APETALA2/ethylene-responsive factor)、bZIP(basic region/leucine zipper motif)、WRKY等四种(图6). Mertens等人[160]从蒺藜苜蓿中鉴定出两种同源的碱性螺旋-环-螺旋(helix-loop-helix)家族的MeJA诱导转录因子(bHLH TFs), TSAR1(triterpene saponin biosynthesis activating regulator 1)和TSAR2. 其中, TSAR1可以促进非溶血性大豆皂苷的生物合成, 激活bAS, CYP93E2, CYP72A61v2等相关酶基因的表达, TSAR2可促进溶血性大豆皂苷的合成, 并激活bAS, CYP716A12和CYP72A68v2等相关酶基因的表达. 而后, 该研究团队基于蒺藜苜蓿种子发育的转录组数据, 通过基因共表达分析, 鉴定出另一个转录因子TSAR3, 该转录因子可以激活bAS, CYP716A12, CYP72A67, CYP72A68, CYP88A13和UGT73F3等相关酶基因的表达, 促进蒺藜苜蓿中溶血性皂苷的合成[131]. 甘草中的bHLH3可激活bAS, CYP93E3和CYP72A566的表达, 且系统发育分析表明, bHLH3与TSAR2(53%)的氨基酸序列相似性高于TSAR1(43%)[161]. Jarvis等人[162]发现了藜麦中的两个bHLH转录因子TSARL1和TSARL2, 它们可以增加藜麦体内三萜生物合成途径中基因的表达. 此外, 研究学者们也在黄瓜[20]、三七[163]、人参[164]、白桦[165]等植物中发现了调控三萜生物合成的bHLH转录因子. 近年来, 研究还发现, bHLH转录因子与植物三萜类化合物生物合成相关基因簇的表达调控有关, 例如, TSAR1和TSAR2参与HMGR1和MKB1(MAKIBISHI1, RING membrane anchor-like E3 ubiquitin ligase)所在基因簇的表达调控, 促进蒺藜苜蓿三萜皂苷生物合成[160]; 而黄瓜中的两个组织特异性bHLH转录因子Bl(bitter leaf)和Bt(bitter fruit)可以对葫芦素合成相关基因簇进行调控[20]. 除了bHLH家族外, 也发现了AP2/ERF, bZIP, WRKY家族的转录因子参与植物三萜皂苷生物合成调控的情况, 例如, 三七中的AP2/ERF转录因子ERF1, 在三七皂苷生物合成中起正调控因子作用[159]; 而北柴胡(Bupleurum chinense)中的bZIP转录因子bZIP134, 起着负调控柴胡皂苷生物合成的作用[166]. 南非醉茄中的WRKY转录因子WRKY1对其体内三萜化合物withanolides的生物合成起着积极的调控作用[167]. Sun等人[168]报道, 西洋参中的WRKY1可以调控拟南芥中的FPPS, SQS和SQE等三萜合成途径基因, 但并未研究其对三萜类代谢产物的影响. 现今, 关于三萜皂苷生物合成相关转录因子的研究仍较少, 加强此方面的研究不仅有助于了解植物三萜皂苷代谢途径的调控机制, 还可以将其作为调控工具应用到相关代谢工程, 助力植物三萜皂苷基础研究和人工合成的发展.

3.2 miRNA

miRNA是一类内源性非编码小RNA, 在植物基因表达调控中发挥着重要作用[169]. 近年来, 研究发现miRNA是许多植物中调节次级代谢物产生的主要生物因子[170]. 因此, 为了高效获取植物中的三萜皂苷, 除了确定其合成和代谢途径的关键酶基因和转录因子, 研究miRNA在转录后水平对关键酶基因和相关转录因子的调控作用也是至关重要的. 随着高通量测序技术和生物信息学的快速发展, 越来越多植物的miRNA被预测出来. Mathiyalagan等人[171]研究表明, miR854e可能靶向调控高丽参人参皂苷生物合成中的FPS基因, 而miR1439b和miR1439h可能靶向调控βAS基因. Wei等人[172]预测三七中的miR5021, miR5163, miR5293和novel_miR_27可能靶向调控萜类主链生物合成途径中的基因. Fan等人[173]结合转录组数据对苍耳(Xanthium strumarium)中miRNA及其靶基因进行了鉴定与分析, 结果表明, miR5255和miR5491分别靶向调控SE和βAS, 进而对萜类生物合成进行调控. 李华云等人[174]、陈艳琳等人[175]分别对长白山人参和甘草中miRNA的靶基因进行了预测和相应的生物信息学分析. Kajal和Singh[176]报道吊兰(Chlorophytum borivilianum)中的miR9662, miR894, miR172和miR166可能参与了其体内三萜皂苷生物合成的调控. 这些工作为miRNA在三萜皂苷生物合成中的调控机制研究提供了数据资源, 然而, 三萜皂苷生物合成相关的miRNA研究仍处于起步阶段, 迄今为止报道的相关miRNA仍较少, 且多数仅进行了功能预测, 这些miRNA作用的靶基因及其调控植物三萜皂苷代谢的分子机制仍有待进一步研究.

4 微生物细胞工厂中三萜皂苷的合成

合成生物学是涉及分子生物学、微生物学、生物工程、计算科学以及材料科学等多个领域的具有巨大潜力的综合性学科, 以生命科学理论为指导, 旨在通过参考化合物的生物合成途径, 人工设计、构建具有某种特定功能或全新的生物系统[177,178]. 目前, 合成生物学已被广泛应用于药物生产、疫苗开发、再生医学等方面[179]. 随着合成生物学的发展和植物三萜皂苷生物合成途径的不断解析, 利用合成生物学理论和技术生产结构复杂、稀有的生物活性三萜皂苷已取得了一定成果.

通过合成生物学技术在微生物中设计代谢途径和模块组成的生物元件, 利用微生物的发酵工程生产次生代谢产物, 已成为现今获得稀有次生代谢产物的一种最先进、最快捷的方式. 与植物相比, 微生物具有生长快、节约土地、大规模发酵等优点. 其中, 酵母是最常用微生物, 尤其在三萜皂苷的合成上拥有独特的优势, 这是由于酵母细胞膜上可以积累大量的三萜类化合物麦角固醇或合成途径的中间体. 近年来, 随着合成生物学的发展, 一些三萜皂苷和苷元已在微生物细胞工厂成功合成(表5). 在微生物细胞工厂中从头合成人参皂苷是当前研究的热点, 目前, 已在酿酒酵母(Saccharomyces cerevisiae)中成功合成了三种苷元(原人参二醇, protopanoxadiol, PPD; 原人参三醇, protopanaxatriol, PPT; 齐墩果酸, oleanolic acid, OA)、两种非天然人参皂苷(compound K, CK; 3β,12β-Di-O-Glc-PPD)和四种天然人参皂苷(Rh2, Rg3, RF1和Rh1). Han等人[129]将人参达玛烯二醇合成酶(PgDS)、人参CYP716A47和拟南芥CYP450还原酶1(AtCPR1)基因导入酿酒酵母中共表达, 首次在微生物中合成了人参皂苷苷元PPD. 随后, 该研究团队又在酵母工程菌中相继合成了PPT和OA[119,126], 但是这三种人参皂苷元在酵母中的产量均较低. 为了提高产量, Dai等人[180]通过提高关键基因的表达活性和进行相关编码基因密码子优化等措施, 使PPD产量增加了262倍; 在此基础上, 再通过双相发酵工艺优化, 最终使PPD产量提高到1.2 g/L. 研究还发现, 把OA, PPD和PPT的功能模块导入同一底盘细胞, 可同时生产这三种人参皂苷元, 这便是第一代基于多组分概念的“人参酵母”细胞工厂[181]. 另外, 相关研究团队还报道了细胞工厂生产三萜10 g/L级别的方案, 可以使酵母工程菌生产的达玛烯二醇产量高达15 g/L[188]. 中国科学院上海植物生理生态研究所与中国科学院上海药物研究所合作, 对人参皂苷CK, Rh2, Rg3, RF1和Rh1生物合成途径中的关键糖基转移酶和P450还原酶PgCPR1进行了详细研究, 通过酵母细胞工厂的构建和优化, 实现了利用单糖发酵生产这些稀有人参皂苷的工艺[21,149,150]. 此外, 科研工作者也开展了酿酒酵母生产甘草次酸(glycyrrhetinic acid, GA)[184]、柴胡皂苷元[100]和罗汉果苷V[6]等方面的研究. Wang等人[189]将密码子优化的CYP88D6和CYP72A154, 与β-AS和来自拟南芥的细胞色素P450还原酶(NADPH-cytochrome P450)基因引入酿酒酵母中, 成功合成了GA(14 μg/L); 进一步研究发现, 甘草细胞色素b5(GuCYB5)的引入, 可使GA产量提高8倍; 采用组合发酵策略, GA产量可提高近630倍, 达8.78 mg/L; 通过使用不同植物源的细胞色素P450还原酶和增加Uni25647的拷贝数, 可使GA产量增加到(18.9±2.0) mg/L[184]. 中国科学院天津工业生物技术研究所团队还报道了一个涵盖差异转录组分析、代谢物分析、候选基因在底盘细胞中的表征、化合物鉴定和植物组织培养的“即插即用”生物合成途径快速解析平台, 并通过该平台开发出了生产山楂酸(384 mg/L)和科罗索酸(141 mg/L)的酿酒酵母细胞 工厂[186,187].

Table 5  Heterologous synthesis of several important triterpenoids

三萜皂苷或中间体

产量

参考文献

原人参二醇(PPD)

1.2 g/L

[180]

原人参三醇(PPT)

15.9 mg/L

[181]

人参皂苷CK(ginsenoside CK)

1.4 mg/L

[21]

人参皂苷Rg3

1.3 mg/L

[147]

人参皂苷RF1

42.1 mg/L

[149]

人参皂苷Rh1

92.8 mg/L

[149]

人参皂苷Rh2

300 mg/L

[182]

3β,12β-Di-O-Glc-PPD

9.05 mg/L

[183]

甘草次酸(GA)

18.9 mg/L

[184]

齐墩果酸

606.9 mg/L

[185]

山楂酸

384 mg/L

[186,187]

科罗索酸

141 mg/L

[186,187]

虽然三萜皂苷在微生物细胞工厂中的合成已取得了一定的进展, 但仍面临着许多挑战, 例如, 大多数三萜皂苷的生物合成途径尚不清楚, 一些关键酶很难在微生物宿主中表达, 某些三萜皂苷对微生物细胞具有毒性, 工程细胞异源合成效率低, 人工智能等自动化技术使用程度较低等. 针对这些问题, 研究学者们也陆续提出了许多解决方案, 比如使用底物混杂酶[182], 将蛋白质工程[190]、形态学工程[191]等技术应用其中, 进行代谢流量动态调节和区域化设置[5,100]等. 随着生物学技术和人工智能技术的发展, 三萜皂苷的人工合成将迎来新的时代.

5 展望

三萜皂苷是植物中一类重要的次级代谢产物, 在植物和外界环境的相互作用中起着重要作用, 且具有多种应用价值, 与人类的生活和发展息息相关. 随着现代生物技术的发展, 三萜皂苷生物合成途径不断被解析, 关键酶基因、转录调控、生物工程方面的研究也取得了一定进展. 相关研究主要集中在三萜皂苷生物合成后修饰阶段关键酶(OSC, CYP450和UGT)基因的发掘, 并在微生物(酵母)和/或异源宿主(如模式植物: 烟草)中进行功能分析, 但其中大多数在植物体内的功能仍处于未知状态; 而且关键酶的具体催化过程、结构修饰和转录调控机制(转录因子、miRNA等)方面的研究依然较少, 人们对三萜皂苷生物合成途径的认识仍不够系统和全面; 再加上三萜皂苷种类繁多, 在植物中的生物合成途径冗长而复杂, 使得三萜皂苷生物合成途径全面解析、植物体内三萜皂苷代谢调控和采用合成生物学及体外培养等方法来生产三萜皂苷仍存在困难.

随着分子生物学、生物信息学、代谢组学、蛋白组学和合成生物学等学科的发展及其在各个领域的应用和渗透, 以大数据为驱动, 开展多层次的研究, 将加速三萜皂苷的基础研究和相关产业发展. 未来, 或可加强以下四方面研究.

(1) 利用多组学和大数据进行三萜皂苷生物合成途径功能基因的发掘和代谢调控网络的研究, 构建从基因到代谢的调控网络, 并将功能基因组学技术(如VIGS, RNAi和CRISPR/Cas9等)应用到非模式植物中, 探讨其生化功能, 明确三萜皂苷合成的调控机制, 进一步解析植物三萜皂苷的生物合成途径.

(2) 进行三萜皂苷在植物体内合成部位及其转运机制研究. 研究三萜皂苷合成部位, 并构建相关元件特异性表达的启动子, 使其只在合成部位表达, 实现三萜皂苷的定向合成; 或通过沉默竞争途径关键酶基因的表达, 来增强三萜皂苷的生物合成; 开展三萜皂苷相关转运蛋白及其转运机制的研究.

(3) 开展三萜皂苷合成生物学研究. 将基因工程技术和生物工程技术结合, 在微生物中构建三萜皂苷代谢途径, 通过微生物生产大量有价值的三萜皂苷. 可以通过提高前体物质的供给、增加相关酶基因的效率, 或抑制竞争代谢途径, 改善培养条件等来提高目标代谢物的生产. 同时, 加强人工智能等自动化技术在微生物细胞工厂方面的应用.

(4) 通过体外组织培养来生产三萜皂苷. 采用植物组织培养、细胞培养、体细胞胚胎发生和根培养等方法来生产三萜皂苷, 并将细胞工程技术、基因工程等技术应用其中, 获得高效合成三萜皂苷、遗传性质稳定、培养特性优良的基因工程植物细胞系, 以实现三萜皂苷的大规模生产.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值