玉米籽粒发育基因Dek219的图位克隆和功能分析

籽粒发育与产量紧密相关,对籽粒发育关键基因的挖掘和分子机理解析是玉米高产分子育种的基础。本研究筛选到玉米自交系W22自然突变的一个籽粒缺陷突变体dek219(defective kernel219),Dolutegravir临床试验通过图位克隆和等位测验确定突变基因为Zm00001d027412,该基因编码DCL1(DICER-LIKE1)蛋白,是miRNA(micro RNA)生物发生过程中一种关键的酶。然后利用miRNA、转录组和ATAC测序(assay for transposase-accessible chromatin using sequencing)等手段明确Dek219通过调控miRNA的合成影响染色质可及性,进而调控关键基因的表达和玉米籽粒发育,是一种新的玉米籽粒发育调控机制。进一步通过基因表达分析、原生质体瞬时表达分析和EMSA(electrophoretic mobility shift assay)等实验手段确定miR167h-Hsf17(Heat shock transcription factor17)-LSM10(Sm-like protein 10)模块是影响组蛋白基因表达和染色质可及性的因素之一。通过候选基因关联分析鉴定到Dek219、Hsf17和LSM10的多个自然变异位点与籽粒相关性状和组蛋白基因表达量显著关联,并且挖掘到相关的优异自然等位基因。本研究进一步完善了玉米plant bacterial microbiome籽粒发育的分子调控机制,为玉米高产分子育种提供了重要理论支持和有应用价值的基因资源。主要研究结果如下:(1)突变体dek219成熟籽粒表现胚缺失、胚乳粉质和不能出苗的表型。dek219的粒长、粒宽、粒厚和百粒重均显著低于野生型WT(wild type)。石蜡切片观察发现dek219的胚未发育;此外,dek219的淀粉胚乳细胞比WT灌浆充实程度更差,且dek219胚乳基部转移层的壁内突比WT更稀疏。(2)通过图位克隆将候选区段定位到120 kb物理区域内,该区域包含6个注释基因。分别对这6个基因进行PCR(polymerase chain reaction)扩增和测序,发现其中一个基因Zm00001d027412的第12外显子插入了一个碱基T,导致发生移码突变,致使该基因编码序列提前终止,两个必不可少的RNase Ⅲ结构域和两个RNA结合结构域缺失。该基因编码DCL1蛋白,是miRNA生物发生过程中一种关键的酶。(3)通过等位测验确定候选突变基因,等位材料dek219-1的Zm00001d027412基因第6外显子的一个碱基T被替换为碱基A,导致编码序列提前终止,使得两个RNase Ⅲ结构域和三个RNA结合结构域缺失。dek219-1/+杂合植株自交所得果穗中缺陷籽粒的比例为25%,表型与dek219相似。dek219/+杂合植株和dek219-1/+杂合植株的等位测验所得籽粒表现出正常籽粒与缺陷籽粒的分离比为3:1,证实了Zm00001d027412是导致dek219籽粒缺陷的突变基因。(4)miRNA测序分析表明Dek219功能缺失导致miRNAs的表达水平显著下降。dek219和WT之间共鉴定到59个差异表达的miRNAs,其中57个miRNAs在dek219中表达量下调。进一步筛选后鉴定到35个可能在玉米籽粒发育中起重要作用的候选miRNAs。(5)转录组分析共鉴定到7,613个差异表达基因(DEGs,differentially expressed genes),在突变体dek219中,2,836个基因表达量上调,4,777个基因表达量下调。GO(Gene Ontology)富集分析表明,DEGs在核小体组装中富集最显著,而在突变体dek219中大部分组蛋白基因的表达量极显著下调,这可能会影响染色质可及性和基因表达,并可能是导致dek219籽粒发育缺陷的原因。此外,籽粒发育关键基因在突变体dek219和WT之间也存在显著的表达量差异。(6)ATAC分析表明,与WT相比,突变体dek寻找更多219具有更高的染色质可及性。通过对dek219和WT之间转录组分析得到的差异表达基因和ATAC分析鉴定的差异可及染色质区域(ACRs,accessible chromatin regions)进行联合分析,我们鉴定到119个受染色质可及性调控的玉米籽粒发育候选基因。其中包括已报道的籽粒发育关键基因,这些基因的启动子在突变体dek219和WT之间均存在差异ACRs。启动子中的差异ACRs对这些基因表达量进行调控,进而影响玉米籽粒发育。(7)通过miRNA-靶基因预测和表达量分析,将miR167h-Hsf17模块作为调控组蛋白基因表达的候选通路之一,原生质体瞬时表达分析表明Hsf17可能是miR167h的靶基因。通过系统发育分析和表达量分析,挖掘到LSM10基因可能在调控组蛋白基因表达量和玉米籽粒发育中起重要作用。原生质体瞬时表达分析和EMSA试验证明转录因子Hsf17通过与TTCTAG基序结合来抑制LSM10的表达。进一步的分析明确Hsf17通过抑制LSM10的表达负向调控组蛋白基因表达量。表明miR167h-Hsf17-LSM10模块是影响组蛋白基因表达和染色质可及性的因素之一。(8)候选基因关联分析表明Dek219、Hsf17、LSM10和组蛋白基因均存在多个自然变异位点与籽粒相关性状显著关联,表明这些基因参与到玉米籽粒发育的调控中。此外,Dek219、Hsf17和LSM10均存在多个自然变异位点与组蛋白基因表达量显著关联,表明它们均可能调控组蛋白基因的表达。同时挖掘到相关性状的优异自然等位基因和种质资源,对于后续的玉米高产分子育种实践具有重要意义。