基于万寿菊转录组测序的SSR标记开发.pdf
<p>园艺学报, 2018, 45 (1): 159 167. Acta Horticulturae Sinica doi: 10.16420/j.issn.0513-353x.2017-0166; http: /www. ahs. ac. cn 159 收稿日期 : 2017 05 15; 修回日期 : 2017 12 11 基金项目 : 国家自然科学基金面上项目( 31572166) * 通信作者 Author for correspondence( E-mail: zghhzpx163.com) 基于万寿菊转录组测序的 SSR 标记开发 张华丽1,丛日晨1,王茂良1,董爱香1,辛海波1,*,义鸣放2,郭 华3,*(1北京市园林科学研究院,绿化植物育种北京市重点实验室,北京 100102;2中国农业大学观赏园艺与园林系,北京 100193;3河南省泌阳县森林病虫害防治检疫站,河南泌阳 463721) 摘 要: 万寿菊( Tagetes erecta L.)花蕾转录组测序共获得 48 953 条 Unigene,利用 MISA 软件检测出 20 666 个 SSR 位点,分布于 13 849 条 Unigene 中,出现频率为 28.29%,平均分布距离为 2.51 kb。优势重复基序为三核苷酸、四核苷酸,分别占总 SSR 位点的 50.16%和 20.94%。 ATG/ATG 和 AAAC/GTTT分别是三核苷酸、四核苷酸的优势重复基元,占总 SSR 重复类型的 13.82%和 3.66%。随机选取不同主导重复基元类型并合成 SSR 引物 36 对,以 20 份万寿菊自交系的基因组 DNA 为模板,对引物有效性和多态性进行了验证, 30 对引物可以扩增到清晰稳定的目标条带,有效扩增率为 80.56%;其中 13 对引物具有多态性,平均 He和 PIC 分别为 0.275 和 0.608。以上结果表明,万寿菊转录组测序产生的 Unigene 信息可作为开发 SSR 标记的有效来源,获得的大批量 SSR 标记可为万寿菊的遗传多样性分析和遗传图谱构建提供可靠的标记选择。 关键词: 万寿菊; SSR;转录组 中图分类号: S 682.1+1 文献标志码: A 文章编号: 0513-353X( 2018) 01-0159-09 Development of SSR Molecular Markers Based on Transcriptome Sequencing of Tagetes erecta ZHANG Huali1, CONG Richen1, WANG Maoliang1, Dong Aixiang1, XIN Haibo1,*, YI Mingfang2,and GUO Hua3,*(1Beijing Institute of Landscape Architecture, Beijing Key Laboratory of Greening Plants Breeding, Beijing 100102,China;2Department of Ornamental Horticulture and Landscape Architecture, China Agricultural University, Beijing 100193, China;3Biyang Forest Diseases and Insect Pests Quarantine Station in Henan Province, Biyang, Henan 463721,China) Abstract: A total of 48 953 Unigenes were obtained by transcriptome sequencing of flower buds of Tagetes erecata. MISA found 20 666 SSRs located in 13 849 unigenes with the frequency of 28.29% and a mean distance of 2.51 kb per one. Trinucleotide and tetranucleotide were major types with the percentages of 50.16% and 20.94%, respectively. ATG/ATG and AAAC/GTTT were most frequent motifs in trinucleotide and tetranucleotide repeats, accounting for 13.82% and 3.66%, respectively. Based on different dominant motifs types, 36 primers were chosen randomly and verified with 20 different inbred lines of Tagetes erecta. The results showed that 30 primers were effective with a valid rate of 80.56%, and 13 primers showed polymorphism with He and PIC mean values of 0.275 and 0.608, respectively. These Zhang Huali, Cong Richen, Wang Maoliang, Dong Aixiang, Xin Haibo, Yi Mingfang, Guo Hua. Development of SSR molecular markers based on transcriptome sequencing of Tagetes erecta. 160 Acta Horticulturae Sinica, 2018, 45 (1): 159 167. data indicated that the Unigenes generated from transcriptome sequencing can be used as an effective source to develop SSR markers, and the large quantities of SSR markers will provide reliable resources for analysis on genetic polymorphism and constructing genetic map in Tagetes erecta. Keywords: Tagetes erecta L.; SSR; transcriptome 简单重复序列( Simple sequence repeat, SSR)也叫微卫星( Microsatellites) ,广泛地存在于真核生物基因组。 SSR 标记数量丰富、遍布整个基因组、多态性高,具有扩增位点专一、呈共显性和多等位性的特点,且操作技术相对简便,并且 SSR 位点在属间和属内种间具有保守性( Thomas & Scott, 1992) 。 SSR 技术已经被广泛应用于植物的遗传图谱构建、品种鉴定、遗传多样性分析、亲缘关系研究等方面。 万寿菊( Tagetes erecta L.)为菊科万寿菊属植物,种内具有丰富的多样性,株高、头状花序的花形、花色等都有丰富的类型;万寿菊不仅可以用于园林绿化,还可以提取色素,吸收土壤中的重金属镉,提取杀虫剂等。截至目前,仅见菊花的 EST-SSR 标记在万寿菊上的可转移性研究(张华丽 等, 2016)。本研究中基于前期工作中对万寿菊花蕾转录组测序获得的数据,开发 SSR 标记,为万寿菊种质资源亲缘关系、遗传多样性、遗传图谱构建等研究奠定基础。 1 材料与方法 本试验于 2014 年 12 月至 2016 年 6 月在北京市园林科学研究院进行。 1.1 转录组数据来源 万寿菊转录组数据来源于北京市园林科学研究院万寿菊课题组 2014 年 12 月对万寿菊雄性不育系 S-121 花蕾进行 Illumina 高通量深度测序。测序取 3 个发育时期的花蕾: ( 1)现蕾前,取可见花蕾之前的茎分生组织; ( 2)花序发育期,取直径 1.5 mm 的花蕾; ( 3)花器官分化期,取直径 2 3 mm 的花蕾。委托广州市锐博生物科技有限公司进行 RNA-seq 转录组测序,并通过 De novo 方法组装得到 Unigene,作为背景数据。 1.2 植物材料及其 DNA 提取 植物材料为本课题组收集和选育的 20 个表型性状各异的万寿菊自交系(表 1) 。花色采用英国皇家园艺学会标准比色卡测定。 基因组 DNA 提取采用天根生物公司植物基因组提取试剂盒( DP320) ,具体步骤按说明书进行。 1.3 转录组 SSR 位点鉴别及 SSR 引物设计 采用 MISA 程序查找 SSR 位点,标准为:二核苷酸( Dinucleotide) 、三核苷酸( Trinucleotide) 、四核苷酸( Tetranucleotide) 、五核苷酸( Pentanucleotide)和六核苷酸( Hexanucleotide)的重复次数分别 7、 5、 4、 4 和 4。 采用 Primer Premier 5.0 设计引物,标准为:引物长度 18 24 bp, GC 含量 40% 60%,理论退火温度( Tm) 55.0 65.0 ,预计产物长度在 150 300 bp 之间。 张华丽,丛日晨,王茂良,董爱香,辛海波,义鸣放,郭 华 . 基于万寿菊转录组测序的 SSR 标记开发 . 园艺学报, 2018, 45 (1): 159 167. 161 表 1 万寿菊自交系信息 Table 1 Information of marigold( Tagetes erecta L.) inbred lines 编号 No. 来源 Locality 株高 / cm Height 冠幅 / cm Crown cover 花色( RHSCC) Flower color 花径 / cm Flower diameter 播种到开花天数 / d Days from sowing to flowering 1 赤峰 Chifeng 35 40 桔红 Tangerine( 23A) 6.0 100 2 赤峰 Chifeng 35 50 桔黄 Orange( 17A) 6.0 85 3 赤峰 Chifeng 35 35 黄 Yellow( 7A) 7.0 85 4 赤峰 Chifeng 35 35 黄 Yellow( 6A) 5.5 95 5 赤峰 Chifeng 30 35 黄 Yellow( 6A) 3.0 80 6 赤峰 Chifeng 45 45 黄 Yellow( 6A) 6.0 69 7 赤峰 Chifeng 36 38 黄 Yellow( 5A) 6.5 82 8 自育 Independent 35 40 黄 Yellow( 5A) 6.5 82 9 自育 Independent 38 46 金黄 golden( 9A) 6.5 82 10 自育 Independent 35 40 金黄 golden( 9A) 6.5 74 11 自育 Independent 40 45 金黄 golden( 9A) 7.0 82 12 自育 Independent 38 42 黄 Yellow( 5A) 7.0 82 13 自育 Independent 50 45 金黄 golden( 7A) 6.5 82 14 自育 Independent 28 36 桔黄 Orange( 17A) 2.0 74 15 越南 Vietnam 69 66 黄 Yellow( 5C) 6.0 116 16 越南 Vietnam 66 桔红 Tangerine( N25B) 6.0 116 17 赤峰 Chifeng 55 58 桔红 Tangerine( N25C) 8.0 87 18 赤峰 Chifeng 120 45 桔红 Tangerine( N25B) 8.0 92 19 赤峰 Chifeng 24 31 白色 White( 2D) 5.0 110 20 北京花仙子园艺公司 Beijing Huaxianzi Gardening Co. LTD 45 40 桔红 Tangerine( 21A) 7.0 95 1.4 EST-SSR 引物筛选及数据统计 随机选取 36 对 EST-SSR 引物,以 20 份万寿菊自交系材料为模板进行 PCR 扩增。 PCR 采用 10 L 反应体系,包括 4.1 L 双蒸灭菌 H2O, 5 L 2 × Taq PCR MasterMix(天根生化) , 20 mol L-1的上、下游引物各 0.2 L, DNA 模板 0.5 L。 PCR 反应采用 Biometra Gradient(德国) ,反应条件为: 94 预变性 5 min; 94 变性 30 s,合适的退火温度下退火 30 s, 72 延伸 45 s, 35 个循环;72 延伸 5 min。各引物对的最适退火温度通过梯度 PCR 试验确定。 用 8%非变性聚丙烯酰胺凝胶, 150 V 电压条件下电泳 55 min,对 PCR 产物进行电泳分析。电泳后参照 Bassam 等( 1991)的方法进行银染显色,用 Canon IXUS 相机拍照记录。 ( 1) SSR 出现频率 fc( %) = c/n × 100, c 为搜索到的 SSR 数量, n 为无冗余 EST 数量;( 2)SSR 平均分布距离 fN = N/c, N 为无冗余 EST 数量的总碱基数。采用 Popgene 软件计算各 SSR 位点平均等位基因数、预期杂合度和理论杂合度;多态信息含量 计算,其中, Pi为第 i 个基因出现的频率, n 为等位基因数。 2 结果与分析 2.1 转录组中 SSR 的分布及结构特点 通过对万寿菊转录组的 48 953 条 Unigene(序列总长约 51 818 161 kb)序列进行搜索,发现其中 20 666 条 Unigene 序列中含有 13 849 个 SSR 位点, 其中 4 299 条 Unigene 含有 1 个以上 EST-SSRZhang Huali, Cong Richen, Wang Maoliang, Dong Aixiang, Xin Haibo, Yi Mingfang, Guo Hua. Development of SSR molecular markers based on transcriptome sequencing of Tagetes erecta. 162 Acta Horticulturae Sinica, 2018, 45 (1): 159 167. 位点。 SSR 发生频率为 28.29%,平均每 2.51 kb 存在 1 个 SSR 位点。 万寿菊花蕾转录组序列中的 SSR 类型较丰富,二核苷酸至六核苷酸总共 45 个重复类型。其中三核苷酸和四核苷酸重复出现频率占优势,分别占总 SSR 的 50.16%和 20.94%;二核苷酸、五核苷酸和六核苷酸重复类型数量较少,分别占总数的 9.29%、 9.57%和 10.04%(表 2) 。所有 SSR 中,以4 次重复的 SSR 最多, 占 37.83%, 3 次重复的占 32.10%, 5 次和 6 次重复的分别占 12.06%和 10.27%(表 2) 。 万寿菊转录组 SSR 重复单元的重复次数分布在 3 27 次之间,其中 3 10 次重复的 SSR 位点有 20 593 个,占总个数的 99.65%; 11 20 次重复的有 72 个,占 0.35%; 20 次重复以上的有 1 个。 表 2 万寿菊 EST-SSR 基元及其重复数量的变异分析 Table 2 Analyses on repeat motif and its number variation in EST-SSR of Tagetes erecta L. 重复基元长度 Repeat motif length 重复次数 Repeat number 总数 In total 比例 / % Percentage 3 4 5 6 7 8 9 10 > 10 二核苷酸 Dinucleotide 855 501 272 148 81 64 1 921 9.29 三核苷酸 Trinucleotide 6 385 2 249 1 218 486 25 3 10 366 50.16 四核苷酸 Tetranucleotide 3 439 658 186 40 0 3 2 4 328 20.94 五核苷酸 Pentanucleotide 1 469 464 38 1 3 2 1 977 9.57 六核苷酸 Hexanucleotide 1 726 310 19 8 3 4 4 2 074 10.04 总数 In total 6 634 7 817 2 492 2 122 993 306 148 81 73 20 666 100.00 百分比 /% Percentage 32.10 37.83 12.06 10.27 4.80 1.48 0.72 0.39 0.35 2.2 转录组 SSR 基序重复类型和频率特征 由表 3 可知,二核苷酸、三核苷酸和四核苷酸的重复基序类型总计 14 694 个,占 SSR 位点总数的 71.10%,二核苷酸的重复次数集中在 6 次以上,三核苷酸重复次数集中在 4 7 次之间,重复 8 次较少;四核苷酸重复次数集中在 3 4 次之间,没有出现 7 次重复,重复 8 次极少。 从万寿菊转录组 SSR 核苷酸基序类型来看,其 20 666 个 SSR 位点包含 370 种重复基元,二核苷酸至六核苷酸,重复分别有 3、 10、 32、 86 和 239 种。 从分布频率来看(表 3),二核苷酸中出现最多 的重复基元是 AG/CT( 864 个,占 4.18%) ,占二核苷酸重复总数的 44.98%。 三核苷酸中 出现最多的重复基元是 ATC/ATG( 2 857 个,占 13.82%),占三核苷酸总数的27.56%,其次是 AAG/CTT( 1 960 个,占 9.48%)、 ACC/GGT( 1 926 个,占 9.32%)和 AAC/GTT( 1 486 个, 7.19%) ,这 4 种基元占三核苷酸重复总数的 79.39%,在三核苷酸重复基元中,出现频率最小的是 CCG/CGG( 89 个, 0.43%) (表 3)。 在四核苷酸重复基元中,以 AAAC/GTTT、 AAAG/CTTT、 AATC/ATTG 和 ACAT/ATGT 为主(表 3),分别占四核苷酸总数的 17.47%、 11.62%、 10.37%和 10.19%。 五核苷酸中以 AAAAC/GTTTT 和 AACAC/GTGTT 出现频率最高,分别占其总数的 8.19%和8.14%; 六核苷酸中出现频率最高的是 AAGATG/ATCTTC 和 AAACAC/GTGTTT,分别占其总数的7.18%和 4.15%。 张华丽,丛日晨,王茂良,董爱香,辛海波,义鸣放,郭 华 . 基于万寿菊转录组测序的 SSR 标记开发 . 园艺学报, 2018, 45 (1): 159 167. 163 表 3 万寿菊 EST-SSR 中二、三、四碱基重复基元的类型及频率 Table 3 Dinucleotide,trinucleotide and tetranucleotide EST-SSR repeat motifs and their frequency in ESTs of Tagetes erecta L. 重复基元类型 Repeat motif type 重复次数 Repeat number 总计 Total 频率 /% Frequency 3 4 5 6 7 8 > 8 AC/GT 318 198 91 42 697 3.37 AG/CT 343 215 130 90 864 4.18 AT/AT 194 88 51 176 360 1.74 AAC/GT 907 344 168 62 5 1 486 7.19 AAG/CTT 1 214 417 218 108 2 1 1 960 9.48 AAT/ATT 374 166 106 24 4 2 676 3.27 ACC/GGT 1 201 417 223 81 4 1 926 9.32 ACG/CGT 94 21 7 1 123 0.60 ACT/AG 66 29 20 4 119 0.58 AGC/CTG 514 181 100 30 5 830 4.02 AGG/CCT 214 49 28 7 2 300 1.45 ATC/ATG 1 735 608 343 168 3 2 857 13.82 CCG/CGG 66 17 5 1 89 0.43 AAAC/GTTT 620 99 28 9 756 3.66 AAAG/CTTT 392 79 27 4 1 503 2.43 AAAT/ATTT 292 35 7 4 338 1.64 AACC/GGTT 124 19 4 1 1 149 0.72 AACG/CGTT 22 1 23 0.11 AACT/AGTT 43 11 7 61 0.30 AAGC/CTTG 80 19 5 1 1 106 0.51 AAGG/CCTT 67 12 79 0.38 AAGT/ACTT 19 9 4 2 34 0.16 AATC/ATTG 350 75 18 6 449 2.17 AATG/ATTC 243 50 13 3 309 1.50 AATT/AATT 113 14 127 0.61 ACAG/CTGT 29 7 1 37 0.18 ACAT/ATGT 298 90 48 5 441 2.13 ACCC/GGGT 48 5 1 54 0.26 ACCG/CGGT 13 13 0.06 ACCT/AGGT 25 7 32 0.15 ACGC/CGTG 5 5 0.02 ACGT/ACGT 29 12 41 0.20 ACTC/AGTG 90 13 6 3 112 0.54 ACTG/AGTC 20 4 2 26 0.13 AGAT/ATCT 101 18 6 1 126 0.61 AGCC/CTGG 16 3 19 0.09 AGCG/CGCT 13 2 1 16 0.08 AGCT/AGCT 93 20 5 118 0.57 AGGC/CCTG 27 18 1 46 0.22 AGGG/CCCT 48 2 50 0.24 ATCC/ATGG 76 11 2 89 0.43 ATCG/ATCG 77 13 90 0.44 ATGC/ATGC 46 10 2 58 0.28 CCCG/CGGG 8 1 9 0.04 CCGG/CCGG 12 12 0.06 总计 Total 3 439 7 043 2 435 1 258 486 28 5 14 694 71.10 频率 /% Frequency 16.64 34.08 11.78 6.09 2.35 0.14 0.02 71.10 Zhang Huali, Cong Richen, Wang Maoliang, Dong Aixiang, Xin Haibo, Yi Mingfang, Guo Hua. Development of SSR molecular markers based on transcriptome sequencing of Tagetes erecta. 164 Acta Horticulturae Sinica, 2018, 45 (1): 159 167. 2.3 万寿菊转录组 SSR 引物的有效性和多态性检测 为了验证引物的有效性,随机挑选 36 对 EST-SSR 引物(包括二核苷酸、三核苷酸、四核苷酸、五核苷酸及六核苷酸重复基元的 SSR 位点,重复次数在 5 9 次),以 20 个性状不同的万寿菊自交系基因组 DNA 为模板进行了 PCR 扩增。结果表明,其中编号为 5、 12、 26、 28、 30 和 35 的 6 条引物为无效引物;其余 30 对引物均可以扩增到预期产物。 通过 30 对有效引物扩增产物的多态性分析表明, 13 对引物呈现出多态性(图 1,表 4) ,占有效引物的 43.33%。 图 1 多态性标记在 20 个万寿菊自交系材料中的扩增情况 Fig. 1 Amplification of polymorphic markers using 20 marigold varieties as templates 表 4 13 对万寿菊多态性 SSR 引物信息 Table 4 Information of 13 pairs of polymorphic primers developed from T. erecta L. 编号 No. 重复基元 Motifs 引物序列( 5 3) Primer sequence 退火温度 / Annealing temperature GC 含量 /% GC content 产物预期大小 /bp Expected size 2 ( TCTC)5F: CCATACACACATCAGCAGAC 52 50 203 R: GAGCAGGTGATTGTGTGTGT 52 50 3 ( AAT)6F: GGAGCATAGGGTATCTGCTT 52 50 177 R: CGAAGCCTCCTCTTCAGATA 52 50 4 ( TTGT)6F: CACAAGAATGCTATCGCCAC 52 50 157 R: ATTGGCTAAAGCACAGACCG 52 50 6 ( GTAGG)5F: TCCATGGGCATACAAGGTGT 52 50 231 R: ACGACCTGCGAAGCATATTC 52 50 7 ( CACACG)7F: ATGCTCTCGATGGTGCCTTT 52 50 213 R: GACCAACTAATAGCTCTGTG 50 45 8 ( TGA)5, ( CAT)5F: CATCATCACCATTGGTCCTG 52 50 234 R: CCGCCTTATCTCGGAATGTA 52 50 10 ( TCC)5, ( GCT)5, ( TA)7F: TGAAGATGGTGAGGAAGAAG R: CAATTGCTAGCTAGATCCAC 50 50 45 45 279 张华丽,丛日晨,王茂良,董爱香,辛海波,义鸣放,郭 华 . 基于万寿菊转录组测序的 SSR 标记开发 . 园艺学报, 2018, 45 (1): 159 167. 165 续表 4 编号 No. 重复基元 Motifs 引物序列( 5 3) Primer sequence 退火温度 / Annealing temperature GC 含量 /% GC content 产物预期大小 /bp Expected size 15 ( GA)8F: AAAGAACCAAGAGGGAGGCT 52 50 111 R: TCTAGTCCATACATCCCATC 50 45 18 ( CA)7: TCGTCGGTTGCTTGGATTTG 52 50 188 R: GAGTATGATTCAAAGCCACC 50 45 21 ( AT)6F: CACACGGTAACAATCCCTAG 52 50 201 R: GCTGAGGATTGTCTGATAAC 50 45 29 ( GTTTA)7F: TCATCCCATGATTTAGGCTC 50 45 242 R: CCAGAACCAGAAGAGAAGCA 52 50 33 ( GATGTA)6F: TGCTGGAACAGGTGAATCAC 52 50 242 R: CTTCTTCAAGCTCGCTTGCA 52 50 36 ( CCATCT)5F: GTAAGTGCACCATCACCATC 52 50 224 R: GAGTTTTGAGATGGAGGAGG 52 50 2.4 多态性标记位点多样性分析 使用 13 个多态性标记对 20 份万寿菊自交系遗传多样分析,扩增到 26 个等位基因;各 SSR 位点之间的有效等位基因数平均值为 1.477, 变化范围为 1.051( SSR7、 SSR8 和 SSR33) 1.980( SSR10) ;香农多样性指数平均值为 0.408,变化范围为 0.117 0.692;观察杂合度和期望杂合度的平均值分别为 0.342 和 0.275,变化范围分别为 0 0.900 和 0.05 0.512;各位点多态信息含量平均值为 0.608,变化范围为 0.524 0.772(表 5) 。 表 5 13 对多态性引物多样性分析 Table 5 Diversity of 13 pairs of polymorphic primers SSR 位点 SSR locus 有效等位基因数 Effective number of alleles 香农多样性指数 Shannons diversity index 观察杂合度 Observed heterozygosity 期望杂合度 Expected heterozygosity 多态信息含量 Polymorphism information content SSR2 1.995 0.692 0.850 0.512 0.569 SSR3 1.782 0.631 0.650 0.450 0.772 SSR4 1.923 0.673 0.800 0.492 0.580 SSR6 1.105 0.198 0.100 0.097 0.545 SSR7 1.051 0.117 0.050 0.050 0.524 SSR8 1.051 0.117 0.050 0.050 0.524 SSR10 1.980 0.688 0.900 0.508 0.697 SSR15 1.219 0.325 0.000 0.185 0.590 SSR18 1.956 0.682 0.850 0.501 0.564 SSR21 1.105 0.199 0.100 0.097 0.707 SSR29 1.105 0.198 0.000 0.097 0.569 SSR33 1.051 0.117 0.050 0.050 0.524 SSR36 1.882 0.662 0.050 0.481 0.734 平均值 Average 1.477 0.408 0.342 0.275 0.608 3 讨论 菊属植物 SSR 标记对万寿菊具有通用性(张华丽 等, 2016) ,但标记的数量和质量远不能满足研究需要。转录组测序成为 SSR 标记开发的重要途径( Dutta et al., 2011;王丽鸳 等, 2014; Zhai et al., 2014;李荣华 等, 2016;宗宇 等, 2016) ,但基于转录组测序的万寿菊 SSR 标记开发仍无相关报道。 已有报道,各类植物间 EST 的 SSR 分布频率大不相同,频率较低的种类包括:蝴蝶兰( 3.19%)Zhang Huali, Cong Richen, Wang Maoliang, Dong Aixiang, Xin Haibo, Yi Mingfang, Guo Hua. Development of SSR molecular markers based on transcriptome sequencing of Tagetes erecta. 166 Acta Horticulturae Sinica, 2018, 45 (1): 159 167. (张水明 等, 2012) 、百合( 5.98%) (杨素丽 等, 2008) 、砂梨( 7.2%) ( Yue et al., 2014) 、鹰嘴豆 ( 7.6%) ( Dutta et al., 2011) 和辣椒 ( 7.83%) (刘峰 等, 2012) ; 频率较高的种类有: 刺梨 ( 20.37%)(鄢秀芹 等, 2015) 、柑橘( 21.74%) ( Jiang et al., 2006)和萝卜( 23.79%) ( Wang et al., 2012) ;处于中等频率的有:红掌( 12.17%) (郁永明 等, 2015) 、蜡梅( 12.35%) (李响 等, 2013) 、茶树( 14.7%) ( Wu et al., 2013)和中国樱桃 ( 15.62%) (宗宇 等, 2016) 。本研究中利用万寿菊雄性不育系 S-121 花蕾转录组数据,对 48 953 条 Unigene(序列总长约 51 818 161 kb)序列进行分析,发现有 13 849 个 SSR 位点, SSR 位点频率为 28.29%,处于较高水平,这种差异可能源于两个原因: 1)与物种、 SSR 位点搜索标准以及序列大小等有关(刘峰 等; 2012;鄢秀芹 等, 2015) ; 2)转录组数据来源于特定时期和特定器官,缺乏对物种整个基因组序列特征的代表性。 在各重复类型的 SSR 位点中,三和四核苷酸重复出现频率占优势,分别占总 SSR 的 50.16%和20.94%; 二核苷</p>