靶向富集的低复杂度区域的定义是什么?

目前我们正在使用一种专有模型来预测通过 Illumina 测序是否难以检测到探针。该模型的输入要素包括 GC 含量、整体复杂性(以探针序列中包含的显性 kmer 的数量来衡量)、局部复杂性(以有限序列区域内显性 kmer 的数量来衡量)和均聚物的存在情况。

通常情况下,GC 含量大于 85%、均聚物长度超过 20 nt、或二核苷酸或三核苷酸串联重复序列长度超过 30 nt 的探针难以测序。

本文是否有帮助?

仍有疑问?联系我们

Powered by Translations.com GlobalLink OneLink Software