Was ist die Definition einer Region mit geringer Komplexität für das Target Enrichment?

Wir verwenden derzeit ein proprietäres Modell, um vorherzusagen, ob eine Sonde mithilfe der Illumina-Sequenzierung schwer zu erkennen ist oder nicht. Die Eingaben in dieses Modell umfassen den GC-Gehalt, die globale Komplexität (gemessen als Anzahl unterschiedlicher k-Mere in einer Sondensequenz), die lokale Komplexität (gemessen als Anzahl unterschiedlicher k-Mere innerhalb eines begrenzten Bereichs einer Sequenz) und das Vorhandensein von Homopolymeren.

Im Allgemeinen ist es schwierig, Sonden mit einem GC-Gehalt von > 85 %, Homopolymeren mit einer Länge von mehr als 20 nt oder Tandem Repeats von Di- oder Trinukleotiden mit einer Länge von mehr als 30 nt zu sequenzieren.

War dieser Artikel hilfreich?

Nein

Sie haben noch Fragen? Kontakt

Powered by Translations.com GlobalLink OneLink Software
Powered by Translations.com GlobalLink OneLink Software