Difference Between Similarity and Identity in Sequence Alignment

Innholdsfortegnelse:

Difference Between Similarity and Identity in Sequence Alignment
Difference Between Similarity and Identity in Sequence Alignment

Video: Difference Between Similarity and Identity in Sequence Alignment

Video: Difference Between Similarity and Identity in Sequence Alignment
Video: Sequence similarity and identity 2024, November
Anonim

Nøkkelforskjellen mellom likhet og identitet i sekvensjustering er at likhet er likheten (likheten) mellom to sekvenser i sammenligning, mens identitet er antallet tegn som samsvarer nøyaktig mellom to forskjellige sekvenser.

Bioinformatikk er et tverrfaglig vitenskapsfelt som hovedsakelig involverer molekylærbiologi og genetikk, informatikk, matematikk og statistikk. Sekvensjustering er et hovedbegrep innen bioinformatikk. Det er prosedyren der sekvensene til DNA, RNA eller protein er ordnet for å identifisere regioner med likhet som er en konsekvens av funksjonelle, strukturelle eller evolusjonære forhold mellom sekvensene. På slutten av justeringen vil de bli presentert som rader i en matrise. For å justere de identiske tegnene i påfølgende farger, er det innsatte mellomrom mellom restene.

Hva er likhet?

Likhet i sekvensjustering er likheten mellom to sekvenser når de sammenlignes. Dette faktum er avhengig av sekvensens identitet. Likhet viser i hvilken grad restene er på linje. Derfor inneholder lignende sekvenser lignende egenskaper. I bioinformatikk er likhet et verktøy for å vurdere likheten mellom to proteiner.

Forskjellen mellom likhet og identitet i sekvensjustering
Forskjellen mellom likhet og identitet i sekvensjustering

Figur 01: Likhet i sekvensjustering

Det er to hovedtrinn for sekvensjusteringsprosessen. Det første trinnet er parvis justering, som hjelper til med å finne den optimale justeringen mellom to sekvenser (inkludert gap) ved hjelp av algoritmer som BLAST, FastA og LALIGN. Samsvarsalgoritmen finner minimum antall redigeringsoperasjoner; in-dels og substitusjoner for å justere en sekvens til den andre sekvensen. Etter parvis justering er det nødvendig å oppnå to kvantitative parametere fra hver parvis sammenligning. De er identitet og likhet.

Hva er identitet?

Identitet i sekvensjustering er antallet tegn som samsvarer nøyaktig mellom to forskjellige sekvenser. Derfor teller ikke hull ved identitetsvurdering. Målingen anses å være relasjonell til den kortere sekvensen blant de to sekvensene. Det innebærer betydelig at det har effekten der sekvensidentiteten ikke er transitiv. Hvis X=Y og Y=Z, så er ikke X nødvendigvis lik Z. Dette utledes i form av identitetsavstandsmålet.

Hovedforskjell - likhet vs identitet i sekvensjustering
Hovedforskjell - likhet vs identitet i sekvensjustering

Figur 02: Identitet i sekvensjustering

For eksempel har X sekvensen AAGGCTT, Y har sekvensen AAGGC og Z har sekvensen AAGGCAT. Identiteten mellom X og Y er 100 % {5 identiske nukleotider/min[lengde(X), lengde(Y)]}. Identiteten mellom Y og Z er også 100 %. Men identiteten mellom X og Z er bare 85 % {(6 identiske nukleotider / 7)}.

Hva er likhetene mellom likhet og identitet i sekvensjustering?

  • Både likhet og identitet er to termer vi bruker i sekvensjustering.
  • De refererer også til likheten mellom de to sekvensene.
  • Vi uttrykker dem dessuten som en prosentverdi.

Hva er forskjellen mellom likhet og identitet i sekvensjustering?

Slikhet i justering forteller likheten mellom to sekvenser når de sammenlignes, mens identitet i sekvensjustering forteller mengden tegn som samsvarer nøyaktig mellom to forskjellige sekvenser. Derfor er dette nøkkelforskjellen mellom likhet og identitet i sekvensjustering.

Forskjellen mellom likhet og identitet i sekvensjustering - tabellform
Forskjellen mellom likhet og identitet i sekvensjustering - tabellform

Summary – Similarity vs Identity in Sequence Alignment

Sekvensjustering hjelper til med å identifisere regioner med likhet i DNA, RNA eller protein som følge av funksjonelle, strukturelle eller evolusjonære forhold mellom sekvensene. Derfor er likhet og identitet to nøkkelbegreper i sammenheng med sekvensjustering. Den viktigste forskjellen mellom disse to begrepene er at likhet er likheten mellom to sekvenser i sammenligning, mens identitet er antall tegn som samsvarer nøyaktig mellom to forskjellige sekvenser. Dermed er dette sammendraget av forskjellen mellom likhet og identitet i sekvensjustering.

Anbefalt: