Nøkkelforskjellen mellom likhet og identitet i sekvensjustering er at likhet er likheten (likheten) mellom to sekvenser i sammenligning, mens identitet er antallet tegn som samsvarer nøyaktig mellom to forskjellige sekvenser.
Bioinformatikk er et tverrfaglig vitenskapsfelt som hovedsakelig involverer molekylærbiologi og genetikk, informatikk, matematikk og statistikk. Sekvensjustering er et hovedbegrep innen bioinformatikk. Det er prosedyren der sekvensene til DNA, RNA eller protein er ordnet for å identifisere regioner med likhet som er en konsekvens av funksjonelle, strukturelle eller evolusjonære forhold mellom sekvensene. På slutten av justeringen vil de bli presentert som rader i en matrise. For å justere de identiske tegnene i påfølgende farger, er det innsatte mellomrom mellom restene.
Hva er likhet?
Likhet i sekvensjustering er likheten mellom to sekvenser når de sammenlignes. Dette faktum er avhengig av sekvensens identitet. Likhet viser i hvilken grad restene er på linje. Derfor inneholder lignende sekvenser lignende egenskaper. I bioinformatikk er likhet et verktøy for å vurdere likheten mellom to proteiner.
Figur 01: Likhet i sekvensjustering
Det er to hovedtrinn for sekvensjusteringsprosessen. Det første trinnet er parvis justering, som hjelper til med å finne den optimale justeringen mellom to sekvenser (inkludert gap) ved hjelp av algoritmer som BLAST, FastA og LALIGN. Samsvarsalgoritmen finner minimum antall redigeringsoperasjoner; in-dels og substitusjoner for å justere en sekvens til den andre sekvensen. Etter parvis justering er det nødvendig å oppnå to kvantitative parametere fra hver parvis sammenligning. De er identitet og likhet.
Hva er identitet?
Identitet i sekvensjustering er antallet tegn som samsvarer nøyaktig mellom to forskjellige sekvenser. Derfor teller ikke hull ved identitetsvurdering. Målingen anses å være relasjonell til den kortere sekvensen blant de to sekvensene. Det innebærer betydelig at det har effekten der sekvensidentiteten ikke er transitiv. Hvis X=Y og Y=Z, så er ikke X nødvendigvis lik Z. Dette utledes i form av identitetsavstandsmålet.
Figur 02: Identitet i sekvensjustering
For eksempel har X sekvensen AAGGCTT, Y har sekvensen AAGGC og Z har sekvensen AAGGCAT. Identiteten mellom X og Y er 100 % {5 identiske nukleotider/min[lengde(X), lengde(Y)]}. Identiteten mellom Y og Z er også 100 %. Men identiteten mellom X og Z er bare 85 % {(6 identiske nukleotider / 7)}.
Hva er likhetene mellom likhet og identitet i sekvensjustering?
- Både likhet og identitet er to termer vi bruker i sekvensjustering.
- De refererer også til likheten mellom de to sekvensene.
- Vi uttrykker dem dessuten som en prosentverdi.
Hva er forskjellen mellom likhet og identitet i sekvensjustering?
Slikhet i justering forteller likheten mellom to sekvenser når de sammenlignes, mens identitet i sekvensjustering forteller mengden tegn som samsvarer nøyaktig mellom to forskjellige sekvenser. Derfor er dette nøkkelforskjellen mellom likhet og identitet i sekvensjustering.
Summary – Similarity vs Identity in Sequence Alignment
Sekvensjustering hjelper til med å identifisere regioner med likhet i DNA, RNA eller protein som følge av funksjonelle, strukturelle eller evolusjonære forhold mellom sekvensene. Derfor er likhet og identitet to nøkkelbegreper i sammenheng med sekvensjustering. Den viktigste forskjellen mellom disse to begrepene er at likhet er likheten mellom to sekvenser i sammenligning, mens identitet er antall tegn som samsvarer nøyaktig mellom to forskjellige sekvenser. Dermed er dette sammendraget av forskjellen mellom likhet og identitet i sekvensjustering.