Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Bases de datos bioinformatica, Guías, Proyectos, Investigaciones de Bioinformática

Bases de datos para transformas formatos

Tipo: Guías, Proyectos, Investigaciones

2022/2023

Subido el 26/06/2023

paola-flores-xzd
paola-flores-xzd 🇲🇽

5 documentos

1 / 21

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Actividad
Conversión de formatos de secuencias con EMBOSS seqret
Introducción
Un formato de archivo es un estándar que define la forma en que la información se organiza y se
codifica en un archivo informático. El formato de secuencia biológica es un conjunto de formatos de
archivo distintos, con el objetivo de hacer que los archivos sean legibles para programas específicos.
Los formatos de secuencia son la disposición necesaria de caracteres, símbolos y palabras clave que
especifican la secuencia, el nombre del identificador, los comentarios, etc. Los formatos de secuencia
son necesarios para dos propósitos:
Diferentes programas reconocen diferentes tipos de formatos. Necesitamos convertir un
formato a otro para usar la secuencia de ese programa.
A veces se requieren presentaciones de la secuencia molecular en un formato determinado.
Formatos de secuencia de uso común:
Secuencia de nucleótido
Secuencia de proteína
FASTA
GCG
EMBL (versión abreviada)
GenBank (versión abreviada)
PIR / NBRF
PHYLIP
GFF3
FASTA
GCG
Genbank (versión abreviada)
PIR / NBRF
PHYLIP
UniProtKB/Swiss-Prot
abreviada)
GFF3
(versión
EMBOSS Seqret lee y escribe (devuelve) secuencias. Es útil para una variedad de tareas, que incluyen
extraer secuencias de bases de datos, mostrar secuencias, reformatear secuencias, producir el
complemento inverso de una secuencia, extraer fragmentos de una secuencia, conversión de casos
de secuencia o cualquier combinación de las funciones anteriores.
Objetivo
Convertir el formato de una determinada secuencia molecular a otros formatos de secuencia
como FASTA, EMBL, PIR, GenBank, etc.
Procedimiento
a) Entre a la página principal de EMBOSS Seqret
(https://www.ebi.ac.uk/Tools/sfc/emboss_seqret/)
b) El primer paso consiste en seleccionar el tipo de molécula (proteína, DNA o RNA),
posteriormente la secuencia en cualquier formato se pega en el cuadro de texto. También
puede adjuntar un archivo.
c) En el segundo paso se selecciona el formato de entrada y el formato de salida así como otras
opciones (vea la figura para más detalle).
d) En el tercer paso se somete la conversión.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15

Vista previa parcial del texto

¡Descarga Bases de datos bioinformatica y más Guías, Proyectos, Investigaciones en PDF de Bioinformática solo en Docsity!

Actividad

Conversión de formatos de secuencias con EMBOSS seqret

Introducción

Un formato de archivo es un estándar que define la forma en que la información se organiza y se

codifica en un archivo informático. El formato de secuencia biológica es un conjunto de formatos de

archivo distintos, con el objetivo de hacer que los archivos sean legibles para programas específicos.

Los formatos de secuencia son la disposición necesaria de caracteres, símbolos y palabras clave que

especifican la secuencia, el nombre del identificador, los comentarios, etc. Los formatos de secuencia

son necesarios para dos propósitos:

• Diferentes programas reconocen diferentes tipos de formatos. Necesitamos convertir un

formato a otro para usar la secuencia de ese programa.

• A veces se requieren presentaciones de la secuencia molecular en un formato determinado.

Formatos de secuencia de uso común:

Secuencia de nucleótido Secuencia de proteína

• FASTA

• GCG

• EMBL (versión abreviada)

• GenBank (versión abreviada)

• PIR / NBRF

• PHYLIP

• GFF

• FASTA

• GCG

• Genbank (versión abreviada)

• PIR / NBRF

• PHYLIP

• UniProtKB/Swiss-Prot

abreviada)

• GFF3 (versión

EMBOSS Seqret lee y escribe (devuelve) secuencias. Es útil para una variedad de tareas, que incluyen

extraer secuencias de bases de datos, mostrar secuencias, reformatear secuencias, producir el

complemento inverso de una secuencia, extraer fragmentos de una secuencia, conversión de casos

de secuencia o cualquier combinación de las funciones anteriores.

Objetivo

• Convertir el formato de una determinada secuencia molecular a otros formatos de secuencia

como FASTA, EMBL, PIR, GenBank, etc.

Procedimiento

a) Entre a la página principal de EMBOSS Seqret

(https://www.ebi.ac.uk/Tools/sfc/emboss_seqret/)

b) El primer paso consiste en seleccionar el tipo de molécula (proteína, DNA o RNA),

posteriormente la secuencia en cualquier formato se pega en el cuadro de texto. También

puede adjuntar un archivo.

c) En el segundo paso se selecciona el formato de entrada y el formato de salida así como otras

opciones (vea la figura para más detalle).

d) En el tercer paso se somete la conversión.

Rango de la

secuencia

Si desea que las

letras sean

mayúsculas o

minúsculas

Para obtener la

reversa

complementaria

de una

secuencia de

nucleótidos

Con la opción “yes” elegimos que solo se convierta la primera secuencia, en dado caso que se trabaje con varias. Si queremos que todas se conviertan elegimos “no” Si queremos o no que se muestren las características.

Selección del tipo

de molécula

Pegado de la(s) secuencia(s) de entrada

También se puede adjuntar un archivo

Se selecciona el formato de salida

3. En una empresa de desarrollo biotecnológico, usted se encuentra laborando en el área de

biotecnología dorada donde hoy en la mañana le solicitaron evaluar la conservación de los

dominios proteicos mediante un alineamiento múltiple de secuencias. Los resultados se

encuentran en formato FASTA, pero los requiere en formato CLUSTAL W para un mejor

análisis visual.

1LYLA F-----NDELRNRRE-KLAALRQQGVAFPNDFRRDHTSDQLHEEFDAK ------------------- D NQELESLNI------EVSVAG---------RMMTRRIM---GKASFVTLQDVGGRIQLYV ARDSLPEG-VYNDQFK---KWDLGDIIGARGTLFKTQ--------- TGELSIHCTELRLLTKALRPLPDQ EVRYRQ RY LDLIA NDKSR

  • QTFVVRSKILAA-IRQF-MVARGFMEVETPMMQVIPGGASA RPF ITH ------------HNALDLDMYLRIA --------------------------------------------------------------- PELYLKRLVVG GFE----------------RVFEINR-NFRNEGISVR ------------HNPEFTMMELYMAYAD Y-HDLIE LTESLFRT LAQEV LGTTKVTYGEHVFDF -----------------GKPFEKLTMREAIKKYRPETD---MADLDNF ---------- DAAKAL AES---------IGITVEKSWGLGRIVTEIFD---EVAEAHLI----------------- QPTFITEYPAE VSPLARRND VNPEITDRFEFF ---------IGG--REIGNGFSELNDAEDQAERFQEQVNAKAAGDDEAMFYDEDYVTALE YGLPPTA------GLGIGI-DRMIMLFTNSHTIRD ------------------------------------- VILF PAMRP

c|p2 S56383 9510 lysine--tRNA ligase (EC 6.1.1.6) genX - Escherichia co MP LSKTGDLTM SETAS WQPSAS IPNLLKRAAIMAE-IRRF-FADRGVLEVETPCMSQATVTDIH-----------LVPF--- ETRFV GP

  • GHSQGMNLWLMTS PEYHMKRLLVA GCG----------------PVFQLCR-SFRNEEMGRY ------------HNPEFTMLEWYRPHYD M-YRLMN EVDDLLQQ VLD -----------------CPAAESLSYQQAFLRYL-EID---PLSADK ------------ TQLREV AAKL DLSN VADTEEDRDTLLQLL
  • FTFGVEPNIGKE---KPTFVYHFPAS---------------------QASLAQIST--- EDHRVAERFEVY ---------YKG--IELANGFHELTDAREQQQRFEQDNRKRAARGLPQHPIDQNLIEALK VGMPDCS------GVALGV-DRLVMLALGAETLAE ------------------------------------- VIAF

LEHGMKVWPQ-------PVRLWMAGP-MFRAERPQKG ------------RYRQFHQVNYEALGSE NPILD AEAVVL LYECLKEL---GL----------------------RRLKVKLSSVG ------ DPEDRARYNA YLREV LSPHREALSEDSKERLEE NPMRILDSKSERDQALLKELGVRPMLD FLGE EARAHLKEVER HLE RLSVPYELEPALVRGLDYY --------------------------VRTAFEVHHEEIGAQSA--LGGGGRYDGLSE--L LGGP--R--VPGVGFAFGV-ERVALAL ------------------------ EAEGFGLPEEKGP-DLYLI PLTEE-----AVAEAFYLAEALRPR-L-RAEYALAPRKPAKGLEEALKRGAAFAGFL--- ------GEDELRAGEVTLKRLATGE-----QVRLSREEVPGYLLQALG------------

j|p2 G64424 9609 histidine--tRNA ligase (EC 6.1.1.21) - Methanococcus M IVMFQKPRGTRDFLP

  • EEMKKRRFVENK-LREV-FERYGYKEILTPTFESFELIAKKTGE---EIRKQLYVF--- KDH
  • GGR EMALR PEMTSPVVRFY LNE-LKNLQK-------PLRLYYFAN-CFRYERPQAG ------------RFREFWQMGCELIGCK EPLAD AEVLNL AMDGLINI---GLDFDVHIGHLGVLKGVLEKFNVSEEEEVKIRRLI ------ DKEDYDNLKI YLTQI LGEEKKELIFE ILKFKGSREVLDE LKEILKDFPKS MEAINNLEEILE FV IHDKYTINLGIARGLDYY TGMVFEIYGKKGAKQ ICGGGRYDNLIE T FGGEPT----PAVGFAYGF-DRIMMNIDDLDIEEE ------------------------------------SILII PVKKD-KE--LIKKSLIIADKLRKAGK-IVELEIMGRKLRKALDYANSRGFKKVIIV--- ------GEKELNEGKVTVKDMITGE-----QKLIGIDELTNF------------------

j|p2 L->M D64449 9609 threonine--tRNA ligase (EC 6.1.1.3) - Methanococcus L RDNMK MLLIHSDYLEFEAKEKTKIAEETENL ------KG-KLDECLACFIAVEREDENNPEGTAIGAVEEIEKVANQLKVNNIV-VYPYAH LSSDLSSPETAVKVLKDIESILKERGYNVLRAPFGWYKAFK-ISCKGHP-LSELSRKIVA KE--EKKEEGEESKFYLLNPE-TEEIIELNENNINIIKDEELLALA KHELGIREHK EH---------------------DEPPHVKFIKEKDICS----YEEASDPGHFRWYP---

  • KGKLMRDLLADY-VYNL-VVNMGAMPVETPIMYDLGNPAIR-EH-ADKFGERQYRF--- RQ GNK ELMLR
  • FAACFGQFMMK KDM-YLLPRYL------PLKLYELSTYSFRYEQRGEL ---- VGLKRLRCFTMPDMHTVCLN L-EQAME EFEKQFWE CLKTGDDL NL SYSVIFRFTKDF FDEH RDWFFKI AK EYKNKYGKDVILEI LPKR KHYWVGKVDIAVIDSLGRPIENPTVQ IDVESAKRFDIK VH TNEGEIYPIILHCSP TGS---------------I-ERVLCGLLEKAAIEA -------- EKGNAPMLPVWLSPIQVRVI PVAER-----HYDYALKVAEKLRENNI-RADFDDREESVSKKIRNAGKEWVPYVVVI--- ------GDEEMESDKLTVTIREKSTLKKPYKEKMTLDELIERIKKETANY-------PYR PLP--LPIRCSLQP-------------------------------- KFH

c|p1 G64930 8605 threonine--tRNA ligase (EC 6.1.1.3) - Escherichia coli MPVITLPDGSQRHYD HAVSPMDVALDIG

  • PGLA----------KACIAGRVNG----ELVDACDLIENDAQLSIITAKDEEGL----- -------------------EIIRHSCAHLLGHAIKQLWPHTKMA ------ IGPVIDNGFYYD VDLDRTLTQEDVEALEKRMHELAEKNYDVIKKKVSWHEARETFANRGESYKVSILDENIA HDDKPGLYFHEEYVDMCRGPH-V -------------- PNMRFCHHFKLMKTAGAYWRGDSNNKMLQ RIYGTAWADKKALNAYLQRLEEAAKRDHRKIGKQLDLYH----MQEEA-PGMVFWHN---
  • DGWTIFRELEVF-VRSK-LKEYQYQEVKGPFMMDRVLWEKT-GH-WDNYKDAMFTT--- SS
  • ENR EYCIK PMNCPGHVQIF NQG-LKSYRDL------PLRMAEFGS-CHRNEPSGSL ---- HGLMRVRGFTQDDAHIFCTE EQIRD EVNGCIRL VYDMYSTF GF EKIVVKLST RPEKRIGSDEMWDRAE ADLAVALEENNIPFEYQLGE GA F YGPK IEFTL --------------YDCLDRAWQCGTVQLDFSLP-SRLSASYVG-EDNERKVPVMIHRAI LGS---------------M-ERFIGIL---------T ---- EEF-AGFFPTWLAPVQVVIM NITDS-----QSEYVNELTQKLSNAGI-RVKADLRNEKIGFKIREHTLRRVPYMLVC--- ------GDKEVESGKVAVRTRRGKD-----LGSMDVNEVIEKLQQEIRSR------------ SLK QLEE

c|p1 B64744 9209 proline--tRNA ligase (EC 6.1.1.15) - Escherichia coli M RT SQYLLSTLKET ------------------------PADAEVISHQLMLRAGM--IRKLA-SGLYTWLP---

  • TGVRVLKKVENI-VREE-MNNAGAIEVSMPVVQPADLWQES-GR-WEQYGPELLRF--- VDR
  • GER PFVLG PTHEEVITDLI RNE-LSSYKQL------PLNFYQIQT-KFRDEVRPRF ------ GVMRSREFLMKDAYSFHTS Q-ESLQE TYDAMYAA YSKIFSRM---GLDFRAVQADTGSIGG------- SASHEFQVLAQSGE--DDVVFSDTSD YAANIELAE------AIAPKEPRAAATQEMTLVD ----------------------------------------------------------------------------------------------- TPNAKTI AELV EQFNLPIEKTVKTLLVKAV EGSS -----------------------FPQVALLVRGDHELNEVKAEKLPQVASPLTFATEEEI RAVVKAGPGSLGPVNMPIPVVIDRTVAAMSDFAAGANIDGKHYFGINWDRDVATPEVADI RNVVAGDPSPDGQGRLLIKRGIEVGHIFQLGTKYSEALKASVQG-EDGRNQI ---------- LT MG-----------CYGIGV-TRVVAAAIEQNYDER ----------------GIVWPDAIAPFQVAIL PMNMH-KSFRVQELAEKLYSELRAQGI-EVLLDDRKERPGVMFADMELIGIPHTIVL--- ------GDRNLDNDDIEYKYRRNGE-----KQLIKTGDIVEYLVKQIKG-----------

j|p2 L->M E64454 9609 proline--tRNA ligase (EC 6.1.1.15) - Methanococcus L -----------EFSEW-----------YSDILEKAEIYD----VRYPI-KGCGVYLP---

  • YGFKIRRYTFEI-IRNL-LDESGHDEALFPMLIPEDLLAKEAEH-IKGFEDEVYWV--- TH
  • GGKTQLDVKLALR PTSETPIYYMM KLW-VKVHTDL------PIKIYQIVN-TFRYETKHTR ------ PLIRLREIMTFKEAHTAHS TKEEAEN QVKEAISI YKKFFDTL GI PYLISKRPE WDK FPGA EYTMAFDTI --------FPDG-------RTMQIATVHNLGQNFSKTFEIIFET-PTGDKDYAY------ -------------QTCYGISDRVIASIIAIHGDEK ----------------GLILPPIVAPIQVVIV PLIFKGKEDIVMEKAKEIYEKLKGKF--RVHIDDRDIRPGRKFNDWEIKGVPLRIEV--- ------GPKDIENKKITLFRRDTME -------- KFQVDETQLMEVVEKTLNNIMENIKNRAWE KFENFITILEDINPDEIKNILSEKRGVILVPFKEEIYNEELEEKVEATILGETEYKGNKY IAIAKTY

1ATIA AASSLDELVALCKRRGF IFQSSEIYGGL--------QGVYDYGP---

  • LGVELKNNLKQAWWRRNVYERDDMEGLDASVLTHRLVLHYS-GH-EATFADPMVD---- NWTPP RYFNMMFQDLRGP RGGRGL LAYLR PETAQGIFVNF KNVLDATSRKL------GFGIAQIGK- AFRNEITPRN FIFRVREFEQMEIEYFVRP GEDEYWH RYWVEE RLKWWQEM---GL----------------------SRENLVPYQQP -------- PESSAHYAK ATVDI-LYRFPHGSLELEGIAQRTDFDLGSHTK------------DQ------------------------EALGITARVLRNEHSTQRLAYR-------------- DPET GKWFVPYVIE ----P ----------------- SAGV-DRGVLALLAEAFTREELPNGEERIVLKLKPQLAPIKVAVI PLVKNRPE--ITEYAKRLKARLLALGLGRVLYEDTG-NIGKAYRRHDEVGTPFAVTVDYD TIGQSKDGTTRLKDTVTVRDRDTME-----QIRLHVDELEGFLRERLRW-----------

j|p2 E64328 9609 glycine--tRNA ligase (EC 6.1.1.14) - Methanococcus jan M EKDIYEKIMDLAKRRGY LWSSFEIYGGI AGFVDYGP

  • LGCLLKNNIISK-FREQYIIKEGFYEIESPTVTPYEVLKAS-GH-VDNFTDPIVECKNC LESFRADHLIEEFVDVDTEGKTLKELDELIRKHNIRCPKCGGELGEVKKFNLMFVTSIGP GGKR TGYMR PETAQGIFIQF RRLAQFFRNKL------PFGVVQIGK- SYRNEISPRQ GVIRLREFTQAEIEYFVHP ERKEHEKFDLVKDEVVPLLPAERQMDENLSDDEKVIKISIGEAVEKGIIRHQTIAYFIAL TKRFLEAI---GI----------------------DKDKIRFRQHL -------- PNEMAHYAI

TKEGLTLK ----------------------- LSEKGKKAEKRAIDI--ALE-VLSKGEV-SVEEIEKIIS VKELKRRKIAEEEEKVIRNVEITDKGLELVEKGIELKREVSILTPE-------------- LIVTGKWREVEF KPFNIKA PVKKIYPG --KKQPYRVFLDK-IRRR-LIEMGFIEMTVDSLIET ---------------------------- QFWNFDAL FQ PQNH

  • PAREWTD-TYQLKYPEKGYLPDENLVSKVKEAHERGLAGSRGWGYVWSPERAMLLMPRA HAT-ALSARELAKGIEIPGKYFTIQR-VFRPDVLDRT ------------HLIEFNQIDGFVASED L TFRHLLGI LKRFAIEI AGAKKVKFFPDY YPFT EPSVQLSAY HPEL GWVEFGGAGIFREEMTEALGIK VPVIAWGIGI-DRLAMFKLGVDDIRY LFSYDLKWLRESKLIW FORMATO CLUSTAL W CLUSTAL W (1.83) multiple sequence alignment

1LYLA F-----NDELRNRRE-KLAALRQQGVAFPNDFRRDHTSDQLHEEFDAK ---------- D

EMBOSS_001 MP

1B8AA M YRTHYS SEITEELNG

1ASZB E------DTAKDNYG-KLPLIQSRDSDRTG--QKRVKFVDLDEAKDSD------------

EMBOSS_002 M RTEYCGQL

1ADJA

EMBOSS_003 M

EMBOSS_004 L RDNMK

EMBOSS_005 MPVITLPDGSQRHYD--------------------HAVSPMDVALDIG------------

EMBOSS_006 M RT

EMBOSS_007 L

1ATIA

EMBOSS_008 M

1SESA M VD-LKRLRQEPE

EMBOSS_009 M LD-PNLLRNEPD

1PYSA R

EMBOSS_010 M---------RLGYNEKLVLLKLAEL KNATVEELIEKTNLDQVAVMRALLTLQ

1LYLA NQELESLNI------EVSVAG---------RMMTRRIM -- GKASFVTLQDVGGRIQLYV

EMBOSS_

1B8AA --------Q------KVKVAG---------WVWEVKDL -- GGIKFLWIRDRDGIVQITA

1ASZB --------K------EVLFRA---------RVHNTRQQG--ATLAFLTLRQQASLIQGLV

EMBOSS_002 --RLSHVGQ------QVTLCG---------WVNRRRDL -- GSLIFIDMRDREGIVQVFF

1ADJA

EMBOSS_

EMBOSS_004 -----------------------------MLLIHSDYLEFEAKEKTKIAEETENL-----

EMBOSS_005 - PGLA----------KACIAGRVNG----ELVDACDLIENDAQLSIITAKDEEGL-----

EMBOSS_

EMBOSS_

1ATIA

EMBOSS_

SQYLLSTLKET

1SESA -----VFHR------AIREKGVAL------DLEALLALDREVQELKKRLQEV--------

EMBOSS_009 -----AVAE------KLARRGFKL------DVDKLGALEERRKVLQVKTENL--------

1PYSA

EMBOSS_010 SQGLAKVHEERRRMIKLTETGKRYIEIGLPEIRALKILKEKGKVTLNDLKDV--------

1LYLA ARDSLPEG-VYNDQFK---KWDLGDIIGARGTLFKTQ-----------------------

EMBOSS_

1B8AA PKKK-----VDPELFKLIPKLRSEDVVAVEGVVNFTP --------------------- K

1ASZB KANK--EGTISKNMVKWAGSLNLESIVLVRGIVKKVDEPIKS ---------------- A

EMBOSS_002 DPDR-------ADALKLASELRNEFCIQVTGTVRARDEKNINRD -------------- M

1ADJA

EMBOSS_

EMBOSS_004 ----------- KG-KLDECLACFIAVEREDENNPEGTAIGAVEEIEKVANQLKVNNIV-VYPYAH

EMBOSS_005 -------------------EIIRHSCAHLLGHAIKQLWPHTKMA --- IGPVIDNGFYYD

EMBOSS_

EMBOSS_

1ATIA

EMBOSS_

1SESA -------------------QTERNQVAKRV--PKAPPEEKEAL ---------- IARGKA

EMBOSS_009 -------------------QAERNSRSKSIGQAKARGEDIEPL ---------- RLEVNK

1PYSA

EMBOSS_010 --------------------LSDEELKAIVGVLRKEG ---------------- WAEVSK

1LYLA TGELSIHCTELRLLTKALRPLPDQ------------------------------------

EMBOSS_

1B8AA AKLGFEILPEKIVVLNRAETPLPLD-----------------------------------

1ASZB TVQNLEIHITKIYTISETPEALPIL--------------LE-------------------

EMBOSS_002 ATGEIEVLASSLTIINRA-DVLPLD-----------------------------------

1ADJA

EMBOSS_

EMBOSS_004 LSSDLSSPETAVKVLKDIESILKERGYNVLRAPFGWYKAFK-ISCKGHP-LSELSRKIVA

EMBOSS_005 VDLDRTLTQEDVEALEKRMHELAEKNYDVIKKKVSWHEARETFANRGESYKVSILDENIA

EMBOSS_

EMBOSS_

1ASZB

EMBOSS_

1ADJA

EMBOSS_

EMBOSS_

EMBOSS_

EMBOSS_

EMBOSS_

1ATIA

TYF

RVH

QDR

KDH

RQ

SS

VDR

TH

NWTPP RYFNMMFQDLRGPRGG

EMBOSS_008 LESFRADHLIEEFVDVDTEGKTLKELDELIRKHNIRCPKCGGELGEVKKFNLMFVTSIGP

1SESA

EMBOSS_009 RPL

1PYSA - PEHH PA

EMBOSS_010 FQ PQNH

1LYLA LDLDMYLRIA ---------------------------------- PELYLKRLVVGGFE-

EMBOSS_001 - GHSQGMNLWLMTS ---------------------------------- PEYHMKRLLVA

1B8AA - EEDAF LAES PQLYKEIMMAS

1ASZB - KGKAY LAQS PQFNKQQLIVA

EMBOSS_002 - KGKFY ALPQS PQLFKQLLMMS

1ADJA - GGR SLTLR PEGTAAMVRAY

EMBOSS_003 - GGR EMALR PEMTSPVVRFY

EMBOSS_004 GNK ELMLR FAACFGQFMMKK

EMBOSS_005 - ENR EYCIK PMNCPGHVQIF

EMBOSS_006 - GER PFVLG PTHEEVITDLI

EMBOSS_007 - GGKTQLDVKLALR ---------------------------------- PTSETPIYYMM

1ATIA RGL---LAYLR ---------------------------------- PETAQGIFVNFKNV

EMBOSS_008 GGKR TGYMR PETAQGIFIQF

1SESA - AET DLYLT GTAEVVLNALH

EMBOSS_009 - EEEADTS-NYALI ---------------------------------- PTAEVPLTNLV

1PYSA RDMWD-TFWLT--GEGFRLEGPLG --------------------- EEVEGRLLLRTHTS

EMBOSS_010 - PAREWTD-TYQLKYPEKGYLPDENLVSKVKEAHERGLAGSRGWGYVWSPERAMLLMPRA

1LYLA ---------------RVFEINR-NFRNEGISVR ------ HNPEFTMMELYMAYADY-HD

EMBOSS_001 GCG----------------PVFQLCR-SFRNEEMGRY ------ HNPEFTMLEWYRPHYD

1B8AA GLD----------------RVYEIAP-IFRAEEHNTTR ----- HLNEAWSIDSEMAFIE

1ASZB DFE----------------RVYEIGP-VFRAENSNTHR ----- HMTEFTGLDMEMAFEE

EMBOSS_002 GFD----------------RYYQIVK-CFRDEDLRAD ------ RQPEFTQIDVETSFMT

1ADJA LEHGMKVWPQ-------PVRLWMAGP-MFRAERPQKG ------ RYRQFHQVNYEALGSE

EMBOSS_003 LNE-LKNLQK-------PLRLYYFAN-CFRYERPQAG ------ RFREFWQMGCELIGCK

EMBOSS_004 DM-YLLPRYL------PLKLYELSTYSFRYEQRGEL -- VGLKRLRCFTMPDMHTVCLNL

EMBOSS_005 NQG-LKSYRDL------PLRMAEFGS-CHRNEPSGSL -- HGLMRVRGFTQDDAHIFCTE

EMBOSS_006 RNE-LSSYKQL------PLNFYQIQT-KFRDEVRPRF --- GVMRSREFLMKDAYSFHTS

EMBOSS_007 KLW-VKVHTDL------PIKIYQIVN-TFRYETKHTR --- PLIRLREIMTFKEAHTAHS

1ATIA LDATSRKL------GFGIAQIGK-AFRNEITPRN --- FIFRVREFEQMEIEYFVRPGED

EMBOSS_008 RRLAQFFRNKL------PFGVVQIGK-SYRNEISPRQ --- GVIRLREFTQAEIEYFVHP

1SESA SGE-ILPYEAL ----- PLRYAGYAP-AFRSEAGSFGKDVRGLMRVHQFHKVEQYVLTEA

EMBOSS_009 RGE-IIDEDDL ----- PIKMTAHTP-CFRSEAGSYGRDTRGLIRMHQFDKVEMVQIVRP

1PYSA - PMQVRYMVAHTP-PFRIVVPGR-VFRFEQTDAT-------HEAVFHQLEGLVVGEGI--

EMBOSS_010 HAT-ALSARELAKGIEIPGKYFTIQR-VFRPDVLDRT ------ HLIEFNQIDGFVASED

1LYLA LIE LTESLFRTLAQE

EMBOSS_001 M-YRLMN EVDDLLQQ

1B8AA DEEEVMS FLERLVAH

1ASZB HYHEVLD TLSELFVF

EMBOSS_002 A-PQVRE VMEALVRH

1ADJA

EMBOSS_

NPILD AEAVVL

EPLAD AEVLNL

EMBOSS_004 - EQAME EFEKQFWEC

EMBOSS_005 EQIRD EVNGCIRL

EMBOSS_006 Q-ESLQE TYDAMYAA

EMBOSS_007 TKEEAEN QVKEAISI

1ATIA EYWH RYWVEERLK

EMBOSS_008 ERKEHEKFDLVKDEVVPLLPAERQMDENLSDDEKVIKISIGEAVEKGIIRHQTIAYFIAL

1SESA SLEASDR AFQELLEN

EMBOSS_

1PYSA

EDSMA ALEEMTGH

AMAHLKGAIYE

EMBOSS_010 L TFRHLLGI

1LYLA V LGTTKVTYGEHVFDF

EMBOSS_001 VLD 1B8AA

AINYVREHNAKELDIL--------------NF---ELEEPKLPF----------------

1ASZB IFSELPKRFAHEIELV------------RKQY---PVEEFKLPKD---------------

EMBOSS_002 LWLEVKGVDLGDFPVM--------------TF -- AEAERRYGSDKPDLRNPMELTDVAD

1ADJA LYECLKEL---GL----------------------RRLKVKLSSVG --- DPEDRARYNA

EMBOSS_003 AMDGLINI---GLDFDVHIGHLGVLKGVLEKFNVSEEEEVKIRRLI --- DKEDYDNLKI

EMBOSS_004 LKTGDDL NL SYSVIFRFTKDF

EMBOSS_005 VYDMYSTF GF EKIVVKLST

EMBOSS_006 YSKIFSRM---GLDFRAVQADTGSIGG-------SASHEFQVLAQSGE--DDVVFSDTSD

EMBOSS_007 YKKFFDTL GI PYLISKRPE

1ATIA WWQEM---GL----------------------SRENLVPYQQP ---- PESSAHYAKATV

EMBOSS_008 TKRFLEAI---GI----------------------DKDKIRFRQHL ---- PNEMAHYAI

1SESA AEEILRLL---EL----------------------PYRLVEVAT ------- GDMGPGKW

EMBOSS_009 AEKVLQLL---GL----------------------PYRKIILCT ------- GDMGFGAC

1PYSA LAQAL F GPDSKVRFQPVY

EMBOSS_010 LKRFAIEI AGAKKVKFFPDY

1LYLA -------------GKPFEKLTMREAIKKYRPETD---MADLDNF ----- DAAKALAES-

EMBOSS_001 -----------------CPAAESLSYQQAFLRYL-EID---PLSADK ------ TQLREV

1B8AA PRVSYDKALEILG DLGKEI

1ASZB ------------------GKMVRLTYKEGIEMLR ------------------- AAGKEI

EMBOSS_002 LLKSVEFAVFAGPANDPKGRVAALRVPGGASLTR ------- KQIDEYGNFVKIYGAKGL

1ADJA YLREV-----------LSPHREALSEDSKERLEE--------------------------

EMBOSS_003 YLTQI LGEEKKELIFE

EMBOSS_

EMBOSS_

FDEH RDWFFKIA

RPEKRIGSDEMWDRAE

EMBOSS_006 YAANIELAE------AIAPKEPRAAATQEMTLVD ------------------ TPNAKTI

EMBOSS_007 WDK

1ATIA DI-LYRFPHGSLELEGIAQRTDFDLGSHTK------------DQ----------------

EMBOSS_008 DCWDAEIYTERFGWIECVGIADRTDYDLRSHSAHSGVELSVFVELDE-------------

1SESA RQVDIEVY

EMBOSS_009 KTYDLEVW

1PYSA

EMBOSS_

1LYLA --------IGITVEKSWGLGRIVTEIFD---EVAEAHLI---------------------

EMBOSS_001 AAKL--DLSN--VADTEEDRDTLLQLL---------------------------------

1B8AA PWG---------EDIDTEGERLLGKYMMEN-----ENAP---------------------

1ASZB GDF---------EDLSTENEKFLGKLVRDK-----YDTD---------------------

EMBOSS_002 AYIKVNERAKGLEGINSPVAKFLNAEIIEDILDRTAAQDGDMIFFGADNKKIVADAMGAL

1ADJA ------NPMRILDSKSERDQALLKELGVRPMLD---------------------------

EMBOSS_003 ILKFKGSREVLDE

EMBOSS_004 K EYKNKYGKDVILEI

EMBOSS_005 -----ADLAVALEENNIPFEYQLGE-----------GA----------------------

EMBOSS_006 AELV--------EQFNLPIEKTVKTLLVKAV----EGSS---------------------

EMBOSS_

1ATIA --------EALGITARVLRNEHSTQRLAYR------------------------------

EMBOSS_008 ------------EREIETYEINLNYKVVGKIFKK--------------------------

1SESA

EMBOSS_

1PYSA

EMBOSS_

1LYLA QPTFITEYPAE VSPLARRND

EMBOSS_001 - FTFGVEPNIGKE---KPTFVYHFPAS---------------------QASLAQIST---

1B8AA

1ASZB

LYFLYQYPSE AKPFYIMKYD

FYILDKFPLE IRPFYTMPDP

EMBOSS_002 RLKVGKDLGLTDESKWAPLWVIDFPMF----EDDGEGG ----- LTAMHHPFTSPKDM--

1ADJA FLGE EARAHLKEVER

1LYLA P

EMBOSS_001 SVDRA

1B8AA PRDRR

1ASZB DPK

EMBOSS_002 PKTTAAAC LMTEAPSFA

1ADJA PLTEE-----AVAEAFYLAEALRPR-L-RAEYALAPRKPAKGLEEALKRGAAFAGFL---

EMBOSS_003 PVKKD-KE--LIKKSLIIADKLRKAGK-IVELEIMGRKLRKALDYANSRGFKKVIIV---

EMBOSS_004 AER-----HYDYALKVAEKLRENNI-RADFDDREESVSKKIRNAGKEWVPYVVVI-----

EMBOSS_005 NITDS-----QSEYVNELTQKLSNAGI-RVKADLRNEKIGFKIREHTLRRVPYMLVC---

EMBOSS_006 PMNMH-KSFRVQELAEKLYSELRAQGI-EVLLDDRKERPGVMFADMELIGIPHTIVL---

EMBOSS_007 PLIFKGKEDIVMEKAKEIYEKLKGKF--RVHIDDRDIRPGRKFNDWEIKGVPLRIEV---

1ATIA NRPE--ITEYAKRLKARLLALGLGRVLYEDTG-NIGKAYRRHDEVGTPFAVTVDYDTIGQ

EMBOSS_008 PLVNK-DD--MPKIAKEIEQMLRENGI-IAEYDDSG-AIGRRYMRADEIGVPFCITV---

1SESA

EMBOSS_

1PYSA

EMBOSS_

YM-

YMN

F

1LYLA

EMBOSS_

1B8AA

1ASZB

EMBOSS_002 NPTALAELSIQVVKKAENN

1ADJA ------GEDELRAGEVTLKRLATGE-----QVRLSREEVPGYLLQALG------------

EMBOSS_003 ------GEKELNEGKVTVKDMITGE-----QKLIGIDELTNF------------------

EMBOSS_004 ----GDEEMESDKLTVTIREKSTLKKPYKEKMTLDELIERIKKETANY ------ PYRPL

EMBOSS_005 ------GDKEVESGKVAVRTRRGKD-----LGSMDVNEVIEKLQQEIRSR ------ SLK

EMBOSS_006 ------GDRNLDNDDIEYKYRRNGE-----KQLIKTGDIVEYLVKQIKG-----------

EMBOSS_007 ------GPKDIENKKITLFRRDTME ---- KFQVDETQLMEVVEKTLNNIMENIKNRAWE

1ATIA SKDGTTRLKDTVTVRDRDTME-----QIRLHVDELEGFLRERLRW---------------

EMBOSS_008 ------DGQTLEDRTVTVRERNTRE-----QVRVKIDELVDYLKERLKE-----------

1SESA

EMBOSS_

GKEVLE

GLEYIG

1PYSA FGGRLKFLEQFKGVL

EMBOSS_010 LFSYDLKWLRESKLIW

1LYLA

EMBOSS_

1B8AA

1ASZB

EMBOSS_

1ADJA

EMBOSS_

RLTP

RLRP

EMBOSS_004 P LPIRCSLQP

EMBOSS_005 QLEE

EMBOSS_

EMBOSS_007 KFENFITILEDINPDEIKNILSEKRGVILVPFKEEIYNEELEEKVEATILGETEYKGNKY

1ATIA

EMBOSS_

1SESA

EMBOSS_

1PYSA

EMBOSS_

P CG

1LYLA -------

EMBOSS_001 -------

1B8AA -------

1ASZB -------

EMBOSS_002 -------

1ADJA -------

EMBOSS_003 -------

EMBOSS_004 --KFH--

EMBOSS_005 -------

PatitoFeliz CAGACGGAAAAGCTGGAGCGCAGGCGCAAGCCCCACCTGGACCGCAGAGGCGCCATCATC

CGGGGCATCCCCGGCTTCTGGGCCAATGCCATTGCGAACC

EMBOSS_006 -------

EMBOSS_007 IAIAKTY

1ATIA -------

EMBOSS_008 -------

1SESA -------

EMBOSS_009 -------

1PYSA -------

EMBOSS_010 -------

4. Responda las siguientes preguntas:

  • ¿Cuál es el formato de la secuencia?

a) FASTA

b) CLUSTAL W

c) PHYLIP

d) PIR

¿Cuál es el formato de la secuencia?

a) FASTA

b) CLUSTAL W

c) PHYLIP

d) PIR

¿Cuál es el formato de la secuencia?

!!AA_SEQUENCE 1.

1LYLA Length: 480 Type: P Check: 1239 ..

1 FNDELRNRRE KLAALRQQGV AFPNDFRRDH TSDQLHEEFD AKDNQELESL

51 NIEVSVAGRM MTRRIMGKAS FVTLQDVGGR IQLYVARDSL PEGVYNDQFK

101 KWDLGDIIGA RGTLFKTQTG ELSIHCTELR LLTKALRPLP DQEVRYRQRY