Blogia
casanovas

Alineamiento de secuencias proteicas

  1. La información de esta entrada está obtenida  y reproducida por mi en http://www.bigre.ulb.ac.be/ Acceder a las secuencias de las proteínas cuales descripcion contiene la cadena "Homoserine O-succinyltransferase" en el databank UniProt/Swiss-Prot (la seccion Swiss-Prot de UniProt). Guardar estas secuencias en formato .fasta.
  2. Abrir el programa clustalX (disponible en los repositorios de Linux/Ubuntu) y cargar el archivo de secuencias. 
  3. Ejecutar el comando Do complete alignment. El programa exporta dos archivos:
    • El "árbol-guía" (guide tree) se guarda en un archivo con extensión .dnd
    • Las secuencias alineadas en un archivo .aln (el formato propio de clustal)
  4. Analizar el resultado. Localizar los residuos conservados, y los "gaps" terminales o internos. Comparar el contenido de las columnas con el perfil de conservación, desplegado debajo del alineamiento.
  5. En el menú Quality, seleccionar el comando Calculate low scoring segments (calcular segmentos de escore bajo). Analizar el resultado. Se asocian los segmentos de escore bajo a algunas columnas específicas? A algunas secuencias específicas?
  6. En el menú Edit, seleccione el comando Select all sequences.
  7. En el menú Quality, correr el comando Save column score to file. El perfil de escores se guarda en un archivo con extensión .qscores. Abrir esto archivo con un editor de textos. Este archivo contiene una representación textual del alineamiento, junto con los escores asociados a cada columna.

 

0 comentarios