EL LENGUAJE DE LA VIDA

El ADN, que posee toda la información genética necesaria para el funcionamiento de una célula, se aloja en el núcleo celular; por otra parte, la síntesis de las diferentes proteínasy enzimas (síntesis que resulta de las órdenes recibidas desde el ADN) ocurre en el citoplasma de la célula. El ácido ribonucleico o ARN mensajero (ARNm) es el encargado de transportar la información desde el núcleo hasta el citoplasma ya que por medio de un proceso llamado de transcripción copia en sus propias bases la información contenida en el ADN. Cabe preguntarse, entonces, de qué manera las cuatro bases del ARNm (adenina, A; citosina, C; guanina, G; uracilo, U) representan a los veinte aminoácidos que forman las proteínas y cómo está preestablecido en el ARNm el orden en el cual deberán ubicarse dichos aminoácidos en las cadenas peptídicas (los aminoácidos se unen mediante enlaces llamados peptídicos) para que pueda producirse la síntesis de las diferentes proteínas y enzimas del organismo.

Con el fin de contestar estas preguntas imaginémonos un sistema alfabético en el cual las cuatro bases son letras y los veinte aminoácidos, palabras. Además, permitámonos la licencia de aceptar que todas las palabras están representadas por un mismo número de letras. En un sistema de este tipo, si las palabras estuvieran constituidas por una única letra, solamente se podrían obtener cuatro palabras diferentes (una por cada base). Dos letras por palabra permitirían formar 42 = 16 palabras (2 representa el número de letras por palabra y 4 el número de letras del alfabeto). Si utilizáramos tres letras, obtendríamos 43 = 64 palabras distintas, y con series de cuatro letras la cantidad de palabras posibles sería 44 = 256. Teniendo en cuenta que solamente necesitamos 20 palabras distintas, una por aminoácido, el sistema de tres letras por palabra satisface con creces nuestros requerimientos. En efecto, actualmente se acepta que cada uno de los veinte aminoácidos está representado en la cadena de los ácidos nucleicos por una secuencia de tres bases (tripletes).

Con el sistema alfabético empleado hemos podido contestar la primera de las preguntas que nos formuláramos, de manera que ahora sabemos cómo cuatro bases (letras) pueden representar a veinte aminoácidos (palabras). Responder a la segunda cuestión ‑cómo está preestablecido en el ARNm el orden en el cual se ubicarán los aminoácidos en la cadena peptídica para dar origen a las diferentes proteínas‑ obliga a determinar, en primer lugar, de qué manera, dada una sucesión de letras, se identifican los tripletes que designan a cada uno de los aminoácidos.

Podríamos pensar en recurrir a un sistema de tripletes de letras superpuestas (a partir, por ejemplo, de la sucesión AMARO, los tripletes posibles comenzarían con cada una de las letras de la serie: AMA, MAR, ARO), pero por tratarse de una opción en la que cada una de las palabras debe utilizar las dos últimas letras de la palabra anterior, se produce una limitación que no condice con la flexibilidad exigida por la gran variedad de proteínas que se deben codificar.

Un sistema de tripletes constituido por los sucesivos grupos de tres letras de la serie (por ejemplo, AMAMASQUEANA=AMA MAS QUE ANA) resulta un modelo adecuado pues admite gran variedad de frases. Sin embargo, presenta el inconveniente de que al colocar dichas frases una tras otra sería difícil determinar cuáles son las palabras con las que comienza y termina cada una de ellas (por ejemplo, PAN CON SAL AMA MAS QUE ANA ESE REY). El problema se solucionaría colocando al final de cada frase una señal que sirviera como signo de puntuación (PAN CON SAL XXX AMA MAS QUE ANA XXX ESE REY XXX).

En efecto, éste es el sistema: un gen está formado por una secuencia de tripletes correspondientes a los aminoácidos de una cadena peptídica y por un triplete que no corresponde a ningún aminoácido y tiene por función indicar su fin. Vale decir que actúa como sistema de puntuación.

Hasta aquí hemos analizado el aspecto teórico del código genético. En la tabla adjunta se indican las bases que forman los tripletes representativos de cada aminoácido. Ella muestra que varios tripletes pueden representar un mismo aminoácido; debido a este fenómeno se califica al código genético como "degenerado". En los casos en que varios tripletes corresponden a un aminoácido, la base que habitualmente varía es la tercera y con menos frecuencia, la primera; la segunda base, en cambio, es constante. Los tripletes identificados con las letras CT (" chain terminator" = terminador de cadena) son los tripletes que cumplen funciones de puntuación.

UUU

Phe

UCU

 

Ser

UAU

Tyr

UGU

Gys

UUC

UUC

UAC

UGC

 

 

 

 

 

 

 

UUA

Leu

UCA

UAA

CT

UGA

CT

UUG

UCG

UAG

UGG

Trp

 

 

 

 

 

 

 

 

CUU

 

Leu

CCU

 

Pro

CAU

His

CGU

 

Arg

CUC

CCC

CAC

CGC

 

 

 

 

 

CUA

CCA

CAA

Gln

CGA

CUG

CCG

CAG

CGG

 

 

 

 

 

 

 

 

AUU

Ilu

ACU

 

Thr

AAU

Asn

AGU

Ser

AUC

ACC

AAC

AGC

 

 

 

 

 

 

 

AUA

Ilu

ACA

AAA

Lys

AGA

Arg

AUG

Met

ACG

AAG

AGG

 

 

 

 

 

 

 

 

GUU

 

Val

GCU

 

Ala

GAU

Asp

GGU

 

Gly

GUC

GCC

GAC

GGC

 

 

 

 

 

GUA

GCA

GAA

Glu

GGA

GUG

GCG

GAG

GGG

Código genético. Tripletes y aminoácidos codificados: Phe = fenilalanina; Leu = leucina; Ilu = isolencina; Met = metionina; Val = valina; Ser = serina; Pro = prolina; Thr = treonina; Ala = alanina; Tyr = tirosina; His = histidina; Gln = glutamina; Asn = asparagina; lys = lisina; Asp = ácido aspártico; Glu = ácido glutámico; Cys = cistina; Trp = triplofano; Arg = arginina; Gly = glicina; CT = terminador de cadena.