Что такое генетический код в биологии определение. Универсальный генетический код

ГЕНЕТИЧЕСКИЙ КОД, система записи наследственной информации в виде последовательности оснований нуклеотидов в молекулах ДНК (у некоторых вирусов - РНК), определяющая первичную структуру (расположение аминокислотных остатков) в молекулах белков (полипептидов). Проблема генетического кода была сформулирована после доказательства генетической роли ДНК (американские микробиологи О. Эйвери, К. Мак-Леод, М. Маккарти, 1944) и расшифровки её структуры (Дж. Уотсон, Ф. Крик, 1953), после установления того, что гены определяют структуру и функции ферментов (принцип «один ген - один фермент» Дж. Бидла и Э. Тейтема, 1941) и что существует зависимость пространственной структуры и активности белка от его первичной структуры (Ф. Сенгер, 1955). Вопрос о том, как комбинации из 4 оснований нуклеиновых кислот определяют чередование 20 обычных аминокислотных остатков в полипептидах, впервые поставил Г. Гамов в 1954 году.

На основании эксперимента, в котором исследовали взаимодействия вставок и выпадений пары нуклеотидов, в одном из генов бактериофага Т4 Ф. Крик и другие учёные в 1961 году определили общие свойства генетического кода: триплетность, т. е. каждому аминокислотному остатку в полипептидной цепи соответствует набор из трёх оснований (триплет, или кодон) в ДНК гена; считывание кодонов в пределах гена идёт с фиксированной точки, в одном направлении и «без запятых», то есть кодоны не отделены какими-либо знаками друг от друга; вырожденность, или избыточность, - один и тот же аминокислотный остаток могут кодировать несколько кодонов (кодоны-синонимы). Авторы предположили, что кодоны не перекрываются (каждое основание принадлежит только одному кодону). Прямое изучение кодирующей способности триплетов было продолжено с использованием бесклеточной системы синтеза белка под контролем синтетической матричной РНК (мРНК). К 1965 году генетический код был полностью расшифрован в работах С. Очоа, М. Ниренберга и Х. Г. Кораны. Раскрытие тайны генетического кода явилось одним из выдающихся достижений биологии в 20 веке.

Реализация генетического кода в клетке происходит в ходе двух матричных процессов - транскрипции и трансляции. Посредником между геном и белком является мРНК, образующаяся в процессе транскрипции на одной из нитей ДНК. При этом последовательность оснований ДНК, несущая информацию о первичной структуре белка, «переписывается» в виде последовательности оснований мРНК. Затем в ходе трансляции на рибосомах последовательность нуклеотидов мРНК считывается транспортными РНК (тРНК). Последние имеют акцепторный конец, к которому присоединяется аминокислотный остаток, и адаптерный конец, или антикодон-триплет, который узнаёт соответствующий кодон мРНК. Взаимодействие кодона и анти-кодона происходит на основании комплементарного спаривания оснований: Аденин (А) - Урацил (U), Гуанин (G) - Цитозин (С); при этом последовательность оснований мРНК переводится в аминокислотную последовательность синтезирующегося белка. Различные организмы используют для одной и той же аминокислоты разные кодоны-синонимы с разной частотой. Считывание мРНК, кодирующей полипептидную цепь, начинается (инициируется) с кодона AUG, соответствующего аминокислоте метионину. Реже у прокариот инициирующими кодонами служат GUG (валин), UUG (лейцин), AUU (изолейцин), у эукариот - UUG (лейцин), AUA (изолейцин), ACG (треонин), CUG (лейцин). Это задаёт так называемую рамку, или фазу, считывания при трансляции, то есть далее всю нуклеотидную последовательность мРНК считывают триплет за триплетом тРНК до тех пор, пока на мРНК не встретится любой из трёх кодонов-терминаторов, часто называемых стоп-кодонами: UAA, UAG, UGA (таблица). Считывание этих триплетов приводит к завершению синтеза полипептидной цепи.

Кодоны AUG и стоп-кодоны стоят соответственно в начале и в конце участков мРНК, кодирующих полипептиды.

Генетический кода квазиуниверсален. Это значит, что существуют небольшие вариации в значении некоторых кодонов у разных объектов, и это касается, прежде всего, кодонов-терминаторов, которые могут быть значащими; например, в митохондриях некоторых эукариот и у микоплазм UGA кодирует триптофан. Кроме того, в некоторых мРНК бактерий и эукариот UGA кодирует необычную аминокислоту - селеноцистеин, а UAG у одной из архебактерий - пирролизин.

Существует точка зрения, согласно которой генетический кода возник случайно (гипотеза «замороженного случая»). Более вероятно, что он эволюционировал. В пользу такого предположения говорит существование более простого и, по-видимому, более древнего варианта кода, который считывается в митохондриях согласно правилу «два из трёх», когда аминокислоту определяют только два из трёх оснований в триплете.

Лит.: Crick F. Н. а. о. General nature of the genetic code for proteins // Nature. 1961. Vol. 192; The genetic code. N. Y., 1966; Ичас М. Биологический код. М., 1971; Инге-Вечтомов С. Г. Как читается генетический код: правила и исключения // Современное естествознание. М., 2000. Т. 8; Ратнер В. А. Генетический код как система // Соросовский образовательный журнал. 2000. Т. 6. № 3.

С. Г. Инге-Вечтомов.

0

Генетический код — это свойственный всем живым организмам способ кодирования аминокислотной последовательности белков при помощи последовательности нуклеотидов в молекуле ДНК.

Реализация генетической информации в живых клетках (то есть синтез белка, закодированного в ДНК) осуществляется при помощи двух матричных процессов: транскрипции (то есть синтеза иРНК на матрице ДНК) и трансляции (синтез полипептидной цепи на матрице иРНК).

В ДНК используется четыре нуклеотида — аденин (А), гуанин (Г), цитозин (Ц), тимин (T). Эти «буквы» составляют алфавит генетического кода. В РНК используются те же нуклеотиды, за исключением тимина, который заменен урацилом (У). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности «букв».

В нуклеотидной последовательности ДНК имеются кодовые «слова» для каждой аминокислоты будущей молекулы белка — генетический код. Он заключается в определенной последовательности расположения нуклеотидов в молекуле ДНК.

Три стоящих подряд нуклеотида кодируют «имя» одной аминокислоты, то есть каждая из 20 аминокислот зашифрована значащей единицей кода — сочетанием из трех нуклеотидов, называемых триплет или кодон.

В настоящее время код ДНК полностью расшифрован, и мы можем говорить об определенных свойствах, характерных для этой уникальной биологической системы, обеспечивающей перевод информации с «языка» ДНК на «язык» белка.

Носителем генетической информации является ДНК, но так как непосредственное участие в синтезе белка принимает иРНК — копия одной из нитей ДНК, то чаще всего генетический код записывают на "языке РНК".

Аминокислота Кодирующие триплеты РНК
Аланин ГЦУ ГЦЦ ГЦА ГЦГ
Аргинин ЦГУ ЦГЦ ЦГА ЦГГ АГА АГГ
Аспарагин ААУ ААЦ
Аспарагиновая кислота ГАУ ГАЦ
Валин ГУУ ГУЦ ГУА ГУГ
Гистидин ЦАУ ЦАЦ
Глицин ГГУ ГГЦ ГГА ГГГ
Глутамин ЦАА ЦАГ
Глутаминовая кислота ГАА ГАГ
Изолейцин АУУ АУЦ АУА
Лейцин ЦУУ ЦУЦ ЦУА ЦУГ УУА УУГ
Лизин ААА ААГ
Метионин АУГ
Пролин ЦЦУ ЦЦЦ ЦЦА ЦЦГ
Серин УЦУ УЦЦ УЦА УЦГ АГУ АГЦ
Тирозин УАУ УАЦ
Треонин АЦУ АЦЦ АЦА АЦГ
Триптофан УГГ
Фенилаланин УУУ УУЦ
Цистеин УГУ УГЦ
СТОП УГА УАГ УАА

Свойства генетического кода

Три стоящих подряд нуклеотида (азотистых оснований) кодируют «имя» одной аминокислоты, то есть каждая из 20 аминокислот зашифрована значащей единицей кода — сочетанием из трех нуклеотидов, называемых триплет или кодон.

Триплет (кодон) — последовательность из трех нуклеотидов (азотистых оснований) в молекуле ДНК или РНК, определяющая включение в молекулу белка в процессе ее синтеза определенной аминокислоты.

  • Однозначность (дискретность)

Один триплет не может кодировать две разные аминокислоты, шифрует только одну аминокислоту. Определенный кодон соответствует только одной аминокислоте.

Каждая аминокислота может определяться более, чем одним триплетом. Исключение — метионин итриптофан . Другими словами — одной и той же аминокислоте может соответствовать несколько кодонов.

  • Неперекрываемость

Одно и то же основание не может одновременно входить в два соседних кодона.

Некоторые триплеты не кодируют аминокислоты, а являются своеобразными «дорожными знаками», которые определяют начало и конец отдельных генов, (УАА, УАГ, УГА), каждый из которых означает прекращение синтеза и расположен в конце каждого гена, поэтому мы можем говорить о полярности генетического кода.

У животных и растений, у грибов, бактерий и вирусов один и тот же триплет кодирует один и тот же тип аминокислоты, то есть генетический код одинаков для всех живых существ. Другими словами, универсальность — способность генетического кода работать одинаково в организмах разного уровня сложности от вирусов до человека. Универсальность кода ДНК подтверждает единство происхождения всего живого на нашей планете. На использовании свойства универсальности генетического кода основаны методы генной инженерии.

Из истории открытия генетического кода

Впервые идея о существовании генетического кода сформулирована А. Дауном и Г. Гамовым в 1952 — 1954 годах. Учёные показали, что последовательность нуклеотидов, однозначно определяющая синтез той или иной аминокислоты, должна содержать не менее трёх звеньев. Позднее было доказано, что такая последовательность состоит из трех нуклеотидов, названных кодоном или триплетом .

Вопросы о том, какие нуклеотиды ответственны за включение определенной аминокислоты в белковую молекулу и какое количество нуклеотидов определяет это включение, оставались нерешенными до 1961 года. Теоретический разбор показал, что код не может состоять из одного нуклеотида, поскольку в этом случае только 4 аминокислоты могут кодироваться. Однако код не может быть и дуплетным, то есть комбинация двух нуклеотидов из четырехбуквенного «алфавита» не может охватить всех аминокислот, так как подобных комбинаций теоретически возможно только 16 (4 2 = 16).

Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трех последовательных нуклеотидов, когда число возможных комбинаций составит 64 (4 3 = 64).

Лекция 5. Генетический код

Определение понятия

Генетический код - это система записи информации о последовательности расположения аминокислот в белках с помощью последовательности расположения нуклеотидов в ДНК.

Поскольку ДНК непосредственного участия в синтезе белка не принимает, то код записывается на языке РНК. В РНК вместо тимина входит урацил.

Свойства генетического кода

1. Триплетность

Каждая аминокислота кодируется последовательностью из 3-х нуклеотидов.

Определение: триплет или кодон - последовательность из трех нуклеотидов, кодирующая одну аминокислоту.

Код не может быть моноплетным, поскольку 4 (число разных нуклеотидов в ДНК) меньше 20. Код не может быть дуплетным, т.к. 16 (число сочетаний и перестановок из 4-х нуклеотидов по 2) меньше 20. Код может быть триплетным, т.к. 64 (число сочетаний и перестановок из 4-х по 3) больше 20.

2. Вырожденность.

Все аминокислоты, за исключением метионина и триптофана, кодируются более чем одним триплетом:

2 АК по 1 триплету = 2.

9 АК по 2 триплета = 18.

1 АК 3 триплета = 3.

5 АК по 4 триплета = 20.

3 АК по 6 триплетов = 18.

Всего 61 триплет кодирует 20 аминокислот.

3. Наличие межгенных знаков препинания.

Определение:

Ген - это участок ДНК, кодирующий одну полипептидную цепь или одну молекулу tPHK , r РНК или sPHK .

Гены tPHK , rPHK , sPHK белки не кодируют.

В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х триплетов, кодирующих терминирующие кодоны РНК, или стоп-сигналы. В мРНК они имеют следующий вид: UAA , UAG , UGA . Они терминируют (оканчивают) трансляцию.

Условно к знакам препинания относится и кодон AUG - первый после лидерной последовательности. (См. лекцию 8) Он выполняет функцию заглавной буквы. В этой позиции он кодирует формилметионин (у прокариот).

4. Однозначность.

Каждый триплет кодирует лишь одну аминокислоту или является терминатором трансляции.

Исключение составляет кодон AUG . У прокариот в первой позиции (заглавная буква) он кодирует формилметионин, а в любой другой - метионин.

5. Компактность, или отсутствие внутригенных знаков препинания.
Внутри гена каждый нуклеотид входит в состав значащего кодона.

В 1961 г. Сеймур Бензер и Френсис Крик экспериментально доказали триплетность кода и его компактность.

Суть эксперимента: "+" мутация - вставка одного нуклеотида. "-" мутация - выпадение одного нуклеотида. Одиночная "+" или "-" мутация в начале гена портит весь ген. Двойная "+" или "-" мутация тоже портит весь ген.

Тройная "+" или "-" мутация в начале гена портит лишь его часть. Четверная "+" или "-" мутация опять портит весь ген.

Эксперимент доказывает, что код тршплетен и внутри гена нет знаков препинания. Эксперимент был проведен на двух рядом расположенных фаговых генах и показал, кроме того, наличие знаков препинания между генами.

6. Универсальность.

Генетический код един для всех живущих на Земле существ.

В 1979 г. Беррел открыл идеальный код митохондрий человека.

Определение:

«Идеальным» называется генетический код, в котором выполняется правило вырожденности квазидублетного кода: Если в двух триплетах совпадают первые два нуклеотида, а третьи нуклеотиды относятся к одному классу (оба - пурины или оба - пиримидины), то эти триплеты кодируют одну и ту же аминокислоту.

Из этого правила в универсальном коде есть два исключения. Оба отклонения от идеального кода в универсальном касаются принципиальных моментов: начала и конца синтеза белка:

Кодон

Универсальный

код

Митохондриальные коды

Позвоночные

Беспозвоночные

Дрожжи

Растения

STOP

STOP

С UA

А G А

STOP

STOP

230 замен не меняют класс кодируемой аминокислоты. к рываемость.

В 1956 г. Георгий Гамов предложил вариант перекрываемого кода. Согласно Гамовскому коду, каждый нуклеотид, начиная с третьего в гене, входит в состав 3-х кодонов. Когда генетический код был расшифрован, оказалось, что он неперекрываем, т.е. каждый нуклеотид входит в состав лишь одного кодона.

Достоинства перекрываемого генетического кода: компактность, меньшая зависимость структуры белка от вставки или делеции нуклеотида.

Недостаток: большая зависимость структуры белка от замены нуклеотида и ограничение на соседей.

В 1976 г. была секвенирована ДНК фага φХ174. У него одноцепочечная кольцевая ДНК, состоящая из 5375 нуклеотидов. Было известно, что фаг кодирует 9 белков. Для 6 из них были определены гены, располагающиеся друг за другом.

Выяснилось, что есть перекрывание. Ген Е полностью находится внутри гена D . Его инициирующий кодон появляется в результате сдвига считывания на один нуклеотид. Ген J начинается там, где кончается ген D . Инициирующий кодон гена J перекрывается с терминирующим кодоном гена D в результате сдвига на два нуклеотида. Конструкция называется "сдвиг рамки считывания" на число нуклеотидов, некратное трем. На сегодняшний день перекрывание показано только для нескольких фагов.

Информационная емкость ДНК

На Земле живет 6 миллиардов человек. Наследственная информация о них
заключена в 6x10 9 сперматозоидах. По разным оценкам у человека от 30 до 50
тысяч генов. У всех людей ~ 30x10 13 генов или 30x10 16 пар нуклеотидов, которые составляют 10 17 кодонов. Средняя книжная страница содержит 25x10 2 знаков. ДНК 6x10 9 сперматозоидов содержит информацию, равную по объему примерно

4x10 13 книжных страниц. Эти страницы заняли бы объем 6-и зданий НГУ. 6x10 9 сперматозоидов занимают половину наперстка. Их ДНК занимает менее четверти наперстка.

- единая система записи наследственной ин­формации в молекулах нуклеиновых кислот в виде последова­тельности нуклеотидов. Генетический код основан на использо­вании алфавита, состоящего всего из четырех букв-нуклеотидов, отличающихся азотистыми основаниями: А, Т, Г, Ц.

Основные свойства генетического кода следующие:

1. Генетический код триплетен. Триплет (кодон) - последовательность трех нуклеотидов, кодирующая одну аминокислоту. Поскольку в состав бел­ков входит 20 аминокислот, то очевидно, что каждая из них не может кодироваться одним нуклеотидом (поскольку в ДНК всего четыре типа нуклеотидов, то в этом случае 16 аминокислот оста­ются незакодированными). Двух нуклеотидов для кодирования аминокислот также не хватает, поскольку в этом случае могут быть закодированы только 16 аминокислот. Значит, наименьшее число нуклеотидов, кодирующих одну аминокислоту, оказыва­ется равным трем. (В этом случае число возможных триплетов нуклеотидов составляет 4 3 = 64).

2. Избыточность (вырожденность) кода является следствием его триплетности и означает то, что одна аминокислота может кодироваться несколькими трип­летами (поскольку аминокислот 20, а триплетов - 64). Исключение составляют метионин и триптофан, которые кодируются только одним триплетом. Кроме того, некоторые триплеты вы­полняют специфические функции. Так, в молекуле иРНК три из них УАА, УАГ, УГА - являются терминирующими кодонами, т. е. стоп-сигналами, прекращающими синтез полипептидной цепи. Триплет, соответствующий метионину (АУГ), стоящий в начале цепи ДНК, не кодирует аминокислоту, а выполняет функцию инициирования (возбуждения) считывания.

3. Одно­временно с избыточностью коду присуще свойство однозначнос­ти, которое означает, что каждому кодону соответствует только одна определенная аминокислота.

4. Код коллинеарен, т.е. по­следовательность нуклеотидов в гене точно соответствует после­довательности аминокислот в белке.

5. Генетический код непере­крываем и компактен, т. е. не содержит «знаков препинания». Это значит, что процесс считывания не допускает возможности перекрывания колонов (триплетов), и, начавшись на определенном кодоне, считывание идет непрерывно триплет за триплетом вплоть до стоп-сигналов (терминирующих кодонов). Например, в иРНК следующая последовательность азотистых оснований АУГГУГЦУУААУГУГ будет считываться только такими трип­летами: АУГ, ГУГ, ЦУУ, ААУ, ГУГ, а не АУГ, УГГ, ГГУ, ГУГ и т. Д. или АУГ, ГГУ, УГЦ, ЦУУ и т. д. или еще каким-либо образом (допустим, кодон АУГ, знак препинания Г, кодон УГЦ, знак пре­пинания У и Т. п.).

6. Генетический код универсален, т. е. ядер­ные гены всех организмов одинаковым образом кодируют инфор­мацию о белках вне зависимости от уровня организации и систематического положения этих организмов.

Ведущий научный журнал Nature сообщил об обнаружении второго генетического кода – такого себе «кода внутри кода», который был недавно взломан молекулярными биологами и компьютерными программистами. Более того, для того чтобы его выявить, они использовали не эволюционную теорию, а информационные технологии.

Новый код получил название Код Сплайсинга. Он находится внутри ДНК. Этот код контролирует основной генетический код очень сложным, однако, предсказуемым образом. Код сплайсинга управляет тем, как и когда происходит сборка генов и регулирующих элементов. Раскрытие этого кода внутри кода помогает пролить свет на некоторые давнишние тайны генетики, которые всплыли на поверхность после проведения Проекта по расшифровке полной последовательности генома человека. Одна из таких тайн заключалась в том, почему в таком сложном организме, как человеческий, существует всего лишь 20 000 генов? (Ученые ожидали обнаружить намного больше.) Почему гены разбиваются на сегменты (экзоны), которые разделяются некодирующими элементами (интроны), а затем после транскрипции соединяются вместе (т.е. сплайсируются)? И почему гены включаются в одних клетках и тканях, и не включаются в других? На протяжении двух десятилетий молекулярные биологи пытались выяснить механизмы генетической регуляции. Эта статья указывает на очень важный момент в понимании того, что происходит на самом деле. Она не дает ответы на все вопросы, но она демонстрирует, что внутренний код существует. Этот код – система передачи информации, которую можно так понятно расшифровать, что ученые могли бы прогнозировать, как в определенных ситуациях и с необъяснимой точностью может вести себя геном.

Представьте, что в соседней комнате вы слышите оркестр. Вы открываете дверь, заглядываете внутрь и видите в комнате трех или четырех музыкантов, играющих на музыкальных инструментах. Это то, на что, по словам Брендона Фрея, участвовавшего в раскрытии кода, похож человеческий геном. Он говорит: «Мы смогли обнаружить только 20,000 генов, но мы знали, что они образуют огромное количество белковых продуктов и регулирующих элементов. Как? Один из методов называется альтернативным сплайсингом» . Различные экзоны (части генов) могут собираться разными способами. «Например, три гена белка нейрексина могут создавать более 3000 генетических посланий, которые помогают управлять системой связей мозга» , - говорит Фрей. Тут же в статье говорится о том, что ученым известно, что 95% наших генов имеют альтернативный сплайсинг, и в большинстве случаев в разных типах клеток и тканей транскрипты (молекулы РНК, образующиеся в результате транскрипции) экспрессируются по-разному. Должно быть что-то, что управляет тем, как собираются и экспрессируются эти тысячи комбинаций. В этом и состоит задача Кода Сплайсинга.

Читатели, которые хотят получить беглый обзор открытия, могут прочитать статью в Science Daily под названием «Исследователи, взломавшие ‘Код сплайсинга’, раскрывают тайну, лежащую в основе биологической сложности» . В статье говорится: «Ученые из университета Торонто получили фундаментально новое представление о том, как живые клетки используют ограниченное число генов для образования таких невероятно сложных органов, как мозг» . Сам журнал Nature начинается со статьи Хейди Ледфорда «Код внутри кода». Затем последовала статья Техедора и Валькарсела под названием «Регуляция генов: взлом второго генетического кода. И, наконец, решающей стала статья группы исследователей из университета Торонто под руководством Бенджамина Д. Бленкоу и Брендона Д. Фрея, «Расшифровывая код сплайсинга».

Эта статья – победа информационной науки, которая напоминает нам дешифровальщиков времен Второй Мировой Войны. Их методы включали алгебру, геометрию, теорию вероятностей, векторное исчисление, теорию информации, оптимизацию кода программы, и другие передовые методы. В чем они не нуждались, так это в эволюционной теории , которая никогда не упоминалась в научных статьях. Читая эту статью, можно увидеть, под каким сильным напряжением находятся авторы этой увертюры:

«Мы описываем схему ‘кода сплайсинга’, в которой используются комбинации сотен свойств РНК для того, чтобы предсказать обусловленные тканями изменения в альтернативном сплайсинге тысячи экзонов. Код устанавливает новые классы схем сплайсинга, распознает разные регулирующие программы в разных тканях и устанавливает контролируемые мутациями регулирующие последовательности. Мы раскрыли широко распространенные регулирующие стратегии, включая: использование непредвиденно крупных объединений свойств; выявление низких уровней включения экзона, которые ослабляются свойствами специфических тканей; проявление свойств в интронах глубже, чем считалось раньше; и модуляция уровней сплайс-варианта структурными характеристиками транскрипта. Код помог установить класс экзонов, включение которых заглушает экспрессию в тканях взрослого организма, активируя деградацию мРНКа, и исключение которых способствует экспрессии во время эмбриогенеза. Код облегчает раскрытие и детальное описание регулируемых событий альтернативного сплайсинга в масштабах всего генома».

В команде, взломавшей код, участвовали специалисты с кафедры электронной и вычислительной техники, а также с кафедры молекулярной генетики. (Сам же Фрей работает в подразделении корпорации Microsoft, Microsoft Research) Подобно дешифровальщикам прошлого времени, Фрей и Бараш разработали «новый метод биологического анализа, проводимого с помощью компьютера, который обнаруживает ‘кодовые слова’, запрятанные внутри генома» . С помощью огромного количества данных, созданных молекулярными генетиками, группа исследователей проводила «обратную разработку» кода сплайсинга до тех пор, пока они не смогли предсказать, как он будет действовать . Как только исследователи с этим справились, они проверили этот код на мутациях и увидели, как вставляются или удаляются экзоны. Они обнаружили, что код даже может вызывать тканеспецифические изменения или действовать по-разному в зависимости от того, взрослая это мышь или эмбрион. Один ген, Xpo4, связан с раком; исследователи отметили: «Эти данные подтверждают вывод о том, что экспрессия Xpo4 гена должна строго контролироваться во избежание возможных губительных последствий, включая онкогенез (рак), так как он активен во время эмбриогенеза, но его количество снижено в тканях взрослого организма. Оказывается, что они были абсолютно удивлены уровнем контроля, который они увидели. Намеренно или нет, но в качестве ключа к разгадке Фрей использовал не случайную изменчивость и отбор, а язык разумного замысла. Он отметил: «Понимание сложной биологической системы подобно пониманию сложной электронной схемы».

Хейди Ледфорд сказал, что кажущаяся простота генетического кода Уотсона-Крика, с его четырьмя основаниями, триплетными кодонами, 20 аминокислотами и 64 «символами» ДНК – скрывает под собой целый мир сложности . Заключенный внутри этого более простого кода, Код сплайсинга намного сложнее.

Но между ДНК и белками находится РНК – отдельный мир сложности. РНК – это трансформер, который иногда переносит генетические послания, а иногда управляет ими, задействуя при этом множество структур, способных влиять на его функцию. В статье, опубликованной в этом же выпуске, группа исследователей под руководством Бенджамина Д. Бленкоу и Брендона Д. Фрея из университета Торонто в Онтарио, Канада, сообщает о попытках разгадать второй генетический код, который может предсказывать, как сегменты информационной РНК, транскрибированные с определенного гена, могут смешиваться и сочетаться, чтобы образовывать разнообразные продукты в разных тканях. Это процесс известен как альтернативный сплайсинг. На этот раз нет никакой простой таблицы – вместо неё алгоритмы, которые объединяют более чем 200 различных свойств ДНК с определениями структуры РНК.

Работа этих исследователей указывает на быстрый прогресс, которого достигли вычислительные методы в составлении модели РНК. В дополнение к пониманию альтернативного сплайсинга, информатика помогает ученым предсказывать структуры РНК и устанавливать маленькие регулирующие фрагменты РНК, которые не кодируют протеины. «Это замечательное время» , - говорит Кристофер Берг, компьютерный биолог из массачусетского института технологий в Кембридже. «В будущем нас ждёт огромный успех» .

Информатика, компьютерная биология, алгоритмы и коды – эти концепции не были частью дарвиновского словаря, когда он разрабатывал свою теорию. У Менделя была очень упрощенная модель того, как распределяются признаки во время унаследования. К тому же, идея о том, что признаки кодируются, была представлена только в 1953 году. Мы видим, что исходный генетический код регулируется еще более сложным, включенным в него, кодом. Это революционные идеи . К тому же есть все признаки того, что этот уровень контроля не последний . Ледфорд напоминает нам, что например, РНК и белки имеют трехмерную структуру. Функции молекул могут изменяться, когда изменяется их форма Должно существовать что-то, что контролирует складывание, так что трехмерная структура выполняет то, что требует функция. К тому же, доступ к генам, по-видимому, контролируется другим кодом, гистоновым кодом . Этот код закодирован молекулярными маркерами или «хвостами» на гистоновых белках, которые служат центрами для скручивания и суперскручивания ДНК. Описывая наше время, Ледфорд говорит о «постоянном возрождении в информатике РНК» .

Техедор и Валькарсел согласны с тем, что за простотой кроется сложность. «По идее все выглядит очень просто: ДНК образует РНК, которая затем создает белок» , - начинают они свою статью. «Но в реальности всё намного сложнее» . В 1950-х годах мы узнали о том, что все живые организмы, от бактерий до человека, имеют основной генетический код. Но вскоре мы поняли, что сложные организмы (эукариоты) обладают каким-то неестественным и трудным для понимания свойством: их геномы имеют своеобразные участки, интроны, которые должны удаляться, чтобы экзоны могли соединиться вместе. Почему? Сегодня туман рассеивается: «Основное преимущество этого механизма заключается в том, что он позволяет разным клеткам выбирать альтернативные способы сплайсинга предшественника матричной РНК (пре-мРНК) и таким образом один ген образует различные послания», - объясняют они, - «а затем различные мРНК могут кодировать разные белки с различными функциями» . Из меньшего кода вы получаете больше информации, при условии, что внутри кода есть этот другой код, который знает, как это сделать.

Что и делает взлом кода сплайсинга настолько трудным, так это то, что факторы, контролирующие сборку экзонов, устанавливаются множеством других факторов: последовательностями, расположенными рядом с границами экзона, последовательностями интронов и регулирующими факторами, которые либо помогают, либо тормозят механизм сплайсинга. К тому же, «воздействия определенной последовательности или фактора могут изменяться в зависимости от её расположения относительно границ интрона-экзона или других регуляторных мотивов» , - поясняют Техедор и Валькарсел. «Поэтому самой сложной задачей в предсказании тканеспецифического сплайсинга является вычисление алгебры несметного числа мотивов и взаимоотношений между регуляторными факторами, которые их распознают» .

Для разрешения этой проблемы группа исследователей ввела в компьютер огромное количество данных о последовательностях РНК и условиях, в которых они образовались. «Затем компьютеру было дано задание - определить комбинацию свойств, которые лучше всего могли бы объяснить экспериментально установленный тканеспецифический отбор экзонов» . Другими словами, исследователи провели обратную разработку кода. Подобно дешифровальщикам времен Второй Мировой Войны, как только ученые узнают алгоритм, они могут делать предсказания: «Он правильно и с точностью установил альтернативные экзоны и предсказал их дифференциальное регулирование между парами типов тканей». И так же как любая хорошая научная теория, открытие дало новое понимание: «Это позволило нам по-новому объяснить ранее установленные регуляторные мотивы и указало на ранее неизвестные свойства известных регуляторов, а также неожиданные функциональные связи между ними» , - отметили исследователи. «Например, код подразумевает, что включение экзонов, ведущее к процессированным белкам, является общим механизмом управления процессом экспрессии генов во время перехода из эмбриональной ткани в ткань взрослого организма» .

Техедор и Валькарсел считают публикацию их статьи важным первым шагом: «Работу... лучше рассматривать как открытие первого фрагмента гораздо более крупного Розеттского камня, необходимого для расшифровки альтернативных сообщений нашего генома». По словам этих ученых, будущие исследования, несомненно, улучшат их знания об этом новом коде. В заключение своей статьи они вскользь упоминают эволюцию, и делают это очень необычным образом. Они говорят: «Это не значит, что эволюция создала эти коды. Это означает, что прогресс будет требовать понимания того, как коды взаимодействуют. Другой неожиданностью стало то, что наблюдаемая на сегодня степень сохранения поднимает вопрос о возможном существовании «видоспецифичных кодов» .

Код, вероятно, работает в каждой отдельной клетке и, поэтому, возможно должен отвечать более чем за 200 типов клеток млекопитающих животных. Также он должен справляться с огромным разнообразием схем альтернативного сплайсинга, не говоря уже о простых решениях о включении или пропуске отдельного экзона. Ограниченное эволюционное сохранение регулирования альтернативного сплайсинга (который по подсчетам составляет около 20% между людьми и мышами) поднимает вопрос о существовании видоспецифичных кодов. Более того, связь между процессингом ДНК и транскрипцией генов влияет на альтернативный сплайсинг, и последние данные указывают на упаковку ДНК гистоновыми белками и ковалентными модификациями гистонов (так называемый эпигенетический код) в регуляции сплайсинга. Поэтому будущим методам предстоит установить точное взаимодействие между гистоновым кодом и кодом сплайсинга. То же самое касается еще мало понимаемого влияния сложных структур РНК на альтернативный сплайсинг.

Коды, коды и снова коды. То, что ученые практически ничего не говорят о дарвинизме в этих статьях, указывает на то, что эволюционным теоретикам – приверженцам старых идей и традиций, предстоит много над чем поразмышлять после того, как они прочтут эти статьи. А вот те, кто с восторженностью относится к биологии кодов, окажутся на передовой. У них есть замечательная возможность воспользоваться увлекательным веб-приложением, которое дешифровщики создали для того, чтобы стимулировать проведение дальнейшего исследования. Его можно найти на сайте университета Торонто под названием «Веб-сайт прогнозирования альтернативного сплайсинга». Посетители напрасно будут искать здесь упоминания об эволюции, и это несмотря на старую аксиому, что ничего в биологии не имеет без неё смысла. Новая версия этого выражения 2010 года может звучать так: «Ничто в биологии не имеет смысла, если не рассматривается в свете информатики» .

Ссылки и примечания

Мы рады, что смогли рассказать вам об этой истории в день её публикации. Возможно, это одна из наиболее значимых научных статей года. (Конечно же, значимым является каждое большое открытие, сделанное другими группами ученых, как открытие Уотсона и Крика.) Единственное, что мы можем сказать на это: «Вот это да!» Это открытие – замечательное подтверждение Сотворения по замыслу и огромный вызов дарвиновской империи. Интересно, как эволюционисты попытаются исправить свою упрощенную историю случайных мутаций и естественного отбора, которая была придумана еще в 19 столетии, в свете этих новых данных.

Вы поняли, о чем говорят Техедор и Валькарсел? Виды могут иметь свой собственный код, свойственный только этим видам. «Поэтому будущим методам предстоит установить точное взаимодействие между гистоновым [эпигенетическим] кодом и кодом сплайсинга», - отмечают они. В переводе это означает: «Дарвинисты здесь не причем. Они просто не способны с этим справиться». Если простой генетический код Уотсона-Крика был проблемой для дарвинистов, то, что они скажут теперь о коде сплайсинга, который из одних и тех же генов создает тысячи транскриптов? А как они справятся с эпигенетическим кодом, который управляет экспрессией генов? И кто знает, может в этом невероятном «взаимодействии», о котором мы только начинаем узнавать, задействованы и другие коды, напоминающие Розеттский камень, только начинающий показываться из песка?

Теперь, когда мы размышляем о кодах и информатике, мы начинаем думать о разных парадигмах нового исследования. Что если геном частично действует как сеть хранения данных? Что если в нем имеет место криптография или происходят алгоритмы сжатия? Нам следует вспомнить о современных информационных системах и технологиях хранения информации. Может быть, мы даже обнаружим элементы стеганографии. Несомненно, существуют дополнительные механизмы устойчивости, такие как дублирования и исправления, которые возможно помогут объяснить существование псевдогенов. Копирования всего генома могут быть реакциями на стресс. Некоторые из этих явлений могут оказаться полезными показателями исторических событий, которые не имеют ничего общего с универсальным общим предком, но помогают исследовать сравнительную геномику в рамках информатики и дизайна устойчивости, а также помогают понять причину заболевания.

Эволюционисты оказываются в сильном затруднении. Исследователи попытались видоизменить код, а получили только рак и мутации. Как они собираются пройти по полю приспособленности, если оно всё заминировано катастрофами, ждущими своего часа, как только кто-то начинает вмешиваться в эти неразрывно связанные коды? Мы знаем, что существует некая встроенная устойчивость и переносимость, но вся картина представляет собой невероятно сложную, разработанную, оптимизированную информационную систему , а не беспорядочное соединение частей, которыми можно бесконечно играться. Вся идея кода является концепцией разумного замысла.

A. E. Уайлдер-Смит придавал этому особое значение. Код предполагает соглашение между двумя частями. Соглашение – это заблаговременное согласие. Оно подразумевает планирование и цель. Символ SOS, как сказал бы Уайлдер-Смит, мы используем по соглашению как сигнал бедствия. SOS не выглядит как бедствие. Оно не пахнет как бедствие. Оно не ощущается как бедствие. Люди не понимали бы, что эти буквы обозначают бедствие, если бы они не понимали суть самого соглашения. Подобным образом, кодон аланина, ГЦЦ, не выглядит, не пахнет и не ощущается как аланин. Кодон не имел бы никакого отношения к аланину, если бы между двумя кодирующими системами (кодом белка и кодом ДНК) не было заранее установленного соглашения о том, что «ГЦЦ должен означать аланин». Для передачи этого соглашения используется семейство преобразователей, аминоацил-тРНК-синтетаз, которые переводят один код в другой.

Это должно было укрепить теорию замысла в 1950-х годах и многие креационисты эффективно её проповедовали. Но эволюционисты похожи на красноречивых торговцев. Они сочинили свои сказки о фее Динь-Динь, которая разбирает код и создает новые виды путем мутации и отбора, и убедили многих людей в том, что чудеса могут происходить и сегодня. Ну, хорошо, сегодня за окном 21-й век и нам известен эпигенетический код и код сплайсинга – два кода, которые намного сложнее и динамичнее, чем простой код ДНК. Мы знаем о кодах внутри кодов, о кодах над кодами и под кодами – нам известна целая иерархия кодов. На этот раз эволюционисты не могут просто вставить палец в пистолет и с блефом убеждать нас своими красивыми речами, когда по обеим сторонам расставлены пушки – целый арсенал, направленный на их главные элементы конструкции. Всё это игра. Вокруг них выросла целая эра информатики, они давно вышли из моды и похожи на Греков, которые пытаются с копьями лезть на современные танки и вертолеты.

Грустно признавать, но эволюционисты не понимают этого, или даже если и понимают, то не собираются сдаваться. Между прочим, на этой неделе, как раз когда была опубликована статья о Коде сплайсинга, со страниц продарвиновских журналов и газет посыпалась наиболее злая и ненавистная за последнее время риторика, направленная против креационизма и разумного замысда. Нам предстоит услышать еще о многих подобных примерах. И пока они держат в своих руках микрофоны и контролируют институты, многие люди будут попадаться на их удочку, думая, что наука продолжает давать им достаточное основание. Мы рассказываем вам всё это для того, чтобы вы читали этот материал, изучали его, понимали и запаслись информацией, которая вам необходима для того, чтобы сразить истиной этот фанатичный, вводящий в заблуждение вздор. А теперь, вперёд!