Кто открыл генетический код. Вырожденность генетического кода: общие сведения


Под генетическим кодом принято понимать такую систему знаков, обозначающих последовательное расположение соединений нуклеотидов в ДНКа и РНКа, которая соответствует другой знаковой системе, отображающей последовательность аминокислотных соединений в молекуле белка.

Это важно!

Когда учёным удалось изучить свойства генетического кода, одним из главных была признана универсальность. Да, как ни странно это звучит, все объединяет один, универсальный, общий генетический код. Формировался он на протяжении большого временного промежутка, и процесс закончился около 3,5 миллиардов лет назад. Следовательно, в структуре кода можно проследить следы его эволюции, от момента зарождения до сегодняшнего дня.

Когда говорится о последовательности расположения элементов в генетическом коде, имеется в виду, что она далеко не хаотична, а имеет строго определённый порядок. И это тоже во многом определяет свойства генетического кода. Это равнозначно расположению букв и слогов в словах. Стоит нарушить привычный порядок, и большинство того, что мы будем читать на книжных или газетных страницах, превратится в нелепую абракадабру.

Основные свойства генетического кода

Обычно код несёт в себе какую-либо информацию, зашифрованную особым образом. Для того чтобы расшифровать кода, необходимо знать отличительные особенности.

Итак, основные свойства генетического кода - это:

  • триплетность;
  • вырожденность или избыточность;
  • однозначность;
  • непрерывность;
  • уже указанная выше универсальность.

Остановимся подробнее на каждом свойстве.

1. Триплетность

Это когда три соединения нуклеотидов образуют последовательную цепочку внутри молекулы (т.е. ДНК или же РНК). В результате создаётся соединение триплета или кодирует одну из аминокислот, место её нахождения в цепи пептидов.

Различают кодоны (они же кодовые слова!) по их последовательности соединения и по типу тех азотистых соединений (нуклеотидов), которые входят в их состав.

В генетике принято выделять 64 кодоновых типа. Они могут образовывать комбинации из четырёх типов нуклеотидов по 3 в каждом. Это равносильно возведению числа 4 в третью степень. Таким образом, возможно образование 64-х нуклеотидных комбинаций.

2. Избыточность генетического кода

Это свойство прослеживается тогда, когда для шифрования одной аминокислоты требуется несколько кодонов, обычно в пределах 2-6. И только и триптофана можно кодировать с помощью одного триплета.

3. Однозначность

Она входит в свойства генетического кода как показатель здоровой генной наследственности. Например, о хорошем состоянии крови, о нормальном гемоглобине может рассказать медикам стоящий на шестом месте в цепочке триплет ГАА. Именно он несёт информацию о гемоглобине, и им же кодируется А если человек болен анемией, один из нуклеотидов заменяется на другую букву кода - У, что и является сигналом заболевания.

4. Непрерывность

При записи этого свойства генетического кода следует помнить, что кодоны, как звенья цепочки, располагаются не на расстоянии, а в прямой близости, друг за другом в нуклеиновой кислотной цепи, и цепь эта не прерывается - в ней нет начала или конца.

5. Универсальность

Никогда не следует забывать, что всё сущее на Земле объединено общим генетическим кодом. И потому у примата и человека, у насекомого и птицы, столетнего баобаба и едва проклюнувшейся из-под земли травинки одинаковыми триплетами кодируются схожие аминокислоты.

Именно в генах заложена основная информация о свойствах того или иного организма, своего рода программа, которую организм получает в наследство от живших ранее и которая существует как генетический код.

ГЕНЕТИЧЕСКИЙ КОД (греч, genetikos относящийся к происхождению; син.: код, биологический код, аминокислотный код, белковый код, код нуклеиновых к-т ) - система записи наследственной информации в молекулах нуклеиновых кислот животных, растений, бактерий и вирусов чередованием последовательности нуклеотидов.

Генетическая информация (рис.) из клетки в клетку, из поколения в поколение, за исключением РНК-содержащих вирусов, передается путем редупликации молекул ДНК (см. Репликация). Реализация наследственной информации ДНК в процессе жизнедеятельности клетки осуществляется через 3 типа РНК: информационную (иРНК или мРНК), рибосомную (рРНК) и транспортную (тРНК), которые с помощью фермента РНК-полимеразы синтезируются на ДНК как на матрице. При этом последовательность нуклеотидов в молекуле ДНК однозначно определяет последовательность нуклеотидов во всех трех типах РНК (см. Транскрипция). Информацию гена (см.), кодирующего белковую молекулу, несет только иРНК. Конечным продуктом реализации наследственной информации является синтез белковых молекул, специфичность которых определяется последовательностью входящих в них аминокислот (см. Трансляция).

Поскольку в составе ДНК или РНК представлено только по 4 разных азотистых основания [в ДНК - аденин (А), тимин (Т), гуанин (Г), цитозин (Ц); в РНК - аденин (А), урацил (У), цитозин (Ц), гуанин (Г)], последовательность которых определяет последовательность 20 аминокислот в составе белка, возникает проблема Г. к., т. е. проблема перевода 4-буквенного алфавита нуклеиновых к-т в 20-буквенный алфавит полипептидов.

Впервые идея матричного синтеза белковых молекул с правильным предсказанием свойств гипотетической матрицы была сформулирована Н. К. Кольцовым в 1928 г. В 1944 г. Эйвери (О. Avery) с соавт, установил, что за передачу наследственных признаков при трансформации у пневмококков ответственны молекулы ДНК. В 1948 г. Чаргафф (E. Chargaff) показал, что во всех молекулах ДНК имеет место количественное равенство соответствующих нуклеотидов (А-T, Г-Ц). В 1953 г. Ф. Крик, Дж. Уотсон и Уилкинс (М. H. F. Wilkins), исходя из этого правила и данных рентгеноструктурного анализа (см.), пришли к выводу, что молекул а ДНК представляет собой двойную спираль, состоящую из двух полинуклеотидных нитей, соединенных между собой водородными связями. Причем против А одной цепи во второй может находиться только Т, против Г - только Ц. Эта комплементарность приводит к тому, что последовательность нуклеотидов одной цепи однозначно определяет последовательность другой. Второй существенный вывод, вытекающий из этой модели,- молекула ДНК способна к самовоспроизведению.

В 1954 г. Гамов (G. Gamow) сформулировал проблему Г. к. в ее современном виде. В 1957 г. Ф. Крик высказал Гипотезу адаптера, предположив, что аминокислоты взаимодействуют с нуклеиновой к-той не непосредственно, а через посредников (теперь известных под названием тРНК). В ближайшие после этого годы все принципиальные звенья общей схемы передачи генетической информации, вначале гипотетичные, были подтверждены экспериментально. В 1957 г. были открыты иРНК [А. С. Спирин, А. Н. Белозерский с соавт.; Фолькин и Астрахан (E. Volkin, L. Astrachan)] и тРНК [Хоугленд (М. В. Hoagland)]; в 1960 г. синтезирована ДНК вне клетки с использованием в качестве матрицы существующих макромолекул ДНК (А. Корнберг) и открыт ДНК-зависимый синтез РНК [Вейсс (S. В. Weiss) с соавт.]. В 1961 г. была создана бесклеточная система, в к-рой в присутствии естественной РНК или синтетических полирибонуклеотидов осуществлялся синтез белковоподобных веществ [М. Ниренберг и Маттеи (J. H. Matthaei)]. Проблема познания Г. к. состояла из исследования общих свойств кода и собственно его расшифровки, т. е. выяснения, какие комбинации нуклеотидов (кодоны) кодируют определенные аминокислоты.

Общие свойства кода были выяснены независимо от его расшифровки и в основном до нее путем анализа молекулярных закономерностей образования мутаций (Ф. Крик и соавт., 1961; Н. В. Лучник, 1963). Они сводятся к следующему:

1. Код универсален, т. е. идентичен, по крайней мере в основном, для всех живых существ.

2. Код триплетен, т. е. каждая аминокислота кодируется тройкой нуклеотидов.

3. Код неперекрывающийся, т. е. данный нуклеотид не может входить в состав более чем одного кодона.

4. Код вырожден, т. е. одна аминокислота может кодироваться несколькими триплетами.

5. Информация о первичной структуре белка считывается с иРНК последовательно, начиная с фиксированной точки.

6. Большинство возможных триплетов имеет «смысл», т. е. кодирует аминокислоты.

7. Из трех «букв» кодона преимущественное значение имеют лишь две (облигатные), третья же (факультативная) несет значительно меньшую информацию.

Прямая расшифровка кода состояла бы в сравнении последовательности нуклеотидов в структурном гене (или синтезированной на нем иРНК) с последовательностью аминокислот в соответствующем белке. Однако такой путь пока технически невозможен. Были применены два других пути: синтез белка в бесклеточной системе с использованием в качестве матрицы искусственных полирибонуклеотидов известного состава и анализ молекулярных закономерностей образования мутаций (см.). Первый принес положительные результаты раньше и исторически сыграл в расшифровке Г. к. большую роль.

В 1961 г. М. Ниренберг и Маттеи применили в качестве матрицы гомо-полимер - синтетическую полиуридиловую к-ту (т. е. искусственную РНК состава УУУУ...) и получили полифенилаланин. Из этого следовало, что кодон фенилаланина состоит из нескольких У, т. е. в случае триплетного кода расшифровывается как УУУ. Позже наряду с гомополимерами были использованы полирибонуклеотиды, состоявшие из разных нуклеотидов. При этом был известен только состав полимеров, расположение же нуклеотидов в них было статистическим, поэтому и анализ результатов был статистическим и давал косвенные выводы. Довольно быстро удалось найти хотя бы по одному триплету для всех 20 аминокислот. Выяснилось, что присутствие органических растворителей, изменение pH или температуры, некоторые катионы и особенно антибиотики делают код неоднозначным: те же кодоны начинают стимулировать включение других аминокислот, в некоторых случаях один кодон начинал кодировать до четырех разных аминокислот. Стрептомицин влиял на считывание информации как в бесклеточных системах, так и in vivo, причем был эффективен только на стрептомицинчувствительных штаммах бактерий. У стрептомицинзависимых штаммов он «исправлял» считывание с кодонов, изменившихся в результате мутации. Подобные результаты давали основание сомневаться в правильности расшифровки Г. к. с помощью бесклеточной системы; требовалось подтверждение, и в первую очередь данными in vivo.

Основные данные о Г. к. in vivo получены при анализе аминокислотного состава белков у организмов, обработанных мутагенами (см.) с известным механизмом действия, напр, азотистой к-той, к-рая вызывает в молекуле ДНК замену Ц на У и А на Г. Полезную информацию дают также анализ мутаций, вызванных неспецифическими мутагенами, сравнение различий в первичной структуре родственных белков у разных видов, корреляция между составом ДНК и белков и т. п.

Расшифровка Г. к. на основании данных in vivo и in vitro дала совпадающие результаты. Позже были разработаны три других метода расшифровки кода в бесклеточных системах: связывание аминоацил-тРНК (т. е. тРНК с присоединенной активированной аминокислотой) тринуклеотидами известного состава (М. Ниренберг и соавт., 1965), связывание аминоацил-тРНК полинуклеотидами, начинающимися с определенного триплета (Маттеи с соавт., 1966), и использование в качестве иРНК полимеров, в которых известен не только состав, но и порядок нуклеотидов (X. Корана и соавт., 1965). Все три метода дополняют друг друга, а результаты находятся в соответствии с данными, полученными в опытах in vivo.

В 70-х гг. 20 в. появились методы особенно надежной проверки результатов расшифровки Г. к. Известно, что мутации, возникающие под действием профлавина, состоят в выпадении или вставке отдельных нуклеотидов, что приводит к сдвигу рамки считывания. У фага Т4 был вызван профлавином ряд мутаций, при которых изменился состав лизоцима. Этот состав был проанализирован и сопоставлен с теми кодонами, которые должны были получиться при сдвиге рамки считывания. Получилось полное соответствие. Дополнительно этот метод позволил установить, какие именно триплеты вырожденного кода кодируют каждую из аминокислот. В 1970 г. Адамсу (J. М. Adams) с сотрудниками удалось провести частичную расшифровку Г. к. прямым методом: у фага R17 определили последовательность оснований во фрагменте длиной в 57 нуклеотидов и сравнили с аминокислотной последовательностью белка его оболочки. Результаты полностью совпали с полученными менее прямыми методами. Т. о., код расшифрован полностью и верно.

Результаты расшифровки сведены в таблицу. В ней указан состав кодонов и РНК. Состав антикодонов тРНК комплементарен кодонам иРНК, т. е. вместо У в них находится А, вместо А - У, вместо Ц - Г и вместо Г - Ц, и соответствует кодонам структурного гена (той нити ДНК, с к-рой считывается информация) с той лишь разницей, что место тимина занимает урацил. Из 64 триплетов, которые могут быть образованы сочетанием 4 нуклеотидов, 61 имеет «смысл», т. е. кодирует аминокислоты, а 3 являются «нонсенсами» (лишенными смысла). Между составом триплетов и их смыслом имеется довольно четкая зависимость, к-рая была обнаружена еще при анализе общих свойств кода. В ряде случаев триплеты, кодирующие определенную аминокислоту (напр., пролин, аланин), характеризуются тем, что два первых нуклеотида (облигатные) у них одинаковы, а третий (факультативный) может быть любым. В других случаях (при кодировании, напр., аспарагина, глутамина) один и тот же смысл имеют два сходных триплета, у которых совпадают два первых нуклеотида, а на месте третьего стоит любой пурин или любой пиримидин.

Нонсенс-кодоны, 2 из которых имеют специальные названия, соответствующие обозначению фаговых мутантов (УАА-охра, УАГ-амбер, УГА-опал), хотя и не кодируют каких-либо аминокислот, но имеют большое значение при считывании информации, кодируя конец полипептидной цепи.

Считывание информации происходит в направлении от 5 1 -> 3 1 - к концу нуклеотидной цепи (см. Дезоксирибонуклеиновые кислоты). При этом синтез белка идет от аминокислоты со свободной аминогруппой к аминокислоте со свободной карбоксильной группой. Начало синтеза кодируется триплетами АУГ и ГУГ, которые в этом случае включают специфичную стартовую аминоацил-тРНК, а именно N-формилметио-нил-тРНК. Эти же триплеты при локализации внутри цепи кодируют соответственно метионин и валин. Неоднозначность снимается тем, что началу считывания предшествует нонсенс. Есть данные, говорящие в пользу того, что граница между участками иРНК, кодирующими разные белки, состоит более чем из двух триплетов и что в этих местах меняется вторичная структура РНК; этот вопрос находится в стадии исследования. Если нонсенс-кодон возникает внутри структурного гена, то соответствующий белок строится только до места расположения этого кодона.

Открытие и расшифровка генетического кода - выдающееся достижение молекулярной биологии - оказало влияние на все биол, науки, положив в ряде случаев начало развитию специальных крупных разделов (см. Молекулярная генетика). Эффект открытия Г. к. и связанных с ним исследований сравнивают с тем эффектом, который оказала на биол, науки теория Дарвина.

Универсальность Г. к. является прямым доказательством универсальности основных молекулярных механизмов жизни у всех представителей органического мира. Между тем большие различия в функциях генетического аппарата и его строении при переходе от прокариотов к эукариотам и от одноклеточных к многоклеточным, вероятно, связаны и с молекулярными различиями, исследование которых - одна из задач будущего. Поскольку исследования Г. к.- дело лишь последних лет, значение полученных результатов для практической медицины носит лишь Косвенный характер, позволяя пока понять природу заболеваний, механизм действия возбудителей болезней и лекарственных веществ. Однако открытие таких явлений, как трансформация (см.), трансдукция (см.), супрессия (см.), указывает на принципиальную возможность исправления патологически измененной наследственной информации или ее коррекции - так наз. генная инженерия (см.).

Таблица. ГЕНЕТИЧЕСКИЙ КОД

Первый нуклеотид кодона

Второй нуклеотид кодона

Третий, нуклеотид кодона

Фенилаланин

J Нонсенс

Триптофан

Гистидин

Глутаминовая кислота

Изолейцин

Аспарагиновая

Метионин

Аспарагин

Глутамин

* Кодирует конец цепи.

** Кодирует также начало цепи.

Библиография: Ичас М. Биологический код, пер. с англ., М., 1971; Лучник Н.Б. Биофизика цитогенетических поражений и генетический код, Л., 1968; Молекулярная генетика, пер. с англ., под ред. А. Н. Белозерского, ч. 1, М., 1964; Нуклеиновые кислоты, пер. с англ., под ред. А. Н. Белозерского, М., 1965; Уотсон Дж. Д. Молекулярная биология гена, пер. с англ., М., 1967; Физиологическая генетика, под ред. М. Е. Лобашева С. Г., Инге-Вечтомо-ва, Л., 1976, библиогр.; Desoxyribonuc-leins&ure, Schlttssel des Lebens, hrsg. v„ E. Geissler, B., 1972; The genetic code, Gold Spr. Harb. Symp. quant. Biol., v. 31, 1966; W o e s e C. R. The genetic code, N. Y. a. o., 1967.

ГЕНЕТИЧЕСКИЙ КОД, система записи наследственной информации в виде последовательности оснований нуклеотидов в молекулах ДНК (у некоторых вирусов - РНК), определяющая первичную структуру (расположение аминокислотных остатков) в молекулах белков (полипептидов). Проблема генетического кода была сформулирована после доказательства генетической роли ДНК (американские микробиологи О. Эйвери, К. Мак-Леод, М. Маккарти, 1944) и расшифровки её структуры (Дж. Уотсон, Ф. Крик, 1953), после установления того, что гены определяют структуру и функции ферментов (принцип «один ген - один фермент» Дж. Бидла и Э. Тейтема, 1941) и что существует зависимость пространственной структуры и активности белка от его первичной структуры (Ф. Сенгер, 1955). Вопрос о том, как комбинации из 4 оснований нуклеиновых кислот определяют чередование 20 обычных аминокислотных остатков в полипептидах, впервые поставил Г. Гамов в 1954 году.

На основании эксперимента, в котором исследовали взаимодействия вставок и выпадений пары нуклеотидов, в одном из генов бактериофага Т4 Ф. Крик и другие учёные в 1961 году определили общие свойства генетического кода: триплетность, т. е. каждому аминокислотному остатку в полипептидной цепи соответствует набор из трёх оснований (триплет, или кодон) в ДНК гена; считывание кодонов в пределах гена идёт с фиксированной точки, в одном направлении и «без запятых», то есть кодоны не отделены какими-либо знаками друг от друга; вырожденность, или избыточность, - один и тот же аминокислотный остаток могут кодировать несколько кодонов (кодоны-синонимы). Авторы предположили, что кодоны не перекрываются (каждое основание принадлежит только одному кодону). Прямое изучение кодирующей способности триплетов было продолжено с использованием бесклеточной системы синтеза белка под контролем синтетической матричной РНК (мРНК). К 1965 году генетический код был полностью расшифрован в работах С. Очоа, М. Ниренберга и Х. Г. Кораны. Раскрытие тайны генетического кода явилось одним из выдающихся достижений биологии в 20 веке.

Реализация генетического кода в клетке происходит в ходе двух матричных процессов - транскрипции и трансляции. Посредником между геном и белком является мРНК, образующаяся в процессе транскрипции на одной из нитей ДНК. При этом последовательность оснований ДНК, несущая информацию о первичной структуре белка, «переписывается» в виде последовательности оснований мРНК. Затем в ходе трансляции на рибосомах последовательность нуклеотидов мРНК считывается транспортными РНК (тРНК). Последние имеют акцепторный конец, к которому присоединяется аминокислотный остаток, и адаптерный конец, или антикодон-триплет, который узнаёт соответствующий кодон мРНК. Взаимодействие кодона и анти-кодона происходит на основании комплементарного спаривания оснований: Аденин (А) - Урацил (U), Гуанин (G) - Цитозин (С); при этом последовательность оснований мРНК переводится в аминокислотную последовательность синтезирующегося белка. Различные организмы используют для одной и той же аминокислоты разные кодоны-синонимы с разной частотой. Считывание мРНК, кодирующей полипептидную цепь, начинается (инициируется) с кодона AUG, соответствующего аминокислоте метионину. Реже у прокариот инициирующими кодонами служат GUG (валин), UUG (лейцин), AUU (изолейцин), у эукариот - UUG (лейцин), AUA (изолейцин), ACG (треонин), CUG (лейцин). Это задаёт так называемую рамку, или фазу, считывания при трансляции, то есть далее всю нуклеотидную последовательность мРНК считывают триплет за триплетом тРНК до тех пор, пока на мРНК не встретится любой из трёх кодонов-терминаторов, часто называемых стоп-кодонами: UAA, UAG, UGA (таблица). Считывание этих триплетов приводит к завершению синтеза полипептидной цепи.

Кодоны AUG и стоп-кодоны стоят соответственно в начале и в конце участков мРНК, кодирующих полипептиды.

Генетический кода квазиуниверсален. Это значит, что существуют небольшие вариации в значении некоторых кодонов у разных объектов, и это касается, прежде всего, кодонов-терминаторов, которые могут быть значащими; например, в митохондриях некоторых эукариот и у микоплазм UGA кодирует триптофан. Кроме того, в некоторых мРНК бактерий и эукариот UGA кодирует необычную аминокислоту - селеноцистеин, а UAG у одной из архебактерий - пирролизин.

Существует точка зрения, согласно которой генетический кода возник случайно (гипотеза «замороженного случая»). Более вероятно, что он эволюционировал. В пользу такого предположения говорит существование более простого и, по-видимому, более древнего варианта кода, который считывается в митохондриях согласно правилу «два из трёх», когда аминокислоту определяют только два из трёх оснований в триплете.

Лит.: Crick F. Н. а. о. General nature of the genetic code for proteins // Nature. 1961. Vol. 192; The genetic code. N. Y., 1966; Ичас М. Биологический код. М., 1971; Инге-Вечтомов С. Г. Как читается генетический код: правила и исключения // Современное естествознание. М., 2000. Т. 8; Ратнер В. А. Генетический код как система // Соросовский образовательный журнал. 2000. Т. 6. № 3.

С. Г. Инге-Вечтомов.

Классификация генов

1)По характеру взаимодействия в аллельной паре:

Доминантный (ген, способный подавлять проявление аллельного ему рецессивного гена); - рецессивный (ген, проявление которого подавлено аллельным ему доминантным геном).

2)Функциональная классификация:

2) Генетический код - это определенные сочетания нуклеотидов и последовательность их расположения в молекуле ДНК. Это свойственный всем живым организмам способ кодирования аминокислотной последовательности белков при помощи последовательности нуклеотидов.

В ДНК используется четыре нуклеотида - аденин (А), гуанин (G), цитозин (С), тимин (T), которые в русскоязычной литературе обозначаются буквами А, Г, Т и Ц. Эти буквы составляют алфавит генетического кода. В РНК используются те же нуклеотиды, за исключением тимина, который заменён похожим нуклеотидом - урацилом, который обозначается буквой U (У в русскоязычной литературе). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Для построения белков в природе используется 20 различных аминокислот. Каждый белок представляет собой цепочку или несколько цепочек аминокислот в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства. Набор аминокиcлот также универсален для почти всех живых организмов.

Реализация генетической информации в живых клетках (то есть синтез белка, кодируемого геном) осуществляется при помощи двух матричных процессов: транскрипции (то есть синтеза иРНК на матрице ДНК) и трансляции генетического кода в аминокислотную последовательность (синтез полипептидной цепи на матрице иРНК). Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трёх последовательных нуклеотидов. Набор из трёх нуклеотидов называется триплетом. Принятые сокращения, соответствующие аминокислотам и кодонам, изображены на рисунке.

Свойства генетического кода

1. Триплетность - значащей единицей кода является сочетание трех нуклеотидов (триплет, или кодон).

2. Непрерывность - между триплетами нет знаков препинания, то есть информация считывается непрерывно.

3. Дискретность - один и тот же нуклеотид не может входить одновременно в состав двух или болеетриплетов.

4. Специфичность - определенный кодон соответствует только одной аминокислоте.

5. Вырожденность (избыточность) - одной и той же аминокислоте может соответствовать несколько кодонов.

6. Универсальность - генетический код работает одинаково в организмах разного уровня сложности - от вирусов до человека. (на этом основаны методы генной инженерии)

3) транскрипция - процесс синтеза РНК с использованием ДНК в качестве матрицы, происходящий во всех живых клетках. Другими словами, это перенос генетической информации с ДНК на РНК.

Транскрипция катализируется ферментом ДНК-зависимой РНК-полимеразой. Процесс синтеза РНК протекает в направлении от 5"- к 3"- концу, то есть по матричной цепи ДНК РНК-полимераза движется в направлении 3"->5"

Транскрипция состоит из стадий инициации, элонгации и терминации.

Инициация транскрипции - сложный процесс, зависящий от последовательности ДНК вблизи транскрибируемой последовательности (а у эукариот также и от более далеких участков генома - энхансеров и сайленсеров) и от наличия или отсутствия различных белковых факторов.

Элонгация - продолжается дальнейшее расплетение ДНК и синтез РНК по кодирующей цепи. он равно как и синтез ДНК осуществляется в направлении 5-3

Терминация - как только полимераза достигает терминатора, она немедленно отщепляется от ДНК, локальный гибрид ДНК - РНК разрушается и новосинтезированная РНК траспортируется из ядра в цитоплазму на этом транскрипция завершается.

Процессинг - совокупность реакций, ведущих к превращению первичных продуктов транскрипции и трансляции в функционирующие молекулы. П. подвергаются функционально неактивные молекулы-предшественники разл. рибонуклеиновых к-т (тРНК, рРНК, мРНК) и мн. белков.

В процессе синтеза катаболических ферментов (расщепляющих суб-страты) у прокариот происходит индуцируемый синтез ферментов. Это дает клетке возможность приспосабливаться к условиям окружающей среды и экономить энергию, прекращая синтез соответствующего фермента, если потребность в нем исчезает.
Для индукции синтеза катаболических ферментов обязательны следующие условия:

1. Фермент синтезируется только тогда, когда расщепление соответствующего субстрата необходимо для клетки.
2. Концентрация субстрата в среде должна превысить определенный уровень, прежде чем соответствующий фермент сможет образоваться.
Наиболее хорошо изучен механизм регуляции экспрессии генов у кишечной палочки на примере lac-оперона, контролирующего синтез трех катаболических ферментов, расщепляющих лактозу. Если в клетке много глюкозы и мало лактозы, промотор остается неактивным, а на операторе находится белок репрессор - блокируется транскрипция lac-оперона. Когда количество глюкозы в среде, а следовательно и в клетке, уменьшается, а лактозы увеличивается, происходят следующие события: количество циклического аденозинмонофосфата увеличивается, он связывается с САР -белком - этот комплекс активирует промотор, с которым соединяется РНК-полимераза; в это же время избыток лактозы соединяется с белком-репрессором и освобождает от него оператор - путь для РНК-полимеразы открыт, начинается транскрипция структурных генов lac -оперона. Лактоза выступает в качестве индуктора синтеза тех ферментов, которые её расщепляют.

5) Регуляция экспрессии генов у эукариот протекает намного сложнее. Различные типы клеток многоклеточного эукариотического организма синтезируют ряд одинаковых белков и в то же время они отличаются друг от друга набором белков, специфичных для клеток данного типа. Уровень продукции зависит от типа клеток, а также от стадии развития организма. Регуляция экспрессии генов осуществляется на уровне клетки и на уровне организма. Гены эукариотических клеток делятся на два основных вида: первый определяет универсальность клеточных функций, второй – детерминирует (определяет) специализированные клеточные функции. Функции генов первой группы прояв­ляются во всех клетках . Для осуществления дифференцированных функций специализированные клетки должны экспрессировать определенный набор генов.
Хромосомы, гены и опероны эукариотических клеток имеют ряд структурно-функциональных особенностей, что объясняет сложность экспрессии генов.
1. Опероны эукариотических клеток имеют несколько генов - регуляторов, которые могут располагаться в разных хромосомах.
2. Структурные гены, контролирующие синтез ферментов одного биохимического процесса, могут быть сосредоточены в нескольких оперонах, расположенных не только в одной молекуле ДНК, но и в нескольких.
3. Сложная последовательность молекулы ДНК. Имеются информативные и неинформативные участки, уникальные и многократно повторяющиеся информативные последовательности нуклеотидов.
4. Эукариотические гены состоят из экзонов и интронов, причем созревание и-РНК сопровождается вырезанием интронов из соответствующих первичных РНК-транскриптов (про-и-РНК), т.е. сплайсингом.
5. Процесс транскрипции генов зависит от состояния хроматина. Локальная компактизация ДНК полностью блокирует синтез РНК.
6. Транскрипция в эукариотических клетках не всегда сопряжена с трансляцией. Синтезированная и-РНК может длительное время сохраняться в виде информосом. Транскрипция и трансляция проис­ходят в разных компартментах.
7. Некоторые гены эукариот имеют непостоянную локализа­цию (лабильные гены или транспозоны).
8. Методы молекулярной биологии выявили тормозящее действие белков-гистонов на синтез и-РНК.
9. В процессе развития и дифференцировки органов активность генов зависит от гормонов, циркулирующих в организме и вызывающих специфические реакции в определенных клетках. У млекопитаю­щих важное значение имеет действие половых гормонов.
10. У эукариот на каждом этапе онтогенеза экспрессировано 5-10% генов, остальные должны быть заблокированы.

6) репарация генетического материала

Репарация генетическая - процесс устранения генетических повреждений и восстановления наследственного аппарата, протекающий в клетках живых организмов под действием специальных ферментов. Способность клеток к репарации генетических повреждений впервые была обнаружена в 1949 году американским генетиком А.Кельнером.Репарация - особая функция клеток, заключающаяся в способности исправлять химические повреждения и разрывы в молекулах ДНК, повреждённой при нормальном биосинтезе ДНК в клетке или в результате воздействия физических или химических агентов. Осуществляется специальными ферментными системами клетки. Ряд наследственных болезней (напр., пигментная ксеродерма) связан с нарушениями систем репарации.

виды репараций:

Прямая репарация наиболее простой путь устранения повреждений в ДНК, в котором обычно задействованы специфические ферменты, способные быстро (как правило, в одну стадию) устранять соответствующее повреждение, восстанавливая исходную структуру нуклеотидов. Так действует, например, O6-метилгуанин-ДНК-метилтрансфераза, которая снимает метильную группу с азотистого основания на один из собственных остатков цистеина.

К серии статей, описывающих происхождение ГК, можно относиться как к расследованию событий, о которых у нас осталось очень немало следов. Однако для понимания этих статей необходимо немного приложить усилий для вникания в молекулярные механизмы синтеза белка. Данная статья является вступительной для серии автопубликаций, посвященных возникновению генетического кода, и с неё лучше всего начинать знакомство с этой темой.
Обычно генетический код (ГК) определяют как способ (правило) кодирования белка на первичной структуре ДНК или РНК. В литературе чаще всего пишут, что это - однозначное соответствие последовательности из трёх нуклеотидов в гене одной аминокислоте в синтезируемом белке или месту окончания синтеза белка. Однако в таком определении есть две ошибки. При этом подразумеваются 20, так называемых канонических аминокислот, которые входят в состав белков всех без исключения живых организмов. Эти аминокислоты являются мономерами белка. Ошибки следующие:

1) Канонических аминокислот не 20, а только 19. Аминокислотой мы можем называть вещество, которое одновременно содержит аминогруппу -NH 2 и карбоксильную группу - COOH. Дело в том, что мономер белка - пролин - аминокислотой не является, поскольку в нём вместо аминогруппы присутствует иминогруппа, поэтому пролин правильней называть иминокислотой. Однако в дальнейшем во всех статьях, посвящённых ГК, для удобства я буду писать о 20 аминокислотах, подразумевая указанный ньюанс. Структуры аминокислоты приведены на рис. 1.

Рис. 1. Структуры канонических аминокислот. Аминокислоты имеют константные части, обозначенные на рисунке чёрным цветом, и вариабельные (или радикалы), обозначенные красным.

2) Соответствие аминокислот кодонам не всегда является однозначным. О нарушении случаев однозначности см. ниже.

Возникновение ГК означает возникновение кодируемого синтеза белка. Это событие является одним из ключевых для эволюционного формирования первых живых организмов.

Структура ГК представлена в круговой форме на рис. 2.



Рис. 2. Генетический код в круговой форме. Внутренний круг - первая буква кодона, второй круг - вторая буква кодона, третий круг - третья буква кодона, четвертый круг - обозначения аминокислот в трехбуквенном сокращении; П - полярные аминокислоты, НП - неполярные аминокислоты. Для наглядности симметрии важен избранный порядок символов U - C - A - G .

Итак, приступим к описанию основных свойств ГК.

1. Триплетность. Каждая аминокислота кодируется последовательностью из трёх нуклеотидов.

2. Наличие межгенных знаков препинания. К межгенным знакам препинания относятся последовательности нуклеиновой кислоты, на которых трансляци я начинается или заканчивается.

Трансляци я может начаться не с любого кодона, а только со строго определённого - стартового . К стартовому кодону относится триплет AUG , с которого начинается трансляци я. В этом случае этот триплет кодирует или метионин, или другую аминокислоту - формилметионин (у прокариот), который может включаться только в начале синтеза белка. В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х терминирующих кодонов , или стоп-сигналов : UAA, UAG, UGA. Они терминируют трансляци ю (так называется синтез белка на рибосоме).

3. Компактность, или отсутствие внутригенных знаков препинания. Внутри гена каждый нуклеотид входит в состав значащего кодона.

4. Неперекрываемость. Кодоны не перекрываются друг с другом, каждый имеет своё упорядочённое множестов нуклеотидов, которое не перекрывается с аналогичными множествами соседних кодонов.

5. Вырожденность. Обратное соответствие в направлении аминокислота-кодон неоднозначно. Это свойство называется вырожденностью. Серия - это множество кодонов, кодирующих одну аминокислоту, другими словами, это группа эквивалентных кодонов . Представим себе кодон в виде XYZ. Если XY определяет “смысл ” (т.е. аминокислоту), то кодон называется сильным . Если же для определения смысл а кодона нужен определенный Z, то такой кодон называется слабым .

Вырожденность кода тесно связана с неоднозначностью спаривания кодон-антикодон (под антикодоном подразумевается последовательность из трёх нуклеотидов на тРНК , которая может комплементарно спариваться с кодоном на матричной РНК (см. более подробно об этом две статьи: Молекулярные механизмы обеспечения вырожденности кода и Правило Лагерквиста. Физико-химическое обоснование симметрий и соотношений Румера ). Один антикодон на тРНК может узнавать отодного до трёх кодонов на мРНК.

6. Однозначность. Каждый триплет кодирует лишь одну аминокислоту или является терминатором трансляци и.

Известно три исключения.

Первое. У прокариот в первой позиции (заглавная буква) он кодирует формилметионин, а в любой другой - метионин.В начале гена формилметионин кодируется как обычным метиониновым кодоном AUG , так и ещё валиновым кодоном GUG или лейциновым UUG , которые внутри гена кодируют валин и лейцин, соответственно.

Во многих белках формилметионин отщепляется, либо удаляется формильная группа, в результате чего формилметионин превращается в обычный метионин.

Второе. В 1986 году сразу несколько групп исследователей обнаружили, что на мРНК терминирующий кодон UGA может кодировать селеноцистеин (см. рис. 3) при условии, что за ним следует особая последовательность нуклеотидов.

Рис. 3. Структура 21-й аминокислоты - селеноцистеина.

У E. coli (это латинское название кишечной палочки) селеноцистеил-тРНК в процессе трансляци и распознает в мРНК кодон UGA, но лишь в определенном контекст е: для узнавания UGA-кодона как осмысл енного важна последовательность длиной в 45 нуклеотидов, расположенная вслед за UGA-кодоном.

Рассмотренный пример показывает, что при необходимости живой организм может изменять смысл стандартного генетического кода. В этом случае генетическая информация, заключенная в генах, кодируется более сложным образом. Смысл кодона определяется в контекст е с определенной протяженной последовательностью нуклеотидов и при участии нескольких высокоспецифических белковых факторов. Важно, что селеноцистеиновая тРНК обнаружена в представителях всех трёх ветвей жизни (архей, эубактерий и эукариот), что указывает на древность происхождения селеноцистеинового синтеза, и возможно на присутствие его ещё в последнем универсальном общем предке (о нём речь пойдёт в других статьях). Скорей всего селеноцистеин встречается у всех без исключения живых организмов. Но в каждом отдельном организме селеноцистеин встречается не более, чем в паред есятков белков. Он входит в состав активных центров ферментов, в ряде гомологов которых на аналогичной позиции может функционировать обычный цистеин.

До недавнего времени считалось, что кодон UGA может считываться либо как селеноцистеин, либо кактерминальный, но недавно было показано, что у инфузории Euplotes кодон UGA кодирует или цистеин, илиселеноцистеин. См. " Генетический код допускает разночтения "

Третье исключение. У некоторых прокариот (5 видов архей и одной эубактерии - в Википедии информация сильно устарела) встречается особая кислота - пирролизин (рис. 4). Она кодируется триплетом UAG , который в каноническом коде служит терминатором трансляци и. Предполагается, что в этом случае, подобно случаю с кодированием селеноцистеина, считывание UAG как пирролизинового кодона происходит благодаря особой структуре на мРНК. Пирролизиновая тРНК содержит антикодон CTA и аминоацилируется АРСаз ой 2-го класса (про классификацию АРСаз см. статью "Кодазы помогают понять, как возник генетический код ").

UAG в качестве стоп-кодона используется редко, а если и используется, то часто за ним следует другой стоп-кодон.

Рис. 4. Структура 22-й аминокислоты пирролизина.

7. Универсальность. После того, как в середине 60-х годов прошлого века расшифровка ГК была завершена, долгое время считалось, что код одинаков во всех организмах, что указывает на единство происхождения всего живого на Земле.

Попробуем понять, почему ГК универсален. Дело в том, что если бы в организме изменилось хотя бы одно правило кодирования, то это привело бы к тому, что изменилась структура значительной части белков. Такое изменение было бы слишком кардинальным и поэтому практически всегда летальное, так как изменение смысл а только одного кодона может затронуть в среднем 1/64 часть всех аминокислотных последовательностей.

Отсюда следует одна очень важная мысль - ГК почти не менялся со времени своего формирования более 3,5 млрд. лет назад. А, значит, его структура несёт в себе след его возникновения, и анализ этой структуры может помочь понять, как именно мог возникнуть ГК.

В действительности ГК может несколько отличаться у бактерий, митохондрий, ядерный код некоторых инфузорий и дрожжей. Cейчас насчитывают не менее 17 генетических кодов, отличающихся от канонического на 1-5 кодонов Суммарно во всех известных вариантах отклонений от универсального ГК используются 18 различных замен смысл а кодона. Больше всего отклонений от стандартного кода известно у митохондрий - 10. Примечательно, что митохондрии позвоночных, плоских червей, иглокожих, кодируются разными кодами, а плесневых грибков, простейших и кишечнополостных - одним.

Эволюционная близость видов - отнюдь не гарант того, чтобы у них были сходные ГК. Генетические коды могут различаться даже у разных видов микоплазм (одни виды имеют канонический код, а другие - отличающиеся). Аналогичная ситуация наблюдается и для дрожжей.

Важно отметить, что митохондрии - потомки симбиотических организмов, которые приспособились жить внутри клеток. Они имеют сильно редуцированный геном , часть генов переселилась в ядро клетки. Поэтому изменения ГК в них становятся уже не столь кардинальными.

Обнаруженные позднее исключения представляют особый интерес с точки зрения эволюции, поскольку могу помочь пролить свет на механизмы эволюции кода.

Таблица 1.

Митохондриальные коды у различных организмов.

Кодон

Универсальный код

Митохондриальные коды

Позвоночные

Беспозвоночные

Дрожжи

Растения

UGA

STOP

Trp

Trp

Trp

STOP

AUA

Ile

Met

Met

Met

Ile

CUA

Leu

Leu

Leu

Thr

Leu

AGA

Arg

STOP

Ser

Arg

Arg

AGG

Arg

STOP

Ser

Arg

Arg

Три механизма смены аминокислоты, кодируемой кодом.

Первый - когда какой-то кодон не используется (или почти не используется) каким-то организмом в силу неравномерности встречаемости каких-то нуклеотидов (GC -состав), или комбинаций нуклеотидов. В результате такой кодон может вовсе исчезнуть из употребления (например, благодаря потере соответствующей тРНК ), а в дальнейшем может использоваться для кодирования другой аминокислоты без нанесения существенного ущерба организму. Этот механизм возможно отвечает за появление некоторых диалектов кодов у митохондрий.

Второй - превращение стоп-кодона в смысл овой. В этом случае часть у части транслируемых белков могут появиться дополнения. Однако ситуацию частично спасает то, что многие гены часто заканчиваются не одним, а двумя стоп-кодонами, поскольку возможны ошибки трансляци и, при которых стоп-кодоны считываются как аминокислоты.

Третий - возможно неоднозначное считывание определённых кодонов, как это имееют место у некоторых грибов.

8 . Связность. Группы эквивалентных кодонов (то есть кодонов, кодирующих одну и ту же аминокислоту) называются сериями . ГК содержит 21 серию, включая стоп-кодоны. В дальнейшем для определенности любая группа кодонов будет называться связной, если от каждого кодона этой группы можно перейти ко всем другим кодонам этой же группы путем последовательных замен нуклеотидов. Из 21 серии связны 18. 2 серии содержат по одному кодону, и лишь 1 серия для аминокислоты серин является несвязной и распадается на 2 две связные подсерии.


Рис. 5. Графы связности для некоторых кодовых серий. а - связная серия валина; б - связная серия лейцина; серия серина несвязная, распадается на две связных подсерии. Рисунок взят из статьи В.А. Ратнера " Генетический код как система ".

Свойство связности можно объяснить тем, что в период формирования ГК захватывал новые кодоны, которые минимально отличались от уже используемых.

9. Регулярность свойств аминокислот по корням триплетов. Все аминокислоты, кодируемые триплетами скорнем U, являются неполярными, не крайних свойств и размеров, имеюталифатические радикалы. Все триплеты с корнем C имеют сильные основы, ааминокислоты, кодируемые ими, имеют относительно малые размеры. Все триплеты с корнем A имеют слабые основы, кодируют полярные аминокислоты не малых размеров. Кодоны с корнем G характеризуются крайними и аномальнными вариантами аминокислот и серий. Они кодируют самую маленькую аминокислоту (глицин), самую длинную и плоскую (триптофан), самую длинную и «корявую» (аргинин), самую реактивную (цистеин), образует аномальную подсерию для серина.

10. Блочность. Универсальный ГК является «блоковым» кодом. Это означает, что аминокислоты со сходными физико-химическими свойствами, кодируются кодонами, отличающимися друг от друга одним основанием. Блочность кода хорошо видна на следующем рисунке.


Рис. 6. Блочная структура ГК. Белым цветом обозначены аминокислоты с алкильной группой.


Рис. 7. Цветовое представление физико-химических свойств аминокислот, основанное на значениях, описанных в кн книге Стайерса "Биохимия" . Слева - гидрофобность. Справа - способность к формированию альфа-спирали в белке. Красный, жёлтый и голубой цвета обозначают аминокислоты с большой, средней и малой гидрофобностью (слева) или соответствующей степенью способности к формированию альфа-спирали (справа).

Свойство блочности и регулярности также можно объяснить тем, что в период формирования ГК захватывал новые кодоны, которые минимально отличались от уже используемых.

Кодоны с одинаковыми первыми основаниями (приставками кодонов) кодируют аминокислоты с близкими путями биосинтеза . Кодоны аминокислот, принадлежащих к шикиматному , пируватному , аспартатному и глутаматному семействам, имеют в качестве приставок U, G, A и C, соответственно. О путях древнего биосинтеза аминокислот и его связи со свойствами современного кода см. "Древний дублетный генетический код был предопределён путями синтеза аминокислот ". На основе этих данных некоторые исследователи делают вывод о том, что на формирование кода большое влияние оказали биосинтетические взаимоотношения между аминокислотами . Однако сходство биосинтетических путей вовсе не означает сходство физико-химических свойств .

11. Помехоустойчивость. В самом общем виде помехоустойчивость ГК означает, что при случайных точковых мутациях и ошибках трансляци и не очень сильно меняются физико-химические свойства аминокислот.

Замена одного нуклеотида в триплете в большинстве случаев или не приводит к замене кодируемой аминокислоты, или приводит к замене на аминокислоту с той же полярностью.

Один из механизмов, обеспечивающих помехоустойчивость ГК - его вырожденность. Средняя вырожденность равна - число кодируемых сигналов/общее число кодонов, где к кодируемым сигналам относятся 20 аминокислот и знак терминации трансляци и. Усредненная вырожденность для всех аминокислот и знака терминации составляет три кодона на кодируемый сигнал.

Для того, чтобы количественно оценить помехоустойчивость, введём два понятия. Мутации замен нуклеотидов, не приводящие к смене класса кодируемой аминокислоты, называют консервативными. Мутации замен нуклеотидов, приводящие к смене класса кодируемой аминокислоты, называют радикальными .

Каждый триплет допускает 9 однократных замен. Всего кодирующих аминокислоты триплетов 61. Поэтому количество возможных замен нуклеотидов для всех кодонов -

61 x 9 = 549. Из них:

23 замены нуклеотидов приводят к появлению стоп-кодонов.

134 замены не меняют кодируемую аминокислоту.
230 замен не меняют класс кодируемой аминокислоты.
162 замены приводят к смене класса аминокислоты, т.е. являются радикальными.
Из 183 замен 3-его нуклеотида, 7 приводят к появлению терминаторов трансляци и, а 176 - консервативны.
Из 183 замен 1-ого нуклеотида, 9 приводят к появлению терминаторов, 114 - консервативны и 60 - радикальны.
Из 183 замен 2-го нуклеотида, 7 приводят к появлению терминаторов, 74 -консервативны, 102 - радикальны.

На основе этих расчётов получим количественную оценку помехоустойчивости кода, как отношение числа консервативных замен к числу радикальных замен. Оно равно 364/162=2.25

При реальной оценке вклада вырожденности в помехоустойчивость необходимо учитывать частоту встречаемости аминокислот в белках, которая варьирует в разных видах.

В чем причина помехоустойчивости кода? Большинство исследователей считают, что это свойство является следствием селекции альтернативных ГК .

Стивен Фриленд и Лоренс Херст генерировали случайные такие коды и выясняли, что только один из ста альтернативных кодов обладает не меньшей помехоустойчивостью по сравнению с универсальным ГК.
Еще более интересный факт обнаружился, когда эти исследователи ввели дополнительное ограничение, с тем чтобы учесть реально существующие тенденции в характере мутирования ДНК и появлении ошибок при трансляци и. При таких условиях лучше канонического кода оказался ТОЛЬКО ОДИН КОД ИЗ МИЛЛИОНА ВОЗМОЖНЫХ.
Столь беспрецедентную жизнестойкость генетического кода проще всего объяснить тем, что он сформировался в результате естественного отбора. Возможно когда-то в биологическом мире существовало множество кодов, каждый со своей чувствительностью к ошибкам. Организм, лучше справлявшийся с ними, имел больше шансов выжить, и канонический код просто победил в борьбе за существование. Это предположение кажется вполне реальным - ведь мы знаем, что альтернативные коды действительно существуют. Подробнее о помехоустойчивости см. Закодированная эволюция (С.Фриленд, Л. Херст "Закодированная эволюция".//В мире науки. - 2004, №7).

В заключение, предлагаю посчитать число возможных генетических кодов, которые можно сгенерировать для 20 канонических аминокислот. Почему-то это число нигде мне не попадалось. Итак, нам необходимо, чтобы в генерируемых ГК были обязательно 20 аминокислот и стоп-сигнал, кодируемые ХОТЯ БЫ ОДНИМ КОДОНОМ.

Мысленно будем нумеровать кодоны в каком-то порядке. Рассуждать будем следующим образом. Если у нас имеется ровно 21 кодон, то тогда каждая аминокислота и стоп-сигнал будут занимать ровно по одному кодону. В этом случае возможных ГК будет 21!

Если будет 22 кодона, то появляется лишний кодон, который может иметь один из любых 21 смысл ов, причём этот кодон может располагаться на любом из 22 мест, тогда как остальные кодоны имеют ровно по одному разному смысл у, как и для случая 21 кодонов. Тогда получим число комбинаций 21!х(21х22).

Если кодонов будет 23, то рассуждая аналогично, получим, что 21 кодон имеют ровно по одному разных смысл ов (21! вариантов), а два кодона - по 21 разных смысл а (21 2 смысл ов при ФИКСИРОВАННОМ положении этих кодонов). Число различных положений для этих двух кодонов будет 23х22. Общее число вариантов ГК для 23 кодонов - 21!х21 2 х23х22

Если кодонов будет 24 - то число ГК будет равно 21!х21 3 х24х23х22,...

....................................................................................................................

Если кодонов будет 64, то число возможных ГК будет 21!х21 43 х64!/21! = 21 43 х64! ~ 9.1х10 145