Биотехнологии →
Немного о биологии и биоинформатике
Введение
Думаю, все пользователи Хабра знакомы с успехами человечества в области микроэлектроники, подавляющее большинство — покорения космоса, немалая часть — физики. Но почти никто не знает о том, что прямо сейчас в биологии происходит революция, которая изменит нашу жизнь в ближайшие несколько десятилетий не меньше, чем распространение компьютеров. Более того, эта революция напрямую связана с успехами в построении мощных вычислительных систем.Конечно же, какие-то «круги по воде» расходятся. Но далеко не каждый способен сопоставить истерию в СМИ относительно ГМО, слово «рекомбинантный» на пузырьке с интерфероном или инсулином и невнятные (в России) слухи о неком 23andme. На самом деле, все эти явления связаны одной нитью. И распутывать эту нить лучше с самого начала.
Мендель и гены
Начать стоит, пожалуй, с исследований никому на тот момент (XIX век) не известного монаха Менделя (это только сейчас о нём рассказывают в каждой школе). Он заметил странные закономерности в наследовании растениями гороха окраски цветков. Для объяснения этого эффекта он ввёл понятие гена как единицы наследственной информации, проявляемой в наборе внешних признаков (фенотипе). Все гены наследуются парами (аллелями); в паре могут находиться гены, кодирующие две разных вариации конкретного признака; какая же конкретно вариация воплотится в жизнь, определяется характеристиками самого гена. Эта теория очень хорошо объясняла наблюдаемые особенности наследования. Настолько хорошо, что ни для кого не стало сюрпризом обнаружение физического механизма, обуславливающего именно такие законы наследования.
ДНК
Следующей вехой стоит считать открытие Джеймсом Уотсоном и Франсисом Криком в 1953 году структуры ДНК. Нет, конечно же, и до них было известно о наличии некоего вещества, сконцентрированного в ядре клетки и образующего хроматин (видимые в световой микроскоп после специальной окраски запутанные нити), а при делении клетки — хромосомы (гораздо лучше заметные веретенообразные структуры). Но именно Уотсон и Крик показали, что это за вещество и какова его структура.Стоит сделать небольшое отступление и напомнить, что такое ДНК, белки и РНК. ДНК — органический полимер — вещество, составленное из большого количества достаточно простых «кирпичиков». В случае ДНК это нуклеотиды тимин, аденин, гуанин и цитозин, обычно кодируемые буквами T, A, G, C соответственно. ДНК в клетке представляет собой двойную спираль (см. рисунок), состоящую из двух цепочек комплиментарных нуклеотидов: дело в том, что нуклеотиды попарно образуют между собой связи (T-A, G-C). Свойство комплиментарности заставляет одинарные цепочки ДНК, плавающие в растворе, находить свои «пары» и объединяться с ними. Подобная самоорганизация вообще крайне свойственна биохимическим процессам.РНК достаточно сильно похожа на ДНК, но не образует двойную цепочку, в силу чего менее стабильна, но более подвижна и химически активна.Белки представляют из себя полимеры аминокислот. Обычно они строятся по РНК-матрице, которая, в свою очередь, строится по ДНК.
Генная инженерия
После открытия структуры ДНК дальнейшие открытия не заставили себя ждать. Был постепенно сформирован «набор генного инженера» — белки, находимые преимущественно в бактериях и вирусах и позволяющие проводить различные операции над ДНК:
- рестриктазы, разрезающие ДНК в точно определённых местах;
- лигазы, «склеивающие» ДНК обратно;
- транскриптазы, позволяющие транслировать информацию из ДНК в РНК и обратно;
- и многие другие белки.
- Инсулин и интерферон. Раньше для получения этих белков необходимо было использовать тонны внутренностей свиней; сейчас же их производят бактерии буквально из простейших ингредиентов вроде раствора глюкозы.
- Глифосат (он же раундап). По сравнению с другими гербицидами глифосат практически безвреден для животных (летальная доза для взрослого человека измеряется сотнями грамм), при этом летален для всех растений, кроме искуственно генетически модифицированных — другими словами, он полностью решает проблему сорняков, не мешая при этом расти выращиваемой культуре. Собственно, под «генетически модифицированной соей» практически всегда подразумевается именно соя, модифицированная для устойчивости к раундапу. В свете этого особенно забавно смотрятся противники ГМО, фактически призывающие к использованию по-настоящему опасных для людей гербицидов — альтернативы-то нет, без гербицидов все 6.5 миллиардов не прокормить.
Биоинформатика
Совершенствование биологических инструментов принесло новые проблемы: стала очевидной запредельная сложность процессов, протекающих в живой клетке, и гигантское количество информации, которое неспособен анализировать «вручную» ни один человек. Но к этому времени компьютеры получили уже достаточно широкое распространение, чтобы стать очевидным ответом на вопрос о средствах контроля сложности. Так родилась биоинформатика — наука, призванная справляться с огромными объёмами данных, переплетённых внутренними зависимостями и неочевидными закономерностями больше, чем что-либо, известное человечеству ранее. Проблемы, которые она решает, крайне новы, сложны и актуальны для человечества, и именно эта область знания привлекает сейчас умы сильнейших алгоритмистов мира. Практически все они порождаются отставанием на несколько порядков доступных вычислительных мощностей от тех, что необходимы для прямого моделирования происходящих в клетке процессов. Большое количество новостей о построении всё более мощных суперкомпьютеров может создать впечатление о том, что сейчас уже нет проблем с вычислительной мощью и самой сложной задачей современного IT является построение отказоустойчивого чатика на пару миллионов человек — так вот, это не так :) Чем же занимается биоинформатика?
- Сборка последовательностей. Сейчас существует возможность «разобрать» белок или ДНК на составные части, построив последовательность нуклеотидов или аминокислот, из которых он построен (этот процесс называется секвенированием). К сожалению, в силу технических ограничений размер самого большого участка, разбираемого «за раз», в сотни раз меньше целого размера генома человека, при этом концы отрезков фиксированы неточно, а сами отрезки могут дублироваться. Это порождает необходимость собирать геном из небольших участков, пытаясь с помощью эвристик угадать, как именно перекрываются «хвосты» этих участков и в каком порядке их нужно расположить. Для лучшего понимания вычислительной сложности задачи нужно пояснить, что полный геном человека, записанный в виде строки, занимает около 3гб, суммарная же длина участков может превышать длину конечной последовательности в десятки раз.
- Сравнение и сопоставление последовательностей. Двадцать лет назад даже сопоставление двух последовательностей могло стать проблемой; сейчас же, благодаря возросшей мощности компьютеров и разработанным алгоритмам, это уже не является сложной задачей. Тем не менее, стала крайне актуальной проблема множественного сравнения последовательностей; так, например, особенно высокие требования к сопоставлению предъявляет метагеномика: метод классификации бактерий (многие виды которых неотличимы друг от друга под микроскопом), основанный на выделении из массы бактерий смеси из коротких участков ДНК, их секвенирования и исключительно программного сопоставления полученного «супа» из случайных участков ДНК разных бактерий с уже известными геномами бактерий.
- Фолдинг. Функциональность белков (которые являются лучшими катализаторами, известными человечеству, способными провести практически любую реакцию) определяется их трёхмерной структурой. Трёхмерная же структура определяется последовательностью аминокислот в белке и некоторыми действиями, которые клетка совершает над белком после его синтеза. Естественно, для конструирования белков с заданными свойствами принципиально важно уметь предсказывать трёхмерную структуру по линейной последовательности аминокислот. Методы молекулярной динамики (непосредственного моделирования атомов, составлящих молекулу) пасуют на количествах атомов, свойственных белкам (десятки тысяч). Примером сложности структуры белков может являться, например, т.н. белковый автосплайсинг, когда уже синтезированный белок исключительно за счёт собственной структуры вырезает участок своей последовательности и «склеивает» разрез, формируя два разных белка.
- Докинг. Очевидно, белков достаточно много и они взаимодействуют между собой. Докингом называется процесс взаимодействия белков друг с другом и с более простыми молекулами. Расчёт этого взаимодействия включает в себя фолдинг как составную часть, но не ограничивается им.
К каким же именно вершинам ведёт нас биология?
Как я уже заметил во вступлении, наша жизнь в ближайшие пару десятков лет не может не измениться. Мы слишком многое узнали о живом, чтобы это знание осталось бесплодным. Так, например, в прошедшем году произошло событие, сравнимое с высадкой на Луну, но привлекшее значительно меньше внимания — создание первого искуственного организма. Эй, конфессии мира! Мы, люди — создали жизнь! Для этого не нужен Бог! Что дальше?
- Лекарства от рака и СПИДа. Нужно понимать, что между появлением лекарства в лабораториях и на рынке проходит порядка 5-10 лет тестирования и сертификации. Сейчас в лабораториях есть лекарства, способные излечивать некоторые виды рака единственной инъекцией (публикация). Никакой химеотерапии, выпадающих волос, радиации, операций и потери веса. Единственная инъекция. Могли ли мы хотя бы надеяться на это 10 лет назад?
- Настоящие биотехнологии. Растения, не требующие гербицидов и пестицидов; бананы, вызревающие в тундре; трава, способная соперничать с асфальтом по прочности. Всё это возможно и становится реальностью прямо у нас на глазах.
- Настоящая генетическая диагностика. Уже сейчас стартап (хотя можно ли назвать стартапом компанию жены Сергея Брина? :) ) 23andme.com диагностирует десятки наследственных заболеваний и предрасположенностей (которые могут «выстрелить» лет этак в 50) за $200. И это только начало.
- Замедление старения. Вооружившись новыми знаниями, большое количество учёных работает над исследованиями процесса старения. Учитывая взрывной рост развития биологии в последние 10-20 лет — у многих из нас есть неплохой шанс не умереть в ближайшие лет 100 :)
Заключение
Надеюсь, эта краткая экскурсия в современную биологию была интересной. Если кому-то что-то интересно, я могу попробовать написать продолжение на интересующие темы.В заключение могу вынести небольшую мораль: не верьте шарлатанам, утверждающим, что они лучше знают, как устроен человек, и рассказывающим обо всяких «нефиксируемых энергиях», «душе» и прочем. Современная биология почти не оставила совсем тёмных мест в живом, и вероятность того, что для объяснения какого-либо эффекта понадобится привлекать какие-то неизвестные физике материи, исчезающе мала. Живое крайне сложно, но сложность эта проста в своих основах и опирается на реакции, которые каждый может повторить в пробирке без дорогих реактивов и оборудования.Также хотелось бы сказать отдельное спасибо vyahhi и всем людям, сделавшим возможным замечательные курсы по биоинформатике в СПбАУ. Вы очень-очень классные.
17.03.2011 06:52+0300