Руководство по методам и программному обеспечению для прогнозирования структуры белка

Для осуществления своих биологических функций белки складываются в одну или несколько специфических конформаций, продиктованных сложными и обратимыми нековалентными взаимодействиями. Определение структуры белка может быть достигнуто с помощью трудоемкой и относительно дорогой техники, такой как кристаллография, спектроскопия ядерного магнитного резонанса и интерферометрия с двойной поляризацией. Биоинформатическое программное обеспечение было разработано для вычисления и прогнозирования белковых структур на основе их аминокислотных последовательностей.

Резюме по структуре белка

В качестве альтернативы экспериментальной технике, структурный анализ и инструменты прогнозирования помогают предсказать структуру белка в соответствии с его аминокислотными последовательностями. Решение структуры данного белка очень важно в медицине (например, в разработке лекарств) и биотехнологии (например, в разработке новых ферментов). Таким образом, область компьютерного прогнозирования белка постоянно развивается, следуя за увеличением вычислительной мощности машин и развитием интеллектуальных алгоритмов.

Существует четыре уровня структуры белка (рисунок 1). При прогнозировании структуры белка первичная структура используется для прогнозирования вторичных и третичных структур.

Вторичные структуры белков представляют собой локализованный фолдинг внутри полипептидной цепи, который стабилизируется водородными связями. Наиболее распространенные вторичные белковые структуры - альфа-спирали и бета-листы.

Третичная структура является конечной формой белка после того, как различные вторичные структуры сложены в трехмерную структуру. Эта окончательная форма образуется и удерживается вместе посредством ионного взаимодействия, дисульфидных мостиков и сил Ван-де-Ваальса.

Четыре уровня структуры белка. Изображение с Khanacademy.org.

Методы и программное обеспечение для прогнозирования структуры белка

Большое количество программного обеспечения для прогнозирования структуры было разработано для специализированных функций и особенностей белка, таких как прогнозирование беспорядка, прогнозирование динамики, прогнозирование сохранения структуры и т. Д. Подходы включают моделирование гомологии, потоковую обработку белка, методы ab initio, прогнозирование вторичной структуры и трансмембранную спираль и предсказание сигнального пептида.

Выбор правильного метода всегда начинается с использования первичной последовательности неизвестного белка и поиска гомологов в базе данных белков (рисунок 2).

Схема принятия решения для метода прогнозирования структуры белка.

Вот некоторые подробные методы прогнозирования структуры белка:

  • Инструменты прогнозирования вторичной структуры

Эти инструменты предсказывают локальные вторичные структуры, основанные только на аминокислотной последовательности белка. Предсказанные структуры затем сравниваются с оценкой DSSP, которая рассчитывается на основе кристаллографической структуры белка (подробнее об оценке DSSP здесь).

Методы прогнозирования вторичной структуры в основном опираются на базы данных известных белковых структур и современные методы машинного обучения, такие как нейронные сети и машины опорных векторов.

Вот несколько отличных инструментов для прогнозирования вторичной структуры.

  • Третичная структура

Инструменты прогнозирования третичной (или трехмерной) структуры делятся на два основных метода: ab initio и сравнительное моделирование белка.

Методы прогнозирования структуры белка ab initio (или de novo) пытаются предсказать третичные структуры из последовательностей на основе общих принципов, управляющих энергетикой свертывания белка и / или статистическими тенденциями конформационных признаков, которые приобретают нативные структуры, без использования явных шаблонов.

Вся информация о третичной структуре белка закодирована в его первичной структуре (то есть его аминокислотной последовательности). Однако можно предсказать их огромное количество, среди которых только один обладает минимальной свободной энергией и стабильностью, необходимой для правильного складывания. Таким образом, предсказание структуры белка ab initio требует огромных вычислительных ресурсов и времени для решения нативной конформации белка и остается одной из главных задач для современной науки.

К наиболее популярным серверам относятся Robetta (с использованием пакета программ Rosetta), SWISS-MODEL, PEPstr, QUARK. Просмотрите исчерпывающий список здесь.

Если белок с известной третичной структурой имеет по меньшей мере 30% своей последовательности с потенциальным гомологом с неопределенной структурой, сравнительные методы, которые перекрывают предполагаемую неизвестную структуру с известной, могут использоваться для прогнозирования вероятной структуры неизвестного. Гомологическое моделирование и белковая нить являются двумя основными стратегиями, которые используют предварительную информацию о другом подобном белке, чтобы предложить прогноз неизвестного белка на основе его последовательности.

Программное обеспечение для моделирования гомологии и белковой нити включает RaptorX, FoldX, HHpred, I-TASSER и многое другое.

Ссылки

De novo предсказание структуры белка. Wikipedia.

Предсказание структуры белка. Википедия