Рейтинг пользователей: / 2
ХудшийЛучший 

УДК 004.94

Рекубратский В.А., Короткова М.А.

МОДЕЛИРОВАНИЕ РАБОТЫ И ВЗАИМОДЕЙСТВИЯ ГЕНОВ

Научно Исследовательский Ядерный Университет (МИФИ)

 

В данной работе описана программная система, позволяющая создавать генные сети и моделировать их работу. Функционирование и взаимодействие генов имеют место в любом организме. Обычно о системе взаимодействующих генов говорят как о генной сети. Моделирование работы генных сетей — одна из важных задач биоинформатики. Преимуществом описанной системы являются широкие возможности для моделирования и наглядное представление результатов.

Ключевые слова: ген, генная сеть, динамическая генная сеть, моделирование, клетка, многоклеточный организм

System providing tools for creating, setting up and simulating gene networks is described. Gene operation and interaction occur in every organism. Gene network is commonly used to describe gene interaction issues due to its complicity. Simulation of gene networks operation is an essential problem of bioinformatics. Broad simulation abilities along with visual result representation are the system’s advantages to be noted.

Key words: gene, gene network, dynamic gene network, simulation, cell, multicellular organism

1. Введение

Работа и взаимодействие генов являются определяющими факторами развития любого организма на Земле [1]. И хотя состав генов многих организмов на сегодняшний день хорошо изучен [2], взаимодействие генов все еще остается предметом интенсивных исследований. Основной проблемой является то, что влияние одних генов на работу других зачастую может быть выявлено только по косвенным признакам, таким как согласованное изменение активностей генов [3, 4]. Активность одних генов может позитивно или негативно влиять на активность других генов [3]. Это влияние может быть обнаружено экспериментально. Каждый год публикуется множество работ [5-9], в которых описываются предположительные взаимозависимости генов. Генная сеть, т.е. система взаимодействующих генов [10], обычно представляется в виде направленного графа, в котором вершины соответствуют генам, а дуги — положительным или отрицательным взаимодействиям генов. Как правило, генные сети описываются биологами, изучающими взаимозависимости генов различных организмов.

Иногда описание генной сети, основанное на одних экспериментальных данных, может входить в противоречие с другими экспериментальными данными, полученными позже или другими исследователями (ср., например, работы [4] и [7]). Также бывают ситуации, когда по одному набору экспериментальных данных можно построить несколько вариантов описания сети. Для того, чтобы найти самый точный и непротиворечивый вариант описания генной сети, необходимо произвести сопоставление всех вариантов с другими данными, что может быть весьма трудозатратной задачей.

Для сравнения и анализа различных вариантов описания генных сетей необходима  компьютерная система, моделирующая работы и взаимодействия генов. Подобная система позволит автоматизировать процесс верификации, т.е. сопоставления описаний генной сети с экспериментальными данными.

2. Система моделирования

2.1. Модель гена

В реальных организмах ген может быть активен в одних клетках и неактивен в других. Степень активности также может меняться. Каждый ген характеризуется своим продуктом, который он производит в результате процессов транскрипции и трансляции [1]. Ген считается активным в клетке, если в этой клетке находится некоторое количество соответствующего ему продукта. Количество продукта может быть измерено в клетках реального организма, и эти экспериментальные данные могут затем быть использованы для верификации описания генной сети. Таким образом, количество продукта является важной характеристикой при создании модели гена. Скорость производства продукта может зависеть от многих факторов и варьироваться для разных генов и клеток организма. Одним из факторов, влияющих на скорость производства продукта в конкретной клетке, является наличие и количество продуктов других генов в данной и других клетках [3]. Часто работа генных сетей моделируется с помощью сетей Петри [11, 12]. В подобных моделях учитывается только одна характеристика генов — количество продукта. Однако модель, учитывающая и другие параметры гена, например, скорость производства продукта, могла бы описать более широкий спектр явлений взаимодействия генов.

Предлагается система моделирования, учитывающая состояние генов в клетках и их взаимодействие. В данной системе состояние каждого гена в любой момент времени описывается тремя параметрами: количество продукта, величина активности и флаг блокировки. Количество продукта отражает способность гена влиять на другие гены. Поэтому данный параметр можно также рассматривать как внешнее состояние гена. Второй параметр — величина активности — отражает способность гена к производству соответствующего продукта, поэтому его можно рассматривать как внутреннее состояние гена. Величина активности гена может меняться во времени и от клетки к клетке. Также вводится постоянная характеристика гена — функция производства продукта, ставящая в соответствие величине активности количество производимого продукта. Количество продукта и величина активности являются вещественными параметрами. Третий же параметр гена является Булевой величиной. Он введен для отражения того факта, что в реальности могут прекращать или возобновлять свою работу на любом этапе развития организма. Когда ген блокирован, производство соответствующего продукта прекращается. Любой продукт in vivo подвержен деградации, т.е. постепенному распаду. Этот факт также учитывается в системе моделирования. Скорость деградации вводится как функция от количества продукта. Функция деградации является второй постоянной во времени характеристикой гена.

2.2. Модель взаимодействия генов

Каждое взаимодействие генов в системе описывается как набор правил. Эти правила определяют условия возникновения воздействия и математические законы, по которым меняются параметры генов в результате взаимодействия. Условия представляются в виде неравенств, законы изменения параметров — в виде уравнений. И в неравенствах, и в уравнениях возможно применение любых комбинаций из алгебраических операций (сложение, вычитание, умножение, деление, возведение в степень, извлечение корней, взятие модуля, вычисления синуса и тангенса), вещественных чисел и параметров генов и клеток. Как правило, в условиях возникновения процессов из всех параметров используется только количество продукта. Это отражает тот факт, что данный параметр определяет способности гена к взаимодействию.

2.3. Процесс моделирования

Работа генной сети в модели представляется как пошаговый процесс. Один шаг соответствует изменению состояния системы клеток за единицу модельного времени.  На каждом шаге производится проверка активных взаимодействий (для которых выполнены условия их осуществления), что приводит к изменению параметров генов в некоторых клетках. Изменение параметров генов, произошедшее в результате взаимодействия, откладывается до начала следующего шага, чтобы иметь возможность на одном шаге отработать все взаимодействия. Помимо результатов взаимодействий на количество продукта каждого гена влияет также величина его активности. Приращение количества продукта, связанное с активностью гена, производится также перед началом следующего шага, но перед применением других изменений в параметрах гена. После выполнения всех изменений система переходит в новое состояние. Затем процесс повторяется с полученными значениями параметров.

3. Реализация

Предложенная система моделирования реализована в виде отдельного приложения MS Windows. Приложение предоставляет пользователю возможность создать описание генной сети, вводя гены и их параметры, рисуя схему взаимодействий между генами и задавая параметры этих взаимодействий. Созданное описание генной сети может быть сохранено в файле и впоследствии восстановлено. После того как описание сети создано, задается начальное состояние группы клеток, для которых будет производиться моделирование. Далее пользователь может наблюдать и контролировать процесс моделирования, используя трехмерный макет группы клеток и таблицу параметров клеток и генов. За изменением параметров отдельных генов во времени также можно наблюдать по графикам.

3.1. Мониторинг параметров генной сети в процессе моделирования

Подсистема для мониторинга и контроля работы генной сети предоставляет средства для визуализации состояния моделируемой группы клеток и динамики определенных параметров генов. Визуализация группы клеток осуществляется посредством трехмерного макета. Данный макет можно вращать, масштабировать, а также скрывать часть клеток, составляющих макет. Благодаря этому возможно получение детальной информации о структуре моделируемой группы клеток и изменениях, появляющихся в этой структуре в процессе моделирования. Для мониторинга численных параметров генов и клеток можно прямо на трехмерном макете выбрать одну или несколько клеток. Для наглядного представления численных параметров производится визуализация значений параметров в виде линейных диаграмм.

Также пользователь имеет возможность построить график изменения интересующих его параметров во времени. В одном координатном пространстве может быть построено произвольное число графиков, отражающих как значения отдельных параметров, так и соотношений между параметрами. Эти соотношения, подобно математически выражениям для описания взаимодействий генов,  могут содержать любые комбинации алгебраических операций, вещественных чисел и параметров генов и клеток. Данный аппарат может быть полезен для анализа различного рода связи между параметрами, например, соотношения количества продукта двух различных генов в одной клетке или же продуктов одного гена в разных клетках.

4. Научная новизна и полученные результаты

К настоящему моменту разработан целый ряд систем для моделирования работы генных сетей (см., например, [13, 14]). Однако эти системы моделируют функционирование сети слишком абстрактно — вне контекста клеток организма, их состояния и процессов жизнедеятельности. В реальности же наблюдаемые взаимодействия генов часто имеют место в группе клеток организма. Каждая клетка при этом характеризуется своим уникальным набором параметров генов. Подобные взаимодействия не могут быть описаны при помощи модели изолированной генной сети.

Существует всего несколько систем, моделирующих работу генетической сети в многоклеточном организме. Примером такой системы является «CellModeller Project» [15]. Однако использование данной системы требует от пользователя знания языков программирования, в частности, языка Python.

Предложенная в настоящей работе система является отдельным приложением, не требующим для своей работы наличия стороннего ПО, за исключением собственно операционной системы (семейства MS Windows). Система предоставляет пользователю простой инструментарий для создания описаний генных сетей и их графического представления. Все правила, описывающие взаимодействия генов, выражаются исключительно с помощью математических формул и знания каких-либо языков программирования от пользователя не требуется. Математический аппарат, предоставляемый пользователю, позволяет моделировать широкий спектр процессов взаимодействия генов и жизнедеятельности клеток. Так, с помощью данной системы были промоделированы некоторые процессы генетического контроля развития растения Arabidopsis thaliana, а также функционирования вируса HCV в клетках.

5. Заключение

Разработана система моделирования и проведена ее реализация. Система предоставляет возможности для моделирования работы и взаимодействия генов в группе клеток. Программная реализация системы позволяет пользователю задавать графическое описание генной сети и математическое описание взаимодействий генов. С помощью системы можно производить моделирование широкого спектра процессов взаимодействия генов в клетках и функционирования самих клеток.

 

Литература:

1. Коничев А.С. Молекулярная биология / А.С. Коничев, Г.А. Севастьянова. –М.: Издательский центр «Академия», 2003. – 400 с.

for Biotechnology Information: http://www.ncbi.nlm.nih.gov/

3. Колчанов Н.А., Ананько Е.А., Колпаков Ф.А. Генные сети. // Молекулярная биология, М. – 2000. – т. 34. №. 4. – стр. 449-460

4. Bowman J.L., Drews G.N., Meyerowitz E.M. Negative regulation of the Arabidopsis homeotic gene AGAMOUS by the APETALA2 gene product // Plant Cell, United States. – 1991. – August (№ 8). – p. 749-758

5. Gustafson-Brown C., Savidge B., Yanofsky MF. Regulation of the arabidopsis floral homeotic gene APETALA1. // Cell, Cell Press, United States. –1994. – v. 76. – pp. 131-143.

6. Pogorelko G., Fursova O., Klimov E.. Identification and Analysis of the Arabidopsis Thaliana Atfas4 Gene Whose Overexpression Results in the Development of A Fascinated Stem. // J Proteomics Bioinform, OMICS Publishing Group, United States. – 2008. – 1(7). – pp. 329-335

7. Шестаков С.В., Пеннин А.А., Логачева М.Д., Ежова Т.А. Новая модифицированная схема генетического контроля развития цветка. // Технологии живых систем, Москва, Россия. – 2005. – т. 2, №1. – стр. 37-46

8. Capelli C., Brisighelli F., Scarnicci F., Blanco-Verea A., Brion M., Pascali V.L. Phylogenetic evidence for multiple independent duplication events at the DYS19 locus. // Forensic Sci Int Genet, Elsevier, Netherlands. – 2007. – 1(3-4). – pp. 287-290

9. Zheng B., Lu X. Using protein-semantic network metrics to evaluate functional coherence of protein groups // AMIA Annu Symp Proc, American Medical Informatics Association, United States. – 2007, October. – 11, – pp. 1174

10. Geard N, Wiles J. A gene network model for developing cell lineages. // Artif. Life, United States. – 2005. – 11 (3). – 249–67.

11. Grunwald S., Speer A., Ackermann J., Koch I. Petri net modelling of gene regulation of the Duchenne muscular dystrophy // Biosystems, Elsevier Science Ireland, Ireland. – 2008, May. – 92(2). – pp. 189-205

12. Steggles L.J., Banks R., Shaw O., Wipat A. Qualitatively modelling and analysing genetic regulatory networks: a Petri net approach // Bioinformatics, Oxford University Press. – England. –  2007, February. – 1, 23(3). – pp. 336- 343

13 “Ingeneue: gene network simulation software”

http://rusty.fhl.washington.edu/ingeneue/index.html

14. “GeNESiS: gene network evolution simulation software”

http://genomics.iab.keio.ac.jp/genesis.html

15. “CellModeller Project”

http://www.archiroot.org.uk/doku.php/navigation/cellmodeller