Российские ученые разработали аккуратный алгоритм для поиска аллель-специфичного связывания транскрипционных факторов и собрали самую большую в мире базу таких событий. Случаев, когда замена в регуляторном участке ДНК оказалась важна для управляющих транскрипцией белков, оказалось порядочно — около полумиллиона, и для многих независимо показана клиническая важность. Работа опубликована в журнале Nature Communications.
Активность работы ДНК — сколько белка будет производиться с того или иного участка и при каких условиях — зашита в ней самой. Помимо кодирующих белки генов там есть и регуляторные участки, — посадочные площадки для соответствующих управляющих белков, называемых факторами транскрипции. Приземление на площадку такого белка меняет активность подшефного гена или даже группы генов. Для исследования комплексов белок:площадка существует технология ChIP-Seq, она позволяет создать карту посадочных площадок, оценить активность их использования или сравнить например работу белка-фактора транскрипции у больных и здоровых.
Как и у белок-кодирующих генов у регуляторных последовательностей ДНК есть свои варианты-аллели. Отличие всего на одну-две буквы-нуклеотида может кардинально изменить способность белка узнавать эту площадку и садиться на нее, и это влечет за собой изменение активности генов. На практике большой коллекции таких событий нет, и изучают их не очень активно из-за сложностей обработки данных. Посчитать на основании эксперимента ChIP-Seq соотношение белков, выбравших первый или второй вариант вариант площадки довольно легко, но дальше начинаются проблемы. В клеточных линиях например — обычном материале для экспериментов — может быть нарушена плоидность. Вместо стандартных пар «материнской и отцовской» хромосом, гомолоогичных хромосом может быть и три и больше. В результате на основании ChIP-Seq трудно понять чем обусловлено поведение белка — плохим соединением с одним из вариантов площадки или многократным копированием другого варианта. Кроме того, для раковых образцов типично копирование не целой хромосомы, а отдельных ее кусков.
Группа ученых из Института белка РАН и Института общей генетики РАН придумала, как узнать об аллельных предпочтениях транскрипционных факторов без предварительных знаний о плоидности образца и сделала по ним самую большую на сегодняшний день базу данных ADASTRA (Allelic Dosage-corrected Allele-Specific human Transcription factor binding sites). В основу ее легла стандартизированная обработка более семи тысяч экспериментов ChIP-Seq. Благодаря такому большому количеству данных исследователям удалось поймать больше полумиллиона событий, когда транскрипционный фактор по-разному использовал одну и ту же площадку в зависимости от ее варианта.
Чтобы разделить вклад копийности и аллельных предпочтений транскрипционного фактора для конкретной площадки на ДНК авторы придумали смотреть на нее в контексте других разновариантных площадок поблизости. Посчитав для них доли случаев, когда белок связался с одной или другой аллелью, можно определить общий тренд, который и будет отражать копийность ДНК на этом участке. Выбивающиеся из этого тренда значения будут наоборот говорить о предпочтениях белка.
Понимание предпочтений транскрипционных факторов — помимо фундаментальной важности — может оказаться полезным и для лечения болезней. Из-за замен в регуляторных областях важные гены могут работать некорректно даже при отсутствии мутаций в кодирующих областях. Выяснилось, что среди регулируемых таким образом генов примерно 90% генов базы ClinVar, имеющих клиническое значение. Кроме того, по независимым данным GWAS, многие замены в регуляторных участках, меняющие поведение белков-транскрипционных факторов, оказались связаны с теми или иными болезнями, от онкологических до аутоиммунных.
Сравнительно недавно ученые начали находить в геноме не просто одиночные регуляторные площадки, а целые батареи генных активаторов, лежащих друг за другом. Их количество и качество влияют на активность генов, отвечающих за клеточную идентичность, в том числе и онкогенов. Скорее всего, они играют не последнюю роль во многих раках, но пока описаны лишь для небольшого их числа, например для рака головы и шеи.
Вера Мухина
Источник
Автор: Андрей Зверев