Новая генетика и ДНК-информатика
КУРНОСОВ М. Н.
НОВАЯ ГЕНЕТИКА
И
ДНК-ИНФОРМАТИКА
(ПРОЕКТ НЕОГЕРМЕТИК)
2013
НАУЧНОЕ ИЗДАНИЕ.
***** Курносов Михаил Николаевич. Copyright (C). 2013. *****
ПРЕДИСЛОВИЕ.
Термин "новая генетика" я применяю для постгеномной эпохи в биологии. Это
время началось примерно с 2003 года, когда был опубликован впервые геном человека. Биология и медицина вступила на новый,более высокий уровень знаний.
Нам понятно, что секвенирование геномов проводится не только из-за
теоретического интереса. Все в настоящее время направлено на то, чтобы
научиться влиять на гены как человека, так и других организмов.
Новая генетика ставит и новые цели - это изменение самой биологии человека,
а именно влияя на гены сделать человека невосприимчивым к обычным болезням, значительно продлить жизнь человека, сделать его максимально устойчивым к
вредным факторам среды (излучениям, высокой и низкой температуре, повышенному или пониженному парциальному давлению кислорода в воздухе, измененному давлению), а также сделать человека независимым от обычной пищи, устойчивым к химическим мутагенам, невосприимчивым к микробам и вирусам, с высокой скоростью регенерации повреждений. Управление генами
человека скоро выйдет на новый уровень, что изменит всю его жизнь.
После того , как геном был определен в виде нуклеотидной последовательности, стало ясно, что знаем мы о генах очень мало, и сегодня , несмотря на вал научных работ, я могу утверждать, что в познании генома и генетике человека
все еще только начинается и окончательного изучения работы генома можно
ожидать через 20-30 лет.
Геном человека представляет настолько информационно большую величину, которую сегодня даже трудно представить. Так как дело не только в количестве
нуклеотидов ДНК, а именно в их сочетаниях в каких-то оригинальных участках, доменах, мотивах, повторах. Это придает геному человека гораздо более
информационную емкость, чем только сама последовательность. Этим сейчас занимается ДНК-информатика. Расшифровка биологического значения и функций участков ДНК, моделирование и создание новых информационных участков ДНК и
так далее. Я приведу в этой книге те примеры, которые сам разрабатывал.
В науке сегодня ведуться работы по созданию геномодифицированного человека. В одних странах это под запретом, но я думаю, что ненадолго. Как только люди поймут , что опасность, которую предполагали от этого, настолько мала по сравнению с пользой, которую принесет для человека его геномодификация, то
эти запреты будут сняты. Главное время не упустить. Работы можно начать в
любое время сегодня, были бы средства и желание развивать науку.
У человечества нет другого пути, либо болеть, рано умирать и быть уязвимым в окружающей среде, либо изменить человека.
Мой проект я назвал NEOGERMETIC, что означает новый зародыш, росток,стволовая клетка. Это негосударственный, частный научный проект. Он находится в
постоянной моей разработке. Проект НЕОГЕРМЕТИК включает в себя разработку способов кодирования текстов в ДНК, внесение этой ДНК в геном для
длительного хранения. Также рассматриваются вопросы поиска в ДНК человека и других организмов разумных текстов.
Эта книга в виде отдельных статей описывает разные способы преобразования генетической информации в другие виды информации. Также поиск в ДНК возможных
участков, несущих информацию, не связанную с работой генов, то есть разумных
текстов, похожих на тексты обычных книг.
В других главах затронуты вопросы старения в связи с митохондрией и транспозонами. Работы продолжаются несколько лет и возможные открытия еще впереди. В книге даны разработки пока теоретических подходов, начальная информация для других ученых, которые будут заниматься тем же, что и я.
Если в геноме какого-то организма будут найдены разумные тексты в виде
послания или просто технологические разумные метки высшей цивилизации,
проводившей генные операции, то это будет означать самое выдающееся открытие
в истории человечества.
3
Уже сегодня ученые могут ввести в ДНК участки с любыми текстами. Чтобы знать, что надо искать в геноме, надо научиться вводить тексты в ДНК. Это описывают
несколько глав в этой книге. Итак, представляю Вам мою книгу, и что было разработано по мере моих сил за последние 8 лет. Материалы могут быть
спорными по некоторым местам, но это и есть наука – от гипотез и черновых наработок через теорию к практике.
Возле каждой главы стоит дата публикации статьи в интернете на моем сайте
www.neogermetic.narod.ru , поскольку в науке все стремительно меняется.
Частично книга дописывалась в течение 2013 года.
01 мая 2013 г.
ВВЕДЕНИЕ В СОВРЕМЕННУЮ ДНК ИНФОРМАТИКУ.2013.
ДНК информатика нужна для теоретического просчитывания биологического эксперимента. Работы с генами и ДНК очень дороги, поэтому ученые сначала моделируют опыты на компьютере, после этого проводят опыты с молекулами,
генами и живыми клетками.
Этому и предназначена настоящая книга. На примерах:
проекта по музыке генов,
проекта по изменению митохондрий,
проекта по дефрагментации генов,
проекта по поиску и записи в ДНК текстов,
проекта по управляемому наномашинами мутагенезу в
этой книге проведено теоретическое обоснование подходов к этим экспериментам. Все эти мои проекты объединены в общий проект, который я назвал
"Неогерметик" или "Neogermetic".
В этом и заключается моя роль, как автора книги. С одной стороны , я разрабатываю реальные проекты для будущей генетики, а с другой стороны на их примерах , я показываю, как информатика ДНК применяется в биологии и
медицине.
Для информационного обеспечения задуманного эксперимента, ученый вначале накапливает нужную информацию. ДНК информатика в современном мире очень тесно связана с Интернет ресурсами и уже не мыслима без них. В Интернете находятся
от сотен гигабайт до терабайт информации по разным разделам генетики и биоинформатики. Такое количество не может вместить ни одна книга, и роль книг сегодня – это дать общее направление для работы.
В первую очередь надо закачать геномы организмов, с которыми предстоит работать. Их адрес www.ncbi.nlm.nih.gov/genomes, где для нужного вида есть полная последовательность нуклеотидов в геноме для отдельных хромосом.
Выберем, для примера каталог Homo sapiens (H_sapiens) - человек.
Примеры для человека хромосома 1 генома в виде контигов.
Например, ftp://ftp. ncbi. nlm. nih. gov/genomes/H_sapiens/
hs_alt_HuRef_chr1. fa. gz - архив хромосомы 1 в формате
фаста, то есть без описаний генов,
hs_alt_HuRef_chr1. gbk. gz - архив последовательности
нуклеотидов в ДНК и описание генов,
hs_alt_HuRef_chr1. gbs. gz - архив только описания генов
в хромосоме 1 или аннотация генома,
hs_alt_HuRef_chr1. mfa. gz - архив помеченных или
маскер-повторов в ДНК хромосомы.
Собранная в нить хромосома 1, для примера
ftp://ftp. ncbi. nlm. nih. gov/genomes/H_sapiens/
Assembled_chromosomes/seq/hs_ref_GRCh38_alts. fa. gz
ftp://ftp. ncbi. nlm. nih. gov/genomes/H_sapiens/
Assembled_chromosomes/seq/hs_ref_GRCh38_alts. mfa. gz
ftp://ftp. ncbi. nlm. nih. gov/genomes/H_sapiens/
Assembled_chromosomes/gbs/hs_ref_GRCh38_chr1. gbs. gz
Это архивы ДНК в формате фаста и маскер-повторов, и
описание или аннотация всех генов и их места на хромосоме 1.
4
Для изучения повторов в геноме или каком-то участке ДНК можно для UNIX-компьютера использовать программу для поиска повторов - Repeatmasker.
Программа на сайте www.repeatmasker.org , а базы повторов на сайте
www.girinst.org , на этом же сайте есть онлайновый сервис для поиска повторов ДНК. Для этого надо вставить в окно формы исследуемый участок ДНК, и через несколько минут подгрузится полная аннотация этого участка.
Для изучения взаимодействий генов и их продуктов между собой полезны базы
генных сетей в виде граф. Их адрес www. pid. nci. nih. gov ,
а для закачки баз ftp://ftp1. nci. nih. gov/pub/pid.
Там представлены следующие разделы:BIOCARTA,KEGG,NCI-NATURE CURATED,
REACTOME, представляющие собой базы взаимодействия путей.
Это базы различных путей - метаболических, регуляционных, и других. В них представлены все известные гены и их продукты во взаимодействии с другими
генами и белками.
Представлены файлы с расширением . svg и . jpg, по названию гена определяется индекс рисунка, а в самом рисунке показаны связи его с другими генами в сети.
Например, ген POT1. Надо поисковиком найти это слово в файлах . svg , получим индекс - 200074. svg NCI-NATURE CURATED. По этому индексу надо смотреть
рисунок - 200074. jpg. В рисунке находим наглядно в этих генных сетях, где участвует этот ген в обслуживании теломеры в шелтерин-комплексе. Видно его взаимодействие с другими генами и их продуктами.
Для изучения продуктов генов - РНК или белка полезна база находящаяся на NCBI
в каталоге для каждого вида организма - файл protein.gbk , в котором представлены трансляты генов, и даны функции белка, а также большое
количество литературы для каждого гена. Для РНК, файл аналогично имеет
название rna.gbk.
Чтобы закачивать журнальные статьи по генетике, надо в поисковой системе NCBI, которую можно открыть на его главной странице, выбрать раздел PubMed или Pub,
и в строку поиска ввести нужный ген, или название статьи, или авторов. После этого выводится список статей по выбранной теме, хранящихся на NCBI.
Специализированных баз белков много,к примеру приведу адреса нескольких баз: http://www.pdb.org,
http://www.uniprot.org,
http://www.genome.ucsc.edu,
http://www.expasy.org.
Последняя работает по ftp-протоколу,например taxonomic_divisions/uniprot_sprot_human. dat. gz, при этом закачен будет
архив базы белков человека. Открыв его просмотр, для примера, программой
Windows Commander - клавиша F3, в поисковой строке - клавиша F7, набрать Name=POT1. После чего в файле будет найдено полное описание белка гена POT1,
для примера.
База сигнальных пептидов, необходимых для направления белка в нужное место в клетке, например в ядро или митохондрию. SPDB по адресу:
www.proline.bic.nus.edu.sg/spdb/index.
Как правило, все крупные серверы генетических баз данных имеют доступ по
http-протоколу интернет, при котором открываются обычные страницы интернета и
доступ по ftp-протоколу, по которому идет только обмен файлами.
Для закачки баз данных лучше и быстрее использовать ftp. Для этого надо иметь
на компьютере любой ftp-клиент, программу для закачки файлов. Я использую для закачки файлов по ftp обычный файл-менеджер Windows Commander.
Для этого в меню Commands надо выбрать опцию FTP New Connection, в появившемся
окне набрать адрес, например, ftp. ncbi. nlm. nih. gov.
Надо выбрать анонимное соединение, так как пароля не требуется для
общедоступных баз. После соединения будут видны все каталоги и файлы, которые
есть на этом сервере. Можно открыть эти каталоги и посмотреть какие файлы-базы там есть. В каждом каталоге есть файлы readme. txt для описания баз. Для копирования надо перетащить файл мышью на соседнюю панель Windows Commander.
В интернете сотни сайтов, представляющих различную медико-биологическую и генетическую информацию. Не профессионалам, то есть не медикам и биологам,
часто трудно разобраться в этих данных или базах. Поэтому в конце перечня
5
полезных по теме сайтов, я рекомендую посетить лучший из рускоязычных форумов.
Его адрес: http://www. molbiol. ru , на котором любому человеку можно задать вопрос по генетике, молекулярной биологии, биохимии, цитологии, и так далее,
и получить ответ специалистов и ученых.
В моей книге я излагаю свои проекты в биоинформатике. Для общего
ознакомления с этой наукой можно рекомендовать книгу по общим вопросам компьютерной биоинформатики [32].
Методы и протоколы в генетической биоинформатике [33, 34, 35].
Я работаю в биоинформатике на компьютере, разрабатывая теоретически свои проекты, но я по образованию лабораторный работник по биохимии или
врач-исследователь широкого профиля. Я несколько лет работал в лаборатории и хорошо знаю всю биохимическую "кухню". Примером одной из моих практических
работ я могу назвать статью в журнале "Лабораторное дело", 1991, 3, 34-36. Статья называется "Метод определения нитритов в слюне". Нитриты в слюне
отражают общее поступление нитратов в организм с пищей и водой. Контроль нитритов, как одного из главных мутагенов, может иметь значение для
профилактики возникновения рака и токсического, мутагенного влияния на
организм человека. Эту статью можно посмотреть на моем сайте. Если будет финансирование проектов, описанных в этой книге, то практические работы в лаборатории начнутся немедленно.
Буду благодарен за финансовую и другую помощь. Как мне помочь написано на
моем сайте http://neogermetic.narod.ru.
10 ЛЕТ ГЕНОМА ЧЕЛОВЕКА - ВСЕ ЕЩЕ ТОЛЬКО НАЧИНАЕТСЯ. 29 ФЕВРАЛЯ 2012.
До настоящего времени находят в геноме человека новые гены или определяют функцию неизвестных генов. То, что есть на момент написания этой статьи, я привожу в виде простого списка генов человека. Этот список, который
представлен на моих сайтах, состоит из латинского названия гена и его расшифровки в виде полного названия и его пояснения. Также для гомологов
указан вид организма, с которым сравнивалась ДНК человека. Список генов
человека находится по адресу:
http://www.neogermetic.narod.ru/a-r.txt
http://www.neogermetic.narod.ru/s-z.txt
Этот список имеет значение для науки, потому что дает общее представление о
том , что есть в геноме человека. Обозначены наиболее полно все гены, включая РНК, а также дан полный список псевдогенов.
Список генов привожу здесь для развития генетики в России. Поэтому развернутое название я привожу на русском языке, сделав авторский перевод. При этом специалисты в своих областях - инженеры, химики, биологи, медики получат
смежную информацию. Впервые многие сотни белков написаны по-русски. Это даст
в будущем удобство при работе с рускоязычными научными статьями.
Список был получен путем обработки и перевода файлов баз, находящихся
на сервере NCBI USA, в свободном доступе по указанным ниже интернет адресам. Даты исходных файлов имеют обновления на ноябрь-декабрь 2011 г.
Полное название генов на английском языке и подробное описание находится в файлах генома человека по адресу :
ftp://ftp.ncbi.nlm.nih.gov/genomes/homo sapiens/
ftp://ftp.ncbi.nlm.nih.gov/
ftp://ftp.ncbi.nlm.nih.gov/genes.
Там же надо искать полную информацию и литературу по каждому гену. Либо,
зайти на сайт http://www. ncbi. nlm. nih. gov , и в поисковике выбрать
опцию - Genes, и набрать латинское название гена, при этом указать вид - Homo
sapiens. Например, набрать ADCY1 Homo sapiens, для получения информации по аденилатциклазе 1 мозга.
Чтобы не делать нелепого перевода, я оставил жаргонные научные слова или
термины из генетики гомологов генов разных видов на английском языке или как слышится по-русски.
Перевод полного названия генов с помощью программ-переводчиков приводит к нелепому или ошибочному переводу. Поэтому каждую строчка списка просматривалась вручную. Конечно, возможны ошибки, опечатки при переводе.
6
Я произвел анализ общего списка генов человека.
Список содержит 46005 строк записи, список генов включает в себя
гены белков, псевдогены и РНК.
Количество псевдогенов составляет 11065 записей. Сегодня известно, что часть
их может регулировать активность настоящих генов, то есть нельзя полностью их считать балластом генома. Такое большое число псевдогенов найдено в геноме,
но какое они оказывают влияние на биологию извесно только для единиц
псевдогенов.
То есть псевдогены в основном вообще не изучены.
В ранних сообщениях на своем сайте Neogermetic.narod.ru , я предложил такую операцию на генах и геноме как его ДЕФРАГМЕНТАЦИЮ для удаления некоторых или всех интронов в генах для очистки генома от транспозонов для избавления
человека от болезней и старения. Частично такая операция проведена самой природой для многих псевдогенов ретрокопированием. Значит возможно очистить
и рабочий ген.В будующем будут возможны более глобальные для генома человека операции. Тут я думаю, что от многих псевдогенов надо избавиться как от груза ненужных мутаций. И этот процесс резки и сшивания ДНК, который в будущем
будет легко осуществим прямо на ходу, на компьютере, я назову ОПТИМИЗАЦИЕЙ генома.
Таким образом ДЕФРАГМЕНТАЦИЯ и ОПТИМИЗАЦИЯ генома человека в ближайшем
будущем приведет к созданию нового вида человека с большой длительностью
жизни, без болезней, чрезвычайно устойчивого к среде и годного для полета в дальний космос. В общем решение проблемы псевдогенов только начинается.
Из РНК : транспортной РНК - 688, малой ядрышковой РНК - 407, микроРНК - 1425 генов, длинная межгенная не-белок кодирующая РНК 154 гена (хотя последний
член списка имеет номер LINC00488, то есть возможно, что не все указаны в оригинале).
Большая группа генов рецепторов - 2868 гена, из них обращает на себя внимание рецепторы запаха - их 1097, остальные – это рецепторы мембран,
внутриклеточные и смешанная группа для различных лиганд-рецепторных взаимодействий.
Рецепторов вкусовых всего 49 генов.
Очень много неизученных или малоизученных генов, так слово "гипотетический" встречается в списке 6771 раз, также много генов даже не имеющих оригинального названия - это гены, обозначаемые LOC (локус) с указанием его номера.
Таких LOC в списке 13313 генов.
Много генов ORF (open ready frame) - открытая рамка чтения. С помощью
программы определяется , что для данного места будет возможна транскрипция и трансляция, но функция этих генов мало изучена.
Генов ORF - 1247 в списке.
Много генов гомологов разных организмов, особенно гомологов дрозофилы ,
мышей и других. Хотя клетки у всего живого имеют близкое строение и функцию,
но у человека эти гены могут иметь особую функцию, чем у мух. То есть реально, что делают гены-гомологи у человека мало изучено, да они также мало изучены
и у насекомых, геномы, у которых определяли позднее человека. Так что
ссылка с одного неизвестного гена на неизвестный ген другого организма мало что дает. Генов гомологов в списке 1893.
Большое семейство генов с общим названием "цинк-фингер протеин", или
"цинковый палец белок", это жаргонное имя "палец" связано с тем, что молекула, связывающая цинк, похожа на него. Эти белки связываются с ДНК, РНК, другими молекулами, многие имееют функцию регуляции транскрипции. Отнесены в одну
группу только по схожему цинк-связывающему домену, и точная их функция мало
известна для большинства. Генов цинк-фингеров в списке 1452.
Генов, относящихся к работе рибосом в списке 2479 (может быть
больше).
Много генов, подобных другим генам, то есть им присваивается схожее название
на основании похожести структур или функции. Но все равно эти гены не на 100 процентов идентичны, и если отличия наследуются, значит они для чего-то нужны.
Генов подобных (like) другим генам в списке 4809.
Генов ферментов в списке 4681 (может быть больше).
Можно из этого списка получить и другую статистику по различным генам, но цель этой статьи показать, что изучение биологии человека спустя 10 лет после
7
определения его генома, только начинается.
Хотя сделано учеными очень много за это время, но еще очень много неясного,
не до конца изученного, очень много генов не подключены к генным сетям, то
есть об их взаимодействии информации нет. В генотерапии или других влияниях
на гены больше эмпиричности, чем точного знания. Предполагаемые последствия
не известны, так же как не известна функция многих генов.
Тексты ДНК. Медицина и биология будущего.2013.
В недалеком будущем синтез ДНК на специальных машинах по данной последовательности, а также секвенирование генома или какого-то участка ДНК, значительно ускорятся и станут дешевыми. Это приведет к тому, что работа с генами будет обыкновенной работой для лабораторий больниц или для работы с растениями и животными. Геномодификация их будет общедоступна.
Люди поймут, что геномодифицированные организмы создаются для их пользы. Для людей, далеких от генетики, я могу рекомендовать книгу про
геномодифицированные организмы и пользу, которую они дают. Литература [30].
Генотерапия для лечения рака, старения, инфекций или коррекции каких-то
свойств организма будет повседневной практикой. При этом для вводимых генов будет применяться текстовое пояснение. Вместе с целевым участком ДНК, будет вводится пришитый к нему участок ДНК с текстом. В нем будут записаны
основные данные о гене, месте введения, клетках, и другая медико-биологическая информация.
Эти тексты можно будет извлечь из биопроб и прочитать текст за несколько
минут с помощью специальных сканеров в будущем. Организм можно будет много
раз лечить с помощью различных геномодифицированных клеток.
Будут использованы либо клетки хозяина, которые превращаются
в недифференцированные стволовые клетки, либо универсальные клетки, годные
для любого человека.
Перед введением в конкретного человека, в эти клетки будет введена текстовая информация в ДНК. Это позволит и через много лет для конкретного человека узнать, какие генные модификации с ним были проведены. Для стандартизации
записи и чтения с ДНК будет нужен специальный ПЦР маркер текста. Размер вводимого текста может быть несколько тысяч или десятков тысяч байт.
Все генетические процедуры будут упрощены и доступны. Я думаю, что эти
времена наступят в ближайшие 10-50 лет. Большой срок нужен скорее для
проверки отдаленных последствий, но, если речь идет о жизни и смерти при
лечении рака или инфекций, то для таких людей личные последствия генотерапии
не имеют значения, так как позволяют им выжить сегодня. Без записи текстов в
ДНК любая генотерапия будет не контролируемая и не регулируемая через много
лет для конкретного человека. Процедура записи и чтения текстов будет стандартизована.
Будет полный и несложный контроль за любой генотерапией или генокоррекцией.
Таковы, я думаю, будут перспективы будущего для генетики.
С другой стороны, что будет в будущем, то уже было в прошлом. Если человек подвергался генотерапии или генокоррекции много тысяч лет назад, то эти текстовые или технологические участки ДНК можно пытаться найти в геноме человека.
При этом речь идет не о послании из прошлого, а о текстах, которые являются пояснением к какой-то операции на генах. Это моя гипотеза, которую я буду проверять.
МУЗЫКА ГЕНОВ ЧЕЛОВЕКА. Сообщение 1. 29 мая 2006 г.
Статьи для книги взяты из интернет-публикаций с некоторыми изменениями, написанных мной с 2006 по 2012 г, и расположенными на моих сайтах
www.neogerm.narod.ru и www.neogermetic.narod.ru , Рядом указана дата
публикации для соотношения с постоянно меняющейся мировой научной информацией.
8
Гены человека состоят из ДНК - основной молекулы жизни. Все ферменты,
структурные белки и другие молекулы закодированы в ДНК в виде
последовательности четырех нуклеотидов. Значение ДНК - это прежде всего
хранение информации, подобно жесткому диску компьютера. Возраст этой информации огромен. Жизнь была всегда во вселенной, переходя из галактики в галактику. И если молекула ДНК создана природой, то информация на ней записана далеким творцом и была ранее, чем возникла звезда по имени Солнце. Возраст разных генов человека оценивается от десятков миллионов лет до миллиардов лет. Есть у человека и других организмов настолько консервативные по информации
гены, что предполагается , что они были всегда. Это прежде всего гены ,
которые поддерживают информационную целостность ДНК. Поскольку даже единичные мутации в них, например, замена даже одного нуклеотида на другой, делают продукт этих генов летальным для клетки, и такие клетки сразу же
отбраковываются эволюцией. Для примера - ген белка гистона - H4 человека имеет
такую же последовательность нуклеотидов , что и у растений, а разница в
возрасте генов у них более миллиарда лет.
В начале 3 тысячелетия н. э. первичная структура ДНК человека, наконец,
была полностью определена. Более 25000 генов закодировано в геноме человека.
На 2013 год число генов у человека было уточнено и составило 22389.
Очень большой массив информации, заложенной в ДНК человека начали изучать ученые всего мира. Почти все задают себе вопрос, что еще кроме структуры
белка, РНК, и некодирующих участков - повторов, может содержать в себе главная молекула жизни? Может быть слова создателя всего живого, послание через миллиарды лет для тех, кто достиг сегодняшнего уровня научно-технического развития, достаточного, чтобы прочитать ДНК? Пока ответа нет. Это неизвестно.
Я решил, что одну информационную последовательность можно всегда
преобразовать в другую. Музыка является тоже информацией и мне пришла простая идея - переложить последовательность нуклеотидов в ДНК в последовательность
нот.
Я разработал алгоритм этого перевода, так чтобы музыка полностью
отражала химическое строение генных продуктов. И вот первый исходник
музыкальной программы написан, я ее запускаю, и я потрясен - оказывает
ДНК - это музыкальное произведение, гены - как мелодии! А этим мелодиям
миллиард лет. Музыка звучит несколько непривычно и оригинально, но чем чаще я прослушивал какую-то мелодию, тем больше она мне нравилась, видимо
запоминались отдельные сочетания нот в мелодии.
Хотя в основе этой музыки мой авторский алгоритм, но то, что я для перевода
в ноты использовал именно химическую структуру, позволяет мне это утверждать, что гармония музыки и гармония макромолекул объединились.
Возможны, конечно, другие алгоритмы перевода информациии из ДНК, но я взял наиболее простой и универсальный химический принцип, который является
свойством молекул во всей вселенной.
Данный алгоритм и простое программное оснащение для перевода
последовательности нуклеотидов ДНК в музыку будут опубликованы ниже.
Возможно, возникнет новая наука - генетическая музыкотерапия.
Для исследований по этой музыкальной терапии каждый может написать
мелодию на любой ген или группу генов, имеющих значение для какого-то заболевания или музыка-терапии или музыка-влияния на какие-то биохимические реакции или физиологические процессы.
ВОПРОСЫ ПО МУЗЫКЕ ГЕНОВ. Сообщение 2. 27 сентября 2006.
1. Может ли эта музыка прямо влиять на макромолекулы в организме ?
Нет. Специфическое прямое влияние на нуклеиновые кислоты и белки невозможно.
То есть раскачать в организме в резонансе какой-то конкретный белок или ген с целью изменения его активности, написанной для него музыкой, невозможно.
Нет физической связи между искусственно созданными звуками и молекулами. При любом алгоритме генной музыки. Хотя наука полна неочевидными явлениями и парадоксами. Может быть это явление не известно. Неспецифическое, то есть опосредованное корой и лимбической системой мозга , регуляцией уровня стресса, уровня гормонов в организме, как и другая музыка-терапия, действие генной
9
музыки возможно.
Речь идет именно о музыке, то есть звуках, поступающих через уши в слуховой анализатор мозга. То есть музыка может нравиться, вызывать положительные
эмоции, успокаивать или бодрить и через это влиять на общее состояние
организма. Я слушаю эту музыку уже не менее полугода, каких-то изменений в
организме не отмечено. Хотя если слушать длинную мелодию, то это способствует засыпанию , мелодия как бы слегка усыпляет и все.
Поэтому активировать какие-то нежелательные гены , например апоптоза,
онкогены, эндогенные вирусы, и другие, музыкой написанной с этих генов, не получится.
2. Какой алгоритм музыки генов человека?
Он будет описан ниже. Надо заметить, что алгоритмов преобразования последовательности нуклеотидов в последовательность звуков может быть много.
Сколько авторов - столько и вариантов музыки какого-то гена.
Лишь бы полученная музыка была приятной.
Если набрать в каком-то интернет-поисковике, например в Яндексе, слова
"музыка генов", то будет несколько интересных ссылок.
В одной их них известный ученый Гаряев Петр Петрович, автор книг о волновом геноме, предлагает свой вариант генной музыки, но его алгоритм мне неизвестен.
В инернет-ссылках описан алгоритм только у авторов из Испании. Это
А. С. Соуза и Р. Крулл. Их музыка состоит, как я понял, из 4 нот ,
соответствующих 4 нуклеотидам ДНК.
В моем алгоритме моей музыки генов, скажу пока только, звучат почти
все ноты из трех октав.
Так как диск этих исследователей-музыкантов из Испании купить где-то
невозможно, попробуйте-ка найдите, я сам закачал этот ген, о котором они
говорят - connexin 26. затем переложил его на музыку по-своему и по-ихнему.
Хотя я и не профессионал-музыкант, но музыка по-моему алгоритму гораздо приятнее. Музыка сочнее, четкие запоминающиеся участки мелодии, сама мелодия гораздо короче, что важно.
Гены могут быть очень большие, и слушать 10-20 минут переливы нот надоедает.
В моей музыке убраны все интроны из генов и отражающие их ноты.
Так как слушать то, что сама природа выщепляет из генов и разрушает
при движении информации от ДНК к белкам, пока считаю не нужным.
Но потом дойдет дело и до музыки интронов , музыки транспозонов, музыки повторов, и даже мусорную ДНК можно переделать на музыку, ведь она зачем-то
есть в геноме.
3. Для чего можно использовать музыку генов?
Прежде всего, просто слушать и размышлять о природе и вечности.
Информации , записанной в генах человека, миллионы и миллиарды лет.
А музыка генов отражает эту информацию. Можно попробывать применить
отдельные мелодии для музыкотерапии, но для этого нужны исследования.
Возможно в будущем окажется, что какие-то классические мелодии или музыкальные хиты отражают последовательность нуклеотидов в каких-то генах композиторов.
И они возникли не случайно и их влияние на эмоции, самочувствие людей тоже не случайно.
Поскольку мелодии уже написаны природой, нужно только перевести их в форму
для приятного восприятия, добавить аранжировки и готово. Цена в деньгах
мелодий будет невелика. поэтому их можно , я думаю, с успехом применить для озвучивания компьютерных игр, мультфильмов, кино.
4. Какое качество звука?
Файлы музыки генов записаны в формате pcm, файлы типа riff с
расширением wav. атрибуты файла - 44100 герц, 16 бит, стерео.
МУЗЫКА ГЕНОВ ДРОЖЖЕЙ. Сообщение 3. 10 января 2007 г.
Продолжаю развивать данный проект в виду его научной важности. Несколько лет назад в интернете прошла новость, что японский ученый Нобуо Мунатака перевел геном человека на музыку полностью.
Ссылка - WWW. Mosors. narod. ru/genom_muz. html.
10
Да, очень большая работа. Алгоритм японцев мне не известен. Я, для начала, создал около 40 музыкальных файлов, это музыка генов, основных для сохранения информации в ДНК - полимеразы, лигазы, топоизомеразы, а также генов, важных
для работы нервной системы - миелина, факторов роста нервов, липотропина (пептид, включает в себя эндогенный обезболиватель) и другие.
В 2007 г. я сделал то, что еще не было - полностью перевел на музыку
геном дрожжей. Эти Saccharomyces удивительные организмы.
Генов у них очень много - 6000, причем много уникальных , таких которые
человек в эволюции утратил. Это эукариоты, а не какие-то микробы. У них есть ядро, митохондрии и даже уникальный способ полового размножения. У дрожжей
много генов, последовательности нуклеотидов в которых близки к человеку.
При просмотре последовательностей генов сразу видно какие гены будут
хорошо звучать благодаря наличию в них всяких повторов,что создает уникальный ритм. Потребовалось около 2 месяцев, чтобы с помощью программ в полуавтоматическом режиме перевести геном дрожжей на музыку в программную
форму на BASIC. Теперь необходимые гены можно быстро переводить из этой формы
в WAV или MP3 файлы.
Музыка генов в форме программ позволяет легко изменить параметры музыки
нужного гена - частоту, темп и т. д.
Для примера приведу ген дрожжей PAU7 хромосомы 1.
Белок имеет размер 55 аминокислот, функция неизвестна. Привожу музыкальный
файл в формате QBASIC.Сделал Курносов М. 10 января 2007.
Причем я сделал хвост белка из 11 аминокислот повторяющимся 10 раз
искусственно. Аналогично можно поступать с другими генами, как бы увеличивая количество какого-то домена в белке.
PRINT "pau7 - MVKLTSIAAGVAAIAAGASAAATTTLSQSDERVNLVELGVYVSD"
PRINT "IRAHLAEYYSF"
PLAY "L8"
PLAY "O1GO3CO1BO2FO2BO3EO2GO3AO3AO4DO3C"
PLAY "O3AO3AO2GO3AO3AO4DO3AO3EO3AO3AO3A"
PLAY "O2BO2BO2BO2FO3EO2CO3EO2DO1AO1DO3C"
PLAY "O2EO2FO3CO1AO2FO4DO3CO1CO3CO3EO2D"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
АЛГОРИТМ МУЗЫКИ ГЕНОВ. БЕЛКОВЫЕ ДОМЕНЫ. Сообщение 4. 24 ИЮЛЯ 2008.
По просьбе людей, которые проявили интерес к музыке генов, я раскрываю идею
для алгоритма, который использовал для ее создания. Идея в следующем:
триплет нуклеотидов – универсальный генетический код - одна аминокислота –
одна нота октавы.
Для распределения всех 20 аминокислот по нотам я разделил их по молекулярной массе, чем больше вес - тем ниже частота звука. Таблица перевода аминокислот
в ноты дана ниже.
Каждая аминокислота соответствует одной ноте, а все они охватывают 3 октавы. Хотя музыка полностью отражает химическую структуру гена и его продукта,
но все-таки распределение это принято мной искусственно и этот перевод
последовательности нуклеотидов ДНК в последовательность звуков или нот
выполнен без связи с каким-то биологическим или физико-химическим процессом,
поэтому моя музыка генов не может оказать какого-то иного влияния на организм, чем обычная музыка.
К тому же музыкальный файл охватывает весь ген или белок, а они по своей
длине имеют разное значение. Есть структурные, есть регуляторные участки,есть
11
разные повторы. В ДНК информация белка закодирована, на ДНК участки гена
могут мало отличаться друг от друга, а в кодируемом им белке будут очень
разные структуры. Белки состоят из различных регионов, доменов, сайтов или
точек имеющих функциональное значение.
Поэтому следующим моим шагом было, конечно, создание музыки генов для отдельных белковых доменов. Для примера - белок спондин.
Ген расположен в 7 хромосоме - SSPO. Спондин нужен для нейрональной
агрегации в развитии нервной системы. Белок-предшественник очень большой - молекулярная масса 547504 Д. Аминокислот - 5147.
Если перевести такое количество аминокислот в ноты, то файл будет звучать
около 10 минут. Хорошая же генная мелодия - короткая, но оригинального
звучания. В спондине много доменов и я их привожу ниже, цитируя данные из белковой базы по адресу http://expasy.org.
SIGNAL 1 17 Potential.
CHAIN 18 5147 SCO-spondin.
DOMAIN 18 102 EMI.
DOMAIN 194 408 VWFD 1.
DOMAIN 469 524 TIL 1.
DOMAIN 563 773 VWFD 2.
DOMAIN 827 879 TIL 2.
DOMAIN 880 939 VWFC 1.
DOMAIN 1013 1219 VWFD 3.
DOMAIN 1275 1331 TIL 3.
DOMAIN 1375 1412 LDL-receptor class A 1.
DOMAIN 1415 1450 LDL-receptor class A 2.
DOMAIN 1451 1487 LDL-receptor class A 3.
DOMAIN 1491 1529 LDL-receptor class A 4.
DOMAIN 1564 1600 LDL-receptor class A 5.
DOMAIN 1602 1641 LDL-receptor class A 6.
DOMAIN 1655 1693 LDL-receptor class A 7.
DOMAIN 1694 1748 TSP type-1 1.
DOMAIN 1750 1808 TSP type-1 2.
DOMAIN 1824 1863 EGF-like 1.
DOMAIN 1864 1901 EGF-like 2.
DOMAIN 1909 1965 TSP type-1 3.
DOMAIN 1965 2025 VWFC 2.
DOMAIN 2065 2224 F5/8 type C.
DOMAIN 2233 2269 LDL-receptor class A 8.
DOMAIN 2390 2426 LDL-receptor class A 9.
DOMAIN 2463 2499 LDL-receptor class A 10.
DOMAIN 2500 2553 TSP type-1 4.
DOMAIN 2555 2610 TSP type-1 5.
DOMAIN 2633 2675 TIL 4.
DOMAIN 2715 2769 TSP type-1 6.
DOMAIN 2772 2828 TSP type-1 7.
DOMAIN 2830 2883 TSP type-1 8.
DOMAIN 2985 3040 TSP type-1 9.
DOMAIN 3041 3083 TSP type-1 10.
DOMAIN 3183 3250 TSP type-1 11.
DOMAIN 3252 3307 TSP type-1 12.
DOMAIN 3311 3365 TIL 5.
DOMAIN 3408 3470 TSP type-1 13.
DOMAIN 3472 3527 TSP type-1 14.
DOMAIN 3645 3693 TSP type-1 15.
DOMAIN 3811 3932 TSP type-1 16.
DOMAIN 3946 4002 TSP type-1 17.
DOMAIN 4004 4059 TSP type-1 18.
DOMAIN 4159 4212 TSP type-1 19.
DOMAIN 4253 4305 TSP type-1 20.
DOMAIN 4307 4363 TSP type-1 21.
DOMAIN 4365 4419 TSP type-1 22.
12
DOMAIN 4615 4665 TSP type-1 23.
DOMAIN 4667 4723 TIL 6.
DOMAIN 4763 4816 TSP type-1 24.
DOMAIN 4984 5042 VWFC 3.
DOMAIN 5041 5140 CTCK.
Для примера домен 1864-1901 это участок белка, подобный эпидермальному
фактору роста - EGF-like 2, и для таких коротких, но функционально-значимых
мест есть решение создать звуковой файл. Не обязательно звук, любой волновой паттерн.
Фармакология белковых доменов - это фармакология не далекого будущего, эта область биотехнологии очень интенсивно развивается. На основе 2 и 3 структур белковых доменов подбираются молекулы для избирательной модификации активных участков белка. Уникальность, консервативность и специфичность некоторых
доменов очень велика, например, активный центр фермента связывает и изменяет
только один тип молекул из десятков тысяч других и почти одинаковы у человека
и мыши.
ДОПОЛНЕНИЕ ПО МУЗЫКЕ ГЕНОВ. Сообщение 5. 13 августа 2008 г.
Расхваливать зарубежных ученых модно, своих потому-что почти не осталось.
Поэтому, прочитав ссылку http://www. compnews. ru/news/news/23059. html,
решил высказать свое мнение.
Алгоритм ученых из Америки проекта Gene2Music — выполненного Ри Такахаси
(Rie Takahashi), профессором Джеффри Миллером (Jeffrey Miller), и Фрэнком Петитом (Frank Pettit) из университета Калифорнии в Лос-Анджелесе основан на разделении всех аминокислот по гидрофобности-гидрофильности и по частоте триплетов для кодирования данной аминокислоты - получится звуковой ряд , где каждой аминокислоте будет дана своя нота.
Как и раньше было мной написано, я говорю, что алгоритмов перевода
последовательности нуклеотидов в ДНК в звуковые файлы может быть много, все зависит от целей - для чего эти файлы нужны. Сам я могу составить их штук 20, варьируя разные свойства нуклеотидов или аминокислот.
Чисто из-за музыки ничего не делается, а делается под конкретные проекты попыток влияния на геномы или протеомы. И здесь главное - попытаться
связать свойства молекул с волновыми характеристиками файлов. Это не
обязательно музыка, возможны любые волны, если предполагается их специфическое влияние, например чередование импульсов разной длины волны лазеров.
Музыка коллег из Америки мне понравилась, музыка медленного темпа, хорошего качества и оригинальности. Но на биологические объекты она влиять не сможет иначе, чем обычная музыка. Если разделение по гидрофобности в звуковой ряд
еще имеет какой-то биологический смысл, это влияние гидрофобности аминокислот
на 2 и 3 структуру белка и тропность гидрофобного домена к мембране, то использование вырожденности кода разбивает звуковой ряд искусственно.
Моя генная музыка имеет высокий темп и оригинальные мелодии. Приведу образец своей генной музыки, это субъединица АТФ-синтазного комплекса из митохондрий человека - ATP-SYNTASE-8, небольшой белок, кодируемый митохондриальным
геномом. Вот он -
PRINT "ATP-SYNTASA 8 MITOCHONDRIA HOMO SAPIENS"
REM COPYRIGHT KURNOSOV M. N. 12 apr 2006.
REM NAME - "POWER AND GOLD".
PLAY "L10"
PLAY "O1GO3DO2CO2FO2EO2BO2BO3CO0BO3DO2BO1G"
PLAY "O2GO2BO3DO1GO2FO2FO2BO2FO3EO2FO2GO2B"
PLAY "O2CO2FO1BO1GO2FO2EO2BO2EO1CO1FO2FO3D"
PLAY "O3DO3EO3DO1BO3DO1GO1BO1G"
PLAY "O1BO2EO1CO2EO1BO3DO0BO1AO3DO1BO0BO2B"
PLAY "O1BO2GO2AO3EO2FO1FO3EO2FO3DO3DO2CO3E"
PLAY "O1GO3DO2CO2FO2EO2BO2BO3CO0BO3DO2BO1G"
13
PLAY "O2GO2BO3DO1GO2FO2FO2BO2FO3EO2FO2GO2B"
PLAY "O2CO2FO1BO1GO2FO2EO2BO2EO1CO1FO2FO3D"
PLAY "O3DO3EO3DO1BO3DO1GO1BO1G"
PLAY "O1BO2EO1CO2EO1BO3DO0BO1AO3DO1BO0BO2B"
PLAY "O1BO2GO2AO3EO2FO1FO3EO2FO3DO3DO2CO3E"
PLAY "O1GO3DO2CO2FO2EO2BO2BO3CO0BO3DO2BO1G"
PLAY "O2GO2BO3DO1GO2FO2FO2BO2FO3EO2FO2GO2B"
PLAY "O2CO2FO1BO1GO2FO2EO2BO2EO1CO1FO2FO3D"
PLAY "O3DO3EO3DO1BO3DO1GO1BO1G"
PLAY "O1BO2EO1CO2EO1BO3DO0BO1AO3DO1BO0BO2B"
PLAY "O1BO2GO2AO3EO2FO1FO3EO2FO3DO3DO2CO3E"
В этом файле белок повторен 3 раза.
На эту дату изготовлено более 100 мелодий разных генов человека, формат WAV
или MP3, если кого-то заинтересует моя генная музыка, то сделаю любой ген, любого организма очень быстро с помощью моей простой программы перевода последовательности нуклеотидов в последовательность нот. Или могу сделать
музыку отдельных белковых доменов. В наличии пока есть музыка всех 6000 генов дрожжей S. cerevis. , которые я целый месяц набирал в виде программ на своем
любимом 386 компьютере, ведь для создания и воспроизведения генной музыки достаточно любого древнего ПК.
МУЗЫКА ГЕНОВ ВИРУСА ГЕРПЕСА ТИПА 2. Сообщение 6. 10 января 2011 г.
Я создал музыку генов герпес-вируса типа 2 по алгоритму, сообщенному мной ранее на моем сайте WWW.NEOGERMETIC.NAROD.RU. Прежде всего хочу сказать, что последовательность нуклеотидов ДНК геномов или генов разных организмов от человека до самых простых вирусов можно преобразовать в любую другую информационную последовательность. Это может быть текст из букв какого-то
языка, это может быть последовательность разных звуков , как в музыке генов, последовательность световых, цветовых сигналов, различных полевых импульсов - СВЧ-излучения, модуляции электростатического поля, разное лазерное когерентное излучение и другое.
То есть последовательность нуклеотидов ДНК, РНК или белка можно
преобразовать в любую другую информацию, носителем которой может быть любая другая материя.
Но обратный процесс, а именно влияние этих физических материй, созданных на основе кода молекулы ДНК, РНК или белков , на сами молекулы вряд ли возможно
в смысле специфичности воздействия. Иначе говоря вряд ли музыка генов окажет
какое-то влияние в нужном направлении на гены или белки.
Пока мне про это ничего не известно.Возможно достичь какое-то
неспецифическое действие, например повышение температуры раствора, но для
этого не надо заниматься преобразованиями одного информационного кода или сообщения в другое.
Эта музыка генов вируса герпеса просто демонстрация возможности
преобразования одной информационной последовательности в другую. Для примера привожу музыкальный файл гена VP26 вируса, белок длиной 112 аминокислот. Это малый капсидный белок вируса по функции. Последние 24 аминокислоты я повторил
3 раза искусственно.
PRINT "HERPES VIRUS 2 VP26,AVTOR KURNOSOV M.N."
PLAY "L10"
PLAY PLAY PLAY "O2DO2EO3EO1CO3DO1FO3DO1F"
PLAY PLAY PLAY "O4DO2DO3AO3AO3AO1AO0BO2F"
PLAY PLAY "O1BO2BO3DO3EO2BO3D"
PLAY PLAY "O1BO2BO3DO3EO2BO3D"
14
PLAY PLAY "O1BO2BO3DO3EO2BO3D"
Предлагаю всем желающим студентам, биологам , медикам для научного изучения этой музыки генов получить какие-то экспериментальные результаты по ее воздействию на биологические объекты. А именно вирусы, бактерии, клетки, многоклеточные организмы. Всего у вируса герпеса типа 2 есть 77 белков, из
них 8 с неизвестной функцией. В этой книге приведен для примера один белок и
его музыкальный файл, остальные опубликованы мной на сайте.
МЕТОДИКА РАБОТЫ.
Все это делается на самой простой машине - процессор 386sx33, на выход системного динамика с сопротивлением 8 ом и мощностью 0, 5 ватта подключается более мощный динамик. Испытано хорошо динамик 2ГДШ3 с сопротивлением 8 ом.
Звук более громкий и приятный, чем от маленького динамика. Для создания и проигрывания музыки генов используется программа QBASIC. EXE версия 1. 1 , входящая в состав MSDOS 6. 22 , также используется программа EDIT. COM,
входящая в эту же DOS. Эти программы будут работать и на операционной
системе WINDOWS XP. Этот звук можно вывести на дистанционный динамик для
влияния на биообъекты. В окне QBASIC надо открыть программный файл,
например 75. BAS и нажать клавишу F5 - RUN. Программисты-профессионалы могут, конечно, сделать какой-то шедевр для этих целей для WINDOWS, но мне
достаточно и QBASIC.
Чтобы изучить любой ген, надо загрузить его последовательность из хранилища NCBI по адресу WWW. NCBI. NLM. NIH. GOV или с любого зеркала.
Частоты звуков, кодируемые QBASIC следующие.
НОТА ДО РЕ МИ ФА СОЛЬ ЛЯ СИ
БУКВА C D E F G A B
5 ОКТАВ О1 О2 О3 О4 О5
ЧАСТОТЫ 130-247 261-494 523-988 1047-1975 2092-3950
ГЕРЦ
Например, значение O1B - нота СИ малой октавы , ее частота - 247 Герц.
Перед каждой мелодией стоит PLAY "L12" - это темп или скорость мелодии.
Я принял следующие значения параметров для своей музыки.Алгоритм автора
- Курносова М.Н. для связи аминокислот и звука.
Аминокислота Масса-Д Частота-Гц Значение для PLAY
W 204 247 O2B
Y 181 262 O2C
R 174 294 O2D
F 165 330 O2E
H 155 349 O2F
M 149 392 O2G
E 147 440 O2A
K 146 494 O2B
Q 146 523 O3C
D 133 587 O3D
N 132 659 O3E
L 131 699 O3F
I 131 784 O3G
C 121 880 O3A
T 119 988 O3B
V 117 1047 O4C
P 115 1175 O4D
S 105 1319 O4E
A 89 1760 O4A
G 75 2350 O5D
15
Замена последовательности аминокислот или нуклеотидов на последовательность
нот производится специальной программой, но это можно сделать и вручную, используя в различных редакторах текста опции "заменить на" и "заменить все". Далее вручную набить кавычки и PLAY по образцам, приведенным в статье.
Более точные значения для оператора SOUND и PLAY надо читать руководство по программированию в среде QBASIC. Так все белки вируса герпеса я превратил в музыкальные файлы примерно за час работы. Файлы под QBASIC удобны тем, что параметры звука можно варьировать очень быстро, просто изменяя их в окне редактора QBASIC.
Для прослушивания надо текст стандартными приемами WINDOWS перенести в окно QBASIC. Файл должен иметь обязательно расширение . BAS , например, 75. BAS.
Лучше файл сохранить в одной папке рядом с программой QBASIC, чтоб ее было
легче найти и открыть. Звук системного динамика запускается кнопкой F5 - RUN.
Далее зыук, выводимый системным динамиком компьютера, переводится в звук, с расширением WAV , MP3 или другое для удобства дальнейшего прослушивания. Для этого применяются разные редакторы звука, например SOUNDFORGE, GOLDWAVE или другой. Захваченный программой звук сохраняется в другом нужном формате с коррекцией качества звука.
МУЗЫКА БЕЛКОВЫХ КОМПЛЕКСОВ. СООБЩЕНИЕ 7. 4 ИЮНЯ 2011.
Музыка отдельных генов или отдельных белков - это уже пройденный этап.
В живой клетке большинство белков объединены в различные макромолекулярные комплексы.
Почти все белки обладают большим специфичным сродством к другим белкам.
Белки в клетке находят из тысяч других те, с которыми надо объединиться в комплексы. Binding protein - это свойство есть почти у каждого пятого белка,
а на самом деле еще больше. Например, праймазы PRIM1 и PRIM2 образуют гетеродимер. А полимераза дельта состоит из 4 субъединиц, кодируемые разными генами, они объединяются в тетрамер.
То есть из белков генов POLD1, POLD2, POLD3, POLD4 образуется
единый комплекс - рабочая полимераза или биохимическая наномашина, к ней прицепляются еще несколько регуляторных устройств или добавочных белков.
Binding или связь происходит по строго определенным участкам белка,
как правило, это специальные домены для этой функции связи. Домены - это небольшие участки белка, иногда цепь в несколько аминокислот или пространственная структура, подходящие друг к другу как ключ к замку.
Моя идея состоит в том, чтобы наложить мелодии этих белков друг на друга.
Получиться ансамбль генов. Или ансамбль комплекса белков наномашины или наноструктуры.
Подобное наложение легко осуществить с помощью программы - звукового
редактора GOLDWAVE 5. 04 2003 года, или другой версии. Демо версия этой программы есть на диске "Компьютер пресс"8-2004.
Демо версии вполне достаточно для импульсных научных работ.
Адрес программы - GoldWave Shareware Version http://www. goldwave. com .
Для этого музыку одного гена отправляю в буфер обмена, и кнопкой MIX
произвожу наложение на музыку другого гена. Можно очень точно сделать
смещение одного музыкального файла относительно другого, с точностью
до одной ноты или одной аминокислоты.
Я не думаю, что этой микст-музыкой можно как-то прямо влиять на эти
наномашины.
Любые новые взаимодействия генов , даже на виртуальном или нереальном,
как в случае генной музыки уровне, просто расширяют наши возможности
оперирования генетическим аппаратом, возможно через много лет.
При генном программировании и на информационном уровне, а не на уровне
реальных молекул.
На своем сайте я привожу пример моей музыки генов - файлы музыки генов
праймаз PRIM1, PRIM2 , белки участвуют в репликации ДНК. Можно для примера наложить музыку одного белка на другой с любым смещением нот.
Так без учета доменов реально взаимодействующих в димере произведено
наложение от первой аминокислоты и так далее.
16
Белки POLD1, POLD2, POLD3, POLD4 комплекса дельта полимеразы.
На основную субъединицу полимеразы я наложил звуки не целых белков других субъединиц, а только домены - части молекул. Этот файл ансамбля наномашин.
Гистоновый октет - состоит из 8 белков гистонов по две молекулы белков генов H2a, H2b, H3, H4. Они являются наноструктурами для упаковки ДНК в нуклеосому размером около 10 нм. Структура гистонов H4 очень консервативна и осталось
без изменения около 2 миллиардов лет.Я создал музыкальные файлы этих
гистонов и также наложения двух соседних гистонов. Наложение гистона H4 на гистон H3 без сдвига и гистона H4 на гистон H4 со сдвигом на одну ноту так
как делеция в 24 аминокислоте.
Также произведено мной наложение на музыку белка SSBP1 такого же белка,
только с мутацией, а именно делеция 22 аминокислоты, что приводит к
сдвигу всех нот после нее на единицу. Белок SSBP1 - митохондриальный
белок, связывающий одноцепочную ДНК при ее репликации, белок гомотетрамер, то есть состоит из 4 одинаковых единиц.
Это только начальные примеры генной или белковой музыки комплексов
молекул.
При накладывании интактных белков друг на друга музыка гена не изменяется.
Но при накладывании мутантного белка музыка комплекса совсем другая. Может
она звучит лучше или нет, но для молекул восприятие музыки человеком не имеет значения.
Если наложение сделано неточно, то мелодия звучит плохо, и в редакторе звука исчезают пробелы между нотами.
Это все искусственные звуковые мелодии, напрямую с генами и белками никак не связаны. Есть только косвенная информационная или виртуальная связь.
В заключении по музыке генов я хочу сказать, что любые работы с текстами ДНК, даже на виртуальном уровне, далеком от живых организмов, расширяют наши
знания и обязательно пригодятся в будущем.
Для знакомства с работами по музыке генов на Западе, я даю интернет-ссылку,
где M. A. Klark рассказывает о разных направлениях в музыке генов в настоящее время.
http://whozoo. org/mac/Music/index. htm.
http://whozoo. org/mac/Music/Sources. htm.
На этом же сайте есть примеры генной музыки.
Я, в отличии от других авторов, делаю упор в своей музыке именно на
первичную структуру молекул и не применяю аранжировки для того, чтобы
приятнее было слушать. Моя музыка генов генов – это полное отражение
нуклеотидов или аминокислот без посторонних звуков. Я надеюсь, что моя
методика, которую я напечатал выше поможет новым ученым для изучения живого.
ГЕНОМ ЧЕЛОВЕКА И МИТОХОНДРИЯ. ЧАСТЬ 1. 21 АПРЕЛЯ 2008.
Данная статья написана с целью ускорения эволюции человка, перехода его на более высокий биологический уровень, чем Homo sapiens. Для работы митохондрий необходимо около 810 генов, продукты которых являются структурными
компонентами митохондрий и различными ферментами энергетического обмена и белками обслуживающими геном митохондрий и синтез белков на рибосомах.
Когда-то геном митохондрий содержал значительно больше генов, а сегодня геном митохондрии человека содержит всего 37 гена, а из них только 13 необходимых
для энергетики.
Все остальные гены в течение эволюции переместились в хромосомы ядра.
Этот рудиментарный геном для митохондрии и для клетки в целом только вреден,
так как его повреждаемость кислородными радикалами и другими генотоксическими веществами во много раз выше , чем для генов ядра.
Высокая повреждаемость генома митохондрий значительно сокращает время жизни человека и способность к работе с возрастом. Сами клетки из-за митохондрий
более уязвимы к различным повреждениям, так как часто через митохондрии активируется клеточный апоптоз
и смерть.
Факторов апоптоза, связанных с митохондриями , более 28, и они могут
запускаться при критическом уровне повреждений в митохондрии.
17
Почти 99 белков, которые обеспечивают работу рибосом митохондрий, должны образоваться в цитоплазме и затем переместиться в матрикс митохондриии.
Только для того, чтобы транслировать 13 генов генома митохондрии. Вывод напрашивается сам собой и я не первый, скорее всего, кто обратил на это внимание.
Надо перенести эти 13 нужных генов энергетики в хромосомы ядра, а геном митохондрии разрушить.
Еще в 70-х годах 20 века изучалось движение белков в митохондрию и многие
ученые думали о переносе генома митохондрии в ядро.
О транспорте белков в митохондрию литература [2, 3].
Я здесь попытался осмыслить этот возможный перенос генов в связи с
данными генома человека в новых условиях развития информатики ДНК.
Это должно по расчетам привести к появлению нового вида человека. Я назвал
его Homo neosapiens. Это будет скачок в эволюции человека, так, как он приобретет совершенно новые свойства.
Это очень высокая энергетика, высокая устойчивость к повреждающим факторам среды, скачок в продолжительности жизни, устойчивость ко многим болезням.
Простой перенос в хромосомы в виде вектора выделенных геномов митохондрий
вряд ли приведет к ненужности митохондриального генома, даже если произойдет удачная интеграция. Для сборки митохондрии надо, чтобы белки ферментных комплексов сначала проникли в саму митохондрию. Для этого
белки-предшественники должны иметь лидерный конец, с помощью которого они проходят через пору митохондрии, а также должны иметь сайт атаки
эндопептидазы для отщепления лидерного конца.
Белки, синтезирующихся внутри митохондрии, не имеют таких участков
из-за ненадобности. Поэтому перед созданием вектора, содержащего гены митохондриального генома, надо перед каждым геном расположить обычный
промотор хромосомного гена, затем последовательность, кодирующую лидер и сайт
для эндопептидазы.
Здесь лучше всего пойти по аналогии с генами , являющимися компонентами митохондрий и лежащими в хромосомах и создать участок вектора по подобию.
Для этого я прошелся по геному человека и составил самый полный на сегодня список генов домашнего хозяйства митохондрии. Возможно в нем не хватает нескольких генов, так как генов с неизвестными функциями очень много.
Список дан в приложении 1 и 2. В будущем при изучении генома список незначительно изменится. Получилось, что гены домашнего хозяйства митохондрии, составляют около 3 процентов всех генов человека.
Они разбросаны по всем хромосомам почти равномерно, что говорит о том, что митохондрия теряла гены постепенно, и что переход каждого гена в хромосомы
был выгоден с эволюционной точки зрения для клетки и организма.
Использование этого списка облегчает изучение биологии митохондрии, так как
гены легко найти и сгруппировать на несколько крупных семейств.
Это семейство генов белков рибосом L и S субъединиц, семейство переносчиков низкомолекулярных субстратов SLC25A, семейства транслоказ белков через
наружную и внутреннюю мембраны митохондрий TOMM и TIMM, семейства
NADH-дегидрогеназ NDUFA и NDUFS и другие.
При разработке новых генов хромосом гены из этого списка можно использовать
для образца, так как их белки имееют нужный сигнальный конец и все удачно проникают внутрь митохондрии.
МИТОХОНДРИЯ И ГЕНОМ ЧЕЛОВЕКА. ЧАСТЬ 2. 01 МАРТА 2009.
ДОПОЛНЕНИЕ 01 ЯНВАРЯ 2012.
После обсуждения возможности переноса генома митохондрии в ядерный
геном со специалистами были сделаны дополнительные выводы, которые
изложены ниже.
1. По поводу митохондриальной патологии и старения.
Старение неразрывно связано с всеобщим энергодефицитом
в организме человека. Страдают все звенья энергетического обмена.
Многие возрастные болезни прямо связаны с недостатком энергии в
клетках.
18
Про это много написано в прошлых исследованиях по геронтологии. Старение и патология митохондрий неразрывны. Например, активность цитохромоксидазы значительно падает.
Обзорная информация по энергетике при старении в литературе [4].
Современные данные - литература для примера [5-13].
Мое мнение, что для старения важны как гены митохондрии, так и более 800
генов ядра домашнего хозяйства митохондрий. Но в митохондрии гены более подвержены повреждениям. Можно пробовать спасать или защищать геном ее антиоксидантами, но опыт говорит, что это недостаточно, к тому же много
других, кроме кислорода, вредоносных генотоксических агентов.
Радикальная защита митохондрии - это удаление генома из митохондрии и перенос генов в ядро.
Есть еще один аспект этого переноса. В ядре работают 99 генов для обеспечения работы генома и рибосом митохондрии. Если перенос успешен, то эти гены станут
не нужны. Причем эти гены интенсивного функционирования и их ненадобность
значительно облегчит работу ядра клетки, а их повреждаемость с возрастом не будет влиять на состояние клетки.
Предположительно, ненадобность этих 99 генов значительно повысит
устойчивость клетки к повреждениям и продолжительность жизни.
Последние исследования доказывают роль генома митохондрий в старении.
Так, при создании мышей с ДНК-полимеразой (ген POLGA), которая при
копировании генома митохондрии, вызывает повышение мутаций в нем, обнаружено, что эти мыши имееют ускоренное старение, сокращение жизни, ранний старческий фенотип. Начало старения, средняя продолжительность и максимальная
продолжительность жизни составила соответственно 25, 48, 61 недели.
Причем уровень кислородных радикалов был не высоким. Литература [5-12].
2. В геноме митохондрии 4 кодона отличаются от ядерного генома, то есть в митохондрии они транслируют разные аминокислоты или терминаторы.
То есть, если гены митохондрии просто встроить в хромосому, то их трансляция будет ошибочна. Сегодня различия генного кода легко обходимы,
не надо пытаться заниматься точковым мутагенезом с помощью олигонуклеотидов
или иначе. Есть фирмы, которые рекламирует быстрый синтез гена из нуклеотидов
напрямую, для митохондриальных генов это лучший способ, так как они
небольшие, можно добавить и лидерный участок и промотор. При этом кодоны
будут исправлены.
Нет необходимости переносить весь геном митохондрии в хромосомы, так как в
нем будут содержаться ненужные гены - тРНК, рРНК. Надо перенести только
важные 13 генов, причем для начала можно перенести часть или один ген и посмотреть, что будет.
У меня в наличии есть программа для того, чтобы быстро исправить нужные
кодоны в геноме митохондрии, так, чтобы они были приспособлены для трансляции
в цитоплазме. Приведу пример гена ATP6 с кодонами для трансляции в
митохондрии и созданный мной ген для трансляции в цитоплазме. Это хороший
пример биоинформатики ДНК, когда создается новый ген на основе теоретических знаний.
Ген для трансляции в митохондрии - 681 нуклеотид.
Цитировано с http://ncbi. nlm. nih. gov.
tacctgcacgacaacacataa
19
Ген для трансляции в цитоплазме - 681 нуклеотид,
создал Курносов М. Н. Ген искусственный, только кодирующая
часть.
tacctgcacgacaacacataa
3. Еще одно возможное препятствие для осуществления этого проекта - это
сильно неполярный гидрофобный характер белков, синтезируемых с
митохондриального генома. Возможно будет затруднена их трансляция в
цитоплазме. Действительно , белки митохондрии генома довольно сильно
неполярны, что может препятствовать их трансляции и транспорту внутрь митохондрии.
Субъединицы многих белков митохондрий имеют неполярные, трансмембранные
домены, но тем не менее они с помощью лидерной последовательности проникают сначала в матрикс, а затем встраиваются в мембрану. Поэтому я думаю, что подобрав нужный лидерный участок этих белков, сильно заряженный и
гидрофильный можно это будет преодолеть.
После транспорта внуть митохондрии какой бы лидер не был, он будет отрезан протеазой.
Для примера приведу - ген COX6A ядра, у которого я пометил неполярный домен - ffvalpgvav, а также указал сигнальный пептид - лидер.
Этот пептид отрезается и нужен только для проникновения белка в митохондрию.
mavvgvssvsrllgrsrpqlgrpm - лидер
-*****--*--***---*-**-*-
ssgahgeegsarmwktltFFVALPGVAVsmlnvylk
--**-*--*-*-----*-**********--*-*-*-
shhgeherpefiayphlrirtkpfpwgdgnhtlfhn
---*----*-***-*-*-*---***-*-*---**--
phvnplptgyede
*-*-***-*----
Ген ATP8 генома митохондрии, неполярных участков мало. Без предполагаемого лидера.
MPQLNTTVWPTMITPMLLTLFLITQLKMLN
-*-*---*-*--*-*-**-****--*--*-
TNYHLPPSPKPMKMKNYNKPWEPKWTKICS
----***-*-*--------*--*----*--
LHSLPPQS
*--***--
Я отметил (*) неполярные аминокислоты. Их может быть много в белках,
кодируемых ядром и в белках, кодируемых геномом митохондрии.
4. Белки, образуемые в цитоплазме, подвергаются созреванию, то есть частичной модификации аминокислот.
5. Чтобы белки работали, они должны соединиться в макромолекулярный комплекс. Напимер, образовать АТФ-синтазу из нескольких субъединиц. Все это может усложнить проект. В конечном счете опыт - критерий истины.
Таким образом, необходимы прямые эксперименты для проверки синтеза и
транспорта белков, кодируемых генами митохондрии из цитоплазмы в митохондрию.
20
Показано , что процесс встраивания части митохондриального генома в хромосомы
происходит спонтанно у некоторых видов. То есть этот процесс происходит в природе, но он не управляемый и толку от него нет.
В настоящее время проводятся эксперименты по таргетингу (то есть управляемому транспорту белков внутрь митохондрии). Речь идет именно о белках, которые
сами не могут в нее попасть. К ним надо пришить сигнальный пептид
определенного состава, который и осуществит проникновение белка в
митохондрию. Теоретическое обоснование пользы от этого переноса и возможности это осуществить вполне достаточны, то есть нет каких-то явных непреодолимых препятствий. О возможности переноса генома митохондрии в ядро ученые думали
давно - с 70-годов прошлого века. Наконец весь мир из книги Обри де Грея
узнал, что он взялся решить эту проблему. Литература (14).
И вот прошло уже 5 лет с момента его декларации об этом намерении, а каких-то серьезных результатов пока не напечатано. Можно пожелать ему успеха в его работе. Но может быть так, что результатов никто не дождется. Поэтому я
считаю, что такие проекты надо одновременно делать в нескольких независимых лабораториях.
В этой статье я теоретически обдумал подходы к началу таких экспериментов. Информатика ДНК позволяет это сделать, сидя за компьютером.
Будет создан новый вид человека, который не будет скрещиваться с Homo
sapiens, так как будут созданы митохондрии без генома. Надо будет создать
особи женского рода с новыми митохондриями и особи мужского рода с
хромосомами, содержащими модифицированный геном митохондрий для обоих полов.
Тут без клонирования человека не обойтись, так как митохондрии наследуются
через яйцеклетки. Промежуточный этап - это получение стволовых клеток,
в ядре которых будет такой геном митохондрий. Для начала надо получить устойчивую экспрессию отдельных модифицированных генов митохондрии и
транспорт этого белка внутрь ее.
Еще раз обращаю внимание, что в одной лаборатории это все сделать сложно по многим причинам, и поэтому какие бы не были получены результаты ранее, надо просто подключиться или начать с нуля этот проект. Может быть так, что
удачные результаты никогда не будут опубликованы, а новые клетки содержащие геном митохондрии в ядре невозможно будет где-то получить или приобрести.
Этот проект переноса генов из митохондрии в ядро я представил в этой книге
для демонстрации теоретической биоинформатики, работа с которой должна предшествовать экспериментам с молекулами и клетками.
УПРАВЛЯЕМЫЕ НАНОМАШИНЫ - ОСНОВА ТЕРАПИИ БУДУЩЕГО.2008.
После того, как геном человека или другого организма был полностью
расшифрован,я решил,что появилась возможность НАПРАВЛЯТЬ ЭТУ ИНФОРМАЦИЮ
ОБРАТНО К ГЕНАМ с помощью физических факторов - звука, света, других волн.
Мной без спешки, пока гипотетически, разрабатываются комбинированные
наномашины на основе фермента полимеразы. К ферменту ожидается пришить чувствительный к внешним воздействиям белок или хромофор. При приеме им
квантов звука или света предполагается, что будет изменяется конформация активных центров полимеразы или коррегирующей нуклеазы. Это все делается для управляемого мутагенеза при синтезе ДНК.
Управляемый мутагенез позволит создавать или устранять точковые мутации в
ДНК. А внешний сигнал служит для инструкции наномашины. То есть какой
нуклеотид должен быть встроен задается извне звуком и светом на основаии
известной последовательности для нужного гена.
Звук скорее должен быть не слышимым, а микроволновым. И должен действовать не прямо на молекулы, а на промежуточные микромашины. Эти микромашины, я думаю, будут использоваться уже для передачи информационного сигнала на наномашины, а
они будут влиять на макромолекулы.
Я назвал этот возможный в будущкм синтез нуклеиновых полимеров –
ИНСТРУКТИВНЫМ СИНТЕЗОМ ДНК ИЛИ РНК.
Все это может привести к революционным изменениям в биологии человека!!!
Любые гены можно подвергнуть быстрой модификации, что изменит их белки и
фенотип человека. Лечение всех болезней - рака , старения, нервных болезней,
21
инфекций и так далее будет проволится на совершенно другом уровне
генотерапии. Без применения вирусов, плазмид, векторов. Это все может быть возможно в будущем. Пока создаются только отдаленые подходы к решению этой проблемы. Основные сложности - это отсутствие обратной связи с наномашиной и определение момента ее включения. Инструктивный синтез ДНК отличается от матричного тем, что при работе полимеразы в новую цепь вносятся специальные
ошибки. Если для матричного синтеза эволюцией создан высокоточный механизм копирования с коррекцией ошибок неправильно комплементированных нуклеотидов ,
то для инструктивного синтеза именно ошибки синтеза второй цепи ДНК и
являются целью.
Внешняя инструкция для полимеразы управляет ей и определяет места управляемой замены нуклеотидов, которые уже не являются комплементарными для материнской цепи. При этом ген либо исправляет точковые мутации, полученные по наследству, либо ген нокаутируется и становится непригодным для синтеза белка. Пока что
это одни идеи, но как бы было интересно внешним влиянием на наномашины
изменять быстро генетическую информацию. Даже если будет создана модифицированная полимераза, самый сложный вопрос - точка начала изменения
ДНК и точка остановки. Пока идея мной высказана, а решения, может быть очень необычные, появятся позднее. Итак, информация о генах и других участках ДНК определена в виде последовательности нуклеотидов. Теперь эту информацию надо провести до ядра клетки обратно в виде информационной инструкции и изменить
ДНК в клетке с помощью наномашин. Движется эта наномашина вдоль гена
и синтезирует вторую цепь уже с внесенными точковыми изменениями. Дочерние клетки унаследуют эти изменения.
В настоящее время проводятся эксперименты по влиянию квантов света на белки, связанные со светочувствительными хромофорами. Пример этих работ - это работа
о влиянии света на ионотропный глутаматный рецептор нервной клетки.
К белку был пришит хромофор, имеющий избирательное поглощение света. Импульс света 380 нм вызывал активирование канала рецептора, а импульс света в 500 нм выключал рецептор. Для дистанционного управления каналом рецептора к белку
была пришита молекула деривата азобензена в качестве фотоприемника. При поглощении света изменялась конформация белка, что меняло его функцию. Предполагается использовать эти наномашины в виде глутамат-рецептора с
пришитыми поглотителями света для управления нейронами на расстоянии.
Литература [1].
Успехи этих работ дают мне возможность предположить, что и моя идея об управлении наномашиной в виде модифицированной полимеразы тоже будут успешны.
В настоящее время я могу только гипотетически разрабатывать эту машину.
Моя идея в следующем. Для посадки этой наномашины на нужный ген или в нужное место генома клеток надо сначала отсеквенировать организм или клеточную культуру. Теперь будет возможность выбрать точно праймер для посадки
полимеразы в нужном месте. Праймер пришивается к инициирующему белку,
входящему в наномашину. Один импульс света отсоединяет его от машины,
а другой импульс света вызывает ошибку синтеза в нужном месте ДНК при ее
движении. Таким образом все генетические свойства организма или клеток, любой фенотип можно менять на лету, преобразовывать одни клетки в другие по
качеству. Исправлять любые генетические повреждения быстро и просто. Клетки будут бессмертны. Вот для этого мной и разрабатывается ультразвуковая музыка генов.
ГЕНЫ-ГИГАНТЫ В ГЕНОМЕ ЧЕЛОВЕКА. СООБЩЕНИЕ 1. 20 ноября 2008 г.
Продолжая развивать свой проект "ДНК говорит", я искал какие гены могут выполнять функцию оболочки или носителя для внешних, специально введенных в
гены информационных, текстовых посланий. Для этого я решил, что главным критерием для отбора таких генов будет их размер, чем он больше, тем больше информации может содержать ген.
При анализе генома человека было я просмотрел вручную 29216 генов из реферативной базы генома NCBI. Официальное количество генов в геноме
человека, взятое из карт хромосом, равно 26806 генов. Для анализа учитывались гены размером более 60 тпн, и интроны - размером более 40 тпн. Общее
22
количество таких генов, сумма по всем 24 хромосомам приведена в таблице.
ТПН - тысячи пар нуклеотидов.
РАЗМЕР ГЕНОВ (ТПН) СУММА ГЕНОВ
60 - 100 1943
100 - 200 1639
200 - 300 509
300 - 400 271
400 - 500 130
500 - 600 87
600 - 700 46
700 - 800 29
800 - 900 19
900 - 1000 16
БОЛЕЕ 1000 39
СУММА 4718
Это составит 16, 3 процента от общего количества просмотренных генов.
Наиболее демонстративны особые размеры генов более 400 тпн , их количество
- 324 (1,09 процента от общей суммы генов), и я полностью вывел
в таблицу их обозначение, размер гена в тпн , размер самого большого
интрона в гене в тпн. Они записаны в приложении 3.
Таким образом , были обнаружены в геноме человека гены-гиганты, размер
которых в 10-100 раз больше обычных генов.
Рекордный размер имееют следующие гены : CNTNAP2 - 2305, DMD - 2220,
CSND1 - 2057, LRP1B - 1901 тпн.
Конечно, я не первый их открыл, ученые, которые секвенировали геном, также
обратили на них внимание, только обзора с системным анализом этой генной
аномалии я не нашел. Поэтому неплохо обратить внимание ученых на них еще
раз. Важно, что размер этих генов обусловлен в основном размерами интронов,
которые в них находятся. Также я вывел в таблицу интроны, максимальных
размеров.
Самые крупные интроны в геноме человека находятся в следующих
генах и имеют размер в гене GPC5 - 722, SGCZ - 683, CNTNAP2 - 657,
OPCML - 589 , PCDH9 - 580 тпн .
С точки зрения моего проекта "ДНК говорит" , эти гены и интроны могут
быть оболочкой или носителем какой-то важной информации, введенной
вместо интрона в ген, в одном гене можно разместить почти 700 килобайт
информации.
С точки зрения физиологии клетки, если есть гены и интроны такой
большой длины , значит это необходимо для природы и эти образования
могут играть важную роль в клетке.
Среднее количество интронов в генах человека равно 7, 4 на ген. При
колебании от 0 до 35 интрона на ген.
Однако в геноме человека встречаются в небольшом количестве гены , имеющие
количество интронов в гене значительно выше среднего. Эти гены я вывел в виде таблицы. И эта аномалия интересна для науки, как и все необычное.
Хромосома Ген Размер гена Количество интронов в гене
1 CSMD2 650 74
HMCN1 456 100
USH2A 800 71
HSPG2 115 96
ZUBR1 139 105
LOC728841 77 91
OBSCN 157 81
RYR2 791 104
COL16A 53 70
MACF1 405 94
USP24 149 64
23
COL24A1 428 59
COL11A1 231 65
FRAP1 156 57
VPS13D 284 69
2 LRP1B 1901 90
BIRC6 263 73
USP34 217 77
NEB 249 149
DNAH7 331 67
NAG 394 51
3 COL7A1 31 117
DNAH1 84 76
4 HD 169 66
FRAS1 487 73
WDEY3 297 67
KIAA1109 193 83
5 DNAH5 252 78
GPR90 606 89
FBN2 280 64
6 DNAH8 307 90
DST 385 93
MDN1 176 101
UTRN 559 73
SYNE1 515 145
7 TRRAP 135 70
DNAH11 359 81
8 PKHD1L1 168 77
PRKDC 187 85
9 VPS13A 240 70
10 CDH23 419 69
CUBN 305 66
11 DYNC2H1 371 89
ATM 147 62
12 SEP290 94 53
UTP20 106 61
STAB2 179 68
LRP1 85 88
13 FRY 265 60
MYCBP2 287 83
14 SYNE2 373 120
DYNC1H1 86 77
15 RYR3 555 103
VPS13C 208 85
HERC2 211 92
16 SMG1 121 62
DNAH3 226 59
24
17 DNAHD3 114 64
DNAH9 371 68
MYO15A 71 65
18 LAMA3 266 74
19 RYR1 154 105
X DMD 2220 78
COL4A 258 52
HUWE1 122 80
Y ------
20 LAMA5 58 79
21 ------
22 ------
Итого генов с числом интронов на ген более 50 всего 66 на весь геном
человека. Сразу от статистики можно перейти к обсуждению этой аномалии.
Видно, что в таблице есть семейства генов - COL, DNAH, LAMA, RYR, SYNE , что говорит о не случайности этого феномена.
Рекорд генома человека - это гены небулин - NEB - 149 , SYNE1 - 145,
SYNE2 - 120 интронов в гене.
Таким образом в первом сообщении о генах-гигантах генома человека были
показаны рекордные величины генов, интронов в них и число интронов в гене.
Все это несомненно имеет какое-то важное значение для клетки.
ГЕНЫ-ГИГАНТЫ В ГЕНОМЕ ЧЕЛОВЕКА. СООБЩЕНИЕ 2. 12 февраля 2009.
В генах-гигантах мною были обнаружены следующие закономерности.
Если рассматривать длину всех интронов в гене, то самые длинные интроны
- это последний или предпоследний интроны, они чаще всего и определяют
общую длину гена. Для примера, для генов размером более 60 и более 400 т. п.
нуклеотидов приводится общее количество генов с максимальными конечными
интронами.
При общем числе интронов в среднем 20-30, только конечные 1-2 интрона
могут определять длину гена.
Хромосома Гены размером более 60 тпн Гены с наибольшими конечными
интронами
5 249 51
6 271 64
7 241 47
8 194 50
9 213 27
Сумма 1170 239
Хромосома Гены размером более 400 тпн Гены с наибольшими конечными
интронами
5 23 12
6 25 11
7 31 7
8 16 6
9 7 2
Сумма 102 38
Это составляет 20 и 37 процентов соответственно, что, несомненно,
представляет собой какую-то важную закономерность , имеющую значение
для работы этих генов в клетке.
25
Для примера приведу несколько конкретных генов. Интроны учитывались с
длиной более 40 т. п.
Ген Размер Размеры интронов тпн.
CDH12 1103 i9 -113 i12-193
i10-103 i13-100
i11-134 i14-347 - последний.
PARK2 1379 i3 -162 i5 -217
i6 -187 i7 -470 i8 -285 - последний.
MAGI2 1437 i1 -59 i2 -47 i12-55
i13-87 i16-121 i19-105
i20-380 i21-446 - последний.
CSMD1 2057 i42 -54 i58 -59 i60 -81
i64 -92 i65 -45 i66-244
i68-387 i69-218 i70-357 - последний.
У части больших генов, наоборот, первый интрон
является максимальным по длине. Таких генов 18 процентов среди
больших генов размером более 400 тпн.
Приведу примеры таких генов.
CNTNAP2 2305 i1 -657 i2 -65 i3-204
i4 -64 i8 -168 i9 -95
i10-91 i11-76 i12-77
i13-258 i14-74 i15-140
i18-45 i21-116
KCND2 476 i1 -457
SDK1 964 i1 -317 i4-180 i5-129
GRIK2 670 i1 -223 i3 -50 i6-113 i13-107
Все средние интроны, как правило, не выделяются особым размером
относительно длины гена и имеют размер близкий к среднему для этого гена.
Механизм возникновения таких аномальных по длине интронов, как конечные
или начальные будет рассмотрен в следующем сообщении. Несомненно, что для возникновения, функционирования и сохранения таких гиганских интронов, необходим специальный механизм, особые гены, белки и РНК. Поскольку геном человека уже известен, привожу полный список генов, участвующих в сплайсинге.
Эта база генов сплайсинга составлена мною при поиске по реферативной базе
генома человека NCBI. Они записаны в приложении 4. Возможно, что гены сплайсинга, имеющие отношение к генам-гигантам, находятся в этом списке.
Все гены сплайсинга - это обычные мозаичные гены. Например, ген SF3B1
во 2 хромосоме имеет размер 43 тпн, и имеет 24 интрона размером от 200 пн до 7000 пн округленно. Эта база генов сплайсинга показывает еще один феномен клетки , когда гены или их продукты обслуживают самих себя. Чтобы факторы сплайсинга были рабочими , необходимо чтобы они обработали собственные РНК.
Можно привести примеры таких феноменов.
1. ДНК-полимераза копирует себя при репликации.
2. РНК-полимераза транскрибирует свой ген.
3. Факторы рибосом участвуют в трансляции своей РНК.
4. Факторы сплайсинга выщепляют интроны из своей РНК.
Без этого они сами не функционируют.
Что первично - курица или яйцо? Вопрос древних философов. Поэтому
гены сплайсинга еще раз показывают скачкообразность эволюции живого,
и даже возможность влияния высших цивилизаций на гены при образовании
и эволюции живого.
26
ГЕНЫ-ГИГАНТЫ В ГЕНОМЕ ЧЕЛОВЕКА. СООБЩЕНИЕ 3. ИНТРОГЕНЫ.
февраль-апрель 2009.
В генах-гигантах есть еще один феномен - это расположение внутри гигантских интронов одного или нескольких мелких генов. Эти гены, расположенные внутри других генов, я называю интрогены. Статистика интрогенов следующая.
В хромосомах 5, 6, 7 для примера в 761 гене, размером более 60 тысяч пн, обнаружено 81 интроген, которые расположены по 1-2 , как правило, в самом большом интроне. В генах-гигантах встречаемость интрогенов составляет около
11 процентов. Для примера, ген кадхерин 12 - CDH12 размером 1103 тпн в 9 интроне размером 120 тпн содержит интроген LOC643300 - белок теплового шока,
а в интроне 11 размером 134 тпн интроген PMCHL1 – промеланин концентрирующий гормон подобный 1.
Ген IMP2-пептидаза внутренней мембраны подобный - IMMP2L, размером 899 тпн,
в 3 интроне размером 523 тпн содержит интроген LRRN3 - лейцином богатый
повтор ген нейрональный 3. Ген микроцефалии, ингибитор TERT экспрессии,
MCPH1, размером 213 тпн, в 9 интроне размером 129 тпн содержит интроген
ANGPT2 - ангиопоэтин 2.
Многие из интрогенов являются псевдогенами, а другие обычными мелкими
генами.
В принципе этот природный феномен подходит мне для проекта "ДНК говорит".
Так как я собираюсь использовать эти интрогены для мечения полезной
информации или придания организму особых преимуществ в эволюции для того,
чтобы информация введенная в ДНК сохранилась и через миллионы лет.
Возможно, что человек Homo sapiens, как вид, не является наилучшим
контейнером для информационных посылок. Во-первых, это вид молодой
в эволюции - несколько миллионов лет по сравнению с организмами, которые
дошли до сегодняшнего времени через десятки миллионов лет.
Во-вторых, человек имеет низкую устойчивость к экологическим факторам.
В прессе уже было сообщение о том, что в прошлом человек чуть не вымер,
как вид. Разум человека помогает ему выжить, но его не всегда достаточно.
Для примера приведу устойчивость азиатской черепахи Testudo horsfieldi (УСБ 1991, том 111, выпуск 2, стр 305) к ионизирующему излучению - это 730 Гр, при устойчивости человека 3-5 Гр. Вообще рептилии выдерживают от 15 до 500 Гр, амфибии - 7-30 Гр, а некоторые лишайники до 10000 Гр, насекомые 580-2000 Грей
(при смертности 50 процентов особей). Эти цифры просто фантастика по
сравнению с человеком, а все это определяется особенностями генов генома.
Примеры приведены из Кузин А. М. Структурно-метаболическая теория в
радиобиологии. 1986, с. 120.
Эта устойчивость некоторых организмов позволяет транспортировать их геномы и информацию через космос.
В настоящее время по данным WWW. NCBI. NLM. NIH. GOV в прогрессе секвенса
есть около 50 видов и на сборке полного генома около 50 видов высших
организмов. Данные на 2008 г. К 2013 г. секвенирование геномов резко удешевилось и поэтому можно ожидать определение геномов десятков новых видов.
На планете Земля видов может быть десятки-сотни тысяч с оригинальными
геномами или генами.
Поэтому можно надеятся, что моя гипотеза о информационных посылках в ДНК из прошлого найдет применение. Перспективно, я думаю, для этих целей
секвенировать организмы феноменально-устойчивые к факторам внешней среды.
ГЕНЫ-ГИГАНТЫ В ГЕНОМЕ ЧЕЛОВЕКА. СООБЩЕНИЕ 4.
ТРАНСПОЗОНЫ. Апрель-май 2009.
Я произвел поиск повторов в интронах генов-гигантов. Последовательность нуклеотидов интронов выделялась из реферативной базы генома человека NCBI.
После этого сканировалась программой для поиска повторов несколько раз с подключением каждый раз новой партии консенсусных повторов.
Для примера в этой работе приведены расположение и вид повторов :
1. Ген NEGR1, интрон 6 в гене размером 347 тпн. NEGR1 - нейрональный
роста регулятор 1, функция - адгезия клеток, хромосома 1.
27
Размер белка 354 аминокислоты, что дает 1062 пн. Размер же гена со
всеми интронами составляет 880 тпн.
2. Ген DISC1 размером 415 тпн, интрон 9 размером 140 тпн. Поврежденный
при шизофрении 1, хромосома 1. Размер белка 832 аминокислот, что
дает 2496 пн. Функция точно не известна.
3. Ген NRXN1 - неурексин, размером 1108 тпн, интрон 17 размером 299
тпн. Размер белка 1477 аминокислот, что дает 4431 пн. Функция - аксон
информатор и адгезия. Хромосома 2.
4. Ген ROBO2 размером 607 тпн, интрон 2 размером 379 тпн, хромосома 3.
Функция белка - обходной путь роста аксона, аксон-информатора
рецептор 2. Мозга развитие. Размер белка 1378 аминокислот, что дает
4134 пн.
5. Ген DOCK3 размером 709 тпн, интрон 5 размером 130 тпн. Хромосома 3.
Предназначен цитокинезу 3. Размер белка 2030 аминокислот, что дает
6090 пн.
Всего консенсусных повторов было использовано для поиска 170, простые
повторы не искали.
Также не уточнял разновидности повторов. Подключены были не все имеющиеся повторы. Подробно расположение повторов в гене дано в приложении 6. Это приложение дано только для демонстрации повторов в интронах-гигантах, использование другого генома или баз может дать несколько другую картину.
Мной использовалась программа REPFIND - Dr. G. B. Hutchinson,
(Canada), базы повторов - REPBASE - J. Jurka, (USA), находящихся
в свободном доступе.
В изученных интронах было я обнаружил общее число повторов:
в i6 NEGR1 - 175, в i9 DISC1 - 110, в i17 NRXN1 - 135, в i2 ROBO2 - 223,
в i5 DOCK3 - 117 единиц.
Повторы имеют разную длину , есть полные повторы, соответствующие
консенсусным по длине и укороченные или части , куски от полного размера повтора. Это происходит потому, что транспозоны захватывают части цепи ДНК
при мобилизации или встраиваются посередине целого повтора. Участки между найденными повторами составляют от единиц до нескольких тысяч нуклеотидов. Назначение их неизвестно.
Обнаружены следующие повторы.
Повтор Название Обычная или полная длина, пн
ALU - повтор 290
BSR - бета- сателлит 68
CHARLIE- повтор
ERV1 - эндогенный ретровирус
FRAM - повтор
HSAT1 - сателлит 1 человека 631
MADE1 - вторичный от MARINER1 80
MIR - млекопитающих повтор 265
MIR2 - ------------------------- 150
L1 - повтор транспозон 6140
L2 - -----------------
THE1b - транспозон like элемент с LTR 364
TIGGER1- автономный ДНК транспозон 2418
TIGGER2- -------------------------
MLT1a - транспозон подобный с LTR 374
MLT1b - ------------------------- 390
MSTA - ------------------------- 426
MSTC - транспозон подобный LTR 405
LTR1 - LTR из человеческого эндогенного
ретровируса подобного HUERS- P2 842
LTR2-LTR6
LTR7 - LTR из эндогенного ретровируса
RTVL-H2 450
LTR8-LTR13
LTR12 - LTR ERV9 877
MER1A-MER46 неавтономные транспозоны 189-693
28
MER21 - средней повторяемости
последовательность 933
MER34 - средней повторяемости
последовательность 581
PAB - псевдоаутосомальная погранично-
подобная последовательность 703
PTR5 - --------------------------- 2438
PTR5-1 - транскрипт человеческого вируса
эндогенного ERV9
PTR5-2
RETROVIRAL эндогенный ретровирус
SAR - сателлитный повтор 42
SVA - композитный ретропозон
неретровирусный 1640
R66 - тандемный повтор 66
Многие из этих повторов являются транспозонами, практически обнаружены почти
все типы этих элементов. Это ДНК-транспозоны, ретротранспозоны LTR и без LTR.
Главный вывод из этого поиска - гиганский размер интронов генов-гигантов определяется очень большим количеством повторов и транспозонов, расположенных внутри интрона.
Следующий важный вывод - происходит накопление в больших интронах повторов и транспозонов, это происходит в линиях половых клеток, но потом это
проявляется в соматических клетках нового организма.
В соматических клетках в течение жизни происходят многочисленные атаки транспозонов на их гены. Эта нестабильность их генома - одна из причин
болезней и старения. По-моему , причина такого большого количества повторов в интронах связана с тем, что вставка мобильного элемента в ДНК облегчается в
этих участках, или проходит с большей вероятностью, так как идет вставка в участки со схожей структурой, почти комплементарной. В приложении, где стоит слово COMPLEMENT , означает, что повтор вставился на новое место с поворотом
на 180 градусов. Большое количество таких блоков говорит о том, что инсерции происходили в течение времени многократно во многих поколениях в линиях гамет.
Гиганские интроны, поэтому, будут и далее увеличиваться - это приведет
через какое-то большое время и много поколений к дегенерации вида или
значительного возрастания числа больных особей.
Человечеству от этого никуда не деться и рано или поздно будет поставлен
вопрос о полном избавлении генома человека от транспозонов.
Я назову этот грандиозный шаг, который предстоит сделать человечеству
ДЕФРАГМЕНТАЦИЕЙ ГЕНОМА или для начала дефрагментацией отдельных генов.
Сегодня известно, что транспозоны играют важную роль в старении.
Активация транспозонов и их вставка в какие-то гены приводит к нарушению сплайсинга, остановке транскрипции и другим повреждениям клеточных генов, в результате ген с новым транспозоном может отключиться в смысле , что его
продукт - белок будет невозможен либо дефектен.
Клетка при этом умирает, если ген важен или перестает выполнять свою функцию
в виде синтеза белка. Все это приводит в снижению резервов организма, что на уровне организма проявляется как старение.
Гены-гиганты имеют к этоиу , по-моему, самое главное отношение.
Если в соматической клетке, нейроне или стволовой клетке, произойдет
активация транспозонов, то это коснется в первую очередь генов-гигантов.
Так как будут атакованы интроны-гиганты и произойдет встраивание в них транспозонов. Это приведет к возможному отключению гена, и чем чаще атаки транспозонов, тем больше вероятность возрастной отключки гена.
Поэтому гены-гиганты - это одно из главных направление генотерапии старения.
Одна из основных функций транспозонов - это ускорение эволюции вида.
Но человек в настоящее время вышел на уровень развития науки, когда он сам
может управлять своей биологией, изменяя и улучшая вид без эволюции.
Современному человеку процесс эволюции не нужен и просто вреден, а поэтому борьба с транспозонами - одно из главных направлений генотерапии старения и борьбы с основными болезнями. Примером влияния миграции транспозонов может
29
быть модификация гена DISC1 в нейронах типа альтернативного сплайсинга,
приводящего к шизофрении, как основной психической болезни. Так же основные соматические болезни , возможно, имеют транспозонный механизм на генном
уровне, попадение транспозона под промотор гена или внесение нового промотора может привести к раку, а возможные повреждения соматических клеток разных
тканей приводят к их недостаточности или гибели, снижению резервов нервной и эндокринной системы и кровообращения, что проявляется как старение.
Самый радикальный процесс исключить ген из под влияния транспозонов - это произвести его ДЕФРАГМЕНТАЦИЮ, то есть вырезать из гена-гиганта все интроны.
Это что-то подобное компьютерному процессу дефрагментации жесткого диска.
Хотя движение транспозонов при этом может быть, но не фатально для этого
гена, при промежуточном состоянии мишенями для транспозонов и других
мутагенов будет межгенное пространство.
Размер гена при этом уменьшится в 100-1000 раз, как видно из приведенных выше примеров, если рассчитать размер через размер бепка, 1 аминокислота - 3 нуклеотида.
Во столько же уменьшится мишень для повреждения. Во столько же раз возрастет экономичность энергетики транскрипции.Скорость ответа гена возрастет во много раз. Все это не только защитит ген, но повысит энергетику клетки и скорость реакций, что во много раз улучшит адаптируемость организма, как противоположность старению.
В проекте "ДНК говорит" предполагается в будущем на месте повторов или транспозонов разместить информационные модули, содержащие либо тексты, либо модули-инструкторы для наномашин в виде нуклеиново-белковых комплексов.
Я не утверждаю, что здесь все просто. Проблем может быть много, это
измененная регуляция гена, измененное положение нового дефрагментированного гена, возможно влияние гена на высшие нервные функции - интеллект, память или
на развитие организма. Это все требует тщательного изучения. Но для
генотерапии старения можно оставить старый ген без изменения, а ввести в
клетки дефрагментированный ген , который , будет функционировать значительно дольше и защитит организм от преждевременной гибели.
ГЕНЫ-ГИГАНТЫ В ГЕНОМЕ ЧЕЛОВЕКА. СООБЩЕНИЕ 5.
ДЕФРАГМЕНТАЦИЯ ГЕНОВ - ПРИРОДНЫЙ ФЕНОМЕН. 26 НОЯБРЯ 2012 Г.
Ранее мной была предложена новая генетическая операция для борьбы со
старением и создания новой разновидности человека, более устойчивого к
болезням и патогенным факторам внешней среды. Это - ДЕФРАГМЕНТАЦИЯ генома
или , для начала, наиболее важных генов в геноме человека.
Дефрагментация гена - это вырезание всех интронов из гена.
Это не фантастика , так как сама природа использует этот процесс.
Дело в том, что типичные гены для высших организмов - это мозаичные гены.
Но в высших организмах, и у человека, многие гены вообще не содержат в себе интронов.
Это дефрагментированные природные гены.
Механизм их образования изучен не полностью. С одной стороны - это
мутировавшие псевдогены, которые получили промотор и другие регулирующие
области генома. Известно, что псевдогены, полученые обратной транскрипцией из РНК не содержат интронов. Но они не функционируют до какого-то времени, пока
не попадут под промотор.
С другой стороны природные гены без интронов наводят на мысль об их искусственном происхождении путем генных опрераций над геномом человека в недалеком прошлом. В них еще не успели появиться хотя бы один или два
небольших интрона.
Если предположить, что надо было бы внедрить какой-то ген в геном человека,
то понятно, что вектор с этим геном не должен содержать интронов как
ненужного балласта. Поэтому я думаю, что природные дефрагментированные гены, хотя бы единицы их могут иметь искусственное происхождение.
Третий вариант - это утрата генами интронов в результате каких-то
естественных процессов. Происходит какая-то ферментативная делеция только
30
интрона. Процесс этот я предлагаю в качестве гипотезы. Полное отсутствие
какой-либо информации.
Мной был произведен поиск генов без интронов (дефрагментированных), генов с одним интроном и с двумя интронами на хромосоме 1 человека по базе
s_ref_GRCh37. p5 , дата базы - 20 октября 2011 г.
Всего генов в хромосоме 1, включая разные РНК и псевдогены, просмотрено 3429.
Из них учитывались только функциональные гены, имеющие трансляцию.
Генов без интронов оказалось 143, с одним интроном - 123, с двумя
интронами - 126.
Что составляет соответственно 4, 2 процента, 3, 6 процента и 3, 7
процента от всех генов в хромосоме 1.
Особенно обращает на себя внимание большое количество генов без интронов в семействе ольфакторных рецепторов и семействе гистонов на хромосоме 1.
Примеры нескольких генов без интронов на хромосоме 1 приведены ниже. Как
видно, это совершенно различные по функциям в клетке гены, но их почему-то объединяет одно общее свойство - это отсутствие интронов и поэтому
независимость их от громоздкой для клетки системы сплайсинга.
OR4F5 обонятельный рецептор, семейство 4, субсемейство F, член 5
ACTRT2 актин-связанный белок T2
RNF186 ринг фингер белок 186
HTR1D серотонина рецептор 1D
SFN стратифин
POU3F1 POU класс 3 гомеобокс 1
HPDL 4-гидроксифенилпируват диоксигеназа-подобный
FOXE3 развилки бокс E3
PRMT6 белок-аргинин метилтрансфераза 6
UBL4B убиквитин-подобный 4B
ADAM30 ADAM металлопептидазы домен 30
HIST2H3D гистона кластер 2, H3d
C1orf68 хромосомы 1 открытая рамка чтения 68
RXFP4 релаксин и инсулин-подобных семейств пептидов рецептор 4
ZNF645 цинк фингер протеин 645
HSPA6 теплового шока 70kDa белок 6
IER5 немедленный ранний ответ 5
TEDDM1 трансмембранный эпидидимальный белок 1
OCLM окуломедин
SPHAR S-фазы ответ
EXOC8 экзоцисты комплекс компонент 8
Это природные дефрагментированные гены в геноме человека.
Таким образом, здесь показаны предпосылки для начала экспериментальных работ
по искусственной дефрагментации наиболее важных и уязвимых для повреждений
генов человека. Риск для этих генетических операций или генотерапии для вида человека скорее всего низкий , так как процесс этот является природным, а влияние на него может принести большую пользу для вида человека.
ДОПОЛНЕНИЕ ПО ГЕНАМ-ГИГАНТАМ ОТ 20 апреля 2013.
Поиск повторов был произведен в 2006 году с использованием первых обновлений баз повторов и программы, работающей под DOS. В настоящее время существует онлайновый сервис для поиска повторов в исследуемой ДНК.
Адрес www. repeatmasker. org , на нем в окно для анализа последовательности
ДНК надо вставить изучаемую последовательность.
В течение нескольких минут придет обратно результат, в котором все известные повторы будут помечены и описаны. Повторы в анализируемой ДНК сравниваются с постоянно обновляемыми базами повторов, которые находятся по адресу
www. girinst. org и можно свободно закачать у них программу Repeatmasker для
самостоятельного поиска повторов в ДНК.
В настоящее время после повторного поиска с новыми базами в интроне гена-гиганта в основном мало что изменилось. То есть обнаружены, как и ранее,
31
в этих интронах целые или куски интактных или мутировавших разных повторов -
перемежающиеся длинные повторы, разные транспозоны, эндогенные ретровирусы, простые, тандемы и другие.
То есть общий вывод, что гигантские интроны генов-гигантов состоят из
большого количества разных повторов и межповторной ДНК,остался без изменения.
Количественно для интрона 6 гена NEGR1 размером в 358883 нуклеотидов
количество нуклеотидов, входящих в повторы составило 27 процентов. ДНК
интрона, которая не входит в повторы 73 процента. Эта ДНК , возможно, несет какую-то особую функцию в клетке, пока не известную. Но эта ДНК может быть просто захвачена и перенесена при миграции транспозона или при рекомбинации гена. Межповторная ДНК, как и все остальное должна быть изучена, это какой-то феномен, который я здесь обнаружил и обратил на себя внимание. Таким образом,
интроны генов-гигантов представляют собой чередование разных повторов и межповторной ДНК с неизвестной функцией.
Генов в межповторной ДНК не отмечено, хотя гены могут часто быть
в гиганских интронах.
ГДЕ НАХОДИТСЯ ПАМЯТЬ У ЧЕЛОВЕКА. 23 апреля 2013.
Как генетика вопрос о молекулярных механизмах памяти интересовал меня давно.
Мне уже 54 года и я решил вспомнить что было в моем счастливом детстве. Для этого я нашел журнал "Пионер" за 1967 год. С того времени, как мать выписала мне этот журнал, прошло почти 46 лет. С тех времен ни разу этот журнал не просматривал снова. Первое хорошее впечатлние от просмотра журнала детства,
что многие картинки сразу узнавались, как будто я их видел вчера.
Просмотрев 10 номеров журнала за 1967 год, я насчитал 843 картинки или фото.
Из них 96 были определены как знакомые. То есть около 12 процентов
изображений моя память пронесла через всю жизнь. Интересный эксперимент сопровождался приятными воспоминаниями из детства, то есть просмотр старых журналов с картинками из времен счастливой жизни улучшает настроение и , я думаю, и состояние здоровья.
В главном же долговременная память хранит где-то эту информацию. В настоящее время при всех успехах в молекулярной биологии точно неизвестно где и как хранится память у человека. Я, как генетик, думаю, что долговременная память все-таки связана с ДНК, и хранится в ней. Каким образом эта информация в ДНК
превращается в последовательность электрических импульсов еще неизвестно. Все остальные молекулы , а именно белки, липиды, РНК, а также их комплексы в
виде рецепторов, синапсов и других структур клетки изменяются в течение
секунд, часов или дней и вряд ли смогут быть неизменными в течение 50 лет. Только ДНК отдельного нейрона после записи информации в спираль может хранить
ее всю жизнь в виде последовательности нуклеотидов. Каким образом происходит запись и извлечение в ДНК клетки нейрона неизвестно.
В этой статье я выскажу лишь свою гипотезу этого процесса.
Скорость извлечения памяти.
Чтобы после стимула снять информацию из ДНК заново надо минуты и часы, затрачиваемые на процессы транскрипции и трансляции и наработку продуктов белковых ферментов - медиаторов. Но память реагирует на стимулы мгновенно, в течение нескольких секунд. Поэтому можно предположить, что какой-то нейрон, записав в ДНК информацию, все время держит ее в рабочем состоянии. И при появлении нужного стимула этот один нейрон мгновенно выдаст именно ту информацию, которая в нем записана, в виде спайков импульсов. Если такой же нейрон запомнит другую информацию, то наверное, характер импульсной
активности будет другой. Таким образом , при запоминании отличается
информация, записанная в ДНК и характер импульсной активности ее отражающий.
Если взять два или более отдельных нейрона, то, предположив, что в них есть участки, где записана информация в ДНК, можно подтвердить это, сравнив секвенированные геномы отдельных нейронов. Рано, или поздно, этот проект
кто-то осуществит, чтобы показать разницу в геномах отдельных нервных клеток, взятых из мозга одного человека.
32
Сегодня можно только предположить, что участки записи памяти в ДНК нейрона
лежат в некодирующих участках. То есть сами гены не изменяются при
кодировании памяти. Только один механизм может записываться в геном клетки и
извлекаться из генома - это генетические транспозоны. Это моя гипотеза долговременной памяти – транспозонная гипотеза. Она заключается в том, что мобилизованные транспозоны модифицируются в клетке каким-то механизмом,
связанным с генерацией импульсной активности нейрона. Затем такой транспозон встраивается в геном и уже хранит информацию - долговременную память. При последующих мобилизациях или транскрипции транспозона память извлекается. Фоновая транскрипция транспозонов обеспечивает почти мгновенный ответ памяти
на стимул нейрона, то есть один раз записавшись в ДНК или в РНК,
долговременная память может мгновенно извлекаться даже через годы ее
хранения. В нейроне постоянно работают гены домашнего хозяйства, связанные с обеспечением жизни нейрона и его работы. Это синтез белков рецепторов, медиаторов и других.
В клетке есть динамический пул РНК. Это РНК, готовая для трансляции и пул интронов, вырезанных из транскрипта. Этот постоянно находящийся в клетке пул интронов, я предполагая может быть связан с хранением и извлечением памяти.
При этом молекулы РНК находятся в постоянно готовом состоянии для работы нейрона, для мгновенного ответа его на стимулы.
Кратко, что можно сказать о памяти. Консолидация памяти и ее извлечение,
нейроны холинэргические и адренэргические, нейроны афферентные, нейроны вставочные или ядер, нейроны эфферентные. Спонтанная импульсная активность и вызванные потенциалы, часть нейронов - хранители, другая часть для введения
информации и часть для вывода информации - нейроные сети. Разные сигнальные
пути записи в ДНК и извлечения из ДНК, Синтез и распад РНК, обмен макроэргов.
А где хранится память на всю жизнь?
Я за свою жизнь прочитал много литературы по нервным тканям, создание этой гипотезы основано на интуитивной генерации связей. Гипотеза на основе
интуиции, поэтому каждый пункт нуждается в проверке.
Пока сам механизм синтеза ДНК в связи с импульсной активностью нейрона и обратный процесс преобразования последовательности ДНК в последовательность импульсов нейрона не известен.
Я только гипотетически могу предположить возможный механизм этого.
Статистика генов-гигантов показала, что мозгоспецифические гены из них составляют около 49, 4 процентов. Остальные гены-гиганты - это гены,
работающие в других органах. Приложение 3.
Из этой статистики функций белков для генов-гигантов можно сделать главный вывод, что только прямые эксперименты с их дефрагментацией ответят на вопрос
об их настоящем значении. Речь идет не о белке, кодируемым этими генами, а о роли интронов-гигантов в физиологии не только гена, где он есть , но и о значении транскрипта этого интрона, как самостоятельной функции. Можно только предположить, что сами интроны-гиганты вместе с генами, где они находятся
могут влиять на поведение, память, включение и выключение генов,
генорегуляция и так далее.
В ряду поколений интроны-гиганты не исчезают, как не нужные, хотя
наследование идет через половые клетки. Предположение о том, что эта ДНК
просто паразитическая, как все повторы, может быть неверным. И эта интронная
ДНК гигантского размера, может иметь особое значение для работы некоторых органов, например, мозга.
Если гены-гиганты и их интроны, предположим, нужны для работы мозга,то можно предположить, что с ними связаны основные функции мозга, а именно развитие мозга, хранение памяти, мышление, а также разные заболеванеия, связанные с генами-гигантами.
Не случайно среди этих 324 генов-гигантов 7 генов-гигантов имеют отношение к основной психической болезни мозга- шизофрении, это 2, 16 процента. А гены, связанные с развитием эмбриона и его мозга составляют 31, что дает 9, 57 процента. Это показывает важную роль генов-гигантов в нормальном развитии человека, и особенно его мозга, а также в нормальном функционировании мозга.
Хотя большие интроны интересный феномен, не надо забывать об обычных
небольших интронах, которые создают пул РНК-интронов в клетке. Может быть
33
интроны и сплайсинг есть в генах для каких-то особых, важных функций.
Предположим, для обеспечения работы памяти или других важных процессов в клетке. Пока рано считать интроны просто мусором в клетке или паразитической ДНК.
Итак, биоинформатика ДНК открыла много нового в генетике. Появились новые
данные об интронах и новые гипотезы о памяти. Но, критерий истины, как
известно, это опыт.
Итак, необходим прямой эксперимент для выяснения функций интронов-гигантов и особых функций генов-гигантов, не связанных с белком, ими кодируемыми. Теоретически тут уже ничего не поделать. Нужно синтезировать химически ген
без интронов, или хотя бы без гигантских интронов и вставить его в хромосому. Хозяйский ген при этом блокировать или нокаутировать. После чего наблюдать
биологические функции клетки или организма. Впереди будут эксперименты по дефрагментации генов и генома.
МИКОПЛАЗМА, ТРАНСПОЗОНЫ, ЭВОЛЮЦИЯ И ЗДОРОВЬЕ ЧЕЛОВЕКА.
ЧАСТЬ 1. 25 ИЮЛЯ - 25 АВГУСТА 2009.
На примере генома микоплазмы я продемонстрирую, как производится поиск и сравнение геномов или последовательностей ДНК.
В процессе разных биоинформационных разработок ученые постоянно проводят
поиск и сравнение каких-то участков ДНК. ДНК подвергается постоянному мутированию - это ее основное свойство. Можно сказать, что человек на
столько-то процентов сходен с шимпанзе, мышью и даже с растениями, микробами
и вирусами. С ними в человеческой ДНК есть много совпадений. Чтобы оценить
эти мутации у разных участков или разных организмов, проводится сравнение
разных последовательностей друг с другом. Операция называется иначе
алигментом. Для целей сравнения и выравнивания двух или многих участков есть много разных программ. Я приведу , для примера, самые простые из них, и самые передовые.
Для примера, я приведу программу Repfind, находящуюся по адресу
ftp://ftp. ebi. ac. uk/pub/software/dos/repfind/.
Программа G. Hutchinson, 1995 года, предназначена для работы в
DOS или Windows в командном режиме. В ней использована база
повторов J. Jurka. Программа простая и позволяет искать не только повторы в
ДНК , но и любые участки. У нее есть ограничения на размер участка, который
надо будет найти - около 2500 байт. Для подключения к программе нового
повтора надо дать команду repfind -e <имя файла нового повтора>. ref, далее вписать этот файл строкой в файл repfind. cfg. Для поиска дать команду
repfind -d <имя тест-файла>. Будут выведены наглядно сравниваемые места в
двух файлах со статистикой.
Также простая программа - это Clustalw и Clustalx, можно взять по адресу ftp://ftp. ebi. ac. uk/pub/software/clustalw2.
Она позволяет вести сравнение сразу нескольких участков. Эти программы сравнивают или ведут поиск участков ДНК даже если в них есть пробелы или
gaps, или вставки. Это распространенные мутации ДНК - вставки (инсерции)
одного или нескольких нуклеотидов или делеции (пробелы). Для поиска в ДНК небольших участков, я применяю обычные текстовые поисковики. Для этого
открываю участок ДНК программой "Блокнот", или подобной, беру опцию "Правка",
далее "Найти", и в окно вставляю искомый участок. Далее нажать кнопку "Найти далее". При таком поиске, если хотя бы один знак будет отличен, то участок не будет найден. Также в текстах есть невидимый знак переноса строки. Если он
будет внутри участка, то он не будет найден. Это такие ограничения простых поисковиков. Одной из самых передовых поисковиков является программа BLAST.
Она находится по адресу http://www. ncbi. nlm. nih. gov/
BLAST. Она распространяется свободно в виде файла, например
ncbi-blast-2. 2. 26. +-win32. exe , или используется в онлайновом сервисе.
Для этого надо открыть страницу BLAST, выбрать раздел анализа последовательности, выбрать сравнение. Будет открыто окно "Align Sequences Nucleotide BLAST". В форму вставить два участка ДНК, выбрать опции сравнения,
и нажать кнопку "BLAST". Будет выведен полный отчет о поиске, сравнении двух
34
участков ДНК. Для изучения BLAST написаны целые книги, так как эта программа
довольно сложна и требует введения многих опций или ключей в коммандном
режиме. Литература по BLAST [16]. Можно также использовать Help-файлы со
страниц о BLAST. Пример использования этой программы будет дан в части 2
раздела о микоплазме.
Микоплазма - микроб небольшой, и поэтому алигмент ее генома с другими организмами не сложен по количеству сравниваемой информации.
Что вообще сегодня известно о микоплазме?
Микоплазма - внутриклеточный или расположенный на поверхности микроб, она
может бессимптомно сопровождать человека всю его жизнь или вызывать
заболевание тяжелое, вплоть до смерти. Существует много видов микоплазм
человека и животных. Из микоплазм человека значение, как патогены или сапрофиты, имеют Mycoplasma pneumoniae, M. hominis и другие. Из них самый маленький геном у M. genitalium.
Mycoplasma genitalium имеет 517 генов, из них у 100 функция пока не известна,
а 93 гена повреждены по [19]. У этого микроба наименьшее количество генов, с которыми еще возможна жизнь свободно живущего организма клетки-прокариота.
Живет в половых путях человека, что особо важно, так как она прилипает к сперматозоидам и , возможно, к яйцеклетке. Таким образом, при предполагаемом проникновении ее генома внутрь зиготы или в клетки бластулы или эмбриона, возможно влияние на геном зародыша человека на ранних этапах эмбриогенеза, и поэтому предполагается появление иммунной толерантности к этому микробу.
Если микроб повреждает ключевые системы плода, то происходит смерть эмбриона
- бесплодие или самопроизвольный аборт мертвым плодом или при частичном повреждении и внутриутробной персистенции, носительстве микроба - рождение
живого плода со сниженной массой тела. Литература [17, 18, 21].
Микоплазма может влиять на работу генов клетки-хозяина после инфицирования,
по литературе [20, 22, 23] может изменять работу генов клетки так, что через несколько стадий деления работа генов изменяется необратимо, приводя клетку к
раковой трансформации. В культуре клеток для полной трансформации надо около
18 недель. Этот пример показан для заражения Mycoplasma fermentans. Клетки проходят стадию обратимого изменения, при котором обработка антибиотиком,
освобождая клетки от микоплазмы, возвращает нормальный фенотип клетке.
Этот пример я привел для того, чтобы показать, что геномы клетки и паразита активно взаимодействуют. Аберрации регуляции генов , вероятно, проходят
стадию нестабильности генома, при котором активация транспозонов обычное явление, а возможное внедрение транспозонов под промоторы онкогенов
приводит к стойкой раковой трансформации. Поверхностное расположение
микоплазм также может приводить к обмену генетическим материалом, но по
другому механизму без внутриклеточного расположения микроба. Хотя, как для
M. penetrans так и для M. genitalium показаныо их внутриклеточное положение
для части микробов. Я приведу здесь мою гипотезу о роли микоплазмы в биологии
и эволюции человека. Это микроб , который на протяжении всей истории человечества имеет прямой контакт с половыми и зародышевыми клетками и , поэтому, возможно, причастен к жесткой эволюции человека путем обмена генами
при попадании микроба в эмбрион при его заражении. Если в настоящей генетике проводят эксперименты по введению генетического материала в яйцеклетку с
помощью микрошприца, протыкая оболочку зиготы, то микоплазма - это природный переносчик генов. К тому же, как половая инфекция, микоплазма , возможно,
транспортирует гены между индивидумами. Я предполагаю , что это делает микоплазму носителем или "троянским конем" для введения в клетки
человека иной генетической информации.
Это пока что моя гипотеза, а косвенное ее подтверждение - это обнаруживание
мной в геноме микоплазмы участков ДНК похожих на транспозоны человека.
Я произвел поиск повторов и транспозонов, характерных для человека в
Mycoplasma genitalium G37. Я обнаружил сильно мутировавшие повторы подобные
транспозону L2, CHARLIE2 и эндогенного ретровируса человека.
Примеры этих участков приведены в приложении 8.
Попал вирус или транспозон в микоплазму от человека или другого организма или наоборот. Покажет дальнейшее изучение. Скорее всего обмен ими был
35
многократным в истории человечества и при этом были перестройки генома
в зародышевых клетках.
Это говорит о том, что в далеком прошлом произошла с человеком генетическая катастрофа, изменившая биологию человека. Произошло резкое изменение генома человека, которое и привело к современному Homo sapiens со всеми его
болезнями и низкой продолжительностью жизни. Возможно это связано с какими-то глобальными геологическими или экологическими процессами на планете Земля.
Именно в такие времена выживания человеческого рода происходит снижение иммунитета и распространение различных инфекций. Можно даже вспомнить
библейскую легенду о всемирном потопе и о том что люди до потопа жили до 1000 лет, а после Мафусаила через несколько поколений продолжительность жизни
упала до 40-70 лет в разных эпохах. Такое резкое падение длительности жизни - косвенный признак заражения человека каким-то вирусом. Или , как я думаю, это микоплазма плюс вирус или транспозон.
Микоплазма была всегда с гоминидами и является поэтому свидетелем этой генетической катастрофы. С тех пор как произошел обмен генами с микоплазмой прошло много времени. Хотя количество измененных нуклеотидов в похожих
последовательностях известно, но точно назвать дату трудно. Если геном
человека во много раз стабильнее микоплазмы, то все-таки судить о скорости мутирования микоплазмы трудно, так как влияет на это много факторов. И даже в одном гене у микоплазмы mgpC есть вариабельный и консервативный участки.
Использование для определения скорости мутирования микоплазмы культуры зараженных клеток также может дать большую ошибку, так как в реальном
человеке на них влияет иммунитет и метаболический фон.
Чтобы точно рассчитать это время я предлагаю ученым провести для прямого
замера следующий эксперимент - если будет найден замороженный умерший
человека где то в широтах вечной мерзлоты или высокогорья, что более реально,
то выделить у него микоплазму, которая была заморожена вместе с человеком
на протяжении 300-500 лет со знанием точной даты смерти человека и определить
в ней количество мутаций и сравнить с современной микоплазмой с учетом этноса
и географии. При этом скорость мутации в микоплазме будет определена
более точно in vivo.Если будет возможность,то вместо SNP в отдельных локусах лучше полностью отсеквенировать весь геном у микоплазм, выделенных у такого человека, жившего несколько сотен лет назад. После этого можно будет сравнить
эти участки повторов похожие не человеческие и экстраполировать назад в
историю вида человека.
В настоящее время мне удалось найти одну статью, где in vivo продольные исследования проводились только за 10-35 дней. При этом , конечно, никаких
новых мутаций не обнаружили у микоплазмы из зараженного человека в генах
микоплазмы rRNA и MG309. В другом исследовании проводилось продольное
изучение гена mgpC у инфицированных женщин на протяжении 19 месяцев. Проксимальный его участок содержит гипервариабельный участок, скорость
мутаций в котором очень велика. На участке в 70 аминокислот произошло около
20 различий за это время. Таким образом, у микоплазмы есть консервативные участки, необходимые для стабильности важных генов и сохранения вида и
гипервариабельные участки , необходимые для паразитирования. В частности для ускользания от иммунного надзора. Поэтому только прямое определение в виде секвенса может дать ответ на этот интересный вопрос – когда у человека и микоплазмы произошли обмены генетической информацией и как это могло повлиять
на эволюцию человека?Возможно, за счет обмена между человеком и микоплазмой
даже небольшими участками ДНК, особенно транспозонами или эндогенными ретровирусами, произошло резкое повышение нестабильности генома предков человека, что способствовало его эволюции и приспособлению к среде. Что в конечном счете привело к современному виду человека.
Еще раз отмечу, что это лишь моя гипотеза. Как обычно,данные, полученные с помощью биоинформатики, надо проверять экспериментально.
Меня интересует этот микроб с точки зрения моей программы борьбы с мобильными генетическими элементами - транспозонами. Транспозоны могут быть одними из главных факторов повреждения клеток и снижения уровня здоровья, расходования резервов организма, развития рака и старения.
36
Могут ли как-то взаимодействовать транспозоны человека с их мутировавшими похожими последовательностями из микоплазмы пока не известно.
Косвенный факт этого - возникновение артритов у инфицированных микоплазмой людей. С другой стороны, было показано, что активация некоторых транспозонов
у человека, например LINE, приводит к развитию ревматоидного артрита.
Необходимо радикальное освобождение человечества от этого микроорганизма. Использование антибиотиков и вакцинация по литературе [17] дает временный
эффект для отдельных индивидуумов. Человек может заражаться микоплазмой много
раз в течение жизни. И, если человечество намерено освободиться от основных
микробных патогенов, то микоплазма хороший кандидат для этого. Например, человечество победило натуральную оспу в 70-80 годах прошлого века и всем от этого хорошо. Также надо последовательно избавляться и от других патогенов ,
путем проведения генетических влияний на эти микробы. Для этого надо либо модифицировать геном человека, чтоб он был не совместим с микоплазмой на генетическом уровне, либо применить лекарство , изменяющее геном микроба,
когда он в клетке или снаружи.
Микоплазму легко контролировать микробиологически и генетически, потому что у нее очень маленький геном и достаточно 1-2 генов человека для противостояния
ей, и, если микроб проникнет внутрь клетки, то программу его размножения
легко заблокировать, сделав геномы человека и микроба несовместимыми.
Если же влиять на геном микоплазмы, то из небольшого числа эссенциальных
генов можно in vivo заблокировать тоже 1-2, чтобы сделать микроб нежизнеспособным. Таким образом , я думаю, в недалеком будущем будет переход
от антибиотиков и вакцинации в борьбе с микробами к влиянию на генетическое
взаимодействие микроба и хозяина.
МИКОПЛАЗМА, ТРАНСПОЗОНЫ, ЭВОЛЮЦИЯ И ЗДОРОВЬЕ ЧЕЛОВЕКА.
ЧАСТЬ 2.
Я произвел сравнение генома Mycoplasma genitalium c HERVK и LINE 1 транспозонами. Использовался онлайн сервис - программа BLAST сервиса NCBI. Полученные данные в виде нескольких примеров представлены в приложении 9.
Видно, что есть очень много участков с идентичностью для некоторых до 100 процентов. Данные транспозоны – эндогенный ретровирус человека К и перемежающийся большой повтор 1 характерны для человека. Их ДНК получена из
базы повторов человека с сайта www. girinst. org . Таким образом, я показал,
что в таких разных организмах, как человек и прокариот микроб микоплазма
имеются почти одинаковые участки ДНК. Особенно наглядно соответствие геномов можно видеть, если при алигменте загрузить дот матрикс. Он находится на той
же странице алигмента, что и графический результат алигмента ДНК. На нем
видно, что есть много участков соответствия, но они разбросаны по дот
матриксу и оторваны друг от друга. Также было наблюдение того, что многие алигменты имеют плюс и минус цепи ДНК, то есть повернуты на 180 градусов.
На основании этого я сделал вывод, что участки человеческой ДНК встраиваются
в геном микоплазмы. Эти события встраивания облегчаются тем, что в половых
путях повышено количество ДНК человека из разрушенных сперматозоидов, а транспозоны составляют значительный процент всего генома. Вероятно,
микоплазма постоянно встраивает в свой геном внешнюю ДНК, которая затем подвергается мутированию в течение времени. Возможно влияние ДНК микоплазмы
на человека, но это требует дополнительного изучения. В этой же книге
основной упор я делаю на демонстрацию роли ДНК биоинформатики для подготовки дальнейшиего экспериментального изучения роли микоплазмы на здоровье
человека.
С точки зрения здоровья человека и геронтологии, имеет большое значение наблюдение того, что у животных при эксперименте длительность жизни сильно зависит от условий в которых находятся половые клетки до оплодотворения. При полной зашите половых клеток от окислительной деструкции у мышей
предполагается увеличение в 2 раза предстоящей длительности жизни.
Как пишут эти авторы, это может быть сверхпервичной профилактикой старения и болезней у будущего поколения. Литература [24].
37
Микоплазма может нанести прямой вред половым клеткам за счет токсинов и за
счет кислородных радикалов. Резкое возрастание кислородных радикалов в среде
также происходит за счет "кислородного взрыва", который производят активированные микробами нейтрофилы, находящиеся в половых путях.
В настоящее время распространенность микоплазмы на примере близкого вида M. hominis и U. urealyticum дают 40 процентов всех воспалительных заболеваний мочеполовых органов. Бессимптомное носительство составляет от 8 до 26
процентов всех людей. Литература [25]. Таким образом, проблема микоплазм довольно большая для человечества, и вызывает интерес у разных специалистов,
от практической медицины до генетики.
ПОЛЕЗНЫЕ ГЕНЫ ЖИВОТНЫХ, РАСТЕНИЙ И МИКРОБОВ В ГЕНОМ ЧЕЛОВЕКА.
ДЕКАБРЬ 2010.
Полезных генов очень много в природе. В связи с современным развитием
геномики появляется новая возможность для улучшения человека, как вида.
Можно использовать гены животных, растений и бактерий для создания
суперчеловека будущего.
Почему-то эта возможность , которую дает современная наука мало обсуждается.
Вероятно, многие люди и даже ученые считают человека чем-то постоянным,
незыблемым, и что как бы нельзя вмешиваться в биологию человека.Надо
отбросить эти догмы, развитие науки не остановить.
Я же утверждаю, что человек будущего - это сильный продукт науки будущего. Человек станет генетическим рекомбинантом, человек станет полукиборгом,
человек будет иметь компьютер внутри, превышающего возможности мозга и так далее.
Никто не сможет остановить развитие всего, что улучшает качество жизни человека, его возможности.
Список этих генов может быть большим, для начала я предлагаю встроить в
геном человека следующие гены.
1. Гены синтеза витаминов.
Аскорбат-синтетаза, для эндогенного синтеза витамина С в организме человека. Сегодня потребность в этом витамине полностью зависит от качества пищи.
Витамин К синтетаза - потребность восполняется только за счет кишечной микрофлоры.
Человек полность зависим от растительной и животной пищи почти для всех
витаминов. Хотя многие витамины как коферменты ферментов организма можно
образовывать в самих клетках.
2. Целлюлаза бактерий для того, чтобы человек смог усваивать глюкозу из
целлюлозы растений. Человек будет использовать очищенную древесину как
энергетический субстрат. При этом проблема будущего голода на планете Земля будет полностью решена.
3. Гены для образования естественных молекул запахов, которые будут
выделяться через потовые железы или через выдыхаемый воздух. Самим человеком
эти запахи восприниматься не будут. Но можно сделать так, чтобы этот запах
был непереносим для гнуса, комаров или клещей. В будущем нехватка свободной земли на планете подвигнет людей к освоению мест, где эта проблема
кровососущих насекомых и клещей особенно актуальна, особенно из-за
переносимой ими инфекции.
4. Эндогенный антибиотик широкого спектра действия, обладающий полной
устойчивостью к защите микробов, так чтоб чувствительность микробов к нему никогда не снизилась. Это даст образование человека-гнотобионта. Полностью
будет разрушен симбиоз человека и кишечной микрофлоры и человек полностью освободится от паразитирующих на нем микробов и станет абсолютно стерильным
от микробов. Это снимет все проблемы в медицине, связанные с борьбой
организма человека с агрессивной внешней микробной средой.
5. Гены синтеза незаменимых аминокислот для человека. А также ферменты
микробов превращающих нитраты в нитриты, а нитриты в аммиак. Больше не будет
проблем с белковым голодом на планете Земля. Человеку будет достаточно
небольшого количества аммиака или нитратов чтобы не было белкового голода.
38
Для роста , развития и восполнения катаболизма белков тканей. Это ферменты - нитрат и нитрит редуктазы. Можно пойти по примеру растений и приспособить ферментный комплекс для фиксации атмосферного азота, как у клубеньковых бактерий. Использование атмосферного азота для синтеза белка сделает человека независимым от пищевых природных цепей. Человек сможет превращать
неорганическое сырье в виде газов и солей в энергию и белки.
Конечно, для человека прием пищи - это больше , чем просто употребление
углеводов , белков и так далее. Так радоваться поеданию чего-то вкусненького никто и не отменяет. Можно сколько угодно есть обычную пищу или вообще ничего
не есть, кроме солей.
Такое автономное существование человека без обычной пищи может иметь значение для космических полетов. Перестанет быть угрозой для жизни то, что обычная
пища закончилась.
6. Гены повышенной устойчивости к неблагоприятной внешней среде. Примером
этих генов могут быть гены репараз ДНК, восстанавливающие ее повреждения от мутагенов среды.
Для этих групп генов можно изготовить несколько универсальных
векторов.
Далее эти векторы вводятся в стволовые клетки, выделенные у какого-то
человека - фибробласты или лимфоидные клетки или другие. После
успешного переноса генов, клетки вводятся обратно. Полностью изменить
организм можно только введя векторы в яйцеклетку , из которой вырастет
организм с новыми свойствами.
РАСТЕНИЯ - ГЕННЫЕ КОНТЕЙНЕРЫ И ХИМИЧЕСКИЕ ЛАБОРАТОРИИ. 29 мая 2009.
Рассмотрим планету Земля сквозь время. Миллиарды лет. Предположим, что нашу планету посещали или населяли когда-то высокоразвитые цивилизации. Если наша человеческая цивилизация прошла путь от первобытнонго общества до современной цивилизации за 4-5 тысячи лет, то можно предположить, что Землю населяли
такие же цивилизации несколько раз за миллиарды лет, что существует Земля.
Они могли доходить до совершенства в генетических манипуляциях с организмами значительно выше , чем сейчас.
Какими бы не были цивилизации прошлого для разумной расы существ всегда
будут одинаковы ценности для любой разумной жизни. Это прежде всего
существование без болезней и во времени значительно продлить свою жизнь,
также расширение своих физических и умственных способностей.
Меня, как генетика и геронтолога, интересует прежде всего как генетические ученые и мастера других цивилизаций решали проблему увеличения своей жизни.
Идея в том , чтоб создать такое лекарство, которые никогда не исчезло и было доступно всегда.
Это - растения, как основа пищи и лечения всех высших форм жизни.
Их легко размножить и иметь лекарства в виде консервов - семян при межгалактических полетах. Растения могут с помощью генетичеких программ синтезировать такие химические вещества, которые современная химия не может сделать в пробирке.
Какими же свойствами должны обладать растения несущие генетические программы создания лекарств продления жизни?
Я думаю и предлагаю свою гипотезу о том , что эти растения растущие на Земле
- это сорняки. Это не бесполезные и не пустые создания природы.
Если бы цивилизации создали для себя постоянный источник лекарств для
продления жизни, то они создали бы растения , обладающие следующими
свойствами.
1. Неприхотливость к экологическим факторам.
2. Несколько способов размножения.
3. Сильная экспансия растения, то есть за короткое время оно заполняет
все свободное пространство, растение вне конкуренции.
4. Яркий фенотип, сразу бросающийся в глаза и отражающий наличие нужного
лекарства. Весь внешний вид растения , его цвет, запах, вкус показывает, что
это непростое растение. Сами-то растения не знают, что они выглядят как-то
39
странно или красиво. Это оценка их создателя.
5. Стабильный генотип, неизменность основной химии растения в течение многих миллионов лет.
6. Растения целевые снабжены системой защиты от поедания животными
и устойчивости к микроорганизмам и другой флоре.
7. В геномах сорняков возможно есть метки, послания высших цивилизаций.
Хорошо бы если был произведен секвенс нескольких обычных сорняков. Даже если
не повезет и не будет никаких информационных посланий, то генетика сорняков может иметь большое значение для увеличения урожая пищевых культур.
На Земле биомасса сорняков во много раз превосходит биомассу полезных видов.
И возможно присобление сорняков для биосинтеза нужных химических веществ.
Растения могут синтезировать очень сложные химические соединения.
Синтезировать такие в пробирке очень сложно даже из близких по формуле соединений. Возможно потребуется десятки реакций для воспроизведения
какого-то , к примеру , алкалоида. У растений же в его синтезе участвует
такое же количество генов, каждый фермент модифицирует , режет или
присоединяет какой-то химический радикал. И все работает согласованно.
Возникает вопрос - это продукты эволюции или чья-то генноинженерная мысль.
Если токсический эффект для защиты определяется у растения конечным
соединением, то как же оно защищалось до этого. Приобретало и накапливало
цепи ферментов без защиты, то где же эволюция. Возможны , конечно, разные способы.
А может быть в каком-нибудь обыкновенном одуванчике, иван-чае или
мать-и-мачехе может быть что-то невероятное?
Итак, еще раз выскажу кратко свою гипотезу. Сорняки - это химические лаборатории для синтеза различных лекарств в том числе и для продления
жизни. Причем это могут быть не обязательно низкомолекулярные соединения, а
сам набор генов или какие-то последовательности ДНК, которые могут
поглощаться геномом организма с изменением качества генома для выздоровления
или омомложения организма.
ЧТО ЖЕ ТАКОЕ - РАЗУМНОЕ ПОСЛАНИЕ В ГЕНОМАХ? МОИ РАЗМЫШЛЕНИЯ.2013.
Я предполагаю найти в ДНК именно РАЗУМНОЕ послание в виде текста. В
начальном появлении человека пока точно не ясно, как он произошел, как новый вид. Возможно это простая мутация плюс влияние среды. Тем не менее, человек резко вырос в своем развитии по сравнении с другими приматами. Не случайно, поэтому, некоторые ученые, изучающие появление человека, предполагают, что
он продукт генных операций какой-то более высокой цивилизации. Иногда даже точковые мутации могут резко менять фенотип и приводить к появлению нового
вида. Многие гены человека схожи с высшими приматами, но могут ли быть эти точковые мутации или транслокации продуктом генных операций. Почему бы нет?
Все можно предположить. Если это так, то должны остаться разные участки ДНК, которые несут технологическую информацию, например, метки для ПЦР,
аномальные повторы, возможные дубликаты и копии генов или транспортных систем, какие-то гены или регуляторы для преимущественной эволюции нового вида и так далее. Все технологические метки и остатки ДНК, необходимые для создания и продвижения нового вида ничем особо не отличаются от остального массива ДНК.
И хотя они продукт работы высшей цивилизации, они не являются разумными
посланиями для будущих цивилизаций. Разумное послание - это текст, который высшая цивилизация хочет передать последующей цивилизации, сохранив его
через много поколений и многие тысячелетия. В этом и есть смысл жизни - сохранение и распространение информации, заложенной в ДНК.
При этом предполагается, что последующая цивилизация достигнет уровня науки,
при котором возможна работа с генами и ДНК. Самое главное в разумности
послания - это обращение внимания ученого на необычность участков ДНК и
легкий алгоритм шифрования текста. Предполагается, что текст будет введен
именно в разумный вид, то есть в человека. Хотя им может быть любой из других миллионов видов.
Итак, необычность участков ДНК в виде каких-то искусственных построений
40
последовательности ДНК. Можно подобрать такую последовательность из 15-20 нуклеотидов, что она будет в полном виде встречаться в одном экземпляре на
весь геном, то есть оригинальных участков очень много, но это не будут
признаком метки текста, поскольку никак не обратит на себя внимание. Метка разумного текста должне его сразу выделить из массива ДНК. Для подтверждения этого можно рассчитать вероятность появления этого необычного участка.
Но, скорее всего теорию информации применять будет не нужно,так как вид метки
будет настолько необычен, что случайными событиями объяснить его образование
не возможно. Также он не должен быть естественного происхождения, то есть не должно быть биологического процесса, который формирует, использует или
сохраняет какие-то структуры ДНК, которые решено сделать меткой разумного текста. Я делаю одновременно две вещи - это разрабатываю способ вложения послания в ДНК и способ поиска такого послания. Конечно, логику работы высшей цивилизации предположить трудно и поэтому могут быть сложности с нахождением
меток текста и большая случайность этого события.
Далее будут показаны некоторые метки текста, которые я бы применил при разработке послания от нашей цивилизации той, что придет после нас.
Кодоны в ДНК и разумность последовательности. 2013.
В ДНК, как известно, имеется 64 кодона по 3 нуклеотида. То есть, можно закодировать каких-то 64 знака, присвоив каждому кодону букву или знак. Количество возможных кодонов слишком избыточно для кодирования какого-то
языка. Приведу короткий пример о количество слов в простом языке.
Я принимаю следующие условия.
1. Чередование согласных и гласных.
2. Букв в алфавите 21.
3. Согласных 14 , гласных 7.
Пусть слова в языке будут только по 5 букв с чередованием:
сгсгс, что составит 14*7*14*7*14=134456, гсгсг, что составит
7*14*7*14*7=67228.
Итого 201684 слов в этом условном языке.
Таким образом, только для этих условий, словарь языка огромен. Поэтому, если каждой букве языка присвоить один кодон, то хватит около 20 кодонов или
меньше. Если перейти на биологический принцип подобия, то, конечно, лучше
всего количество букв в языке принять равным числу аминокислот в белках.
То есть , по принципу вырожденности кода, один знак может иметь несколько кодонов. Если транслировать такую ДНК, то полученный текст ни чем не будет отличаться от других белковых транслятов и определить, что здесь написан
какой-то текст-послание будет не возможно.
Поэтому главным признаком разумности последовательности ДНК, я думаю, будет наличие в ней сниженного количества использованных кодонов. То есть, будет использовано 20 кодонов из 64. Этот принцип разумности я предлагаю
использовать для записи в ДНК каких-то текстов или для поиска посланий.
Известна общая статистика числа разных кодонов для человека и других
организмов. Конечно, на каких-то участках ДНК, особенно небольших, процент кодонов может отличаться от среднего. Но не настолько, чтобы отсутствовали совсем десятки кодонов. Для анализа числа разных кодонов можно использовать
следующие программы. Программа CODONS14, расположена по адресу:
ftp://ftp ebi. ac. uk/pub/software/dos/.
Особенностью этой программы, что она выдает результат в виде листа всей последовательности ДНК, кодоны которой разделены пробелами. Пример показан в приложении 10. Для примера дана только верхушка гена PUSHKIN, в котором
зашифровано стихотворение Пушкина "Осень". Такое разделение кодонов позволяет проводить удаление или замены ВСЕХ одинаковых кодонов, не затрагивая
остальных. То есть разбивка последовательности на кодоны очень нужное
свойство этой программы. Програма выводит абсолютное число разных кодонов в
участке ДНК. Количество кодонов в гене PUSHKIN, который я создал,
представлено в приложении 10. Видно, что при кодировании стиха "Осень" в этом гене я использовал только 35 кодонов, приспособив кодоны для русского
41
алфавита. Остальные кодоны не использованы. Таким образом, если кто-то через много лет найдет в ДНК этот ген и определит в нем число разных кодонов, то
сразу будет ясно, что это не природное, а искусственное образование. Еще один признак разумности текста – это большое количество разделителей слов в языке.
В этом примере это кодон разделитель AAA, которого содержится больше, чем
всех остальных знаков. Ген PUSHKIN я создал для примера. Количество использованных кодонов легко можно было уменьшить до 20. При этом текст стиха "Осень" также можно было понять.
Также можно использовать форму для поиска редких кодонов, по адресу: http://molbiol. ru/scripts/01_11. html,
но в ней определяются только промилле разных кодонов, а лучше сразу иметь их абсолютное число.
Можно использовать форму с сайта:
http://www. kazusa. or. jp/codon/countcodon. html. Программа COUNTCODON.
В окно формы надо вставить последовательность ДНК и отослать. Через несколько минут всплывет окно с результатом. В таблице будут указаны промилле и
абсолютное число кодонов в участке ДНК.
Для кодировки текста в геном можно использовать два основных способа - кодирование непосредственно в цепь ДНК и кодирование через трансляцию,
подобно рибосоме.
Конечно, возможны и другие кодировки, все зависит от создателя. Для примера,
я мог бы привести кодирование с четырехбуквенным кодом, когда каждой букве текста будет соответствовать четыре рядом расположенных нуклеотида цепи ДНК.
Но этот код никак не связан с биологией клетки и годен скорее для шифрования
в ДНК текстов, которые никто не должен прочитать, чем для легко читаемого послания. То есть мало вероятности, что 4-буквенный код кто-то вообще будет искать и расшифрует.
Первый способ кодирования я осуществил через понятие "единицы", оно описано далее в разделе "ДНК говорит". При втором способе кодирование сложнее, но оно как-то связано с нормальной биологией клетки, что может быть важно для
сохранения неизменной информации. Если тот человек, который кодирует в ДНК
для последующей трансляции ее, как белок, будет и извлекать эту информацию,
то каждому кодону ДНК можно присвоить любую букву. Если же предполагается сделать послание на длительное время или для поиска посланий из прошлого,
надо процесс кодирования сильно упростить для последующей расшифровки.
Для этого надо сократить количество букв в алфавите хотя бы до 20 и сократить количество используемых кодонов. Некоторые кодоны не надо использовать,
если их промилле мало. Надо использовать для одной буквы тот кодон, которого
по статистике больше,а остальные кодоны при вырожденном коде не использовать.
Из 64 кодонов понадобятся всего 20, столько же, сколько и аминокислот, или немного больше. Надо для кодирования не использовать кодоны терминаторы,
иначе невозможно будет распознать разумный текст. Транслят при большом количестве терминаторов будет выглядеть, как некодирующий участок. При их многочисленности он не обратит на себя никакого внимания.
Надо для разбивки текста белка использовать знак пробела между словами. Примерная статистика такова, что из 300 знаков в обычном тексте 50 знаков пробелы. Это составит 167 промилле, что почти в 10 раз выше, чем для встречаемости разных аминокислот в белке.
Для пробела можно взять кодон TTT в ДНК, это фенилаланин, и AAA - это лизин,
а другие их кодоны не привязывать ни к какому знаку.
При расшифровке текста якобы белка, который получится после трансляции, как
на рибосоме, сначала разбить текст на слова с помощью амнокислоты, соответствующей пробелу. Затем расшифровывать слова. При создании гена
PUSHKIN, конечно, надо было лизину выделить только кодон AAA, а кодон AAG
не присваивать ни какому знаку. В любом случае, пример правильного и не очень правильного присвоения кодонам значения букв, также имеет показательное значение.
При этом этот большой белок разбить на отдельные слова по лизину правильно не получится. Пример трансляции в приложении 11. Чтобы закодированный текст правильно выглядел надо присваивать значения букв с учетов вырожденности
кода. Если аминокислота кодируется несколькими кодонами, то брать только один
42
кодон, а остальные не исползовать. Также не использовать кодоны-терминаторы.
При этом закодированный текст будет выглядеть,как очень большой белок и сразу обратит на себя внимание. Надо, чтобы сам этот текст содержал в этих словах
направление для облегчения расшифровки. При этом можно также, как для кода
ДНК, то есть первого способа кодирования провести ввод чисел, химических
элементов, констант физики , понятий времени, массы, размеров, и так далее. И обязательно словаря. В этом случае этот текст-послание кто-то расшифрует.
Конечно, бесполезно сразу зашифровать в ДНК какие-то тексты вроде
стихотворения Пушкина, расшифровать их без ввода в послание невозможно.
Транслят текста ничем не отличается от какого-то белка, а их десятки тысяч.
Конечно, можно еще сопоставить саму ДНК и транслят. Если выполнять правило об сокращении количества используемых кодонов до 20, или до 25 (точная цифра зависит от целей), то ДНК со сниженным количеством различных используемых
кодонов - это признак разумности текста или его искусственности. ДНК надо транслировать по белковому коду и в этой же ДНК в экзонах определить процент разных кодонов, начиная от кодона инициации - метионина. Если окажется, что какие-то кодоны не встречаются в этом участке ДНК, а какие-то выше среднего
для данной аминокислоты, то можно предположить, что этот участок
искусственного происхождения. Частоты кодонов в ДНК для человека,
цитировано с сайта:
http://www. kazusa. or. jp/codon
Значения в промилле, то есть на 1000 кодонов. Среднее значение без
терминаторов должно быть равно 996, 66 : 61 = 16, 34.Данные о количестве
кодонов приведены в приложении 12.
Если же в кодирующих участках промилле кодонов будет сильно отличаться или,
что еще лучше, более половины кодонов будет отсутствовать, то это важный
признак разумности текста - его отличие от средней статистики. Также, если какая-то одна аминокислота будет превышать средний уровень в несколько раз,то это возможный знак логического раздела слов в тексте, что также признак
разумности текста.
Если после перевода текста в последовательность нуклеотидов, эту последовательность транслировать по обычному коду аминокислот, то возможны 6 последовательностей с разными сдвигами рамки для прямой и обратной цепи.
Буквы обозначения аминокислот и буквы алфавита, слова на котором записаны в
ДНК, не совпадают. При трансляции по биологическому коду получается как бы белок, но прочитать его как слова не возможно. Поэтому при переводе текста,
например стиха Пушкина в ДНК, не надо использовать кодоны терминаторов. Иначе признак разумности текста при его просмотре будет утрачен. Если кодоны терминаторы не использовать, то разумный текст выглядит как очень большой
белок. Иначе говоря, большой белок с непонятной функцией - это и есть
разумный текст. Чтобы его было легче расшифровать как текст, надо буквы алфавита по возможности кодировать с учетом вырожденности кода, то есть несколько кодонов на одну букву. Далее при расшифровке вначале надо найти
знак раздела, В моем примере - это знак f - фенилаланин, кодон пробела - AAA,
при трансляции в обратном направлении. и далее работать со словами,
различными участками белка размером от 1 до 20 аминокислот. Длиннее 20 букв слова в языке человека очень редки.
В приложении приводится пример стиха "Осень" после биологической трансляции
на рибосоме по обратной последовательности со сдвигом -1, отражая код в ДНК,
то есть текст стиха выглядит как большой белок, которые можно
перетранслировать снова в текст стиха. При остальных 5 вариантах трансляции текст из аминокислот имеет очень много терминаторов, и поэтому не производит признака разумности. Хотя, именно в рамке +1, трансляции вперед, и
закодирован текст стиха. В этом случае - это демонстрация ошибки при выборе кодонов.
Данные тексты лишь пример, ничто не может быть однозначно принято, как
какой-то вселенский принцип. Возможны любые изменения, возможны любые
кодировки. Все зависит от автора и конкретной цели. Моя задача лишь обратить внимание читателя на возможные проблемы и их решения.
43
ГЕННОЕ ПРОГРАММИРОВАНИЕ И ДНК ГОВОРИТ. 22 мая 2007.
Наступает новая эпоха в генетике. Наступает время , когда живые организмы
будут использоваться для хранения информации. Футурологи прогнозируют начало этого через 20 лет по статье Деймоса Стренталла "Генное программирование" на сайте XAKEP. RU . Другой исследователь - Джарон Ланье предлагает переписать архивы NEW YORK TIMES или библиотек в интроны тараканов и выпустить их. Предполагается , что тараканы как очень устойчивые насекомые, которым
несколько сотен миллионов лет , сохранят информацию о человечестве в случае глобальных катастроф. Филипп Кео , директор ЮНЕСКО в Москве в статье "Электронный кит, электронный кролик и электронный таракан" развивает эти
идеи и предлагает сохранить шедевры искусства в насекомых.
Итак, фантасты, футурологи, изобретатели, как всегда, опережают реальную
науку на много лет.
Мне же интересен больше другой аспект этой проблемы. Если станет возможно
закинуть в будущее информацию в живых организмах на миллионы лет, то
предположив,что предшествующие цивилизации могли это сделать для людей Земли, надо поискать в современных организмах информацию из далекого прошлого. Этому
и посвящен проект "ДНК говорит".
В геномах организмов много "свободного" места в виде неиспользуемых явно последовательностей нуклеотидов. Это интроны, интергены, повторы,псевдо-гены
или нуль-аллели, множественные молчащие гены, гены изо-ферментов, остатки ретровирусов и другие явно не нужные гены и негенные участки. Информационная емкость неиспользуемых и годных для введения информации в геном довольно
велика и может составить 10-20 процентов генома. Это для человека составит
около 100-200 мегабайт возможного пространства.
Скорее всего на них можно будет записать информацию жизненно важную для конкретного человека. Это типирование его биометрических, генных, личных и других характеристик, необходимых для его здоровья и безопасности. Или же общечеловеческие ценности для избранных организмов.
Забрасывание в будущее информации возможно на время от тысяч лет до сотен миллионов лет. Неизвестны другие носители информации, которые могли бы сохраниться неизменными за это время.Только живое вещество для ДНК - белковой жизни может сохранить информацию навсегда.
Пока создаются только подходы к этой проблеме. Есть несколько сложностей для
ее осуществления. О них будет сказано в другой статье.
Итак, для того , чтобы найти способ расшифровать возможную информацию в ДНК, надо разработать или знать способ, как ее туда эффективно записать.
Я разработал несколько принципов записи для длительного хранения информации в геноме.
Текст по выбранному алгоритму превращается в последовательность
нуклеотидов ДНК. Это не сложно. Для примера приведу стихотворение А. С.
Пушкина "Осень" в виде текста и транслированное мной в вид гена. При способе кодированиия 1 буква - триплет нуклеотидов возможно закодировать 64 знака,что достаточно для любых текстов.Это биологически совместимый способ кодирования.
Если для кодирования использовать по 4 нуклеотида , то возможно закодировать
256 знаков, что достаточно для кодирования всех знаков таблицы ASCII. Этот способ позволит записать любые компьютерные программы и графику на низкоуровневом компьютерном языке, но этот способ не присущ живым организмам.
Можно конечно изобрести различные способы шифрации на ДНК, но это не нужно
для нашей темы. Принципы кодирования.
1. Принцип - это принцип облегченного расшифрования ДНК текста.
То есть информационные посылки создаются именно для того, чтобы их легко мог расшифровать любой лингвист.
2. Принцип ДНК метки. Участки ДНК, несущие текстовую информацию, должны быть выделены из общей ДНК генома специальной меткой, в виде аномальной последовательности, вероятность образования которой случайным или
ферментативным способом близка к нулю. Эта последовательность названа мной INFOINDICATOR. Именно аномальной последовательностью,сразу попадающей в глаза после секвенирования, а не участок для праймера. Эта последовательность нужна для быстрого выделения нужного участка ДНК для анализа или чтения заложенной информации. С этой же целью применяется фланкирование ДНК текста участками,
44
показывающими начало и конец чтения. Пусть это будут просто поли-A блоки
размером 30-100 нуклеотидов. Они названы мной, как STARTINDICATOR и
ENDINDICATOR.
3. Принцип биохимической метки. В текст ДНК надо вставить один или несколько небольших генов - маркеров. Они необходимы для типирования и отбора стволовых клеток в культуре или эмбрионов на ранних стадиях развития. Если интеграция в хромосому прошла удачно, то обнаружив продукт генов - маркеров можно быть уверенными, что и информация на месте для хранения. Биохимические маркеры
можно дополнить оригинальными участками ДНК для ПЦР, но если особый
метаболизм быстро выявляется, то участки для праймеров надо знать точно, а
это , скорее всего, через много лет будет невозможно.
4. Принцип эволюционого превосходства. Организмы, которые предполагается использовать для посылки информации на миллионы лет, должны иметь особое эволюционное превосходство перед другими особями этого вида. Без этого метка будет разбавлена обычными геномами или вообще самоудалится в популяции.
Это касается идеи фантастов вставить информацию в насекомых, а затем их выпустить. Информация будет утеряна.
Эволюционного превосходства можно достичь какими-то генами , дающими новые источники пищи (например, ген целлюлазы для превращения клетчатки древесины
до глюкозы или ген фиксации атмосферного азота для исключения белкового
голода), новые ареалы расселения - устойчивость к экстремальным факторам
среды, новых способов защиты от инфекции , усиление способности к размножению
и так далее.
5. Принцип метки для изменения фенотипа организма. Сам внешний вид взрослого организма должен говорить, что он носитель метки. То есть его внешний вид
должен показывать, что он отличен генетически от себе пободных организмов.
Метки организма - носителя информации желательно интегрировать в
информационный участок.
6. Принцип генетической стабильности информационного участка. Спонтанные
мутации за много лет могут сильно исказить информационную последовательность. Для генетической стабильности применяется комплексный подход. Он будет
изложет в последующих статьях.
7. Могут быть дополнительные условия, которые возникнут во время
непосредственной работы.
Пример записи текстовой информации в ДНК. Я транслировал текст на русском
языке поэта Пушкина - "Осень" в последовательность нуклеотидов в ДНК. Каждая буква или знак - триплет нуклеотидов. Программа для транслирования очень
простая и ее может изготовить любой программист на Java, Basic или другом
языке. Перекодировки буква - триплет любые по желанию.
Я принял для себя, например, такие:
catagggagcagcgaatcggcgagaaccataaa
о с е н ь . ч е г о
aataaacaacatataaaagaaagagagcaataccgttggtagataaaaagtcataacgaa
в м о й д р е м л ю щ и й т о г д
acaaaacaggagaaaaatgggcatgaatagagtaaaagccaaatcaaaaaaaaaaaaaaa
а н е в х о д и т у м ?
Где AAA - пробел между словами, ACA - а, AAT - в, GAA - д, и так
далее. А. С. Пушкин - "Осень".
gtaagtgtcccaagctcacatagaacctcacatggtaacaggggcacatgtagtcttcct
tgtctcttgagatctctgcttatgggcatggtattgtgtctggcacttctttgtttatag
tttagaatgtatttttgtggttgtttggtactgtctccactcatagactatgagctccac
atacttgctactgtaaccacatgcctgcttcatagttgatactcactgaatactgaggga
agagagggaaggcaaaagaaagggtaaagtgaagatttcaggtgccgttacagtcaccga
gtttacattgttatagctttaattagtgtacctccatttataaggagattgatgctatct
tgattattggttcatcttgtctctgtcgctgaaggtattttcatgtcaaatgagaaaaca
tggctttttaacatgaaatttttaatttttaatattcaattcattgtgagaatcctactc
tataappppppp......promotor..............pppppppppppppppppppp
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnn......gene1.................nnnnnnnnnnnnnnnnnnnn
45
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxx......infoindicator.........xxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaa......startindicator........aaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaaaaaaaaacatagggagcagcgaatcggcgagaaccataaa
aataaacaacatataaaagaaagagagcaataccgttggtagataaaaagtcataacgaa
acaaaacaggagaaaaatgggcatgaatagagtaaaagccaaatcaaaaaaaaaaaaaaa
aaaaaaaaaaaagaagagagagacacaaattagcagatccattatagtggcaagagacga
aaaagcgacaaacagacaaggagtagccactagtacaaaactaaaagcgacaaaagacat
tggacaaaacatagtagaggcgggacagagagtcaccataggtacgaggaacagtaggag
aaatactagaggagttgcaaaaggaaacagacaaactaggggaaaaggaatcattagggg
aaaaatgagagtaatgagataatcgaacatgggcagagctacaaacatagggagcagcag
tagataaaagggtacacagaaaaaactaaagaacatagacataacacaaaacacagacat
caagagagataaacagagagtatcgacagcagaggcacaaaagagtgggagaaaaaggag
gactagagtaaataaacaaaacaagagtaccgacagtagggtagcaaaagaagcggcgag
ataattcagcataaacacagaagcgaaaaaagcgacgagaaataaacaaggagttgctac
attaaaaggcatagggaggaaaaacaacatataaaacaccataggcacgagtgaacagag
agtaataaacatagttgtgagtaagactaggagaaacaccattacggcaaaaggaaacat
gggcatagtcatcgtaaaaggaatcatgagataatttagaaaaggagtagaacagacgaa
agcagtaaacattaatagcaatagaaacatagtaaaaaggagtgagagcagcatataaaa
taaacaaagacaaattgcatttagaaaaagagcgaatagagtaaatacacaataaaaagg
cataagacatataaaagcaggcagagcaattgataggagaaagaaagcaagagaacaaat
tgcatcagtgagcacgagagacgaaaacaacatggcaaacaccatagaacaattaaaggc
aaacaggagaaataccgtaagtaccgtaaaaatgagaggcagtgcattaggtatagcggc
cagacaaaacaacaggagaaacatagtagtgagcacgagtaccgaattaaaaatcatcag
cgaattaaaaacagaggctaacgaaaaactaaaaatgagaggcagcatataaaaggcaaa
aagcattacgagcagatttatagacataatcgaaaaaagagacatgaatagagtattaaa
ggcagcaataggagtaatacaattaaaagccaaaaaagtcataggtatcatcgtaaaagg
agtgagaggcaggagcagtgcatcaggagcagacataatcatcgtaaataatagcaacat
ataaaaggcaaaaagcattacgaggagaaagaacataatcattacgagcagatttaccgt
aagtaccgtaaagaggagaaaaggcaggagaacacaattaaaaataaacacagatagagg
agcagtaggagtaattagtagaaatacagccagtgctatacatataaatacgagaactat
tagataaaaaaggagaacaaaaggacacaggagataaaaaggaaacaccatgaaagaagc
aaccatataaaaaagtgcaggagtagaaaatagaaaaatcattacgagcagatttatcat
aacgaaacaaaacaccatgaaaaaaggcataagcattacgagcaaattaaaaggcataac
agagagagtacaaaatagaaaaggaatgaggacacaattcatcagacaaaaaatacacaa
aaaagaagctatagcaaagaccaagagagtattaaacactgctacacaggcaaatagaaa
gaaagacatgacacaatctatacatataaaaatgagagggagtaccatattaaacataag
agcaataaagacgagtacgagtaacatcaaaaacataggagtagatgccaaaaacagcat
aactagattaggtatcattaccgataatagagtcgaaaacaccataaataagagagatat
acatacagcaaaaggagtcatggcggctaggggattaaaagacataatcagtgcgggaaa
agagagtatatcacaaaataatagcaacagtaggggaaacacagaacataagaacagtag
tatcataataaaaagtacgagaggagtggctggtaggagaaaagtagagagaatcataac
tagatcatcatcatccagcataaacagacagaacataaataacagacaagtcgaaaatag
aaaggcgagaggagtcgaatcaaacaccattacaaccatgaaacaaaaaggcaggagaac
aaagaaacaaaaaggcaggagaacattaatgaggaacgaaaacggagtcataaacagaca
tatcatcaggagggtaaatagaaagactagagtgagtaccgtaaaaaggagagataccat
aactagatccaagaggaaaatgaggaacgtaaacagacagaacatgagaggagtatcaaa
caggagtaccgataaggcaaagacgagaaaggtgagtactgcataaaaaatgagtattat
acaagtacaagtcgaaggggcaaacagacacaaaaaaataaaaggacacagggcgggaaa
aggaaaacaagacaataggaaacacaatagaaacaatacacagaatgccaatagatctag
taccgaaaatattagaggcagagcagtcgaaaaagcaaacacgagggcgagataaaataa
acaaaaaggagtgagtattacacacaatagaaagaaaatcatatacagtgccaatagatc
catgggatcaaatacgagagtcataaatatagaacaaggcagcatgagatcaaataccgt
aagtagtacaaaaagtgcaaaggcaaaagtgagaagggcatttatcataacgaaacaaaa
aagaaacaggagaaataacagcatataattaaagaaacaaaacactgctaccgaattaaa
gaaacaaaatatcatcaaacaagatgcattaaagaaacaaaacaaagcgggtagatcagt
tgcattaaaaatagggagaaagaaagctgagagaatcagtgcgagaaaaggcaccatagg
cataagcagcataggagttagaaaaacagcaagggcattcagacaaggaaacaaagcggc
tagtgacgaattaaatatacatataaacaccattacggcattaaacaatgcaaaaggagt
46
agaacagacgaagagcaaaaacatagtaaataaacaaggagcgggtagatttactagtga
cgaaaatatacatataaaaagtgcaaacagacacaccattagagtcgaattaaagaaaca
aaacataggaatgaggactagagtcgaaaaagggagaagggcaaaacttagcagcatata
aaaaataaacagacaaggaaacaatgcaggtactagaaacaggagagtattaaatagaaa
gacacataccgaaaataatagcaatgcaaaaggagtacaagaagcgggtagatttagatt
aaacacagacataatcatgaatagaataaagaggagaaaaagtactagcagacacaatag
aaatagaaaaattagcagcatcaaattcaccatcaatagcagtattagaaagagataaaa
agtaatcatagatagcaaaaacaacatagacatgacgagcagtgccaaaaatagaaatac
cgagaacatcaaatcgaacagtagaaacaccattaagaacaggagataaaacatagggag
cagtagaaaaagagaacacagggcagtaaacataagtgctatcagcataatgagcagcag
catattcagcataaacaacaggagaaacatcagacaaaacaatagtacacaattaaaggc
tagagtacaagtgagtaccgaaaagaacatagacataaccatataatttatagaacaagg
catcgtaaaagttaggggcatcgtattaaaaagtactagaggagtacacgttgggagata
aaaaggcaatagagagagcagcagcatatcagtacatataaacaggagtaccgtaagtag
caacatgagaaagaatagagtggcaaaaataaaagggagcaacgagagaaaagacatgaa
cagcatatatataaaagggagaaggagaaacaagagcagggcaaaaattacgagggcgag
agtatcaaaaggtatacataaacaagtcgaaaaaatacacaaaaacatagttatagacat
aatgagcagcagcatatttagtaaaaaaaccatgaacataattgcgggaaaaatagagag
caagagcagaaaggcaaaagaacagaaaaatactagtgacgaaaagagataaaacatgaa
cagcatataattaataaacaggagataaaacaacagcataaccataaagaacataagaga
cataaccatattaaataccgtaagcataatcagtagtataaacaggagaaaagttgggag
aggtacacaaatcagtgcataattggcaaacaggagggcagtcataaaaataaacaggag
ataaaacagacatgagagtacaaacaagagggcagtcatcgtaaaaggaatcatgagcag
agaacaaatcagcatataatctatacatataaacggagtcataaacataagtgtggcagg
cagtagagtcgaatcaaacaacaggagaaacagagaacaaattagagtaggggcaaacat
cagacaatttatacatatattaaaaatgagagacatggcagtcagcatattaaaaataca
caaaaaggcacagggcatagtcatggccagacaggcaaagaagagaatacacaccataga
catcgtaaacagagaacaaattagagtaggggcatcaaacagacaaaaaggcaagagaga
agtcgaaaacataggagcgacgaagagcagacaattaaggaggaacagggcgactataca
aaatattaccatcagtagagtaggggcaaaaaggagtaaaaaagacatcaccatagtaca
attaaaaaggagtaaaaaaaccaggagaatacaatcagctactgcaagtatacaaaacag
acaaaaagcaggagtacagggaaaagcaatggccagagcaattgataggggaaaaattag
gaacagacaattcaacataactagtaccgacagcatataaaacacagacatcacacaagg
agttagaaacatcagacaaaacaggagaaaaggtactgctgatagagtaaataagagaat
acaatttagaacagaacagagagtaaacagacaaaatactagggtgagaaagagtgggag
aaaaagacaaacagacataattgcataaaaggtaatgagagtatccatcagacaaaagac
tagaatacaaaagagtgggagaaaagggagaaccatgaacagggcattaaataaacaaat
agtagaacaaaacaggagagtatcagccagtgctacacaggcaaacaccatagaacaatc
aaacatggcgagataaaacatggcacaagacataatacacagcgagagatccacagatag
ggcagtcagacaaaacaacaggagaaaagtaatcatggcaaacacagacattggacatac
cgacagacaggcaaatatagaacaaggacaaaaacttaccgtaagtaccgtaaaggcaaa
cactgctgacagcatgagaaacacagatagagacatgaatgcaaaagcaatggcgaaaca
cagcgagagattaataaaaagacaaacagagagggtaaatagaaaaataaataacattac
catagtcataaacatgaagagagttgcgagaaatacgagaggacaattaataaatagggg
aaaagggagcagggcgggaaaaatgagagtagaacaaaatgaagccaaaaatagaaaagg
aatgaggacgaggagaaagaatgcgggacacagcgagagatttagaaacaaaactaccat
ataaaaaatcattaccagtagaggagtcatcgtaaacaccattatagatgcagttgcaaa
caggagaaggagaggacaatttagaaaagagaggaatattagataaaaaggcattaccag
ggtacaaaatacagcggcattaaatagaaacacgagagaaattgcgagaaacaacataga
cattaatgcatttagaaacatagtgaaacatacgagcagcagtgcgagaaaagggaggaa
catataaaataatagcaatgcaaaagcaacagacattaatgcatctagaaaaggaaatat
acagacgaacatataaaacatagggagcagcgacgtaaaggcaaaagaacaaggggtaat
gagagtacacgtaaaaatcagcataatcgaatttaagaacatagacataatcgacgtaaa
caacatgagcaaagcaaacaccattacgagtaagagcagaaaagaagcaggaggtatcat
ataaaagggcattaccatgaaatttataaacacagatagaattgcggctatacacaaaaa
aagtgcagttagggcaaaaatcagcataatcgaaaaggcagcaataggagtaatagccgt
aaataccgtaagcataatcgaattggcagagaggaacatataaaaaggtacgagagtaca
gagagtaaaaggcatcagattaaaggcagagaggaacatataaaacagacagggcatgaa
tagagtaaaaaccattaccatgaaatttacgagaactatcataaatagaaaagaacagaa
cataggagtcagcataaatagaacagaacagagagtaaaaataaaagggagagagaaggt
gagaaatatagacataatcgaattgacgagtacacacagtagggcaaatattagcacggc
agtaaaactaaaggcaaaaggcagcataatacaaaaaggggcacaaggagttactagaat
47
attaaacaacattaccatgaaattggcaaaaggcagcataatacaaaagactagtaacag
tagaaacaccattaccagaaaactaaaagtacatatcataataaacaacatataaaacat
agaaacacacagtagtaacaaatttagtaaaatcattaccgaagtgagaaacaacaggag
aaacacagacataggagttagagtcgaaaacaggagcagagcgaccagtgcataaaacac
agacattaaacatagtaacaaattatcaatgaggaaagcagtaaatatcataaacaacag
gagaaatatcatcagggcattaaaaataaaagaacataagaacattactagtagaaacat
agttatagatgcagtcatcaaattcaaacagggacaggcaaaaacagatagaatcatcgt
attaaacatcagaaaaataggacagaacagtagtatacaaaacaggagagggagagtatt
tagaaataaaatcatcagtatcataaacaccatgaaaaagagaaccataaaaagtactag
aggagtacacgttggtagcaaaaatatcatcactgcagtcatcaataaaatgagcagtag
agtaaacacagacatcaagagagataatactgcataaaagaacattacattaaatagaaa
agtagagagaggtatacagagagtaggggcaaatacgaggaaatccagcataaaaacaca
aggcaggagagtaaatatagaacaagttattagataaaagaagagcagcgaattaaatag
aaaaataaatatacacaagagtaccgatatgagaaataaacaaagtgcagtcatcaacat
aaccatcagcgaaaacatcacggcagtcgaaaaaaccatagatagagtaaaactaaaagt
cataaaggcagatattagataaaaaggaatgagagtaaatactaggagagtattagtcat
aaaagttacgaggagagtaaacaagaggaatacgagcagcagcataaaactaaaacaaaa
ggcaaacacagagaggaaaaacagtagcaaaaaggctagagtacacgtatttagtaccga
aaagaaagccaatgcaaagaacattacaactaggagaaaaataaagaaagctgagagaaa
caacatgagataaaacactagagtacacgtatctagaaataaacaaagtgcaatacacgt
aaacaatagagaaaaactaaatagaaaaataaaaggtacacagaatatcatataaaaagt
tagtgatagcaggagggcaaaaggtacacagaatatcataaaagcaggtgccactacgag
cagaaacaacattagcaaaaaaatcatcataagagaacagacgagcagcgagagcaaatt
tagaaacacagacataagagcgacgaaacagagagtaggggcaaacaccatcggtaatag
ggcaaaaatcataaacaacaggagattgaaagctgaacaaaaaggagtgagaggcagggc
gagagtaggggcaaatactagagatagggcgagaggtattagcaaaaaaatcattaccag
gagcagcgagagcaaattagtagagagcacgagtgggagagtaaatagaaataaaatagc
ggctagagtattaaatagaaatagtgggagagtattaaatatacatataaaaatcataaa
aggcaggagatttagtaatactagagtcgaaggggcaaacagacatatcatcaggagggt
aaaaggaatcataagcatgaacagtgccaaaaacacagacatggcaattacgagcagcga
gagcaaaaaacttagaaaagtagcagtaaatatcataaacaacaggagaaataggaagag
agtaaacaggagtaaagatagcaatgcataaaaagacatataaaaaaccataggagtgag
ataatttaacagacatatcatcaaggttgcaaagaaacaaatcagtaggagattaaacac
taccatgaatgcaaacaagagggcagttgcaaacaacatgagataatctagaaacaatgc
aggtactagaaaaataaaaaccattaccataatgagaaaaatcattaccagagccgtagt
aggggcaaaaataaacatagtaatacaaacgagatttagaaaagatagggacaatgcaaa
tacgagaactattaggagaaacagacaaataggagtagagagggcagcaaatagcaaaaa
aaggagaacagcagtatttagaaacacacataccgaggttgcaaacacagacataggggc
agtaggggcaaatataaacacgagagaagcattaaacacgagagacataaatataaaaag
agccaaacaaacgagattcaatagcagagcagtacaaaaactaaatagaaaaggagttag
gggtagaaaaggaatcataagcatgaacagcataaacaccatagtgagtatagcagtatc
agtacatataaagaaagagagcaatacgagagtaaacaggaggaaaattaggactagcaa
aaatatcatagaacaaagtaccgaaaaaataaacaggaggaaaattaggaccagcatata
aaaaattacacaaacgagattcagcataaaggcagcatcaaaactaaacaaacaagtaga
cataggtgcaaaaatgaaagaagcaacaaatattaggaaacacgtagtaggggcattaaa
caccattactaaagcagtaataatgagagagggattaaaaatcagtagtaaaaaactaaa
tagaaacacacaagaagcaggacaaaacagacagaaagctactagaggcgaattaaaaat
gagagtagaacaaaacaccattaccagtgcattaacagacatcaaacagaaacaaaagaa
aattagcagagctacacaaggcgaaaatagaaaagaacaaggagggagtatacagagagt
aaaaatcattaccagtgcatccactactgcaatgagagtatcaaatatagcgaaacaaaa
gacaaacagacacaaaaacactactgcagtcgaatcagtagaacacagaggtactagaga
cataatacatacaaatatagcagacagcataggcataataaacaataggggacatagtac
atccaaacaataaaaagggaggaacgacaacataaccataaaaaccatgaaacaatcaaa
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaa........endindicator........aaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
pppppppppppppppp........promotor............pppppppppppppppp
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnn........gene2............nnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
aagggtaaattaaattggttggcctaaaaatgtttcttttctttaattagtttgtggaaa
caaaatagcataaacatgcattgattgatttcttatgttgttttgaatgaaatatggaag
48
gtatatttggtttcaggattctcagggacattttggcctgtagaatctgtagacccattg
tttttgcacatattttaaatttctgaatttcgaacatcaagaaaaccatgttgcattttg
tctcagatgctgctactgaattttaaccactgaattagattgcaacctacatgctgttaa
ctactgagccaagatgaaatcgactactgcattgaaatcagggttagctgtgtctgcact
tgaaggagttgtaatggcagtgaacctgttttctttaatgggatttttattccctgattt
tattctcagttttaattgtgactttgattttaagagaatttcttagtacacatttatttg
aggttttcattgtaactttaagagaataataaaaaacatcctatcgaagtaggtgcttcc
aaacccatatgttcagtggcatatttctgtgttgtgttgttgcagttacttgttttattt
ataaagtatctcttgtaaaaagagaagtcatttgtccatgtgcttttgagttcaaatggt
tgtgtgtatgtgcatgaatttaaaataattttttgtgggagttttcttctttggggtatt
tttggaatacttttctgaatttgtttttttcttttacattaatag
Это только пример. А. С. Пушкин - "Осень".
Чего в мой дремлющий тогда не входит ум?
Державин.
Октябрь уж наступил - уж роща отряхает
Последние листы с нагих своих ветвей;
Дохнул осенний хлад - дорога промерзает.
Журча еще бежит за мельницу ручей,
Но пруд уже застыл; сосед мой поспешает
В отъезжие поля с охотою своей,
И страждут озими от бешеной забавы,
И будит лай собак уснувшие дубравы.
Теперь моя пора: я не люблю весны;
Скучна мне оттепель; вонь, грязь - весной я болен;
Кровь бродит; чувства, ум тоскою стеснены.
Суровою зимой я более доволен,
Люблю ее снега; в присутствии луны
Как легкий бег саней с подругой быстр и волен,
Когда под соболем, согрета и свежа,
Она вам руку жмет, пылая и дрожа!
Как весело, обув железом острым ноги,
Скользить по зеркалу стоячих, ровных рек!
А зимних праздников блестящие тревоги?. . .
Но надо знать и честь; полгода снег да снег,
Ведь это наконец и жителю берлоги,
Медведю надоест. Нельзя же целый век
Кататься нам в санях с Армидами младыми,
Иль киснуть у печей за стеклами двойными.
Ох, лето красное! любил бы я тебя,
Когда б не зной, да пыль, да комары, да мухи.
Ты, все душевные способности губя,
Нас мучишь; как поля, мы страждем от засухи;
Лишь как бы напоить, да освежить себя -
Иной в нас мысли нет, и жаль зимы старухи,
И, проводив ее блинами и вином,
Поминки ей творим мороженым и льдом.
Дни поздней осени бранят обыкновенно,
Но мне она мила, читатель дорогой,
Красою тихою, блистающей смиренно.
Так нелюбимое дитя в семье родной
К себе меня влечет. Сказать вам откровенно,
Из годовых времен я рад лишь ей одной,
В ней много доброго; любовник не тщеславный,
Я нечто в ней нашел мечтою своенравной.
Как это объяснить? Мне нравится она,
Как, вероятно, вам чахоточная дева
Порою нравится. На смерть осуждена,
Бедняжка клонится без ропота, без гнева.
Улыбка на устах увянувших видна;
Могильной пропасти она не слышит зева;
49
Играет на лице еще багровый цвет.
Она жива еще сегодня, завтра нет.
Унылая пора! очей очарованье!
Приятна мне твоя прощальная краса -
Люблю я пышное природы увяданье,
В багрец и в золото одетые леса,
В их сенях ветра шум и свежее дыханье,
И мглой волнистою покрыты небеса,
И редкий солнца луч, и первые морозы,
И отдаленные седой зимы угрозы.
И с каждой осенью я расцветаю вновь;
Здоровью моему полезен русской холод;
К привычкам бытия вновь чувствую любовь:
Чредой слетает сон, чредой находит голод;
Легко и радостно играет в сердце кровь,
Желания кипят - я снова счастлив, молод,
Я снова жизни полн - таков мой организм
(Извольте мне простить ненужный прозаизм).
Ведут ко мне коня; в раздолии открытом,
Махая гривою, он всадника несет,
И звонко под его блистающим копытом
Звенит промерзлый дол, и трескается лед.
Но гаснет краткий день, и в камельке забытом
Огонь опять горит - то яркий свет лиет,
То тлеет медленно - а я пред ним читаю,
Иль думы долгие в душе моей питаю.
И забываю мир - и в сладкой тишине
Я сладко усыплен моим воображеньем,
И пробуждается поэзия во мне:
Душа стесняется лирическим волненьем,
Трепещет и звучит, и ищет, как во сне,
Излиться наконец свободным проявленьем -
И тут ко мне идет незримый рой гостей,
Знакомцы давние, плоды мечты моей.
И мысли в голове волнуются в отваге,
И рифмы легкие навстречу им бегут,
И пальцы просятся к перу, перо к бумаге,
Минута - и стихи свободно потекут.
Так дремлет недвижим корабль в недвижной влаге,
Но чу! - матросы вдруг кидаются, ползут
Вверх, вниз - и паруса надулись, ветра полны;
Громада двинулась и рассекает волны.
Плывет. Куда ж нам плыть?
Функциональные элементы генома и ДНК информатика. 2013.
Несколько лет назад [2011-2012] был в основном осуществлен проект ENCODE,
что означает энциклопедия ДНК элементов. По этому проекту получается, что 80 процентов всей ДНК генома человека имееют биохимическую функцию. То есть не являются балластом, а участвуют в регуляции. По ENCODE написано много статей, например [27, 28, 29]. Этот проект и его результаты подверглись критике [26],
в основном это касалось связи генома и эволюции. Тем не менее, был составлен список всех регуляторных элементов в геноме.Базы ЭНКОДЕ, находятся по адресу:
http://encodeproject. org,
http://genome. ucsc. edu/ENCODE/,
ftp://ftp. ebi. ac. uk/pub/database/ensembl/encode/,
http://hgdownload. cse. ucsc. edu/goldenPath/hg19/encodeDCC.
Приведены базы различных регуляторных элементов генома, например,базы раздела протеогеномики wgEncodeUncBsuProt содержат списки пептидов для ядра, митохондрии, цитозоля и мембран, которые образованы после переваривания
50
трипсином. В базе эти пептиды привязаны к геному, к местам их кодирования.
В файлах wgEncodeBroadHmm для разных модельных клеток показаны расположенные
по длине генома регуляторные элементы, такие как энхансеры, репрессоры, инсуляторы, промоторы, участки начала и конца транскрипции, и другие. Для нахождения ENCODE элементов можно использовать UCSC генный браузер, который находится на приведенном выше сайте. У меня возник вопрос, может ли текст , переведенный в последовательность ДНК, влиять на этот геном? Слова и буквы в стихе Пушкина "Осень" никакого значения для ДНК не имеют, это случайный набор знаков для генома и биологических процессов.
Скорее всего, если эту ДНК встроить в геном, то она не будет безразлична для него и клетки. Даже, если участок ДНК случаен, на нем уже есть небольшие участки с измененной структурой ДНК. То есть отличные от обычной ДНК в виде
В-формы. Так, я обнаружил в гене PUSHKIN квадруплекс-формирующие G-богатые участки с помощью программы QGPS, расположенной по адресу: http://bioinformatics. ramapo. edu/QGRS/index. php.
Position Length QGRS G-Score
399 22 GGGGAAAAGGAATCATTAGGGG 13
574 28 GGCACAAAAGAGTGGGAGAAAAAGGAGG 11
710 30 GGAGTTGCTACATTAAAAGGCATAGGGAGG 7
1439 29 GGAGTGAGAGGCAGGAGCAGTGCATCAGG 11
2182 12 GGCGGCTAGGGG 18
2303 15 GGAGTGGCTGGTAGG 20
2450 30 GGCAGGAGAACAAAGAAACAAAAAGGCAGG 5
2744 20 GGACACAGGGCGGGAAAAGG 19
4927 29 GGCACAGGGCATAGTCATGGCCAGACAGG 17
5998 21 GGGAAAAGGGAGCAGGGCGGG 39
6059 28 GGAATGAGGACGAGGAGAAAGAATGCGG 14
7040 29 GGCAGCATAATACAAAAAGGGGCACAAGG 5
7751 30 GGTATACAGAGAGTAGGGGCAAATACGAGG 8
8498 24 GGGGCAAACACCATCGGTAATAGG 10
8564 26 GGAGTGAGAGGCAGGGCGAGAGTAGG 16
8792 27 GGGGCAAACAGACATATCATCAGGAGG 3
9337 30 GGTTGCAAACACAGACATAGGGGCAGTAGG 4
9473 20 GGAGTTAGGGGTAGAAAAGG 14
Поэтому при переводе текста в ДНК, надо оценивать с помощью разных программ
ее возможное влияние на работу генома, соседних генов, или какие-то функции клетки.
Я обратил внимание на особенность поиска по ДНК, в которой записан текст.
Если в ней искать какую-то произвольную последовательность,то она повторяется, хотя не является каким-то повтором. Она просто отражает повторяющиеся
словесные обороты или одни и те же слова.Например,при использовании программы UGENE, расположенной по адресу: http://ugene. unipro. ru,
нужно при анализе участка ДНК выбрать поиск по Смит-Ватерману. Это поиск по шаблону, используя алгоритм, который ищет в случаях, если есть вставки или делеции, или мутации. Так вот, при поиске случайного участка, программа нашла еще 8 близких по составу участков. Это, по-моему, отражает именно поиск по разумному тексту, когда закодированные в ДНК буквы, слоги, и слова
повторяются. Этот пример расположен ниже.
G A G A A C A A A T T A G A G T
G A G A G C A A A T T A G
G A G A G C A A A TTT A G A G
A G A A C A A G T T T T A G A
G A G A A C A A A T T A G A G T
G A G A A C A A A T C A G
A G ACA C A CCA T T A G A G T
G A G A A C ACA A T T A AA
G A G A A C A A A T TGCATCA G T
51
Если поиск велся простым поисковиком, то были бы найдены только первый и четвертый участки. Я перевел последовательность стихотворения Пушкина "Осень"
в последовательность нуклеотидов. Если такую ДНК вставить куда-нибудь в хромосому на хранение, то что может произойти? Как она себя будет проявлять
или будет полностью нейтральна по отношению к геному.
Был произведен поиск участков ДНК,которые могут быть регуляторными элементами, так как имеют аномальную структуру.Использовался онлайновый сервис по адресу
https://www.nonb.abcc.ncifcfr.gov/default.
Я обнаружил, что эта последовательность содержит:
Директ повторы - 5,зеркальные повторы - 10,Г-квадруплекс мотиф – 1,
короткие тандемы - 7.
Не найдены:А-фазы повторы, инвертированные и крестообразные, Z-ДНК.
Хотя другие программы для анализа ДНК могут давать другие значения.
То есть я могу утверждать, что любой текст, транслированный в ДНК последовательность, не будет нейтрален для генома. Даже, если нет участков транскрипции, эта ДНК будет иметь потенциально регуляторное влияние на геном, либо на соседние участки. Завершая изучение гена PUSHKIN, можно сказать, что получена интересная информация по записи текста в ДНК и по поиску возможного текста в каком-то геноме. Моделирование мной записи в ДНК показало,какие могут
быть ошибки. Изучение такой ДНК показало, что может быть признаком разумности для поиска посланий в ДНК. В следующем разделе "ДНК говорит" будут описаны способы кодирования текста с помощью только нуклеотидов, путем ввода
понятий специального языка.
Биоинформатика и белки. 2013.
Ген PUSHKIN, который я сделал, является моделью, для анализа ситуации в
клетке с помощью биоинформатики. Этот ген для записи текста в ДНК не является конечной разработкой, а служит только для проверочных и отладочных действий.
Оказалось, что по цепи ДНК, оппозитной к той, где записан текст, возможна трансляция. Сам транслят показан в приложении 11. Был произведен элементарный состав этого гипотетического белка. Использована форма по адресу:
http://molbiol. ru/scripts/01-18. html.
По ней получены следующие свойства белка:pI=2, 11 ;заряд белка резко отрицательный -44, 349 при pH=7, 4;отсутствуют аминокислоты W, E, Q, H, K, R,
G, преобладают неполярные кислоты A=6,7 в процентах;L=24,4;V=7,8;F=18,0;
I=6,4;M=8,1;P=5,3.
Проверка сигналов или доменов в белке с помощью программы PHOBIUS находящейся
по адресу:http://phobius. binf. ku. dk/index. html, показало, что белок
состоит из чередующихся участков цитоплазматического, трансмембранного и не цитоплазматического. Для примера, приведу начало этого белка:
FT SIGNAL 1 18
FT REGION 1 2 N-REGION.
FT REGION 3 14 H-REGION.
FT REGION 15 18 C-REGION.
FT TOPO_DOM 19 27 NON CYTOPLASMIC.
FT TRANSMEM 28 46
FT TOPO_DOM 47 52 CYTOPLASMIC.
FT TRANSMEM 53 79
FT TOPO_DOM 80 90 NON CYTOPLASMIC.
FT TRANSMEM 91 114
FT TOPO_DOM 115 125 CYTOPLASMIC.
FT TRANSMEM 126 147
FT TOPO_DOM 148 152 NON CYTOPLASMIC.
FT TRANSMEM 153 178
FT TOPO_DOM 179 189 CYTOPLASMIC.
FT TRANSMEM 190 212
FT TOPO_DOM 213 217 NON CYTOPLASMIC.
FT TRANSMEM 218 237
FT TOPO_DOM 238 243 CYTOPLASMIC.
FT TRANSMEM 244 266
52
FT TOPO_DOM 267 271 NON CYTOPLASMIC.
FT TRANSMEM 272 298
FT TOPO_DOM 299 304 CYTOPLASMIC.
Таким образом, при трансляции со второй цепи ДНК, образуется белок с очень аномальными свойствами. Если он будет возможен, то это будет мембранный белок, скорее всего с якорными свойствами или подобие рецепторного белка. Он может иметь влияние на функции клетки. В этом случае биоинформатика позволяет это предположить. Задача записи текста в ДНК, наоборот, такая, чтобы
информационный участок не оказывал на клетку никакого влияния.
Таким образом, ген PUSHKIN, выполнил свою модельную задачу, показав ситуацию, когда возможна трансляция текстового участка. Можно применить разные способы запрещения трансляции с текстового участка. Целью этой книги являются не
какие-то конкретные решения, а показ возможности биоинформатики для использования и прогнозирования ситуаций с записью текста в ДНК.
ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 1. 9 МАЯ 2010 Г.
Для ввода информации в ДНК для посланий в будущее, а также для попыток найти возможные послания из прошлого, надо учесть, что разные цивилизации имеют
разную логику мышления и как свести эти различные мыслительные особенности к тому, чтобы их можно было легко понять другим разумным организмам. Это
самый важный вопрос.
Я не лингвист, а молекулярщик, поэтому взгляд у меня на эти проблемы представляет собственную идею и разработку. И как обычно на стыке разных наук можно найти что-то свежее. В основе моей идеи об нахождении общей логики или общих логических элементов между цивилизациями положена идея об общности
понятия числовой единицы. Любой комплекс предметов, любое множество всегда состоит из отдельных единиц. Через понятие единицы и вводится все остальное –
цифры, логические действия, физические константы, а далее алфавит и словарь,
в котором предметы и их взаимодействие в понятиях одной цивилизации станут понятны другой цивилизации без переводчика, знающего сразу два языка,
разделенных миллионами лет и миллионами километров.
Может быть это можно применить к радиоволнам во Вселенной, но мне ближе предположить, что какие-то информационные послания находятся в биологических молекулах - ДНК,и представлены генетическим кодом,практически 64 комбинации 4 нуклеотидов по три достаточны , чтобы ввести любой язык и описать любое множество предметов и явлений во Вселенной, так же как обычным человеческим языком.
Нужно создать информационный модуль для связи языков разных цивилизаций.
Прежде всего его как-то выделить в геноме, предположим для выделения этого
модуля будет использована длинная последовательность поли-А, или другая
странная или аномальная последовательность. Далее ввести знаки единицы и знак раздела единиц.
Пусть знак "единицы" - TTT, а знак "раздела" между знаками или законченными
уравнениями или словами и предложениями - AAA. Далее вводится простая арифметическая логика - знак "есть" или знак "равно" - CCC. И далее вводятся цифры, предположим для десятичной системы исчисления, хотя цифровая система может быть как двоичной, так и многочисленной, в этом случае наша логика говорит, что чем проще , тем реальнее, что это будет использовано.Вводим арифметические знаки - сложение - CTT, вычитание - CCT, умножение - CGG , деление - CCG. Показана система исчисления - десятичная.
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
53
В переводе на человечий язык этот модуль означает:TTT - это единица, TTT
есть или равно TTT -- введена единица и знак равно, TTT плюс (и) TTT - есть цифра два - 2 или TTA -- введена цифра 2 и знак "+", далее вводится цифра
три - 3 или TAA, цифра - 4 или TCA, цифра - 5 или TGA, цифра – 6 или TAC,
цифра - 7 или TCC, цифра - 8 или TTC, цифра - 9 или TGC, далее вводится
цифра - 0 или TAT и знак минус - CCT, можно продублировать действия,
например 1-1=0, 5-5=0, далее вводится знак умножения - CGG на примере 2 умножить на 2 = 4, и 4 умножить на 2 = 8, и деления - CCG на примере 9 : 3 =
3 и 8 : 2 = 4. Далее показана система исчисления - десятичная,
на примере 9 + 1 = 10, 10 умножить на 10 = 100.
Этот информационный модуль вводит единицу, цифры , логические арифметические
действия и систему исчисления. Все настолько просто, что эти странные по виду
последовательность нуклеотидов легко расшифруется при любой логике разумных
существ.
ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 2. 19 МАЯ 2010 Г.
Химический модуль.
Следующий информационный модуль использует кодировки из цифрового модуля.
Производится ввод таблицы Менделеева, химические элементы, их положение в
таблице одинаково для любых цивилизаций. Эта логика основана на том, что
номер химического элемента - это количество протонов в ядре.
TTTAAAAAAAAAAAAAAAAAAAAATTAAAAAAA
TAAAAATCAAAATGAAAATACAAATCCAAATTCAAATGCAAATTTTATAAAAAA
TCCAAATTATTCAAAAAA
TGAAAATCATACAAAAAA
TAAAAATACTCAAAA
TAAAAATCCTCAAAA
TCCTGAAAATCCTACAAATCCTCCAAATCCTGCAAAAAA
TGAAAATGCTACAAA
TGCTCCAAATGCTTCAAATGCTGCAAA
TTTTATTATAAATTTTATTTTAAA
Этот информационный модуль перечисляет номера химических элементов от
1 до 101 элемента с периодичностью, равной общему количеству электронных
слоев в атоме. В местах их повышения стоит двойной раздел - AAAAAA.
Участок поли-A служит для выделения модуля в геноме, он может быть любым,
лишь бы выглядел искусственно. То, что это именно периодическая таблица
элементов говорит двойной раздел между периодами.
При ссылке на этот модуль каждое число логически связано с конкретным
химическим элементом, а арифметические знаки с их взаимодействиями. Например, запись TTC+TTC - означает молекулярный кислород , а запись TTT+TTC+TTT - означает вода.
Полная запись соответственно - AAATTCCTTTTCAAA и AAATTTCTTTTCCTTTTTAAA.
ДНК ГОВОРИТ, СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 3. 29 МАЯ 2010 Г.
Темпоральный модуль.
Модуль использует данные кодировки из числового и химического модулей.
54
TACCCCTACAAATACCCCTACAAA
TACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACAAAGGGAAA
TACTACTACTACTACTACTACTACAAAGGGAAA
TACTACTACTACAAAGGGAAA
TACTACAAAGGGAAA
TACAAAGGGAAA
GGGCCCTTTTTCTATTCCTATTTTTTATTCTATTATTATTATAAAAAAAAA
6=1, 6=2, 6=3, 6=4, 6=5, 6=6, 6=7, 6=8 - перечисляются все изотопы углерода
по порядку массового числа, 6=6, 6=6 - показано, что описывается изотоп 6 углерода по порядку, это C14. Количество шестого изотопа - 16, затем 8, 4, 2,
1 - показано уменьшение количества изотопа в виде полураспада, разделено
GGG - по логике это время. Этот модуль вводит понятие времени. Для этого используется время полураспада в данном случае изотопа углерода C14, вначале перечисляются все изотопы по массовому числу, у углерода известно 8 изотопов,
показано , что именно шестой по порядку изотоп с массовым числом 14 уменьшает свое количество в геометрической пропорции, соответствующей полураспаду, то
есть уменьшение количества шестого номера в 2 раза. Промежуток между ними обозначен как GGG, это по логике и есть время. Далее время приведено к одной секунде для человеческой цивилизации. Введено GGG - это одна секунда, эталон времени для данной кодировки и цивилизации. GGG = 180701280000.
Время полураспада, хотя величина и статистическая, но очень стабильный
отметчик времени. Аналогично можно ввести время через нестабильные изотопы других элементов.
Литература.
1. Широков Ю. М. , Юдин Н. П. Ядерная физика. Наука. 1972.
ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 4. 12 июня 2010 Г.
Человек говорит словами, которые и описывает все многообразие окружающего
мира. Написанные слова отражают речь, но , конечно, написанные слова содержат
в себе меньше информации, чем произнесенные речью. Речь несет значительно
больше информации для человека, чем написанные слова. Это интонация,возраст, пол и другие индивидуальные особенности.
Алфавит современного языка можно сделать и из 50-100 букв, все зависит от
установок и образования, обучения. И все эти буквы слуховой анализатор
человека легко бы различил. Но необходимо ли это? Знать какие особенности
языка могут быть у другой цивилизации вряд ли возможно, поэтому чем проще,тем
лучше. Разработанная здесь кодировка букв слов представляет собой упрощенный
язык. Уменьшено количество букв,схожие буквы по звучанию удалены.В результате
Язык стал более простым, но по звучанию похож на обычный язык человека.
Речь распознается по слогам, словам и частично интуитивно, то есть слуховой анализатор человека может понять сказанное,даже не расслышав часть сказанного.
В языке для ДНК я , напротив, применил разбивку слов на отдельные элементы-буквы, так как этот язык искусственный. Также этот язык русифицирован, это
тоже искусственно, так как кодонами можно обозначить буквы любого языка.
Можно сделать переход от модуля времени к буквам, то есть сделать их похожими
на речь и ввести как тональный звук какой-то частоты звука. Если с гласными звуками это и можно сделать с упрощением, то согласные звуки ввести через частоту и длительность сложно, так как звуки слагаются из нескольких частот.
Поэтому буквы текста я обозначил кодонами без привязки к реальной речи.
Нужно будет после ввода букв алфавита сделать толковый словарь, в котором начиная с арифметики, затем химии и физики будет переход к биологии и социологии.
Этот словарь, который будет содержать несколько тысяч слов,предполагается
также записать в ДНК. И только после этого можно записать в ДНК уже значимую
для длительного сохранения информацию. Модуль букв.
55
Что означает GTA есть GTA, подразумевается, что это код буквы, производится
перекодирование с 4-буквенного языка, на 31-буквенный язык. Как звучат эти
буквы неважно для кодирования информации, надо только при этом создать еще толковый словарь, в котором термины или слова вводятся логически.
Далее для русского языка кодоны означают:
ACA - А, AAG - Б, AAT - В, AAC - Г, GAA - Д, GAG - Е, GAT - З, GAC - Ж,
TAG - И, TAT - К, CAA - М, CAG - Н, CAT - О, CAC - П, AGA - Р, AGG - С,
AGT - Т, AGC - У, GGA - Ф, GGC - Ц, GGT - Ч, TGG - Щ, TGT - Ъ, TGC - Ы,
CGA - Ь, CGT - Ю, CGC - Я, ATA - Х, ATG - Ш, ATT - Л, ATC – Э.
Во все модули также надо ввести последовательность - участок для Праймера для быстрого нахождения модуля в геноме организма методом ПСР.
В данном случае взят участок из 26 нуклеотидов - ATATAGCAGACAGCATAGGCATAATA, который при синтезе модуля располагается на некотором расстоянии от информационного участка. Участок этот написан может слишком длинным, но его можно будет зацепить с разных концов или посередине. Вообще можно еще
подумать каким сделать сигнальный участок.
Модуль словаря.
GTGAAAAATCATGAAACAAAACCCAAATTTCTTTTCCTTTTTAAAAAA
GTGAAATATTAGAGGATTCATAGACATGAAAAACCCAAATTCCTTTTCAAAAAA
GTGAAAGAGGAATAGCAGTAGGGCACAAAACCCAAATTTAAAAAA
GTGAAAAGAACAGATGAAGAGATTAAACCCAAAAAAAAAAAA
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Это означает GTG есть GTG, означает слово. Затем вводятся слова, например
слово ВОДА означает TTTCTTTTCCTTTTT, логика этого участка взята из
химического модуля. Слово КИСЛОРОД означает TTCCTTTTC. Слово ЕДИНИЦА означает TTT, взято из числового модуля. Слово РАЗДЕЛ означает AAA.
Таким образом набирается словарный запас,то есть слово, выраженное в кодонах, его объяснение с помощью математической, физической или химической логики, а затем оперируя для объяснения слова комбинацией уже известных слов.
В модуле словаря применен участок для праймера - ATATCGTCTGTCGTATCCGTATTA.
Осталось еще несколько кодонов без применения, я думаю они будут
использованы при вводе каких-то логических понятий.
Ну вот и все. Основа общения между цивилизациями планеты Земля или других галактик заложена. Дальше надо сделать защиту языка от мутагенеза и
использовать кодоны с наименьшим значением мутагенеза. Также возможна
привязка букв или логических кодонов к какому-то более глубокому смыслу, например количество букв уменьшить до 20 и каждую букву можно связать с
какой-то аминокислотой. Также надо нарабатывать словарь и применять его для сообщения какой-то важной информации. То есть работы впереди еще много.
В данных статьях приведен только упрощенный вариант языка, он не
оптимизирован и кодоны взяты произвольно.
В следующей части будет произведен ввод биологической части словаря.
Как следствие из этой разработки можно использовать повторы или
какие-то странные участки для поиска вложений в ДНК, то есть на
56
основании этого попробывать найти что-то в геномах разных организмов. Логику создания этого языка можно попробывать использовать для поиска разумных
текстов в ДНК, возможно какая-то древняя цивилизация сообщит нам что-то
важное. Искать для начала надо логические модули ввода в язык, записанный на ДНК.
Литература.
1. Механизмы деятельности мозга человека. Часть 1. Нейрофизиология человека.
Ред. Бехтерева Н. П. . Л. Наука. 1988. Глава 9. Психоакустические аспекты
Изучения речи.
Руководство по физиологии.
2. Слуховая система. Ред. Альтман Я. А. . Л. Наука. 1990.
Руководство по физиологии.
ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ.
ВВОД БИОЛОГИЧЕСКОГО СЛОВАРЯ. 12 ИЮНЯ 2010.
Для биологического словаря надо ввести основные понятия живой материи.
Часть слов можно ввести через основную молекулу жизни - ДНК.
GTGAAA GAACAGTAT AAACCCAAA AGTCAGTCAGTCAGTC AAAAAA
Слово ДНК есть AGTCAGTCAGTCAGTC. Слово ДНК можно обозначить любой особенной последовательностью, что при поиске на геноме даст 1-2 копии на весь геном
или отсутствие в геноме. Если они будут рядом, то сразу обратят внимание, что участок есть важный маркер или ввод какой-то логики.
GTGAAA ACAGAAGAGCAGTAGCAG AAACCCAAA AAAAAAAAAA AAAAAA.
Слово аденин есть AAAAAAAAAA.
GTGAAA AACAGCACACAGTAGCAG AAACCCAAA GGGGGGGGGG AAAAAA
Слово гуанин есть GGGGGGGGGG.
GTGAAA GGCTAGAGTCATGATTAGCAG AAACCCAAA CCCCCCCCCC AAAAAA
Слово цитозин есть CCCCCCCCCC.
GTGAAA AGTTAGCAATAGCAG AAACCCAAA TTTTTTTTTT AAAAAA
Слово тимин есть TTTTTTTTTT.
GTGAAA TATCATGAA AAACCCAAA TTTCCCTTT AAATCACCCTAAAAA TAACCCTACTCAAAA
TACTCACCCTTATATAAA AAAAAA
Слово код - это 1 есть 1, 4 есть 3, 3 есть 64, 64 есть 20.
Введен код жизни через единицу, количество нуклеотидов, кодонов и
аминокислот через цифровую логику.
GTGAAA TATCATGAACATCAG AAACCCAAA TACTCA AAAAAA
Слово кодон равно 64.
GTGAAA ACACAATAGCAGCATTATTAGAGGATTCATAGTACA AAACCCAAA TTATAT AAAAAA
Слово аминокислота равно 20.
GTGAAA AAGGAGATTCATTAT AAACCCAAA ACACAATAGCAGCATTATTAGAGGATTCATAGTACA
AAACTTAAA ACACAATAGCAGCATTATTAGAGGATTCATAGTACA AAAAAA
Слово белок есть аминокислота плюс аминокислота.
GTGAAA GACTAGGATCAGCGA GAACAGTAT AAACTTAAA AAGGAGATTCATTAT AAAAAA
Слово жизнь есть ДНК плюс белок.
И так далее применяются разные численные и химические параметры
молекул жизни для ввода слов в биологический словарь.
57
ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 5. 28 июня 2010 Г.
Введение графических изображений с помощью ДНК.
При введении словаря или каких-то понятий можно использовать логические построения, а можно использовать графические конструкции. То есть
последовательность нуклеотидов разложить по горизонтали и по вертикали. Это
идея приходит в голову почти каждому, кто просматривал секвенс участков
генома. При просмотре последовательности нуклеотидов в любом текстовом
редакторе при движении вниз или вверх строчек видны как бы меняющиеся
картинки, которые образуют последовательность нуклеотидов.Особенно интересно, когда видны повторы нуклеотидов. В это случае картинка секвенса выглядит как кино.
Я несколько раз пробовал выводить последовательность нуклеотидов внутренним просмотрщиком Windows Commander - клавиша F3, с вариациями длины строчки, и затем прокручивать текст по вертикали. Изменить длину строки можно, изменив в настройках этого просмотрщика длину строчки через options/configure/text characters per line. Иногда можно заметить какие-то картинки, но это только
игра воображения, зрительный анализатор человека может видеть картинку, даже если ее нет. Хотя просмотр всего генома имеет очень большие затраты времени,
но он может указать на интересные повторы или другие участки.
В начале надо закачать из генома человека, какой-то файл в формате FASTA,
затем открыть его блокнотом или другим просмотрщиком. После этого удерживать клавишу направления вниз или назад. Надо сесть на расстояние около метра от монитора и расслабить глаза. Теперь понятно, что всякие образы , которые тут возникнут это не какое-то послание, а просто игра воображения.То есть искать
какое-то разумное послание в этих графических картинках вряд ли имеет смысл. Весь этот поиск графики - это шаманство и колдовство, и к науке мало имеет отношения. Если длина строчки изменится хотя бы на один нуклеотид, то
рисунки сразу изменятся. То есть можно увидеть то , чего нет или не увидеть, если рисунок действительно был. Но реальные повторы генома при этом хорошо
видны и так можно обнаружить повтор, которого нет даже в такой базе, как для REPEAT MASKER. Примеры таких повторов приведены в конце книги.
Использование графики вместо логики для ввода понятий в словарь требует в десятки или сотни раз большего количества нуклеотидов. Попробуем ввести слово квадрат и треугольник, как геометрический термины. С помощью этой графики
можно легко ввести только линейные структуры. При этом нужно небольшое число пикселей.
Так для квадрата 20 на 20 единиц нужно 70 на 22 нуклеотида или 1540. Для треугольника равностороннего со стороной 16 единиц надо 70 на 18 нуклеотидов
или 1360. Круг , эллипс для хорошей картинки потребуют более чем в 10 раз большего количества нуклеотидов или единиц изображения, или пикселей. Если рассмотреть режим VGA компьютерного монитора 640 на 480 пикселей , при
котором удовлетворительно видна нелинейная графика, то это потребует 307200 нуклеотидов, что очень много для введения какого-то термина или понятия.
Поэтому , я думаю, что использование графики с помощью нуклеотидных цепей
вряд ли будет использоваться в генетических посланиях, или только в редком случае, так как этот способ требует очень длинных цепей для нелинейной
графики. Также если этот участок ДНК специально не помечен, найти его практически невозможно.
Модуль введения графики.
Это выражение означает CTC есть CTC - кодон обозначения графики, CTC -размер графического модуля - 70 на 70 нуклеотидов. Вначале идет участок для
праймера, а в самом модуле расположен квадрат 20 на 20 нуклеотидов.
Это выражение означает CTC есть CTC - кодон обозначения графики, CTC -размер графического модуля - 70 на 70 нуклеотидов. В самом модуле расположена структура 16 + 16 + 16 нуклеотидов, что означает равносторонний треугольник.
58
Эти повторы оригинальны, что сразу вызовет мысль о графике, и кодон CTC
будет связан с графикой.Эти фасты с псевдографикой набрал на компьютере
автор - Курносов Михаил,это чисто искусственные образования.
ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 6.
ВИЗУАЛЬНО-ОСОБЫЕ, МАГИЧЕСКИЕ УЧАСТКИ ГЕНОМА. 12 НОЯБРЯ 2011.
Информация в ДНК должна быть легко обнаружена.Это один из основных принципов. Можно закодировать что угодно так, что вложенный текст не будет выделяться
среди остального массива. Но если это ПоСлАнИе, то зашифрованный текст должен быть помечен текстом, который сразу бросается в глаза из-за своей оригинальности.
Если просто прокручивать секвенированную ДНК на дисплее монитора, то оригинальные куски ДНК очень хорошо видны на общем фоне.
Лучше всего для метки нужного массива закодированных нуклеотидов
использовать короткие повторы, размером модуля от 2 до 10 нуклеотидов
и общим размером этих повторяющихся модулей от нескольких десятков до
нескольких сотен нуклеотидов.
Процесс поиска и пометки участков, годных для предполагаемой дешифровки
может быть довольно длительным, так как неизвестны маркерные участки.
59
Если на дисплее монитора видно на одной странице текста около 7500
нуклеотидов, а надо просмотреть 1500 мегабайт текста при трате на одну
страницу 2 секунды, то это займет времени около 110 часов. Текст лучше
растянуть по горизонтали монитора выбрав в просмотрщике Windsows Commander
опции ширина дисплея - binary и указать размер строчки , например 180 знаков, текст просматривать в опции - binary.
Для удобства поиска надо сделать замены блоков повторов на хорошо видимые
участки. Искать по сплошному тексту , состоящему из CGTA , неудобно.Например,
с помощью редактора WORD сделать замену блока CCCATCCCAT на
блок __________ или десять пробелов, выбрав опцию - заменить все.
Также облегчает визуальный поиск обработка текста программой типа
RepeatMasker , которая выделяет повторы буквами нижнего регистра. Но она выделеляет также большие повторы типа LINE или другие, которые вряд ли нужны
для маркировки разумного текста.
Искать возможные метки разумного текста с помощью программного поиска в нем
каких-то особых отличий может быть неудачным, лучше визуально просмотреть
текст нуклеотидов. То есть просмотреть всю хромосому от начала до конца.
У разных организмов количество особых участков значительно различаются.
Я произвел подсчет ярких участков у человека и данио.
При визуальном просмотре хромосомы 1 человека с начала хромосомы просмотрено
2500000 нуклеотидов. На этой длине обнаружено 25 участков, которые сразу
бросаются в глаза своей необычностью. Они приведены ниже в статье.
У данио просмотрено в 1 хромосоме с ее начала 1000000 нуклеотидов обнаружено
33 участка. Визуально у данио очень много мелких однообразных повторов -
от 1 до 5 на 1 страницу текста, но эти участки мало подходят на роль особых
маркерных участков. Приложение 7.
При прогоне последовательности, которые я привел в этой статье, через Repeatmasker, было показано, что эта программа определяет лишь часть последовательностей, которые можно определить при непосредственном просмотре
ДНК глазами. То есть последовательность выглядит как повтор, а программа не относит его к каким-то известным повторам ДНК. Возможно, это не обычные
повторы, а какая-то периодическая доменная структура ДНК, связанная с белками или с РНК. Так в приведеном мной примере периодических или ярко-выделяющихся участков ДНК программа нашла, что только 30 процентов от всех нуклеотидов составляют обычные классические повторы. Таким образом, это подтверждает мое заявление в этой статье, что визуальный поиск повторов или помеченых оригинальными повторами участков ДНК, может быть полезен для поиска.
Таким образом, визуальный способ просмотра текстов ДНК может дать важную
информацию или указать на неизвестные повторы.
Это могут быть как простые повторы, так и повторяющиеся домены в генах.
В литературе показано , что блоки повторов небольшой длины участвуют в
регуляции генов, регуляторные участки эволюционируют независимо от
структурных генов и могут быть консервативны, не изменяясь миллионы лет.
Цитата из "Молекулярные основы геносистематики", изд. МГУ, 1980, стр. 230.
Поэтому надо всегда думать, что магические участки не метки посланий, а
регуляторные участки, и оценивать сумму характеристик участка ДНК. Надо
надеяться на удачу в этой науке. Хотя идея говорит, что это может быть, но
пока никто ничего не нашел от прошлых цивилизаций.
Пока моя роль в движении этой моей идеи поиска посланий в геномах - это
разработка методологии их поиска.
Для начала надо искать визуально оригинальные участки , которые могут играть роль метки, а затем смотреть ниже или выше этого участка, для поиска текстов ввода в послание. Например, это могут быть ряды с переменной периодичностью. Например, ряд ATAATAAATAAAATAAAAATAAAAAAT или ряды с переменным количеством одинаковых модулей ACCTTACCTTCCTTACCTTCCTTCCTTA и тому подобное. Всякие ряды нуклеотидов с переменной периодичностью могут указывать на разумность его.
60
ДНК говорит. Способы кодирования. Часть 7.
Гены-маркеры. 12 декабря 2011.
Я думаю,сами гены можно использовать как маркеры для пометки участков генома,
содержащих текстовые послания. При этом текст можно расположить выше или ниже гена, в интергенных участках. Ген, при просмотре текста ДНК, сразу проявится своей необычной магической структурой - повторами. Таким образом, он обратит внимание человека, что рядом могут быть какие-то значимые участки. В этих участках, рядом с отличившимся структурой геном, и могут быть предполагаемые разумные тексты. Особые повторы в экзонах гена могут быть только в одном этом месте генома. Для примера просмотрена хромосома 1 у дрожжей.
При визуальном просмотре последовательности обратил внимание на себя участок заметными повторами движущимися наклонно при протяжке текста. Это оказался кодирующий участок гена. Обнаружено всего 13 повторов размером каждого
около 139 bp.
Этот пример - ген flo9 S. cerev. Лектин-подобный белок-флоккулятор через
клеточную стенку. Повторы в белке - структурные и функциональные домены,
а для этого белка участвуют в обороте углекислоты. Его расположение -
хромосома 1, 24001-27969 участок. Ген книзу на расстоянии 3599 bp- gdh3. Ген кверху на расстоянии 1314 bp - yal063c-a. Это размеры интергенов - участков между генами.
Конечно, в эти небольшие интергены вряд ли что-то можно записать значимое,
это только пример. Если выбрать консервативный ген, то он сохранится
сотни миллионов лет и им можно метить участки с текстовой разумной
информацией. Многократные копии этого текста позволят его восстановить
полностью, устранив точковые мутации.
Программа UGENE при наведении на участок мыши кажет повторы разной длины, например здесь - 17, 25, 50, 95, 116 длиной в комплементарной цепи,
в кодирующей цепи кажет только ORF.
Таким образом, если особый магический ген - это маркер, то рядом надо искать тексты в нескольких копиях. Это также нужно и для записи информации в ДНК в настоящее время, чтобы сделать послание в геноме какого-то организма на
миллионы лет вперед.
При сплошном просмотре может быть не видно четкой периодичности,один участок надо просмотреть с разными длинами строки от 50 до 80. Для просмотра использовать фасту. Для расположенного ниже примера длина строки должна быть более 70. Цитировано с http://ncbi. nlm. nih. gov.
ttaaataatt
61
aaaatatagcagacagcataggcataataaaaaagta
ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 8. СТРУКТУРА ДНК - ВОЗМОЖНЫЙ
МАРКЕР ПОСЛАНИЙ. 9-10 МАЯ 2012 Г.
Цепи ДНК могут образовывать более сложные структуры или структуры, отличные
от обычной конформации ДНК - ее B-структуры.
Вначале предполагалось, что таких структур будет не много в геноме и эти аномальные структуры будут как бы указывать на разумные для человека тексты
или послания в ДНК. Однако поиск таких аномальных структур показал, что они очень сильно распространены в геноме.
Количество не-B-структур ДНК в геноме человека. Цитата из статьи:
Nucleic Acids Research, 2011, Vol. 39, Database issue, D383–D391
Non-B DB: a database of predicted non-B DNA-forming motifs in mammalian
genomes. Regina Z. Cer, Kevin H. Bruce, Uma S. Mudunuri, Ming Yi,
Natalia Volfovsky, Brian T. Luke, Albino Bacolla, Jack R. Collins and
Robert M. Stephens.
G-Quadruplex Forming Repeat(4-цепочные структуры гуанина)374545
Z-DNA Motif (Z конформация) 294320
Direct Repeat (тандемные) 871045
Slipped Motif (2-цепочная ДНК и 1-спиральные петли) 347969
Inverted Repeat (инвертированные) 1044533
Cruciform Motif (крестовидные 2-цепочные мотивы) 197910
Mirror Repeat (зеркальные повторы) 1651723
Triplex Motif (трехцепочная ДНК) 179623
A-Phased Repeat (A структура) 1130731
Можно было предположить, что такое фундаментальное свойство материи, как симметрия в физике и химии, может быть какой-то меткой или указателем чего-то необычного в геноме. Речь идет о зеркальных повторах. Пример такого повтора.
5-ATAGGGACTCTGGAGACT*TCAGAGGTCTCAGGGATA-3 ,
где * - точка зеркальной симметрии для оснований ДНК, ось симметрии.
Пример показывает 100 процентную симметрию.
Речь идет именно об информационном уровне последовательности, так как на
62
химическом уровне полной зеркальности нет из-за разницы положения к оси симметрии 5 и 3 гидроксилов дезоксирибозы.
Теперь я могу сказать, что моя идея о информационной значимости таких
структур в ДНК, как меток для искусственно записанной информации в ДНК, оказалась под вопросом из-за очень большого количества таких структур в
геноме.
Поэтому , если все-таки использовать эти структуры для мечения записываемой информации в ДНК, то они должны быть сильно отличны от природных и быть исключительно оригинальными. В то же время сами эти структуры имеют большое значение для функционирования генов и эти участки связаны с местами их
регуляции, поэтому знание мест их расположения очень важно. Я изучаю гены-гиганты уже давно, несколько лет. Поэтому я сделал таблицу статистики мест расположения не-B-структур ДНК в следующих генах - DESC1, NEGR1, DOCK3, NRXN1,ROBO2.Был использован онлайн-сервис определения этих участков -
HTTP://WWW. NONB. ABCC. NCIFCFR. GOV
Статистика не-B-структур ДНК в них показана ниже.
ПРИМЕРЫ КОЛИЧЕСТВА НЕ-B-СТРУКТУР В ДНК ГЕНОВ-ГИГАНТОВ ЧЕЛОВЕКА.
ТАБЛИЦУ СОСТАВИЛ КУРНОСОВ М. Н. 10 МАЯ 2012Г. НА ОСНОВЕ ОНЛАЙН-СЕРВИСА
ОПРЕДЕЛЕНИЯ НЕ-В-СТРУКТУР ДНК.
ГЕН DISC1 ROBO2 DOCK3 NEGR1 NRNX1
РАЗМЕР ТПН 415 607 709 880 1108
G-Quadruplex Forming Repeat 47 34 80 25 51
Z-DNA Motif 40 63 35 89 113
Direct Repeat 115 190 165 262 316
Slipped Motif 41 75 63 107 121
Inverted Repeat 123 301 233 426 459
Cruciform Motif 21 59 55 89 104
Mirror Repeat 238 383 358 543 663
Triplex Motif 49 35 17 25 73
A-Phased Repeat 136 230 368 351 407
Примеры зеркальных повторов в гене NRXN1.
Повтор 1.
5-tagtaatttat tgctgtgaacatc attg aat aat atgcaaaacaagtgta ta
----------- ---- --- --
at ctatacttttccactact taa tgt gtta aactaaaacta tatttaatgat-3
-- --- ---- -----------
Концы - зеркала , середина только частично зеркальна. Зеркальность
38 процентов.
Повтор 2.
5-gtgtgtgtgtgtgtgtgtgtgtg t gtgtgtgtgtgtgtgtgtgtgtg-3
Чередование любых 2 нуклеотидов с центральным спейсером,
зеркальность 100 процентов.
Повтор 6.
5-taaaaattct aaa ta t c at gtt tcttaaaaat-3
---------- -- -- ----------
Зеркальность 75 процентов
Повтор 29.
5-aaatatttat ttttaaaataaagcatgctg at ctg atta actcc
---------- -- ---- -
catat atta cata ta aaatgacaaagctgtga tatttataaat-3
- ---- -- -----------
63
В спейсере могут быть делеции, инсерции, точковые замены относительно оси симметрии . То есть для метки нужно учитывать возможный мутационный процесс левой и правой частей зеркала. А консервативные участки зеркал скорее всего функционально значимы для клетки и они мало мутируют в ее поколениях.
Большинство определяемых зеркал скорее всего случайные структуры, без информационной составляющей. А 100 процентная симметрия редко встречается и только на коротких повторах. Еще раз скажу, что зеркальность это
информационное свойство в последовательности, то есть признак отношения
высшего разума к этому образованию, если оно не случайное сочетание
нуклеотидов в цепи.
Нужно в метке продемонстрировать что-то оригинальное, не возможное
только обычными природными процессами.
Я предлагаю для начала такую конструкцию метки. Зеркальность плюс
арифметические ряды. Также 100 процентная симметрия для большого участка в
450 нуклеотидов. Пример искусственной метки,сделал Курносов М.
5-TTTTTTTTTTCCCCCCCCCCAAAAAAAAAAGGGGGGGGGG-3
5-TTTTTCCCCCAAAAAGGGGGTTTTTCCCCCAAAAAGGGGG-3 *
5-GGGGGAAAAACCCCCTTTTTGGGGGAAAAACCCCCTTTTT-3
5-GGGGGGGGGGAAAAAAAAAACCCCCCCCCCTTTTTTTTTT-3
В этой конструкции метки * - есть точка зеркальной симметрии. Сколько я
не смотрел последовательностей ДНК, таких структур я не видел. Дублирование частей метки позволит исключить влияние мутаций на информацию.
ДНК ГОВОРИТ. ДОПОЛНЕНИЕ ОТ 26 АВГУСТА 2012. ЧАСТЬ 9.
Особенности живой ДНК, как носителя искусственной текстовой информации,
введенной извне. Размышления автора.
Предпринимаются попытки записать текст в не живую, химическую ДНК, уже без
его введения в клетку и поддержания клеткой.
Так Джордж Черч и группа авторов, создали систему кодирования информации
в ДНК, которая не предполагает использования клеток. Специальное устройство располагает фрагменты химически синтезированной ДНК длиной около 159
нуклеотидов на поверхности чипа. (1).
Я думаю, что какие бы ни были технически хранители информации, все они
имеют временный срок хранения из-за различных спонтанных разрушений, например радиации.
Я считаю , что только в живых организмах можно сохранить информацию в ДНК,
пока существует жизнь в течение многих миллионов лет.
В этом и состоит СМЫСЛ ЖИЗНИ, как космического явления.
За это время любые технические устройства в результате коррозии, Химической модификации, радиации, температуры и т. п. превратятся в пыль. Еще одно замечание. Цивилизация в своем развитии накапливает в виде Информации сначала гигабайты, затем, что характерно для сегодняшнего времени – терабайты информации, через 10-20 лет - сотни и тысячи терабайт. Вместить такое
количество информации нельзя в ДНК клетки. В клетке реально можно расположить без существенного влияния на ее биологию 100-300 мегабайт информации. Если применить защиту информации в виде ее многократного копирования, то и того меньше - 10-30 мегабайт.
Можно ожидать, что такое количество информации какой-то организм и его
клетки пронесут через миллионы лет. Я думаю , в такое небольшое количество информации записывать какие-то учебники или книги нет смысла, в них можно записать только какую-то информацию глобального значения. Например, места расположения разумной жизни во Вселенной, места расположения на планете Земля хранилища информации высокоразвитой цивилизации прошлого, какие-то глобальные предупреждения для человечества в опасностях развития науки или общества и
так далее. То есть по нашей логике послания в ДНК из прошлого должно быть
Небольшим и давать скорее всего направления дальнейшего поиска или какие-то глобальные предупреждения для цивилизаций будущего, то есть для сегоднешнего человечества.
64
Можно человеческой цивилизации создать хранилище всей информации
человечества, возможно, что на каких-то носителях информация сохранится
10000-20000 лет. И в какой-то особенный вид живого организма записать
координаты этого хранилища. Это может быть послание человечества в будущее.
Или в каких-то особенных организмах на Земле , в их ДНК, поискать по этой же логике координаты хранилища информации из прошлого от какой-то высокоразвитой цивилизации.
ИСТОЧНИК ИНФОРМАЦИИ.
1. http://dx. doi. org/10. 1126/science. 1226355
Science DOI: 10. 1126/science. 1226355
George M. Church, Yuan Gao, Sriram Kosuri
Next-Generation Digital Information Storage in DNA.
ДНК ГОВОРИТ НА ЯЗЫКЕ ЧЕЛОВЕКА.КУРНОСОВ МИХАИЛ ПЕРЕВОДИТ ДНК В СЛОВА ТЕКСТА.
01 октября 2006.
Последовательность нуклеотидов в ДНК можно преобразовать в музыку, о чем написано в разделе о музыке генов, а можно преобразовать в псевдотекст, состоящий из гласных и согласных букв, точек и пробелов. Этот текст можно прочитать или озвучить специальными программами. Моя идея заключалась в том, что последовательность нуклеотидов в ДНК превратить в обычный литературный текст, а его затем прочитать на компьютере, используя программные читалки текстовых файлов. На самом деле речь человека гораздо более сложная звуковая форма. Звуки гласных состоят не из чистого тона, а из нескольких формант (наложения нескольких тонов), гласные и согласные звуки влияют друг на друга, давая особое звучание. Слоги в слове (близкое понятие фонема)могут звучать
особо в зависимости от самого слова. Литература по физиологии речи [15].
Если кратко, то помочь создать хороший алгоритм перевода ДНК в слова, помогут лингвисты, знающие особенности языков, слов, букв. Я же, как генетик,
предлагаю здесь упрощенный алгоритм этого перевода. После разбивки ДНК на
слова, возможно потребуется коррекция текста. Для этого надо попробывать
найти на слух слова, похожие на какой-то настоящий или древний язык , далее скорректировать кодировку звуков и дополнительно корректировать код, на
котором в ДНК записаны гипотетически какие-то послания или тексты.
Таким образом, ДНК можно представить в виде слов речи. Для примера,приведу методику для разбивки ДНК на русскую речь. Конечно, можно использовать другой алфавит и текст, похожий, например, на латинский или английский.К тому же эти алфавиты лучше тем, что количество букв близко к количеству аминокислот. Английский алфавит - 26 букв, латинский - 24 буквы.
Пример алгоритма для преобразования текста ДНК.
1. Использование частотного анализа для русского текста.Поскольку аминокислот 20, а букв в русском алфавите 33,то буквы со сходным звучанием объединены,так как это разделение искусственное, связанное с созданием алфавита.Я подсчитал, что проценты букв, пробелов и знаков русского алфавита в тексте составляют следующие значения:
а, я - 7,2 о - 7,8 е, э - 7,4 к - 2,4
у, ю - 3.1 и, ы, й - 8,4 н - 5,4 п - 1,9
л - 3,4 м - 3.0 ш, ж - 1,4 т - 4,6
р - 3,4 х, г - 2,3 б - 1,6
ч, щ - 1,2 ц, с, з - 5,8 пробел - 16,7
ф, в - 3,9 д - 2,9 остальные - 6.2
эта таблица приведена для примера.
2. Для составления алгоритма перехода от аминокислот к буквам разделим аминокислоты по их свойствам. Обозначение аминокислоты какой-то буквой латинского алфавита никак не связано со словами или речью, это просто обычно первые буквы химического названия. Для данного примера разделим аминокислоты
на полярные и неполярные. Примем, что полярные заряженные кислоты
соответствуют гласным, а полярные незаряженные - звонким согласным.
Неполярные кислоты распределены между глухими,шипящими и гудящими согласными.
65
Далее можно распределить по молекулярной массе аминокислоты и буквы - более высокой частоте основной форманты буквы принять более низкую массу.
3. Составление таблицы алгоритма.
Я присваиваю значение буквы алфавита каждой аминокислоте.Получаю следующую таблицу:
Аминокислота. Обозначение аминокислоты. Буква алфавита.
Алгоритм 1 2
глютаминовая e а и
глютамин q б и
аспарагиновая d е о
аспарагин n г о
серин s н е
треонин t л а
тирозин y м у
лейцин l к я
лизин k и н
аргинин r о л
гистидин h у м
изолейцин i в в
валин v п г
пролин p ж д
фенилаланин f т б
триптофан w р р
глицин g пробел
аланин a пробел
цистеин c д .
метионин m с ,
Некоторые буквы могут выпадать их общей закономерности или алгоритм
недостаточно хорош. Приведено два варианта алгоритма. Эта таблица и алгоритмы приведены только для примера.Возможны разные сопоставления аминокислот и букв
алфавита, все зависит от ученого.
4. Для трансляции ДНК в белок используются различные программы. Как правило,в них есть настроечный файл . ini, в котором есть код аминокислот, и этот файл можно редактировать вручную, заменив аминокислоты на буквы в соответствии,как дано выше для принятого алгоритма. Если программа трансляции написана на Perl или Java,то текстовым редактором надо в теле файла заменить буквы аминокислот на буквы принятого алгоритма.
Можно также, используя редактор DOS, заменить в трансляте буквы вручную.Также применяется это при отладке полученного текста, когда надо заменить одну или
две буквы на другие. Для этого надо использовать редактор DOS. В меню ПУСК
WINDOWS выбрать опцию "Выполнить". Набрать команду EDIT text.txt,
где text.txt - редактируемый файл, или указать путь, где находится этот файл. Например, EDIT C:\text. txt. Файл откроется в редакторе DOS.
Кнопкой ALT открыть меню, выбрать "Поиск" - SEARCH,затем "Изменить" - CHANGE,
в окне указать какую букву заменить на какую, затем нажимая на TAB дойти до опции "Изменить все" - CHANGE ALL. В меню "Файл" - FILE, выбрать "Сохранить
как" - SAVE AS. Указать - text1. txt. В Windows для этих операций замены
знаков можно использовать программу Блокнот. Для этого надо выбрать в меню "Правка", опцию "Заменить", выбрать что чем заменить и нажать кнопку
"Заменить все".
После этого во всем тексте нужный знак или буква будет заменен на другой знак или букву или пробел. Можно менять на любые из 255 знаков кода ASCII. Нужный знак можно набрать, удерживая кнопку ALT и набирать нужные цифры на
клавиатуре, после отпускания ALT знак появляется на экране. Например, запятая появится при удержании ALT и наборе числа 44. Это знаки кода ASСII. Если
работа проводится в режиме DOS, то перед редакцией надо запустить русификатор клавиатуры, например KEYRUS. COM, для переключения алфавитов.
Возможна дополнительная коррекция полученного текста, замена отдельных букв
или дополнительная разбивка слов. Эта работа по оценке или коррекции
полученного текста скорее всего в компетенции лингвиста. Если слова в
66
трансляте получаются слишком длинными по 15-20 знаков и более, то скорее
алгоритм выбран неверно, так как короткими словами по 3-6 букв можно записать тысячи слов, почти полный набор обычного языка.
Еще раз обращаю Ваше внимание, что все эти файлы лишь примеры, я даю лишь подходы к поиску, облегчаю начальную работу. Если у Вас что-то не пойдет или будет получаться непонятный "тарабарский" текст, то отнеситесь к этому
просто с юмором или как к игре. Я не обещаю, что обязательно все получится,
это всего лишь рабочая гипотеза.
Для примера в этой статье, я выделил из гена ДНК-полимеразы А - POLA участок ДНК, соответствующий интрону номер 3. Цитировано с данных генома человека по адресу http://ncbi. nlm. nih. gov.
gtaggtggggcggaggtgg
ag
Гены имеют мозаичное строение, то есть участки , кодирующие белок - экзоны, перемежаются с некодирующими участками - интронами. В описании гена аннотации генома рядом с RNA или РНК и CDS или кодирующими участками расположены карты JOIN - соединения. Цифрами показаны нуклеотиды экзонов, а запятая означает интрон между соседними экзонами в РНК. Для примера, для гена POLA. Сама последовательность нуклеотидов прилагается рядом с нумерацией нуклеотидов
в аннотации генома или хромосомы в полностью закаченном геноме человека. Цитировано с данных генома человека по адресу http://ncbi. nlm. nih. gov.
join(16. . 40, 5479. . 5603, 9305. . 9401, 10443. . 10523,
20608. . 20723, 21195. . 21257, 22416. . 22508, 22938. . 23025,
23344. . 23545, 23634. . 23812, 29209. . 29321, 30389. . 30505,
32035. . 32109, 32987. . 33125, 33836. . 33990, 38424. . 38508,
39809. . 39870, 41453. . 41542, 43679. . 43795, 45429. . 45604,
47429. . 47558, 48056. . 48175, 49284. . 49383, 51472. . 51596,
54365. . 54514, 54924. . 55046, 115952. . 115984,
116762. . 116854, 118712. . 118917, 121033. . 121165,
127506. . 127637, 132481. . 132655, 147706. . 147884,
149600. . 149731, 194060. . 194176, 236507. . 236603,
301859. . 302004)
Если кратко , экзоны - это структуры гена,необходимые для кодирования белка. Все экзоны объединяются при сплайсинге в единую РНК, а интроны вырезаются и
распадаются. Назначение интронов до конца не ясно. ДНК в них легко мутирует,
то есть хранит информацию с ошибками, примерно 1 замена на миллион лет.
Если интрона в каком-то месте не будет, то для гена обычно ничего не
изменится, если нет регуляторных элементов. На месте интронов могут даже располагаться другие гены. Например, у POLA человека внутри двух интронов
расположились два других гена.
67
Все это я пишу потому, что именно в интронах может быть расположена любая
внешняя или посторонняя информация, не влияющая на работу гена. В том числе и предполагаемые информационные послания из прошлого. Для поиска надо
подготовить текст ДНК путем разбивки гена на экзоны и интроны . Из карты RNA
или CDS – JOIN находим номера крайних нуклеотидов и открыв редактором
файл текста ДНК, разделяем его и подписываем по порядку все экзоны и интроны.
После этого легко можно из файла текста вырезать нужные участки для анализа. Надо иметь для этого аннотацию к геному. Для удаления цифр и пробелов, чтобы привести файл к виду "фаста",можно пользоваться программами Word или Texter.
Для облегчения разделения отмечу, что любой интрон должен начинаться с GT, а заканчивать AG нуклеотидами, это его основное свойство, необходимое для сплайсинга РНК. Еще одно его свойство - это большое количество кодонов - терминаторов для трансляции РНК. То есть транслироваться с получением
какого-то белка, как экзоны, они не могут.
Интересно то, что все эти терминаторы похожи на разделы между словами в предложениях или на точку. При трансляции интрона обычным кодом я получил следующие варианты: Интрон 3 гена POLA Н. sapiens
Трансляция вперед, рамка +1 - 347 кодонов
VGGAEVGAGMLLPRHCVSCFL*ILTHVVELLLCLGKCKALLGSYLWFGFS
FNYLRMRKQNSRTFIWGYFGESRHIPQDVV*ILQVMAV*ELGGAPCLWGQ
CTALGIKECRFGIHHSYFPIL*PWTSHLISLRLRVFICNMGMRKLPSPRV
VRCI*GSRYEN*LGQ*KAPYKGWS*CPVPLLKAHWFSLVGSDFMAM*MLT
TGSM*IVPVTIYVSTCVVGFSYIASFPL*TGISLWACGNLDSFTFYSSGR
VKLL*SILLWQTLILWAKSFPEVT*LGIIYIIWF*LHTCCVDAVHCLTPV
*TEFCCT*K*HRPGKHLSRYKRFFWSWLKYYWPLLEI*SQY*ILSLQ
рамка +2 - 346 кодонов
*VGRRWGRGCCFLGTVLVASCRFSLMWWSCCFAWANVRHC*DLTFGLDFP
LII*G*GSRIAGHLFGDILENLGTYLRM*YKSSR*WLCKNWEEPLVCGAN
AQRLELRNAGSGSIIPTFQFYDLGQVT*SLCALESSSVIWG*ENYLLPEL
*GVYEVLGMKINLVSRKHHTKAGPNVLCPF*KLIGSHL*GLTSWPCEC*P
QGACRLCL*LFMFLLV*LDSAILPVFPCRLGYLSGLVVILILLLFILLVE
*NCYKASYCGRL*SFGPNRFLRSPD*V*YISFGFDSTPAVWMLCIV*HLC
EQNSAALKNSTGQENI*AGIKGFFGHG*NIIGHF*KFDPSIKFCPC
рамка +3 - 346 кодонов
RWGGGGGGDVAS*ALC*LLLVDSHSCGGVAALPGQM*GTVRILPLVWIFL
*LFEDEEAE*QDIYLGIFWRI*AHTSGCSINPPGNGCVRIGRSPLSVGPM
HSAWN*GMQVRDPSFLLSNSMTLDKSLNLSAP*SLHL*YGDEKTTFSQSC
EVYMRF*V*KLTWSVESTIQRLVLMSCAPSESSLVLTCRV*LHGHVNADH
REHVDCACDYLCFYLCSWIQLYCQFSLVDWDISLGLW*S*FFYFLFFW*S
KTAIKHPIVADFDPLGQIVS*GHLTRYNIYHLVLTPHLLCGCCALSDTCV
NRILLHLKIAQARKTSEQV*KVFLVMAKILLATFRNLIPVLNFVPA
Трансляция назад, то есть по второй цепи ДНК,
рамка -1 - 347 кодонов
LQGQNLILGSNF*KWPIIF*P*PKKPFIPAQMFSWPVLFLSAAEFCSHRC
QTMHSIHTAGVESKPNDIYYT*SGDLRKRFGPKDQSLPQ*DAL*QFYSTR
RIKSKRIKITTSPERYPSLQGKTGNIAESNYTSRNINSHRHNLHAPCGQH
SHGHEVRPYK*EPMSFQKGHRTLGPAFVWCFLLTKLIFIPRTSYTPHNSG
RR*FSHPHITDEDSKAQRD*VTCPRS*NWKVGMMDPEPAFLNSKRCALAP
QTRGSSQFLHSHYLEDLYYILRYVPRFSKISPNKCPAILLPHPQIIKGKS
KPKVRS*QCLTFAQAKQQLHHMSENLQEATNTVPRKQHPRPHLRPTY
рамка -2 - 346 кодонов
CRDKI*YWDQISKSGQ*YFSHDQKNLLYLLRCFPGLCYF*VQQNSVHTGV
RQCTASTQQVWSQNQMIYIIPSQVTSGNDLAQRIKVCHNRMLYSSFTLPE
E*KVKESRLPQAQRDIPVYKGKLAI*LNPTTQVET*IVTGTIYMLPVVSI
HMAMKSDPTSENQ*AFRRGTGH*DQPLYGAFY*PS*FSYLEPHIHLTTLG
EGSFLIPILQMKTLRRREIK*LVQGHRIGK*E*WIPNLHSLIPSAVHWPH
RQGAPPNSYTAITWRIYTTS*GMCLDSPKYPQINVLLFCFLILK*LKENP
NQR*DPNSALHLPRQSSNSTT*VRIYKKQLTQCLGSNIPAPTSAPP
рамка -3 - 346 кодонов
AGTKFNTGIKFLKVANNILAMTKKTFYTCSDVFLACAIFKCSRILFTQVS
DNAQHPHSRCGVKTK*YILYLVR*PQETIWPKGSKSATIGCFIAVLLYQK
68
NKK*KNQDYHKPREISQSTRENWQYS*IQLHK*KHK*SQAQSTCSLWSAF
TWP*SQTLQVRTNELSEGAQDIRTSLCMVLSTDQVNFHT*NLIYTSQLWE
KVVFSSPYYR*RL*GAERLSDLSKVIELESRNDGSRTCIP*FQALCIGPT
DKGLLPILTQPLPGGFILHPEVCA*ILQNIPK*MSCYSASSSSNN*RKIQ
TKGKILTVPYICPGKAATPPHE*ESTRSN*HSA*EATSPPPPPPHL
Обнаруженные кодоны терминаторы помечены (*).
При замене этих знаков на буквы по алгоритму 2 получим, для примера следующий текст с небольшой дополнительной обработкой. Введены дополнительные разделы между словами, в основном между несколькими гласными или несколькими
согласными.
Рамка -2 - 346 кодонов:
лонв уро и вене и у бемо ин ня яуя ялбд яуб ги инегма
глиа еаи игре ин и, вув в де игае ноя ил в нг мнл, яуе
ебаяди и нг ни еляди иловд гун ня в ян да аиг иа вга
аву, ядг гевм, , нео даеини бл л а м оидяу бу де бе у
яидм вмяа ая и ебя в двяи, наял л ливн яги млв н и
рвдня мея вде гм рдм
лид днеуа варл вуа ае , яоед ну див нг я яб бявян янинд
нил одне я мядлие енеа а глвун ния аия енвд дае д д
После того, как выделенный участок ДНК транслирован по какому-то алгоритму , получается текст русского языка. Пример для 3 интрона POLA человека.Текст как
бы написан русскими буквами на непонятном языке. Поэтому его лучше не читать,
а слушать. И здесь уже нужны специалисты по языкам, чтобы уловить в тексте
какие-то сочетания фонем или звуков, похожие на какой-то язык, может быть древний язык. Предполагается, что все разговорные слова, особенно простые, состоящие из 1 - 3 букв, не случайны и во многих разных языках схожи.
Предварительный вывод такой, что транслирование интронов дает текст мало
похожий на речь, хотя мной пока слишком мало было обработано материала.
Можно произвести поиск возможных слов и в экзонах,для этого транслировать РНК гена в 6 возможных вариантах. Но структура белка направлена на какую-то его биохимическую функцию, а не на слова. Если предположить, что РНК интронов
может играть какую-то функцию в памяти нервных клеток, то слова и буквы языка могут иметь отражение в ДНК. Хотя я сам считаю эту мою гипотезу невероятной.
Скорее имеет значение наличие большого количества различных повторов в
интронах.Я произвел поиск возможных слов в различных повторах.При этом слова, полученные по какому-то алгоритму, будут также повторяться. Например,
трансляция повтора 7 человека из приложения 7 этой книги дает такой текст по алгоритму 2:
"мад мамя оана аиад мамя о марамад иамя оама амад лмая
яоама амад иамя оама амад мам гоама лмад мамя оамар амад
ламя оама амини".
Если отнестись к этому с юмором, то похоже на волшебное
заклинание. Не правда ли? Если повтор 7 данио из приложения 7 транслировать
по алгоритму 1, то получится текст:
лулулу
жжлулулувулулулулулулжлулулулуожлулулулулулулулулулклу
лулулу
лжлулулулулунулклулулулулжлулжлужулулулулулужулжлулулу
лулулм
лулулулулулулжлулулужжлужулулулулулулулулулулуиулглул".
Это больше похоже на какую-то песенку - ДНК поет.
Повтор 5 человека дает такой текст:
"сарг сарг сарн сежг саог сарг карг лесг сарг уарг лаог
каре сакг крг уарг сенв сбкгиежи сбрг карг секг сарг
сенг ларг ларг секг варг сениасирг тирг селг лирг сенг
вбргксарлксарг каргола оспрг сарлосаговег садгпсенг ларг
бакгсерг сарл жсад сенг саргпекгсарг сарг саг карг сенг
саргпкакм лакг каог сарг сарг сенг саргакбрг сенгосарг
иенн сарн сенг сарг сенг сажи са".
69
Повтор 13 человека дает такой текст:
"око ко ркоко ко ококо ко ококо ко ококо ко ококо ко ок
око ко ококо ко ококо ко ококо ко ококо ко ококо ко ок
око ко ококо ко ококо ко ококо ко ококо ко ококо ко ок
око ко ококо ко ококо ко окнко коа".
Этими примерами я показал, что наиболее демонстративно ДНК говорит именно с
помощью разных повторов.
Чтобы транслировать ДНК можно использовать хорошую форму по адресу http://molbiol. ru/scripts/01_13. html.
В окно формы нужно вставить ДНК и она выдаст его трансляцию. Эта страница
может работать автономно, без подключения к интернет. Для разработки других алгоритмов удобна страница по адресу http://molbiol. ru/appendix/02_01. html. Она описывает основные свойства аминокислот.
Для прослушивания текстов на компьютере есть несколько программ. Для примера, "Говорилка" А. Рязанова. http://www. vector-ski. ru/vecs/govorilka/
До ее использования надо еще установить на WINDOWS звуковой движок.
Это файлы: microsoftagent (msagent. exe, lhttsrur. exe, spchcpl. exe). Также потребуются файл ms_speech_api. exe. Файлы эти можно найти там же.
Подводя итог для этой статьи, могу сказать, что ДНК можно преобразовать в
слова какого-то языка, подобно преобразованию ДНК в ноты музыки генов, но
работы эти я только начал несколько лет назад и каких-то интересных
результатов пока нет. Надо составлять новые алгоритмы и тестировать их, но
это требует много времени.
ПРИМЕР ИСКАЖЕННОЙ ИНФОРМАЦИОННОЙ ПОСЛЕДОВАТЕЛЬНОСТИ И ЕЕ КОРРЕКЦИЯ.
20 АПРЕЛЯ 2011.
При рассмотрении последовательности аминокислот в белке часть их в результате мутаций оснований в ДНК заменяется на другие аминокислоты. Если белок предназначен для выполнения каких-то определенных функций,то эти замены могут иметь адаптивное значение в эволюции для выполнения какой-то функции белка.
Меня же интересует сохранность текстовой информации. Для замены одной
аминокислоты на другую мутация основания ДНК может не иметь значения из-за вырожденности кода, либо надо чтоб произошла мутация в 1 , 2 или 3 основаниях для замены одной аминокислоты на другую.
В клетке много белков имеют повторяющиеся структуры в виде доменов. Если они важны для функции белка, то их сохранность поддерживается. Если нужна только часть доменов из молекулы белка, то остальные могут мутировать без вреда для функции. Я приведу здесь пример белка, кодируемого геном LOC732021 из
хромосомы 6. Четко видна основная периодичная структура в виде цепочки - setttastag, с периодом повторения равному 10.
Реальный белок имеет множество замен аминокислот , а также делеции,
приведшие к сдвигу периодичности.
Для коррекции просто взят этот домен по принципу максимального его
количества в молекуле белка, и вся остальная структура представлена
обновленной в виде правильного чередования этих доменов по всей молекуле
белка. Так модулей settt всего 127. В этом белке как бы содержатся несколько повторяющихся чисел, что можно использовать для ввода какой-то разумной информации, это 3 - t , промежуток между s - 6 и 4, размер модуля - 10 и , возможно другие числа, которые можно специально применить для ввода
информации в ДНК.
Разница в аминокислотах наглядно представлена с помощью программы
STADEN PACKAGE. Можно предположить, что ген белка постепенно мутировал много миллионов лет без особого снижения своей функции в клетке, так как оставшихся доменов вполне хватало, или этот белок утратил свою первоначальную функцию в клетке и просто является разновидностью белкового балласта клетки.
Меня интересует прежде сохранность каких-то разумных текстов, которые можно ввести в ДНК , или они уже были введены давно.
Таким образом. используя периодичные структуры в ДНК, или в белке, можно
произвести коррекцию потерянной информации в результате мутаций и
70
восстановить ее полностью. Срок хранения информации, доступной для чтения, и сохраненный в генах живых организмов может быть очень большим - миллионы или
десятки миллионов лет.
ПРИЛОЖЕНИЕ.
Белок гена LOC732021, цитировано http://ncbi. nlm. nih. gov. ,
без коррекции, corr0. txt
hihgdgygvnhgghyghgggh
Белок после коррекции, хвост белка оставлен без изменения.
Новый белок с коррекцией создал Курносов М. Н. Имя - corr3. txt.
hihgdgygvnhgghyghgggh
71
Демонстрация возможных замен аминокислот.
Align sequences - сравнение последовательностей
Взяты последовательности:
Added sequence korr0. txt - LOC732021, без коррекции
Added sequence korr3.txt - белок после коррекции автором книги.
1 11 21 31 41 51
korr0.txt .****.*::.**:******.******. ..:********.******:*..**:**..*.
korr3.txt - 10 20 30 40 50
61 71 81 91 100 110
korr0.txt .***.**:**.***.**.*:.**.*****..*****. **.******.*..*:***..*:
korr3.txt 60 70 80 90 100 110
120 130 140 150 160 170
korr0.txt .******.**.:****.:**.******.**.******* *.:****:***.***.**. *
korr3.txt 120 130 140 150 160 170
180 190 200 210 220 230
korr0.txt korr3.txt 180 190 200 210 220 230
240 249 259 269 279 289
korr0.txt .*****. **.*****:****:***.** **:*.******.* ***:***.***.*.***
korr3.txt 240 250 260 270 280 290
299 309 319 329 339 349
korr0.txt .*****.***.*:***..**.:**.**. :.****..***.******.**.********.
korr3.txt 300 310 320 330 340 350
359 369 379 389 399 409
korr0.txt korr3.txt 360 370 380 390 400 410
419 429 439 449 459 469
korr0.txt ****.*:.**.. ***********.*.***.:***************.:*.****.** *
korr3.txt 420 430 440 450 460 470
479 489 499 509 519 529
korr0.txt .********..* ****. *.**:************:.*:.***.**.******.**.**
korr3.txt 480 490 500 510 520 530
539 549 559 569 579 589
korr0.txt .******.**.* ****:******.**.**.*:****.*****.**:***.******.**
korr3.txt 540 550 560 570 580 590
72
599 609 619 629 639 649
korr0.txt korr3.txt 600 610 620 630 640 650
659 669 679 688 698 708
korr0.txt .***.*.:*********.*:.*****. *****.***.*..*****..**.******:**
korr3.txt 660 670 680 690 700 710
718 728 738 748 758 768
korr0.txt korr3.txt 720 730 740 750 760 770
778 788 798 808 818 828
korr0.txt .*****.***.*****..**.:*..**. **.****.***.:*****.**.****..***
korr3.txt 780 790 800 810 820 830
838 848 858 868 878 888
korr0.txt .******: ***********************:******:*.****************:*
korr3.txt 840 849 859 869 879 889
898 908 918 928 938 948
korr0.txt korr3.txt 899 909 919 929 939 949
958 968 978 988 998 1008
korr0.txt korr3.txt 959 969 979 989 999 1009
1018 1028 1038 1048 1058 1068
korr0.txt *.*:***.:*********.:*.*****:. *.******:*********.**.********
korr3.txt 1019 1029 1039 1049 1059 1069
1078 1088 1098 1108 1118 1128
korr0.txt *.: ****.**.**.******.******. ..**.**********:**.**.:*******
korr3.txt 1079 1089 1099 1109 1119 1129
1138 1148 1158 1168 1178 1188
korr0.txt *.***.**. *..*****.**.***:**:*:.***:**:************.********
korr3.txt 1139 1149 1159 1169 1179 1189
1198 1208 1218 1228 1238 1248
korr0.txt *.*********.****.**.*.****:*:*:.****.** ..*****.***.: *.*::*
korr3.txt 1199 1209 1219 1229 1239 1249
73
1258 1268 1278 1288 1298 1308
korr0.txt korr3.txt 1259 1269 1279 1289 1299 1309
1318 1328 1338 1348 1358 1368
korr0.txt korr3.txt 1319 1329 1339 1349 1359 1369
1378 1388 1398 1408 1418 1428
korr0.txt korr3.txt 1379 1389 1399 1409 1419 1429
1438 1448 1458 1468 1478 1488
korr0.txt korr3.txt 1439 1449 1459 1469 1479 1489
1498 1508 1518
korr0.txt glshihgdgygvnhgghyghgggh
************************
korr3.txt glshihgdgygvnhgghyghgggh
1499 1509 1519
74
САМЫЕ БОЛЬШИЕ БЕЛКИ,КОДИРУЕМЫЕ ГЕНОМОМ ЧЕЛОВЕКА.
14 АПРЕЛЯ 2011.
Для поиска разумных посланий в геноме человека я предпринимаю несколько новый подход. Это рассмотрение каких-то аномалий в белках человека, указывающих на
их искусственное происхождение. Одной из таких аномалий являются особо крупные белки, так как они обращают на себя внимание в первую очередь. Функциональные
домены обычных белков имеют размер от нескольких аминокислот до десятков. Конечно , вроде бы ненужные массивы аминокислот белков-гигантов нужны для конфигурации активных центров молекулы, а могут ли они быть вообще
бесполезными. Другие белки-гиганты состоят из множества небольших доменов. В любом случае, рассмотрение последовательности аминокислот выглядит более
наглядным для демонстрации необычности его и я предполагаю, что аномальные
белки могут быть как бы метками в геноме для маркирования информационных участков.
В любом случае , эти мои разработки могут пригодится в будущем, если наша цивилизация достигнет необходимости специально вводить информационные участки
в новые организмы будущего. Это может быть полезным для биологических
наномашин. Пока известны науке только естественные наномашины - это
молекулярные комплексы белков, нуклеиновых кислот и других молекул,
выполняющих определенные функции в клетке.Напрмер, ДНК-полимеразный комплекс, рибосома, РНК-полимеразный комплекс, различные помпы мембран для перекачки нужных молекул и т. п. Введение текста в ДНК может быть программой для управления искусственной наномашиной.
Для изучения и разработки биологических наномашин общее представление о
размерах имеет значение. И если особо крупные белки можно представить как
остов машины, то мелкие белки - это инструменты, подвешенные к остову для выполнения нужных работ внутри клетки. Текст ДНК или белка можно использовать для инструктирования этой наномашины. Через эти тексты, введенные в геном, возможно поддерживать обмен сигналами наномашины с внеклеточной средой или расположенными вне клетки управляющими микро- и макроустройствами.
Привожу примеры белков разного размера, это полезно для их сравнения
в приложении 4.
Если белок очень большой,то для выявления какой-то скрытой периодичности в
нем или доменов,повторов структуры,можно просматривать белок при
прокручивании его в каком-то просмотрщике файла.Будет видна псевдографика
или какие-то необычные картинки при движении файла.Чтобы это облегчить и
уловить скрытую периодичность можно часть аминокислот заменить на пробелы.
Пример ниже.У белка TITIN N2-A я произвел замену EKK на пробелы.
Трудно уловимая периодичность.
Явная периодичность.
pkevvp vpvppakkpeapppkvpeapkevvp vpvpppkkpevpptkvpevpkaa
vp vpeaippkpespppevpeapkevvp vpaappkkpevtpvkvpeapkevvpek
kvpvpppkkpevpptkvpevpkvavp vpeaippkpespppevfeepeevaleeppae
vveepepaappqvtvppkkpvp apavvakkpelppvkvpevpkevvp vplvvpk
kpeappakvpevpkevvp vavpkkpevppakvpevpkkpvleekpavpvperaespp
pevyeepeeiapeeeiapeeekpvpvaeeeepevpppavpeepkkiip vpvikkpea
tplkvpgg vrkllperkpepkeevvlksvlrkrpeeeepkvepkklekvkkpavpep
Таким образом,просмотр псевдографики при движении файла
может дать открытие чего-то необычного.
75
Всего в результате длительной трудной работы, просидев за компьютером
несколько недель было просмотрено вручную 34182 белка-предшественника из этой базы, это больше , чем количество генов в геноме индивидуума. Потому, что в
базе часто есть повторы для одного белка разных изоформ, или разных аллелей одного гена.Список больших белков составлен по порядку их расположения в базе белков генома человека из NCBI - protein. gbs.
Статистика для прекурсоров белков человека , кодируемых геномом
человека следующая.
При размере белка в аминокислотах процент таких белков составил:
до 500 -- 64
500 - 1000 -- 26
1000 - 1500 -- 7
1500 - 2000 -- 2
более 2000 -- 1
Я привожу список белков-гигантов при размере их более 1500 аминокислот.
Общее количество белков гигантов составляет менее 3 процентов от общего количества белков. Самые крупные белки, как рекорды для человека будут перечислены индивидуально.
Большинство белков имеют размер 10-300 аминокислот, и поэтому размер
прекурсоров в 5000 - 8000 и выше можно назвать интересным феноменом. Конечно, эти прекурсоры модифицируются пост-трансляционно, но сам этот феномен есть.
Список рекордных размеров белков-прекурсоров,составил Курносов М.
ABCA13 - 5058 ATP BINDING CASSETE MEMBER 13
AHNAK - 5890 AHNAK NUCLEOPROTEIN ISOFORMA 1
ALMS1 - 4169 ALSTROM SYNDROME 1
ANK3 - 4377 ANKYRIN 3
APOB - 4563 APOLIPOPROTEIN B PRECURSOR
BIRC6 - 4829 BACULOVIRAL IAP REPEAT CONTAINING 6
C14ORF78- 5048 - 6287 SIMILAR AHNAK NUCLEOPROTEIN 1
CMYA5 - 4069 CARDIOMYOPATHY ASSOCIATED 5
DNAH1 - 4330 DYNEIN
DNAH11 - 4523 DYNEIN
DNAH3 - 4116 - 4427 DYNEIN
DNAH5 - 4624 DYNEIN
DNAH7 - 4024 DYNEIN
DNAH8 - 4490 DYNEIN
DNAH9 - 4486 DYNEIN
DST - 5171 - 5497 DYSTONIN
DYNC1H1 - 4646 DYNEIN
DYNC2H1 - 4307 - 4314 DYNEIN
EPPK1 - 5065 EPIPLAKIN 1
FAT - 4588 FAT TUMOR SUPRESSOR 1
FAT2 - 4349 FAT TUMOR SUPRESSOR
FAT3 - 4601 SIMILAR FAT3
FCGBP - 5405 FC-FRAGMENT OF IG-G BINDING PROTEIN
FLG - 4061 FILAGGRIN
FRAS1 - 4011 FRASER SYNDROME 1
GPR98 - 6307 VERY LARGE G-PROTEIN COUPLED RECEPTOR 1 CHR 5
HERC1 - 4861 HECT DOMAIN AND RLC1
HERC2 - 4834 HECT DOMAIN AND RLC2
HMCN1 - 5636 HEMICENTIN 1
HSPG2 - 4391 HEPARIN SULFATE PROTEOGLYCAN 2
HUWE1 - 4374 HECT UBA WWE DOMAINS CONTAINING 1
KIAA1109- 4975 - 5005 SIMILAR CG15133PA
LOC649768 5205 MUCIN 5B
LOC650412 4107 SIMILAR DYNEIN 1
LOC727897 5708 SIMILAR MUCIN 5B PRECURSOR
LOC731751 4096 SIMILAR PROTEIN KINASE DNA ACTIVATED CATALYTIC PP
LPA - 4548 LIPOPROTEIN LPA
76
LRP1 - 4544 LOW DENSITY LIPOPROTEIN-RELATED PROTEIN 1
LRP1B - 4599 LOW DENSITY LIPOPROTEIN-RELATED 1B
LRP2 - 4655 LOW DENSITY LIPOPROTEIN-RELATED PROTEIN 2
MACF1 - 5430 - 5938 MICROFILAMENT AND ACTIN FILAMENT
CROSS-LINKER PROTEIN 1
MDN1 - 5596 MIDASIN
MLL2 - 5262 MYELOID-LYMPHOID LEUKEMIA 2
MLL3 - 4025 - 4911 MYELOID-LYMPHOID LEUKEMIA 3
MUC16 - 14507 MUCIN 16
MUC17 - 4493 MUCIN 17
MUC19 - 4516 - 7328 MUCIN 19
MUC2 - 5179 MUCIN 2
MYCBP2 - 4640 MYC BINDING PROTEIN 2
NEB - 6669 NEBULIN
OBSCN - 6620 OBSCURIN CHR 1
PCLO - 5010 PICCALO
PCLO - 5011 - 5021 SIMILAR PICCOLO
PKD1 - 4302 POLYCYSTIN KIDNEY DISEASE 1
PKHD1 - 4074 FIBROCYSTIN 1
PKHD1L1 - 4243 SIMILAR FIBROCYSTIN 1
PLEC1 - 4515 - 4684 PLECTIN 1
PRKDC - 4128 PROTEIN KINASE DNA-ACTIVATED CATALYTIC PP
RYR1 - 5038 RYANODIN RECEPTOR
RYR2 - 4967 RYANODIN RECEPTOR 2
RYR3 - 4870 RYANODIN RECEPTOR 3
SACS - 4432 SACSIN
STARD9 - 4552 STAR- RELATED LIPID TRANSFER PROTEIN 9
SYNE1 - 8749 - 8797 NESPRIN
SYNE2 - 6883 SPECTRIN NUCLEAR ENVELOPE
TNXB - 4289 TENASCIN XB 1
TTN - 26926 TITIN ISIFORMA N2B
TTN - 27051 TITIN ISOFORMA NOVEX 1
TTN - 27118 TITIN ISOFORMA NOVEX 2
TTN - 33423 TITIN ISOFORMA N2A
TTN - 5604 TITIN NOVEX 3
USH2A - 5202 USHERIN
VPS13B - 4022 VACUOLAR PROTEIN SORTING 13B
VPS13D - 4363 - 4388 VACUOLAR PROTEIN SORTING 13 D
ZUBR1 - 5183 RETINOBLASTOMA-ASSOCIATED FACTOR 600
Итого 75 генов человека кодируют белки-прекурсоры размером более 4000 аминокислот, из них самый большой белок - титин 33423 аминокислоты,на 2 месте муцин 16 - 14507 аминокислот, на 3 месте несприн (ген SYNE1) - 8797 , на 4
месте SYNE2 - 6883, на 5 месте небулин - 6669. Белки эти имеют много доменов. Сам феномен белков-гигантов требует дальнейшего изучения, что будет
продолжено в следующих сообщениях.
ТЕЛОМЕРА ХРОМОСОМЫ И ТЕОРИИ СТАРЕНИЯ. 10 ОКТЯБРЯ 2009.
Старение человека будет всегда волнующей темой. Сегодня на первое место вышла теломерная теория старения, основная идея которой в том, что конец хромосомы, запечатанный теломерой,перестает функционировать и клетка перестает делиться. При каждом делении клетки участок ДНК на краю хромосомы - теломера
укорачивается до тех пор, пока конец хромосомы перестанет нормально функционировать. Получены результаты на животных продления жизни при
удлинении теломеры. Если клетки имеют возможность большее число раз делиться,
то это эквивалентно повышению резервов организма, которые снижаются в течение жизни до критического или предельного значения перед смертью.
Остается как бы удлинить теломеры у человека - и проблема "вечной молодости" решена. На самом деле все гораздо сложнее, и уж точно, что таблетки, для
77
удлинения теломер, не будут продаваться в аптеках. Удлинение теломер - это сложная генетическая операция, при которой в зародышевые или стволовые клетки вводятся векторы или гены для модификации теломеры. Причем количество концов хромосом на гаплоидный набор, то есть в половой клетке, равно 92, и это может
быть самой большой проблемой - удлинить теломеры ВСЕХ концов хромосом.
Возможно, не все 24 хромосомы, а одна или две имеют главное значение в теломерной теории старения, но это пока неизвестно. Затем либо организм клонируется, либо модифицированные клетки размножаются и вводятся в человека. Вся операция полностью индивидуальна, доноры не подойдут, так как будет
иммунная несовместимость клеток. Возможно введение самого фермента теломеразы
с помощью специальных нанокапсул в клетки. Но поскольку этот процесс не
связан с нормальным процессом образования гамет, зародыша и эмбриона,то могут быть всякие неуправляемые осложнения, в том числе образования потенциально раковых клеток.
По этому поводу выскажу некоторые свой соображения. Скорее всего,это не
приведет к значительному увеличению жизни. Как известно,теорий старения около 200, и когда проблема с теломерой будет решена, начнут действовать другие механизмы, приводящие к смерти человека.
Каждая из теорий старения опирается на те процессы, которые вносят свой вклад
в приближение смерти человека. Для тех научных спонсоров, которые инвестируют деньги в науку, и продление жизни , возможно, будут интересны проекты, могущие
существенно повлиять на длительность жизни.
Это:
1. Митохондрии и старение. Какой бы ни были длины теломеры, будет снижение энергетики с возрастом. Необходима генетическая коррекция митохондрий.
2. Эндогенные вирусы (герпес, папиллома, аденовирусы, эндогенные "нормальные" ретровирусы и несколько других из известных вирусов), которые встраиваются в геном клеток человека и доводят клетки до разрушения независимо от длины теломер. К этой же группе я могу отнести и медленные инфекции.
3. Микробные патогены, которые также снижают резервы организма и играют
большую роль в болезнях старения (микоплазма и другие).
4. Мутации и повреждения генов могут накапливаться в клетках независимо от
длины теломер. Для этого необходимо модифицировать системы репарации генома в клетке для защиты от внешних и внутренних мутагенов.
5. Транспозоны - нечто среднее между мутагенами и вирусами.
Их активность не зависит от длины теломер, но они могут выключать
гены, повреждать их и приводить клетку к гибели.
6. В организме много клеток, которые находятся в состоянии конечной
дифференцировки, они не делятся всю жизнь человека. Это клетки мозга –
нейроны, клетки мышц и сердца, клетки эндокринных желез и другие. Решение проблемы теломеры для старения имеет значение только для делящихся клеток - клетки эпидермиса, клетки кишечника, фибробластов соединительной ткани,клетки костного мозга и другие. Неделящиеся клетки имеют особый, другой механизм старения.
В возрасте старше 60 лет большое значение в долгой и полноценной жизни
человека будут иметь защита мозга от различных дегенеративных процессов типа болезни Альцгеймера, атеросклероза мозга, старческого слабоумия.
Эти темы соответствуют моим интересам в науке и все это показывает, что
старение процесс сложный и требует изучения с разных сторон.
ЛИТЕРАТУРА.
1. Биология старения. Руководство по физиологии. 1982.
В настоящее время в литературе существует некоторая путаница в названиях
генов, названиях белков, которые могут не совпадать с названием генов, ссылки
в цитатах на гены из разных организмов. То ли это гены дрожжей, то ли мышей,
то ли человека. Разобраться в этом могут только специалисты-биохимики, а
людям, которые просто интересуются наукой для инноваций в генные технологии,
это часто не по силам, в смысле специальных знаний. Чтобы знать, что научная статья именно про тот ген, что интересует, надо знать первичную структуру
белка, или белковые домены для гомологов дрожжей, мышей для сравнения с человеком.
Простой формальный поиск по генным базам может быть ошибочным.
78
Для примера этого ген TPP1, входящий в защитный комплекс теломер хромосом, на который ссылаются почти в каждой второй статье о теломерах, записан в геноме человека как трипептидил-пептидаза. И это правильно - есть такой ген у
человека, только он никакого отношения к теломерам не имеет.
Только специалист-биохимик сразу это поймет, так как белок TPP1 , входящий в теломеру в защитный комплекс играет функцию биндинга белков и ДНК. Белок TPP1
- это ген ACD человека.
ГЕНЫ ПОДДЕРЖКИ И ОБСЛУЖИВАНИЯ ТЕЛОМЕРЫ ХРОМОСОМ В ГЕНОМЕ
ЧЕЛОВЕКА. СПИСОК И ПЕРЕВОД СДЕЛАЛ КУРНОСОВ М.Н.13 МАРТА 2010.
Гены были найдены по реферативной базе генома человека, а также по
современным статьям в журналах. Гены указаны все на дату этой статьи, но со временем их может стать больше, так как наука идет далее.
ХРОМОСОМА ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. EST1B 33 Est1p-подобный белок B, каждой
закороченной теломеры 1B.
LTPS - взаимодействующий белок.
C1ORF16 82 ORF, каждой закороченной теломеры 1C,
рак груди-ассоциированный антиген.
RAP1 94 RAS онкоген связанный белок, негативная
регуляция клеточного цикла.
2. RIF1 66 RAP1-взаимодействующий фактор, гомолог
дрожжей, поддержка теломер, ответ на ДНК
повреждение.
PAX8 63 Парный бокс белок 8, активатор транскрипции
теломеразы.
XRCC5 97 X-лучей дефектная репарация в клетках
китайского хомячка, Ku80 волчаночный
антиген, репликация, рекомбинация, репарация
двойных разрывов, входит в состав комплекса
теломеры. АТФ-зависимая хеликаза 2.
3. TERC 1 РНК теломеразы.
4. HNRPD 20 Гетерогенный ядерный РНП Д , AU-богатый
элемент РНК связывающий белок 1, 37 kDa,
теломеры поддержка, процессинг РНК,
активатор транскрипции.
LOC646316 3 Побобен теломеры повтор связывающий
фактор 1 - TTAGGG,
NIMA - взаимодействующий белок 2, белок
теломеры PIN2-TRF1.
RFC1 79 Фактор репликации C1, активатор 1,
145 kDa, TDTM.
NOLA1 10 Ядерный белок семейство A, член 1, H-ACA
snRNPs, содержит глицин-аргинин богатый
домен GAR1.
5. LOC442147 1 Подобен TRF2-взаимодействующий белок,
RAP1 hRAP1.
TERT 42 Теломераза, обратная транскриптаза,
4 изоформы.
SERF1A 18 Малый EDRK-богатый фактор 1A, теломерный,
нервной системы развитие, неизвестны
функция, процесс, компонент.
SMN1 28 Аварийный для моторного нейрона 1,
теломерный.
RAD50 87 RAD50-гомолог S. cerv. , регион теломеры
хромосом, TDTM, рекомбинация, репарация
двухцепочных разрывов ДНК, 3-5-экзонуклеаза,
эндонуклеаза одноцепочной ДНК.
NOLA2 4 Ядерный белок семейство A, член 2.
79
6. ----
7. POT1 74 POT1-защита одноцепочной ДНК теломеры,
гомолог S. pombe. , поддержка теломеры,
репликация ДНК.
8. TNKS 221 Танкираза, TRF1-взаимодействующий
анкирин-зависимый АДФ-рибозы полимераза,
NAD-зависимая, АДФ-рибозилирование белков,
TDTM.
PINX1 75 PIN2-взаимодействующий белок 1, поддержка
теломер, негативная регуляция прогрессии
клеточного цикла.
TERF1 39 TRF1, Теломерного повтора связывающий
фактор 1, NIMA-взаимодействующий, связывание
ДНК теломеры, клеточный цикл, TDTM.
WRN 141 Вернера синдром, хеликаза, репликация
теломеры.
9. ----
10. TNKS2 67 Танкираза 2, TRF1-взаимодействующий,
анкирин-связанный АДФ-рибозы полимераза 2,
поддержка теломер, АДФ-рибозилирование
белков.
OBFC1 36 Олигонуклеотид-олигосахарид-связывающее
поле 1, поддержка теломеры, ассоциация с
POT1, TPP1.
11. TNKS1BP1 23 Танкиразу 1-связывающий белок 1,
182 kDa, ядерный теломерный гетерохроматин,
TDTM.
SCYL1 14 SCY1-подобный 1, S. cerev. , N-терминальная
киназа-подобный
белок, тератома-ассоциированный белок,
регулятора теломеры связанный белок,
теломеры
транскрипционный-взаимодействующий элемент.
MRE11A 76 MRE11-мейоза рекомбинации гомолог S. cerev. ,
двухцепочных разрывов репарации белок,
3-5-экзонуклеаза, эндонуклеаза одноцепочной
ДНК. TDTM.
ATM 146 Атаксия-телеангиэктазия мутация,
мейотическая рекомбинация, взаимодействие
с TRF2.
12. PTGES3 25 Простагландин Е синтетаза 3, цитозольная,
теломеразы голоэнзима комплекс, активация
теломеразы и поддержка теломер, неактивный
прогестерона рецептор, 23 kDa.
13. LOC283523 2 Подобен теломерного повтора связывающего
фактору 1, изоформа 2.
14. TEP1 46 Теломеразы-ассоциированный белок 1,
TROVE -домен семейства, член 1, теломеразы
голоэнзимный комплекс, ДНК репликация и
хромосомы цикл.
TINF2 3 TIN2, TERF1 взаимодействующий ядерный
фактор 2, теломеры длины регулятор, TDTM.
PARP2 14 АДФ-рибозы полимераза 2.
15. NOLA3 2 Ядерный белок семейство A, член 3, гомолог
NOP10 S. cerv.
BLM 98 Блума синдром, хеликаза.
16. NOMO1 63 NODAL модулятор 1, PM5-белок, теломерная
копия.
TERF2 31 TRF2, Теломеры повтор связывающий фактор 2,
теломеры ДНК и белок связывающий фактор,
клеточный цикл, TDTM.
80
TERF2IP 10 TERF2-взаимодействующий белок, теломеры
RAP1 белок, с допамин рецептором
взаимодействующий белок 5, связывание
с ДНК теломеры, TDTM.
ACD 3 Адренокортикальной дисплазии гомолог,
поддержка теломеры, взаимодействует с POT1
и TIN2, ДНК, белок TPP1 гомолог.
17. C17ORF31 244 Каждой закороченной теломеры 1A,
Est1p-подобный белок A, поддержка теломер.
18. LOC646359 1 Подобен теломеры повтор связывающий
белок 1, изоформа 2.
19. SIRT2 21 Сиртуин 2, гомолог S. cerv. , спокойного
хроматина комплекс, клеточный цикл.
ERCC1 14 Эксцизионная репарация ДНК 1.
20. RTEL1 40 Регулятор теломеры элонгирующей
хеликазы 1, АТФ-зависимой.
21. ----
22. LOC644899 1 Подобен теломеры повтор связывающий
фактор 2 взаимодействующий белок 1,
TRF2-взаимодействующий теломеры белок
RAP1, hRAP1.
NHP2L1 15 Ядерный высоко мобильных групп белок,
гомолог S. cerv. подобный 1, процессинг
рРНК. Теломеразный комплекс.
XRCC6 43 X-лучей дефектная репарация в клетках
китайского хомячка,
Ku70 тиреоид-волчаночный антиген,
репликация, рекомбинация, репарация
двойных разрывов, входит в состав
комплекса теломеры. АТФ-зависимая
хеликаза 2. Образует гетеродимеры
с Ku80.
X. DKC1 15 Конгенитальный дискератоз 1, дискерин,
теломеразы голоэнзимный комплекс,
регуляция прогрессии клеточного цикла,
рРНК процессинг, TDTM.
Y. CDY1 3 Y-хромосомы хромодомен белок,
теломерный, сперматогенез.
Сокращение TDTM - теломера зависимая теломеры поддержка.
Размер генов показан в тысячах пар нуклеотидов, если меньше
1000 пар нуклеотидов, то 1 округленно.
Информационное приложение. Цитировано с данных генома человека,
по адресу http://ncbi. nlm. nih. gov.
1. Ген TERC - хромосома 3.
10 20 30 40 50 60
70 80 90 100 110 120
130 140 150 160 170 180
190 200 210 220 230 240
81
250 260 270 280 290 300
310 320 330 340 350 360
370 380 390 400 410 420
ccacccctcccaggcccaccctccgcaaccc-3
430 440 450
ggtggggagggtccgggtgggaggcgttggg-5 1
Ген TERC комплементарный в формате фаста.
gcatgtgtgagccgagtcctgggtgcacgtccc
cagttagggttagacaaaaaatggccaccacccctcccaggcccaccctccgcaaccc
Ген TERC РНК
5-ggguugcggagggugggccugggaggggugguggccauuuuuugu
cuaacccuaac
-----------
gacgugcacccaggacucggcucacacaugc-3
Подчеркнут домен обратной транскрипции для образования
гексамера TAAGGG теломерного повтора.
2. Комплекс теломеразы состоит из следующих основных
компонентов:
теломераза - hTERT
РНК теломеразы - TERC
дискерин - DKC1
GAR1 - NOLA1
NOP10 - NOLA3
NHP2 - NHP2L1.
Комплекс поддержки теломеры , SHELTERIN-COMPLEX , состоит из следующих
основных компонентов , белков, связанных с ДНК теломеры и между собой:
TERF1,TERF2,TINF2,RAP1,TPP1,POT1.
Все эти списки наглядно показывают,что проблема длины теломеры
не сводится только к теломеразе.В процессе участвуют около 50
генов и белков.А для геронтологии может быть иметь большее
значение защитные белки типа POT1,которые по словам китайских
ученых и "есть золото".
3. Показан конец Y-хромосомы человека, на конце видны
теломерные повторы - ttaggg. Цитировано с данных генома человека
по адресу http://ncbi. nlm. nih. gov.
82
gtggtgtgtgggtgtgggtgtgggtgtgggtgtgtgggtgtggtgtgtgggtgtggt-3
ГЕНЫ ПОДДЕРЖКИ ВЫСШИХ ПСИХИЧЕСКИХ СВОЙСТВ ЧЕЛОВЕКА. 24 июля 2008.
В этом проекте я решил дать обзорные описания генов, которые имеют прямое значение для работы мозга и обеспечения именно человеческих функций мозга.
Пока я публикую перевод кратких данных из журналов только одного из них, это
ген неурегулина.
ГЕН NRG1.
Ген расположен в хромосоме 8. Размер гена 212320 п. н. Есть 8 изоформ NRG1 в результате альтернативного сплайсинга. Возможны варианты содержат 3 или 6,или 12, или 13 экзонов. Полный продукт NRG1 имеет 640 аминокислот и содержит
83
следующие домены:1. Херегулин HRG. 2. Иммуноглобулин Ig. 3. Эпидермальный
фактор роста подобный EGF-like. 4. Семейство неурегулина. Вес 70392 Д.
Тип 1 содержит домен Ig и гликозилированный домен - изоформы 1-8,
тип 2 - нет гликозилированного домена - изоформа 9, тип 3-есть домен богатый цистеином - изоформа 10. Все формы имеют ткане-специфические функции.
Изоформы в зависимости от наличия этих доменов бывают - херегулин HRG-форма, фактор роста глии GGF-форма, чувствительных и моторных нейронов вторичный
фактор SMDF-форма.
Тип 1 преимущественно экспрессируется в эндокарде. Изоформа альфа
экспрессируется в легких, яичнике, яичках, простате, сердце, скелетных мышцах, молочных железах, плаценте, почках, слюнных железах, немного в кишечнике и мозге, только не в матке, желудке, панкреас и селезенке. Изоформа 3 преимущественно в мезенхимальных клетках и не в нервных органах, тогда как изоформа 5 - большая нейрональная форма. Изоформа 8 - экспрессируется в позвоночнике и мозге. Изоформа 9 - большая форма в скелетных мышцах, в
нервной системе. Тоже обнаружены во взрослом сердце,плаценте, легком, печени,
почках и панкреас. NRG1 - это главный лиганд для ERBB3,ERBB4 тирозин-киназных
рецепторов.
Также использует ERBB1, ERBB2 корецепторы. Результат в усилении
лигандстимулируемого фосфорилирования тирозина и активация ERBB рецепторов.
Входит в состав мембраны трансмембранно и может локализоваться в ядре.
Функции NRG1 и другие интересные сведения.
1. Участвует в росте и дифференцировке эпителиальных, нейрональных,
глиальных и других клеток.
2. Негативная регуляция транскрипции.
3. Взаимодействует с факторами генов NEU-ERBB рецепторами
тирозин-киназы, повышая уровень фосфорилирования.
4. NRG1 индуцирует экспрессию рецептора ацетилхолина в синаптических
пузырьках нервно-мышечного соединения.
5. NRG1 стимулирует продукцию молока молочными железами и вызывает
дифференцировку клеток рака молочных желез.
6. NRG1 стимулирует пролиферацию Шванновских клеток.
7. NRG1 включен в развитие миокарда сердца.
8. NRG1 связан с возможностью развития шизофрении в различных
популяциях.
В патогенезе нарушено взаимодействие NRG1 и ERBB4 рецептора.
Также мутации в промоторном регионе NRG1 ассоциировались с
шизофренией и полиморфизм 5-конца NRG1.
9. NRG1 риск в болезни Альцгеймера. Потеря синапсов, глиоз, воспаление,
смерть нейронов ассоциируется с изменением экспрессии NRG1-ERBB.
10. NRG1 может влиять на развитие коронарного атеросклероза,
расширение бляшек, через регуляцию ангиогенного фактора CYR61.
11. Активация NRG1-ERBB сигнального пути запускает пролиферацию в
неопластических клетках Шванна.
12. Херегулин стимулирует агрегацию и ингибирует инвазию бычьих
клеток меланомы через активацию E - кадхерин-катенин комплекса.
13. Пролактин и херегулин преодалевают остановку роста
индуцированную днк повреждением и запускают фосфатидил-инозитол-3
киназа-зависимую пролиферацию в раковых клетках молочной железы.
14. GGF2 из NRG1 защищает допаминэргические нейроны нигро-стриатума
и роль в репарации этих повреждений, что может иметь значение при
болезни Паркинсона.
15. NRG1 имеет 9 потенциальных промоторов и играет центральную роль
в нейральном развитии, пластичности синапсов, что играет большую
роль в реакциях мозга и адаптациях.
16. Точечные разрывы в NRG1 были обнаружены у 6% с раками легких,
яичников или молочных желез.
17. Бетацеллюлин и херегулин имеют значение в эпидермальном
морфогенезе и поддерживают дифференцированный фенотип. Псориаз.
18. NRG1 играет значительную роль в инвазии клеток глиомы.
19. NRG1-бета стимулирует NF-kappa-B фактора транслокацию ядерную.
Влияет на фактор роста эндотелия сосудов в клетках рака груди.
84
20. Херегулин снижает экспрессию в экстрацеллюлярном матриксе BRCA1.
21. NRG1 активирует JAK-STAT сигнальный путь через рецептор,
HER2-HER3 гетеродимер.
Этот путь играет значительную роль в NRG1- стимуляции пролиферации клеток эпителия легкого.
22. NRG1 стимулирует в эпителии молочной железы фактор транскрипции GADD153.
23. Цитоплазматический домен взаимодействует с LIM доменом LIMK1.
Они играют роль в развитии видео-пространственного восприятия.
21. Протеолиз NRG на внешней стороне мембраны освобождает растворимый фактор роста.
Значительное гликозилирование белка предшествует протеолизу.
Изоформы белка даны ниже, цитата из файла protein. gbk (ncbi),
приведены для наглядности связи структуры и функции белка.
NRG1-HRG-ALPHA
atpafrladsrtnpagrfstqeeiqarlssvianqdpiav
NRG1 HRG-BETA1
aasleatpafrladsrtnpagrfstqeeiqarlssvianqdpiav
NRG1 HRG-BETA2
afrladsrtnpagrfstqeeiqarlssvianqdpiav
NRG1 HRG-BETA3
e
NRG1 HRG-GAMMA
kcaekektfcvnggecfmvkdlsnpsrylck
85
NRG1 GGF
e
NRG1 GGF2
pe
NRG1 NDF43
serhnliaelrrnkahrskcmqiqlsathlrsssiphlgfil
NRG1 SMDF
ektfcvnggecfmvkdlsnpsrylckcpneftgdrcqnyvmasfyststpflslpe
Поскольку эта книга о биоинформатике, в этой главе я кратко покажу, как работать с литературой. Поиск информации о каком-то гене или белке важная
часть работы. Для начала, можно закачать с сервера ftp. ncbi. nlm. nih. gov
базу белков protein. gbk. gz для нужного организма. Разъархивировать ее и, открыв в "Блокноте", набрать в строке поиска Gene="NRG1",после чего откроется описание этого белка. Рядом с этим местом дана какая-то литература. Например,
REFERENCE 7 (residues 1 to 696)
AUTHORS Benzel, I. , Bansal, A. , Browning, B. L. , Galwey, N. W. ,
Maycox, P. R. , McGinnis, R. , Smart, D. , St Clair, D. , Yates, P. and
Purvis, I.
TITLE Interactions among genes in the ErbB-Neuregulin
signalling network are associated with increased susceptibility
to schizophrenia.
JOURNAL Behav Brain Funct 3, 31 (2007). PUBMED 17598910.
В этой цитате есть ссылка на авторов, статью, журнал , а также на индекс ПубМеда. Чтобы прочитать эту статью надо зайти на сайт
http://ncbi. nlm. nih. gov , и в поисковике выбрать опцию "PUBMED",
и ввести этот номер. Будет дана ссылка на эту статью, и ее можно закачать в формате . pdf для чтения. Если искать просто по названию гена, то поисковик выдаст 696 источников для NRG, то есть литературы по этому гену очень много,
и нужно всегда запросы делать очень конкретно. Я для поиска нужной информации применяю также следующий способ. Надо с ftp сервера NCBI закачать базу
артиклей. Артикль статьи, как правило, дает полный текст ее, только без картинок. Удобство поиска по артиклям это быстрота и простота. За несколько
секунд или минут на компьютере можно провести поиск по ключевым словам. Компьютер просмотрит несколько десятков тысяч статей и укажет те, которые
нужны по содержанию.Например, я распакую архив артиклей у себя, далее проведу поиск по журналу "Nucleic acid research". Для поиска использую Windows
86
Commander, нажимаю 2 клавиши - Alt и F7 , в строку поиска ввожу, что нужно
найти, например "long term memory" без кавычек. А в строку места поиска введу маску "*. *" без кавычек, что означает поиск во всех файлах. Поисковик выдаст несколько сотен статей. Нажать кнопку у коммандера - "Вывести в лист".
Названия всех найденных статей будут показаны в его окне. Их надо скопировать
в нужную директорию соседнего окна. Область поиска при этом сузилась. Далее
ищем другое слово, уже среди них, например "sleep". Поисковик выдаст уже несколько десятков статей, которые можно уже быстро прочитать на тему о
влиянии сна на долговременную память на молекулярном уровне, для примера.
Можно уменьшать таким способом количество нужных статей во много раз.
База артиклей находится по адресу.
Ftp://ftp. ncbi. nlm. nih. gov/pub/pmc/articles. A-B. tar. gz
/articles. C-H. tar. gz
/articles. I-N. tar. gz
/articles. O-Z. tar. gz, где буквы означают первые буквы названия журналов. Общий размер этих файлов около 11 Гб в виде архивов. Содержит сотни журналов
и десятки тысяч статей.
Если какие-то статьи интересны, то затем их уже можно закачать в формате .pdf
с картинками, таблицами, графиками.
Для клинического приложения генетики есть база OMIM - Online Mendelian Inheritance in Man. Эту базу можно закачать по адресу
ftp://ftp. omim. org/OMIM/omim. txt. Z.
Этот архив в виде текстового файла размером около 180 Мб можно использовать
для того, чтобы подробно прочитать про какой-то ген, признак человека, его фенотип, заболевание, особенные молекулы, клетки и так далее. Также в тексте
про каждый ген или признак можно найти список литературы. Для примера,открыть эту базу "Блокнотом", в строке поисковика набрать "; NRG1" , точка с запятой, пробел и название без кавычек. Будет открыт в файле участок текста про этот
ген. Размер текста про этот ген около 43 Кб и 42 литературных источника.
В мире издаются сотни названий научных журналов по генетике и медицине, биоинформатике. Определившись с кругом нужных журналов по своим научным интересам, надо, конечно, посещать сайт самого журнала. На многих есть свободные архивы с издаваемыми ими журналами, которые и надо читать. Выше показано, как нужно работать профессионально. Для простого ознакомления с
каким-то геном можно использовать сервис Wikipedia. В ней есть информация
почти о всех генах. Например, набрать
http://en. wikipedia. org/wiki/Neuregulin.
Окончание.
На примере генов-гигантов мной было показано, что такая работа по биоинформатике, как составление разных списков и баз данных по генам или биологическим процессам, может дать новую интересную информацию. Ее не
получить путем простого размышления или просмотра целого генома. Лишь после того, как информация была сгруппирована по какому-то признаку,и статистически
обработана, появилось новое знание. В этой книге я продемонстрировал это несколько раз. Мной были составлены следующие списки-базы.
Список генов митохондрий, находящихся в ядре. Список генов-гигантов.
Список белков-гигантов. Список генов обслуживания теломеры.
База визуально-особых участков генома. Список генов обслуживания сплайсинга.
На моем сайте Neogermetic. narod. ru я выложил список всех генов человека с переводом на русский язык их названий.
Таким образом, кропотливая и трудная работа по просмотру большого объема информации - генома, дает свой результат в получении новой информации. Ее уже можно проверять экспериментально. Составление разных генетических или
белковых списков по какому-то признаку - это важная часть работы в биоинформатике ДНК. Тут на помощь приходят разные программы по компьютерному анализу генома. Они помогают выявить какие-то признаки и провести их
статистическое изучение. В этой книге я много раз приводил примеры
использования компьютерных программ при разработке моих проектов. В интернете число таких программ десятки и сотни. Подбор их для работы и освоение
87
- важная часть биоинформационной работы. Без программного изучения каких-то генетических, молекулярных и других признаков ни обходится ни одна работа.
Большую часть этой книги я уделил проекту записи текстов в ДНК и проекту
поиска текстов. Поиск каких-то текстов в ДНК - это скорее задача для
лингвистов и математиков. Они будут создавать различные алгоритмы поиска. Я в этой книге написал то, что касается больше моей специальности в медицине и
генетике. Надеюсь, что на стыке этих наук будет получено что-то важное для человеческой цивилизации. По лингвистике написаны сотни книг, так примером
профессиональной книги по лингвистике, как прикладной математики, может быть литература [31].
Особенностью биоинформатики ДНК является ее тесная связь с лингвистикой, так
как в ДНК закодирован биологический язык. Он имеет свои законы, в нем также
есть буквы, слова, знаки препинания. В книге было показано, что ДНК и слова
речи, языка человека могут иметь что-то общее. Надеюсь, что моя книга поможет генетикам и лингвистам лучше понимать друг друга.
Заключение.
Эта книга не монография, не руководство по работе с ДНК. Эта книга - научные очерки, о том, что я нашел вокруг ДНК интересного, чтобы поделиться с людьми. Эта книга скорее декларация моих намерений или моих научных интересов.
В будущем, возможно, что-то будет осуществлено. Насколько все эти проекты
будут сделаны зависит от финансирования науки. Теоретическое осмысление этих проектов достаточно для их воплощения. Я также понимаю, что одному мне эти
проекты не поднять. Сегодня в генетике медикам и биологам нужны для помощи
в науке и работе физики, химики, инженеры, программисты, лингвисты и другие специалисты. Если эта книга вызвала у Вас интерес, подключайтесь к
этим проектам в генетике и успехов Вам в работе.
Для связи с автором можно использовать E-mail:z1959z@yandex.ru
Тексты, не вошедшие в книгу можно найти на сайте:
www.neogermetic.narod.ru.
Курносов Михаил. Дата 01 мая 2013.
Об авторе.
Курносов Михаил Николаевич родился в 1959 году, проживает в Пермском крае. Образование высшее, закончил Пермский государственный медицинский институт по специальности гигиена и эпидемиология в 1986 году. Прошел специализацию
по клинической лабораторной диагностике и биохимии в Институте усовершенствования врачей в Казани в 1987 году. Работал врачем-биохимиком. Последние 24 года занимается свободной научной деятельностью.
Научные интересы - геронтология, молекулярная биология, биохимия, геномика,
биоинформатика. Написал 2 книги:
1. Здоровье, возраст, старение. 1992 год. Пермь. Книга - сборник методов
оценки биологического возраста человека.
2. Экономическая геронтология. 1995 год. Пермь. Книга о связи геронтологии и достижении человеком своих жизненных целей.
88
Приложение 1.Гены компонентов митохондрий в хромосомах ядра человека.
Размер генов в тысячах п. н. включает интроны. Список и перевод сделал
Курносов М.Н.2008 год.
ХРОМОСОМА 1
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. CLCC1 31 ХЛОРИД-КАНАЛ
2. ATP5F1 13 АТФ-СИНТАЗА H-ТРАНСПОРТ
3. WARS2 110 ТРИПТОФАН-ТРНК-ЛИГАЗА
4. HSD3B2 8 СТЕРОИД-ДЕГИДРОГЕНАЗА
5. HSD3B1 8 --
6. HMGCS2 21 3-ГИДРОКСИ-3-МЕТИЛГЛУТАРИЛ-КОА-СИНТЕТАЗА
7. SDHB 35 СУКЦИНАТ-ДЕГИДРОГЕНАЗА
8. ALDH4A1 31 АЛЬДЕГИД-ДЕГИДРОГЕНАЗА
9. PINK1 18 ПРОТЕИН-КИНАЗА
10. HMGCL 23 3-ГИДРОКСИ-3-МЕТИЛГЛУТАРИЛ-КОА-ЛИАЗА
11. NUDT17 3 NUDIX
12. LOC391139 19 АСТ ПОДОБНЫЙ
13. DARS2 33 АСП-ТРНК-СИНТЕТАЗА
14. MRPS14 9 БЕЛОК РИБОСОМЫ S14
15. TIMM17A 15 БЕЛОК-ТРАНСЛОКАЗА
16. GLRX2 10 ГЛУТАРЕДОКСИН2
17. LOC643536 1 ПОРИН
18. IARS2 54 ИЛЕЙ-ТРНК-СИНТЕТАЗА
19. MOSC2 36 MOCO-СУЛЬФУРАЗА
20. ACBD3 42 АЦИЛ-КОА-СВЯЗЫВАющий домен 3
21. CABC1 48 ШАПЕРОН ABC1
22. MRPL55 3 БЕЛОК РИБОСОМЫ L55
23. ABCB10 42 АТФ-СВЯЗЫВАЮЩАЯ КАССЕТА
24. C1ORF31 10 ЦИТОХРОМ-С-ОКСИДАЗА
25. TOMM20 19 БЕЛОК-ТРАНСЛОКАЗА
26. FH 22 ФУМАРАТ-ГИДРАТАЗА
27. ATPIF1 2 ИНГИБИТОР АТФ-АЗЫ
28. MECR 38 ЕНОЛ-КОА-РЕДУКТАЗА
29. AK2 29 АДЕНИЛАТ-КИНАЗА
30. MRPS15 8 БЕЛОК РИБОСОМЫ S15
31. MYCBP 10 C-MYC-СВЯЗЫВАЮЩИЙ БЕЛОК
32. NDUFS5 8 NADH-ДЕГИДРОГЕНАЗА
33. OXCT2P 1 ОКСОАЦИД-КОА-ТРАНСФЕРАЗА
34. TRIR1 42 ТРНК-ИЗОПЕНТИНИЛ-ТРАНСФЕРАЗА
35. UQCRH 13 УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА
36. ATPAF1 34 ФАКТОР СОБИРАЮЩИЙ АТФ-СИНТАЗЫ КОМПЛЕКС
37. SCP2 125 СТЕРОИД-ТРАНСПОРТЕР
38. CPT2 18 КАРНИТИН-ПАЛЬМИТОИЛ-ТРАНСФЕРАЗА
39. MRPL37 18 БЕЛОК РИБОСОМЫ L37
40. PARS2 7 ПРО-ТРНК-СИНТЕТАЗА
41. LOC652318 1 AST
42. AK3L1 78 АДЕНИЛАТ-КИНАЗА3
43. ACADM 38 АЦИЛ-КОА-ДЕГИДРОГЕНАЗА
44. MRPL20 5 БЕЛОК РИБОСОМЫ L20
45. TFB2M 26 ФАКТОР ТРАНСКРИПЦИИ
46. MRPS21 15 БЕЛОК РИБОСОМЫ S21
47. MCL1 5 МИЕЛОИДНАЯ ЛЕЙКЕМИЯ
48. MRPL9 4 БЕЛОК РИБОСОМЫ L9
49. SMCP 7 МИТОХОНДРИИ СПЕРМАТОЗОИДОВ
50. HAX1 3 HCLS1-АССОЦИИРОВАННЫЙ БЕЛОК X1
51. MTX1 5 МЕТАКСИН1 ТРАНСПОРТ БЕЛКОВ
52. DAP3 50 СМЕРТЬ-АССОЦИИРОВАННЫЙ БЕЛОК АПОПТОЗА
53. KIAA0446 19 ГИПОТЕТИЧЕСКИЙ БЕЛОК
54. MRPL24 3 БЕЛОК РИБОСОМЫ L24
55. LOC649176 1 ПОРИН
56. CASQ1 13 МИТОХОНДРИИ МЫШЦ
57. PPOX 4 ПРОТОПОРФИРИНОГЕН-ОКСИДАЗА
58. NDUFS2 15 NADH-ДЕГИДРОГЕНАЗА
59. TOMM40L 5 БЕЛОК-ТРАНСЛОКАЗА
60. SDHC 50 СУКЦИНАТ-ДЕГИДРОГЕНАЗНЫЙ КОМПЛЕКС
61. DBT 56 ДИГИДРОЛИПОАМИД-ВЕТВЯЩАЯ-ТРАНСАЦИЛАЗА
62. ACOT7 29 АЦИЛ-КОА-ТИОЭСТЕРАЗА
63. BMSC-MCP 44 ТРАНСПОРТНЫЙ БЕЛОК
64. KIF1B 171 КИНЕЗИН
65. MFN2 34 МИТОФУЗИН
66. SLC25A24 65 РАСТВОРОВ ТРАНСПОРТЕР
67. MGC4399 44 ТРАНСПОРТ БЕЛКОВ
68. AGMAT 13 АГМАТИН-УРЕОГИДРОЛАЗА
89
69. LOC440557 3 ПОДОБЕН УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗЕ
70. LOC653763 2 ГЛИЦИН-РАСЩЕПЛЯЮЩИЙ БЕЛОК
71. LOC642393 7 ПОДОБЕН БЕЛКУ РИБОСОМ L20
ХРОМОСОМА 2
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. LOC647847 25 ПОДОБЕН ГЛИЦЕРОЛ-3-ФОСФАТ-АЦИЛ-ТРАНСФЕРАЗЕ
2. LIPT1 8 ЛИПОИЛ-ТРАНСФЕРАЗА 1
3. COX5B 2 ЦИТОХРОМ-С-ОКСИДАЗА
4. MRPL30 18 БЕЛОК РИБОСОМ L30
5. MRPS9 62 -- S9
6. COQ10B 22 КОЭНЗИМ Q10 ГОМОЛОГ S. CEREVIS.
7. HSRD1 14 60 КДА БЕЛОК 1 ТЕПЛОВОГО ШОКА, ШАПЕРОНИН
8. HSPE1 3 10 КДА -- , ШАПЕРОНИН 10
9. MARS2 3 МЕТИОНИН-ТРНК-СИНТЕТАЗА 2
10. NDUFB3 14 NADH-ДЕГИДРОГЕНАЗА, СУБКОМПЛЕКС 3
11. CASP8 51 КАСПАЗА 8, ЦИСТЕИН-ПЕПТИДАЗА АПОПТОЗА
12. NDUFS1 37 NADH-ДЕГИДРОГЕНАЗА, FE-S БЕЛОК 1, КОМПЛЕКС 1
13. ACADL 37 АЦИЛ-КОА-ДЕГИДРОГЕНАЗА, ДЛИННАЯ ЦЕПЬ
14. CPS1 113 КАРБАМОИЛ-ФОСФАТ-СИНТЕТАЗА 1
15. BCS1L 4 СБОРЩИК БЕЛКОВ В КОМПЛЕКС
16. CYP27A1 34 ЦИТОХРОМ P-450 , СЕМЕЙСТВО 27
17. ABCB6 9 АТФ-СВЯЗЫВАЮЩАЯ КАССЕТА
18. MRPL44 10 БЕЛОК РИБОСОМ L44
19. NDUFA10 65 NADH-ДЕГИДРОГЕНАЗА, 42 КДА СУБКОМПЛЕКС 10
20. AGXT 11 АЛАНИН-ГЛИОКСИЛАТ-АМИНОТРАНСФЕРАЗА
21. LOC730788 1 MYC-ИНДУКТОР ПОДОБЕН
22. LOC731973 3 ПОДОБЕН 11 КДА БЕЛКУ КОМ. УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗЫ
23. HADHA 54 ГИДРОКСИАЦИЛ-КОА-ДЕГИДРОГЕНАЗА, A-СУБЪЕДИНИЦА
24. HADHB 46 -- , B-СУБЪЕДИНИЦА
25. MPV17 13 MPV17 БЕЛОК
26. MRPL33 8 БЕЛОК РИБОСОМ L33
27. LOC651697 1 ПОДОБЕН АДЕНИЛАТ-КИНАЗЕ
28. COX7A2L 11 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 7A
29. LRPPRC 109 ЛЕЙЦИН-БОГАТЫЙ БЕЛОК, ТРАНСПОРТ ВДОЛЬ МИКРОТРУБОЧЕК
30. MTIF2 38 ФАКТОР ИНИЦИАЦИИ ТРАНСЛЯЦИИ 2
31. MCEE 20 МЕТИЛ-МАЛОНИЛ-КОА-ЭПИМЕРАЗА
32. SFXN5 130 СИДЕРОФЛЕКСИН 5
33. RAB11FIP5 39 RAB11 БЕЛОК ПОСРЕДНИК
34. DGUOK 32 ДЕЗОКСИГУАНОЗИН-КИНАЗА
35. MTHFD2 17 МЕТИЛЕН-ТЕТРАГИДРОФОЛАТ-ДЕГИДРОГЕНАЗА 2
36. MRPL53 1 БЕЛОК РИБОСОМ L53
37. HTRA2 4 ВЫСОКОЙ ТЕМПЕРАТУРЫ БЕЛОК A2, СЕРИН-ПЕПТИДАЗА
38. HK2 61 ГЕКСОКИНАЗА 2
39. MRPL19 15 БЕЛОК РИБОСОМ L19
40. SUCLG1 36 СУКЦИНАТ-КОА-ЛИГАЗА
41. IMMT 51 МИТОФИЛИН, БЕЛОК ВНУТРЕННЕЙ МЕМБРАНЫ
42. MRPL35 14 БЕЛОК РИБОСОМ L35
43. LOC389049 42 ВЕРОЯТНЫЙ РЕЦЕПТОР ВВОДА
44. LOC440917 2 ПОДОБЕН ФАКТОРУ СТИМУЛИРУЮЩЕМУ ВВОД
45. C2ORF25 18 ГИПОТЕТИЧЕСКИЙ БЕЛОК
46. LOC642727 - ПОДОБЕН АТФ-СИНТАЗЕ, ЦЕПЬ A
47. GPD2 160 ГЛИЦЕРОЛ-3-ФОСФАТ-ДЕГИДРОГЕНАЗА 2
48. SLC25A12 110 ПЕРЕНОСЧИК
49. MAP1D 81 МЕТИОНИН-АМИНОПЕПТИДАЗА 1D
50. PDK1 43 ПИРУВАТ-ДЕГИДРОГЕНАЗЫ КИНАЗА 1
51. ATP5G3 5 АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0 КОМПЛЕКС, СУБЪЕДИНИЦА C3
52. MTX2 68 МЕТАКСИН 2, БЕЛКОВ ТРАНСПОРТ
53. GLS 85 ГЛУТАМИНАЗА
54. MRPS5 35 БЕЛОК РИБОСОМ S5
ХРОМОСОМА 3
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. CPOX 14 КОПРОПОРФИРИНОГЕН-ОКСИДАЗА, БИОСИНТЕЗ ГЕМА
2. TOMM70A 38 БЕЛКОВ ТРАНСЛОКАТОР, ГОМОЛОГ S. CEREVIS.
3. C3ORF1 26 БЕЛКОВ ТРАНСПОРТ , ВНУТРЕННЯЯ МЕМБРАНА
4. COX17 8 ЦИТОХРОМ-С-ОКИДАЗА, СОБИРАЮЩИЙ БЕЛОК
5. C3ORF15 64 MYCBP-СВЯЗЫВАЮЩИЙ БЕЛОК
6. NDUFB4 6 NADH-ДЕГИДРОГЕНАЗА, 15 КДА B-СУБКОМПЛЕКС 4
7. ACAD9 34 АЦИЛ-КОА-ДЕГИДРОГЕНАЗА, СЕМЕЙСТВО ОЧЕНЬ ДЛИННЫХ ЦЕПЕЙ, 9
8. MRPL3 41 БЕЛОК РИБОСОМ L3
9. PCCB 80 ПРОПИОНИЛ-КОА-КАРБОКСИЛАЗА, B-ПОЛИПЕПТИД
10. LOC651374 - ПОДОБЕН АТФ-СИНТАЗЕ, ЛИПИД-СВЯЗАННЫЙ БЕЛОК, 9
11. MRPS22 13 БЕЛОК РИБОСОМ S22
12. SLC25A36 36 ПЕРЕНОСЧИК
13. GFM1 48 G-ЭЛОНГАЦИИ ФАКТОР 1
90
14. LOC732067 1 ПОДОБЕН СУКЦИНАТ-ДЕГИДРОГЕНАЗНОМУ КОМПЛЕКСУ, СУБЪЕДИНИЦА D
15. MFN1 45 МИТОФУЗИН 1
16. LOC442098 1 ПОДОБЕН МТФ-ДЕГИДРОГЕНАЗЕ/ЦИКЛОГИДРОЛАЗЕ
17. MRPL47 17 БЕЛОК РИБОСОМ L47
18. NDUFB5 19 NADH-ДЕГИДРОГЕНАЗА, 16 КДА СУБКОМПЛЕКС B5
19. DNAJC19 6 DNAJ-ГОМОЛОГ СУБСЕМЕЙСТВО С19, ТРАНСПОРТ И УКЛАДКА БЕЛКОВ
20. MCCC1 94 МЕТИЛКРОТОНИЛ-КОА-КАРБОКСИЛАЗА 1
21. PSARL 55 ПОДОБЕН РОМБОИДУ АССОЦИАЦИЯ С ПРЕСЕНИЛИНОМ, СЕРИН-ПЕПТИДАЗА
22. OPA1 105 ЗРИТЕЛЬНАЯ АТРОФИЯ 1, МИТОХОНДРИИ НЕЙРОНОВ
23. TRNT1 24 ТРНК-НУКЛЕОТИДИЛ-ТРАНСФЕРАЗА
24. OGG1 18 8-ОКСОГУАНИН-ДНК-ГЛИКОЗИЛАЗА, РЕПАРАЦИЯ
25. VHL 11 ВАН ГИППЕЛЯ-ЛИНДАУ СИНДРОМ, СУПРЕССОР РАКА, АНТИАПОПТОЗ, ЦИКЛ
26. RAF1 80 RAF-ГОМОЛОГ ВИРУС-ЛЕЙКЕМИИ ОНКОГЕН, ПРОТЕИН-КИНАЗА
27. MRPS25 17 БЕЛОК РИБОСОМ S25
28. SH3BP5 87 SH3-ДОМЕН СВЯЗЫВАЮЩИЙ БЕЛОК 5, ВНУТРИСИГНАЛЬНЫЙ КАСКАД
29. OXSM 4 3-ОКСОАЦИЛ-ACP-СИНТАЗА
30. LOC651462 2 ПОДОБЕН 60 КДА БЕЛКУ ТЕПЛОВОГО ШОКА
31. FLJ20551 14 ГИПОТЕТИЧЕСКИЙ БЕЛОК
32. LARS2 160 ЛЕЙЦИЛ-ТРНК-СИНТЕТАЗА 2
33. UQCRC1 10 УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА, ОСНОВНОЙ БЕЛОК 1
34. SLC25A20 42 КАРНИТИН И АЦИЛКАРНИТИН ТРАНСЛОКАЗА
35. AMT 6 АМИНО-МЕТИЛ-ТРАНСФЕРАЗА, ГЛИЦИНА КАТАБОЛИЗМ
36. ALAS1 16 АМИНОЛЕВУЛИНАТ-ДЕЛЬТА-СИНТАЗА 1, БИОСИНТЕЗ ГЕМА
37. CHDH 29 ХОЛИН-ДЕГИДРОГЕНАЗА
38. PDHB 6 ПИРУВАТ-ДЕГИДРОГЕНАЗА B
39. SLC25A26 159 S-АДЕНОЗИЛ-МЕТИОНИН ТРАНСПОРТЕР
40. SUCLG2 277 СУКЦИНАТ-КОА-ЛИГАЗА, ГТФ-СПЕЦИФИЧНАЯ, ЦЕПЬ B
41. BDH1 63 3-ГИДРОКСИБУТИРАТ-ДЕГИДРОГЕНАЗА 1
42. SDHAL 32 СУКЦИНАТ-ДЕГИДРОГЕНАЗА СУБЪЕДИНИЦА A, ФЛАВОБЕЛОК ПОДОБНЫЙ 2
43. LOC642749 15 ---
43. LOC220729 16 ---
44. LOC646334 - ПОДОБЕН АТФ-СИНТАЗЕ, H-ТРАНСПОРТ, F0 КОМПЛЕКС, СУБЪЕДИНИЦА F2
45. LOC285216 51 ПОДОБЕН МТФОЛАТ-ДЕГИДРОГЕНАЗЕ/ЦИКЛОГИДРОЛАЗЕ
ХРОМОСОМА 4
ГЕН РАЗМЕР НАЗВАНИЕ
1. C4ORF14 14 ОКИСИ АЗОТА СИНТЕТАЗЫ ОРТОЛОГ ARABIDOPSIS
2. COX18 15 ЦИТОХРОМ-С-ОКСИДАЗЫ ГОМОЛОГ S. CEREVIS.
3. ALB 17 АЛЬБУМИН, ПОДДЕРЖКА ЛОКАЛИЗАЦИИ МИТОХОНДРИЙ
4. MRPL1 89 БЕЛОК РИБОСОМЫ L1
5. GK2 2 ГЛИЦЕРОЛ-КИНАЗА 2
6. LOC391674 1 ПОДОБЕН АМИНО-МЕТИЛ-ТРАНСФЕРАЗЕ
7. COQ2 21 КОЭНЗИМ-Q2-ГОМОЛОГ
8. MRPS18C 6 БЕЛОК РИБОСОМ S18C
9. NUDT9 36 NUDIX9 , ТРАНСПОРТ КАТИОНОВ
10. PPM1K 23 БЕЛОК-ФОСФАТАЗА 1K
11. LOC133083 1 ПОДОБЕН ПЕПТИДАЗЕ A
12. PDHA2 2 ПИРУВАТ-ДЕГИДРОГЕНАЗА A2
13. BDH2 23 3-ГИДРОКСИ-БУТИРАТ-ДЕГИДРОГЕНАЗА 2
14. PPA2 105 ПИРОФОСФАТАЗА 2 НЕОРГАНИЧЕСКАЯ
15. HADHSC 16 L-3-ГИДРОКСИАЦЕТИЛ-КОА-ДЕГИДРОГЕНАЗА, КОРОТКАЯ ЦЕПЬ
16. LETM1 42 ЛЕЙЦИН-СОДЕРЖАЩИЙ ТРАНСМЕМБРАННЫЙ БЕЛОК 1, ЗАСТЕЖКА-МОЛНИЯ
17. GRPEL1 8 КО-ШАПЕРОН, ВВОД БЕЛКОВ В МАТРИКС
18. PPARGC1A 98 ОБРАЗОВАНИЯ ПЕРОКСИСОМ РЕЦЕПТОР ГАММА КОАКТИВАТОР 1A,
РНК-ПОЛ 2 КОМПЛЕКС, МИТОХОНДРИЙ ОРГАНИЗАЦИЯ И БИОГЕНЕЗ
19. LIAS 18 ЛИПОЕВОЙ КИСЛОТЫ СИНТЕТАЗА
20. COX7BD 110 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 7B
21. SLC25A31 43 АДЕНИНА ТРАНСПОРТ, СПЕРМАТОЗОИДЫ
22. NDUFC1 6 NADH-ДЕГИДРОГЕНАЗА 1 , 6КДА
23. UCP1 9 БУРЫЙ ЖИР, РАЗОБЩАЮЩИЙ БЕЛОК
24. LOC345041 2 ПОДОБЕН 60 КДА БЕЛКУ ТЕПЛОВОГО ШОКА
25. ABCE1 31 АТФ-СВЯЗЫВАЮЩАЯ КАССЕТА, ПОДСЕМЕЙСТВО E1
26. MMAA 16 МЕТИЛ-МАЛОНАТ-АЦИДУРИЯ A
27. LOC649288 - ПОДОБЕН АДЕНИЛАТ-КИНАЗЕ
28. PET112L 90 ГЛУТАМИЛ-ТРНК-АМИДО-ТРАНСФЕРАЗА, ГОМОЛОГ
29. ETFDH 36 ЭЛЕКТРОН-ПЕРЕМЕЩАЮЩАЯ-ФЛАВОСОДЕРЖАЩАЯ-ДЕГИДРОГЕНАЗА
30. SLC25A4 4 АДЕНИНА ТРАНСЛОКАТОР, ПОДДЕРЖКА ГЕНОМА МТ, СКЕЛЕТНЫЕ МЫШЦЫ
31. FLJ38991 15 COX18 ПОДОБЕН, ВСТАВКА БЕЛКОВ В МЕМБРАНУ
32. LOC285442 62 ПОДОБЕН ТЕРМИНАТОРУ ТРАНСЛЯЦИИ 1
33. ATP5I 2 АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0-КОМПЛЕКС, СУБЕДИНИЦА E
ХРОМОСОМА 5
ГЕН РАЗМЕР НАЗВАНИЕ
1. MCCC2 70 МЕТИЛ-КРОТОНИЛ-КОА-КАРБОКСИЛАЗА 2
2. MRPS27 101 БЕЛОК РИБОСОМ S27
3. GFM2 46 G-ЭЛОНГАЦИИ ФАКТОР 2
91
4. DMGDH 72 ДИМЕТИЛ-ГЛИЦИН-ДЕГИДРОГЕНАЗА
5. CKMT2 33 КРЕАТИН-КИНАЗА 2, МЫШЦЫ
6. COX7C 3 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 7C
7. FTMT 1 ФЕРРИТИН
8. MRPS36 12 БЕЛОК РИБОСОМ S36
9. LOC653102 7 ПОДОБЕН СУКЦИНАТ-ДЕГИДРОГЕНАЗЕ
10. SDHA 39 СУКЦИНАТ-ДЕГИДРОГЕНАЗНЫЙ КОМПЛЕКС, СУБЪЕДИНИЦА A, ФЛАВОБЕЛОК
11. LOC731488 40 ПОДОБЕН СУКЦИНАТ-ДЕГИДРОГЕНАЗЕ
12. MRPL36 2 БЕЛОК РИБОСОМ L36
13. NDUFS6 15 NADH-ДЕГИДРОГЕНАЗЫ, FE-S , БЕЛОК 6 , 13 КДА
14. MTRR 32 5-МЕТИЛ-ТФ-ГОМОЦИСТЕИН-МЕТИЛТРАНСФЕРАЗЫ РЕДУКТАЗА,
МЕТИОНИН-СИНТЕТАЗЫ РЕДУКТАЗА
15. LOC347397 1 ПОДОБЕН 60 КДА БЕЛКУ ТЕПЛОВОГО ШОКА
16. LOC642237 2 ПОДОБЕН 60 КДА БЕЛКУ ТЕПЛОВОГО ШОКА
17. LOC646639 2 ГОМОЛОГ ТРАНСЛОКАЗЫ TOM40
18. AMACR 20 АЛЬФА-МЕТИЛ-АЦИЛ-КОА-РАЦЕМАЗА
19. ACSL6 7 АЦИЛ-КОА-СИНТЕТАЗА ДЛИННОЙ ЦЕПИ СЕМЕЙСТВА 6
20. UQCRQ 1 УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА 9, 5 КДА, КОМПЛЕКС 3, СЕ 7
21. VDAC1 33 ВОЛЬТАЖ-ЗАВИСИМЫЙ -АНИОН-КАНАЛ 1, АПОПТОЗ
22. PPP2CA 30 ПРОТЕИН-ФОСФАТАЗА 2, СУБЪЕДИНИЦА A
23. HSPA9B 20 МОРТАЛИН 2, БЕЛОК ТЕПЛОВОГО ШОКА 9B, АПОПТОЗ
24. NDUFA2 3 NADH-ДЕГИДРОГЕНАЗА, A-СУБЪКОМПЛЕКС 2, 8 КДА
25. LOC731353 1 ПОДОБЕН ГЛИЦИН-РАЗРУШАЮЩЕЙ СИСТЕМЕ
26. KIAA0141 16 ГИПОТЕТИЧЕСКИЙ БЕЛОК
27. NR3C1 158 ЯДЕРНЫЙ ГЛЮКОКОРТИКОИДНЫЙ РЕЦЕПТОР
28. GRPEL2 10 БЕЛКОВ УКЛАДЧИК , ГОМОЛОГ E. COLI
29. PPARGC1B 117 ПЕРОКСИСОМ РЕЦЕПТОРА АКТИВАТОР, МТ ОРГАНИЗАЦИЯ И БИОГЕНЕЗ
ЭСТРОГЕН-РЕЦЕПТОР
30. MRPL22 26 БЕЛОК РИБОСОМ L22
31. SFXN1 60 СИДЕРОФЛЕКСИН 1, ТРАНСПОРТ FE
32. AGXT2 50 АЛАНИН-ГЛИОКСИЛАТ-АМИНОТРАНСФЕРАЗА 2
33. OXCT1 140 3-ОКСОАЦИД-КОА-ТРАНСФЕРАЗА 1
34. NNT 103 НИКОТИНАМИД-НУКЛЕОТИД-ТРАНСГИДРОГЕНАЗА
35. MRPS30 7 БЕЛОК РИБОСОМ S30
36. NDUFS4 123 NADH-ДЕГИДРОГЕНАЗА, FE-S БЕЛОК 4, 18 КДА
37. MIMITIN 208 MIC-ИНДУКТОР БЕЛОК
38. NLN 102 НЕВРОЛИЗИН, МЕТАЛЛО-ЭНДО-ПЕПТИДАЗА
39. MRPS36 16 БЕЛОК РИБОСОМ S36
40. LOC90624 31 ОКСИДОРЕДУКТАЗА , ГИПОТЕТИЧЕСКИЙ БЕЛОК
ХРОМОСОМА 6
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. C6ORF149 153 ГИПОТЕТИЧЕСКИЙ БЕЛОК, ОКСИДОРЕДУКТАЗА
2. MCCD1 1 ДВУХСПИРАЛЬНЫЙ ЗАВИТОК ДОМЕН 1
3. HSPA1B 2 70 КДА БЕЛОК ТЕПЛОВОГО ШОКА 1B
4. BAK1 7 BLC2-АНТАГОНИСТ-КИЛЛЕР1, АПОПТОЗНЫЕ ИЗМЕНЕНИЯ МИТОХОНДРИЙ
5. MTCH1 18 ТРАНСПОРТЕР, АПОПТОЗ-ПРЕСЕНИЛИН СВЯЗАННЫЙ, ГОМОЛОГ 1 C. EL.
6. MRPS10 11 БЕЛОК РИБОСОМ S10
7. MRPL2 5 -- L2
8. C6ORF206 26 MRPS18A ПОДОБЕН
9. MRPS18A 17 БЕЛОК РИБОСОМ S18A
10. MRPL14 14 -- L14
11. SLC25A27 24 ПЕРЕНОСЧИК
12. MUT 32 МЕТИЛ-МАЛОНИЛ-КОА-МУТАЗА
13. MRPL18 8 БЕЛОК РИБОСОМ L18
14. MRPS18B 8 -- S18B
15. SOD2 14 СУПЕРОКСИД-ДИСМУТАЗА 2
16. TFB1M 67 ТРАНСКРИПЦИИ ФАКТОР B1, ПРОЦЕССИНГ РРНК
17. BPHL 34 ПОДОБЕН БИФЕНИЛ-ГИДРОЛАЗЕ
18. LOC442155 1 ПОДОБЕН ФАКТОРУ ТРАНСКРИПЦИИ B2
19. FARS2 511 ФЕНИЛАЛАНИН-ТРНК-СИНТЕТАЗА 2
20. MRS2L 23 ФАКТОР ГОМЕОСТАЗА МАГНИЯ, ГОМОЛОГ S. CEREVIS.
21. ALDH5A1 43 АЛЬДЕГИД-ДЕГИДРОГЕНАЗА, СЕМЕЙСТВО 5, ЧЛЕН A1
22. MTO1 39 ФАКТОР ОПТИМИЗАЦИИ ТРАНСЛЯЦИИ 1, ГОМОЛОГ S. CEREVIS.
23. COX7A2 6 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 7A, ПОЛИПЕПТИД 2
24. BCKDHB 240 РАЗВЕТВЛЕННЫХ ЦЕПЕЙ КЕТОКИСЛОТ-ДЕГИДРОГЕНАЗА E1, B-ПЕПТИД
БОЛЕЗНЬ КЛЕНОВОГО СИРОПА
25. DJ12208 2 ГИПОТЕТИЧЕСКИЙ БЕЛОК, ОКСИДОРЕДУКТАЗА
26. COQ3 24 КОЭНЗИМ-Q3 ГОМОЛОГ S. CEREVIS. МЕТИЛ-ТРАНСФЕРАЗА, УБИХИНОН
27. RTN4IP1 57 РЕТИКУЛОН 4 БЕЛОК-ПОСРЕДНИК 1
28. RAB32 12 RAS-СЕМЕЙСТВО, ГТФ-АЗА
29. MTHFD1L 236 МЕТИЛЕН-ТЕТРАГИДРОФОЛАТ-ДЕГИДРОГЕНАЗА ПОДОБЕН 1
30. MTRF1L 15 ФАКТОР ТРАНСЛЯЦИИ
92
ХРОМОСОМА 7
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
117
1. MRPS17 3 БЕЛОК РИБОСОМ S17
2. GBAS 35 АМПЛИФИЦИРОВАННАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ГЛИОБЛАСТОМЫ,
ГОМОЛОГ 2 NIPSNAP
3. MDH2 19 МАЛАТ-ДЕГИДРОГЕНАЗА
4. FIS1 6 ФАКТОР ДЕЛЕНИЯ 1, АПОПТОЗ, ГОМОЛОГ S. CEREVIS. , TTC11
5. PMPCB 18 B-ПЕПТИДАЗА, МИТОХОНДРИЙ ПРОЦЕССИНГ
6. DLD 30 ДИГИДРОЛИПОАМИД-ДЕГИДРОГЕНАЗА
7. IMMP2L 901 ВНУТРЕНЕЙ МЕМБРАНЫ МТ ПРОТЕАЗА 2 ПОДОБНАЯ, ГОМОЛОГ
S. CEREVIS.
8. AASS 58 АМИНОАДИПАТ-СЕМИАЛЬДЕГИД-СИНТАЗА
9. NDUFA5 17 NADH-ДЕГИДРОГЕНАЗА, 13 КДА A-СУБКОМПЛЕКС 5
10. CHCHD3 297 ДОМЕН 3 ДВУХСПИРАЛЬНЫХ ЗАВИТКОВ
11. LOC641857 - NDP-СИНТАЗЕ ПОДОБЕН
12. NDUFB2 10 NADH-ДЕГИДРОГЕНАЗА, 8 КДА B-СУБКОМПЛЕКС 2
13. MRPS33 9 БЕЛОК РИБОСОМ S33
14. SSBP1 12 БЕЛОК СВЯЗЫВАЮЩИЙ ОДНОЦЕПОЧНУЮ ДНК
15. GIMAP5 6 IMAP-СЕМЕЙСТВО, ЧЛЕН 5, ГТФ-АЗА, ИММУНИТЕТ
16. ABCB8 17 АТФ-СВЯЗЫВАЮЩАЯ КАССЕТА
17. ABCF2 19 ------
18. C7ORF23 23 ГИПОТЕТИЧЕСКИЙ БЕЛОК
19. MCFP 40 ТРАНСПОРТ
20. MTERF 8 ФАКТОР ТЕРМИНАЦИИ ТРАНСКРИПЦИИ
21. PDK4 13 КИНАЗА ПИРУВАТ-ДЕГИДРОГЕНАЗЫ
22. SLC25A13 202 ПЕРЕНОСЧИК, ЦИТРИН
23. ACN9 65 ACN9-ГОМОЛОГ S. CEREVIS.
24. ATP5J2 8 АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0-КОМПЛЕКС, СУБЪЕДИНИЦА F2
25. NDUFA4 7 NADH-ДЕГИДРОГЕНАЗА, 9 КДА A-СУБКОМПЛЕКС 4
26. TOMM7 10 БЕЛКОВ ТРАНСПОРТЕР
27. CYCS 7 ЦИТОХРОМ-С СОМАТИЧЕСКИЙ, АПОПТОЗ
28. HIBADAH 137 3-ГИДРОКСИ-ИЗОБУТИРАТ-ДГ, ПЕНТОЗО-ФОСФАТНЫЙ ШУНТ
29. MRPL32 5 БЕЛОК РИБОСОМ L32
30. MRPS24 3 БЕЛОК РИБОСОМ S24
31. OGDH 103 ОКСО-ГЛУТАРАТ-ДЕГИДРОГЕНАЗА
32. LOC730306 2 GRPE-БЕЛОК ГОМОЛОГ 1
ХРОМОСОМА 8
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. LOC647337 - ПОДОБЕН ИЗОЛЕЙЦИН-ТРНК-СИНТЕТАЗЕ
2. DECR1 51 2, 4-ДИЕНОЛ-КОА-РЕДУКТАЗА 1
3. PPM2C 9 ПРОТЕИН-ФОСФАТАЗА 2C
4. UQCRB 5 УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗУ СВЯЗЫВАЮЩИЙ БЕЛОК
5. COX6C 16 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 6C
6. SLC25A32 17 ПЕРЕНОСЧИК ФОЛАТА
7. MRPL13 50 БЕЛОК РИБОСОМ L13
8. NDUFB9 11 NADH-ДЕГИДРОГЕНАЗА, 22 КДА, B-СУБКОМПЛЕКС 9
9. CYP11B1 8 ЦИТОХРОМ P-450, СЕМЕЙСТВО 11, СУБСЕМЕЙСТВО B, ПОЛИПЕПТИД 1
10. CYP11B2 7 ПОЛИПЕПТИД 2, МЕТАБОЛИЗМ СТЕРОИДОВ
11. TOP1MT 27 ТОПОИЗОМЕРАЗА ДНК 1, МИТОХОНДРИАЛЬНАЯ
12. CYC1 3 ЦИТОХРОМ C 1
13. MTUS1 158 БЕЛОК ПОСРЕДНИК AT2-РЕЦЕПТОРА, ОПУХОЛИ СУПРЕССОР 1
14. SLC25A37 44 ПЕРЕНОСЧИК
15. BNIP3L 30 BCL2-АДЕНОВИРУСА E1B 19 КДА БЕЛКУ ПОСРЕДНИКУ 3 ПОДОБНЫЙ
16. DCTN6 28 ДИНАКТИН 6, RGD-СОДЕРЖАЩИЙ БЕЛОК, ОРГАНИЗАЦИЯ И БИОГЕНЕЗ МТ
17. GSR 49 ГЛУТАТИОН-РЕДУКТАЗА
18. STAR 8 РЕГУЛЯТОР СРОЧНОГО СТЕРОИДОГЕНЕЗА
19. VDAC3 14 ВОЛЬТАЖ-ЗАВИСИМЫЙ-АНИОН-КАНАЛ 3
20. MRPL15 13 БЕЛОК РИБОСОМ L13
21. MTFR1 66 МИТОХОНДРИЙ РЕГУЛЯТОР ДЕЛЕНИЯ 1
22. MRPS28 111 БЕЛОК РИБОСОМ S28
ХРОМОСОМА 9
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. FXN 40 ФРАТАКСИН, СИНАПСЫ, АТАКСИЯ
2. LOC645225 - ПОДОБЕН АТФ-СИНТАЗЕ, H-ТРАНСПОРТ, F0-КОМПЛЕКС, СЕ F2
3. AUH 148 AU-RNA СВЯЗЫВАЮЩАЯ, ЕНОЛ-КОА-ГИДРАТАЗА, КАТАБОЛИЗМ МРНК
4. MRPL50 9 БЕЛОК РИБОСОМ L50
5. NDUFA8 16 NADH-ДЕГИДРОГЕНАЗА, 19 КДА , СУБЪЕДИНИЦА A8
6. MRRF 58 РЕЦИКЛИНГ-ФАКТОР РИБОСОМ
7. FPGS 12 ФОЛИЛ-ПОЛИГЛУТАМАТ-СИНТАЗА
8. SLC25A25 41 ПЕРЕНОСЧИК, МЫШЦ РАЗВИТИЕ
9. ENDOG 4 ЭНДОНУКЛЕАЗА G
93
10. CRAT 16 КАРНИТИН-АЦИЛ-ТРАНСФЕРАЗА
11. SARDH 76 САРКОЗИН-ДЕГИДРОГЕНАЗА
12. MRPS2 4 БЕЛОК РИБОСОМ S2
13. PMPCA 13 A-ПЕПТИДАЗА, МАТРИКСА ПРОЦЕССИНГ
14. MRPL41 1 БЕЛОК РИБОСОМ L41
15. AK3 33 АДЕНИЛАТ-КИНАЗА 3
16. GLDC 113 ГЛИЦИН-ДЕГИДРОГЕНАЗА
17. NDUFB6 19 NADH-ДЕГИДРОГЕНАЗА, 17 КДА B-СУБКОМПЛЕКС 6
18. FLG20245 5 ГИПОТЕТИЧЕСКИЙ БЕЛОК
19. ALDH1B1 6 АЛЬДЕГИД-ДЕГИДРОГЕНАЗА СЕМЕЙСТВО 1, ЧЛЕН B 1
20. LOC286239 1 ПОДОБЕН МАЛИК-ЭНЗИМУ NAD
ХРОМОСОМА 10
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. ALDH18A1 51 АЛЬДЕГИД-ДЕГИДРОГЕНАЗА, СЕМЕЙСТВО 18, ЧЛЕН А1
2. C10ORF28 110 ГИПОТЕТИЧЕСКИЙ БЕЛОК, РОСТА ИНГИБИТОР
3. SLC25A28 10 ПЕРЕНОСЧИК
4. COX15 22 ЦИТОХРОМ-С-ОКСИДАЗУ СОБИРАЮЩИЙ БЕЛОК
5. NDUFB8 6 NADH-ДЕГИДРОГЕНАЗА, 19 КДА B-СУБКОМПЛЕКС 8
6. MRPL43 1 БЕЛОК РИБОСОМ L43
7. PEO1 7 ПРОГРЕССИВНАЯ ВНЕШНЯЯ ОФТАЛЬМОПЛЕГИЯ 1, ХЕЛИКАЗА
8. SFXN2 24 СИДЕРОФЛЕКСИН 2
9. GPAM 33 ГЛИЦЕРОЛ-3-ФОСФАТ-АЦИЛ-ТРАНСФЕРАЗА
10. CASP7 51 КАСПАЗА 7, ЦИСТЕИН-ПЕПТИДАЗА АПОПТОЗА
11. LOC390007 2 ПОДОБЕН РЕЦЕПТОРУ ВВОДА, ГОМОЛОГ ТРАНСЛОКАЗЫ TOM22
12. SFXN4 25 СИДЕРОФЛЕКСИН 4
13. PRDX3 11 ПЕРОКСИРЕДОКСИН 3, АНТИОКСИДАНТ
14. ACADSB 50 АЦИЛ-КОА-ДЕГИДРОГЕНАЗА, КОРОТКИХ ВЕТВЕЙ ЦЕПИ
15. OAT 22 ОРНИТИН-АМИНО-ТРАНСФЕРАЗА
16. BNIP3 14 BCL2 И АДЕНОВИРУСА E1B 19 КДА БЕЛОК ПОСРЕДНИК 3, АПОПТОЗ
17. MTG1 26 ГТФ-АЗА 1, ГОМОЛОГ S. CEREVIS.
18. ECHS1 10 ЕНОЛ-КОА-ГИДРАТАЗА КОРОТКИХ ЦЕПЕЙ 1
19. ATP5C1 20 АТФ-СИНТАЗА, H-ТРАНСПОРТ, F1-КОМПЛЕКС ГАММА, ПОЛИПЕПТИД 1
20. LOC650237 3 PCD-БЕЛКУ 8 ПОДОБЕН, АПОПТОЗ
21. MSRB2 25 МЕТИОНИН-СУЛЬФОКСИД-РЕДУКТАЗА B2
22. YME1L1 44 ПРОТЕАЗА, ГОМОЛОГ S. CEREVIS.
23. PAPD1 37 ПОЛИ-А-ПОЛИМЕРАЗА СВЯЗАННЫЙ ДОМЕН 1
24. ZCD1 19 ZN-СВЯЗЫВАЮЩИЙ ФАКТОР, ГЕМОПОЭТИН
25. TFAM 11 ФАКТОР ТРАНСКРИПЦИИ А
26. SLC25A16 46 ПЕРЕНОСЧИК
27. SUPV3L1 28 СУПРЕССОР VAR1, 3 ПОДОБНЫЙ, ХЕЛИКАЗА, ГОМОЛОГ S. CEREVIS.
28. AMID 21 АПОПТОЗ ИНДУЦИРУЮЩИЙ ФАКТОР АССОЦИИРОВАННЫЙ С МТ
ДИСУЛЬФИД-ОКСИДОРЕДУКТАЗА
29. MRPS16 4 БЕЛОК РИБОСОМ S16
30. VDAC2 20 ВОЛЬТАЖ-ЗАВИСИМЫЙ АНИОН КАНАЛ 2
31. PPIF 8 ПЕПТИДИЛ-ПРОЛИЛ-ИЗОМЕРАЗА F. ЦИКЛОФИЛИН
32. GLUD1 44 ГЛУТАМАТ-ДЕГИДРОГЕНАЗА 1
33. TIMM23 31 ТРАНСЛОКАЗА БЕЛКОВ
34. ASAH2 61 N-АЦИЛ-СФИНГОЗИН-АМИДОГИДРОЛАЗА 2, ЦЕРАМИДАЗА
35. LOC644567 6 ПОДОБЕН ГЛУТАМАТ-ДЕГИДРОГЕНАЗЕ 1
36. LOC653252 18 ПОДОБЕН TIMM23
37. LOC643580 11 ПОДОБЕН ГЛУТАМАТ-ДЕГИДРОГЕНАЗЕ 1, MRG2
38. LOC643828 28 ----
39. LOC644011 28 ----
ХРОМОСОМА 11
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. LOC390239 1 ПОДОБЕН NADH-ДЕГИДРОГЕНАЗЕ, СУБКОМПЛЕКС B, СУБЪЕДИНИЦА 11
2. ACAT1 26 АЦЕТИЛ-КОА-АЦЕТИЛ-ТРАНСФЕРАЗА
3. FDX1 35 ФЕРРЕДОКСИН 1
4. PPP2R1B 40 ПРОТЕИН-ФОСФАТАЗА 2, РЕГУЛЯТОРНАЯ СУБЪЕДИНИЦА А, ИЗОФОРМА В
5. DLAT 38 ДИГИДРОЛИПОАМИД-S-АЦЕТИЛ-ТРАНСФЕРАЗА, ПВК-ДГ КОМПЛЕКС
6. TIMM8B 2 ТРАНСПОРТЕР БЕЛКОВ
7. SDHD 9 СУКЦИНАТ-ДЕГИДРОГЕНАЗНЫЙ КОМПЛЕКС, СУБЪЕДИНИЦА D
8. REXO2 10 РНК-ЭКЗОНУКЛЕАЗА 2, ГОМОЛОГ S. CEREVIS.
9. ATP5L 9 АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0 КОМПЛЕКС, СУБЪЕДИНИЦА G
10. ACAD8 12 АЦИЛ-КОА-ДЕГИДРОГЕНАЗА, 8 ЧЛЕН СЕМЕЙСТВА
11. FXC1 2 FRACTURE CALUS ГОМОЛОГ 1 КРЫСЫ, БЕЛКОВ ТРАНСПОРТ, АДГЕЗИЯ
12. LOC644169 1 ПОДОБЕН VDAC1, ПОРИН
13. LOC654244 3 ПОДОБЕН ПЕРЕНОСЧИКУ БЕЛКА
14. MRPL17 1 БЕЛОК РИБОСОМ L17
15. IMMP1L 77 ВНУТРЕННЕЙ МЕМБРАНЫ ПЕПТИДАЗА
16. PDHX 80 ПВК-ДЕГИДРОГЕНАЗНЫЙ КОМПЛЕКС , КОМПОНЕНТ X
17. NDUFS3 6 NADH-ДЕГИДРОГЕНАЗА, FE-S 30 КДА БЕЛОК 3
18. MTCH2 30 ПЕРЕНОСЧИК ГОМОЛОГ C. ELEG.
19. LOC653698 2 ПОДОБЕН ПЕРЕНОСЧИКУ БЕЛКА
94
20. SIRT3 21 СИРТУИН 3, ADP-РИБОЗИЛИРОВАНИЕ БЕЛКОВ, ПОКОЙ ХРОМАТИНА
21. TIMM10 3 ТРАНСЛОКАЗА БЕЛКА
22. GLYAT 23 ГЛИЦИН-N-АЦЕТИЛ-ТРАНСФЕРАЗА
23. MRPL16 5 БЕЛОК РИБОСОМ L16
24. COX8A 2 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 8A
25. BAD 15 BCL2-АНТАГОНИСТ СМЕРТИ
26. PRDX5 4 ПЕРОКСИРЕДОКСИН 5
27. MRPL49 5 БЕЛОК РИБОСОМ L49
28. LOC283130 7 ГИПОТЕТИЧЕСКИЙ БЕЛОК, ТРАНСПОРТ
29. FIBP 4 ФАКТОР РОСТА ФИБРОБЛАСТОВ
30. MRPL11 3 БЕЛОК РИБОСОМ L11
31. PC 106 ПИРУВАТ-КАРБОКСИЛАЗА
32. NDUFV1 6 NADH-ДЕГИДРОГЕНАЗА 51 КДА ФЛАВОБЕЛОК 1
33. NUDT8 2 NUDIX8
34. NDUFS8 6 NADH-ДЕГИДРОГЕНАЗА, FE-S 23 КДА БЕЛОК 8
35. CPT1A 61 КАРНИТИН-ПАЛЬМИТОИЛ-ТРАНСФЕРАЗА 1A
36. MRPL21 15 БЕЛОК РИБОСОМ L21
37. MRPL48 77 -- L48
38. UCP2 9 РАЗОБЩАЮЩИЙ БЕЛОК 2, ПРОТОНА ТРАНСПОРТ
39. UCP3 9 --- 3
40. LOC387791 13 ПОДОБЕН РЕЦЕПТОРУ ВВОДА, ГОМОЛОГ TOM20
41. NDUFC2 12 NADH-ДЕГИДРОГЕНАЗА 1, СУБКОМПЛЕКС 2, РАЗМЕР 14, 5 КДА
42. NARS2 139 АСПАРАГИН-ТРНК-СИНТЕТАЗА 2
43. ME3 232 МАЛИК-ЭНЗИМ 3, NADP
44. SLC25A22 6 L-ГЛУТАМАТ ПЕРЕНОСЧИК
45. MRPL23 9 БЕЛОК РИБОСОМ L23
46. LOC441609 - ПОДОБЕН KCIP1
47. P53AIP1 8 P53- РЕГУЛИРУЮЩИЙ, АПОПТОЗ ИНДУЦИРУЮЩИЙ БЕЛОК 1
ХРОМОСОМА 12
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. COQ10A 4 КОЭНЗИМ-Q10 ГОМОЛОГ А
2. UNG 13 УРАЦИЛ-ДНК-ГЛИКОЗИЛАЗА
3. TSFM 15 РЕГУЛЯТОР ТРАНСЛЯЦИИ ЭЛОНГАЦИИ ФАКТОР
4. NDUFA12 32 NADH-ДГ 1, 13 КДА А-СУБКОМПЛЕКС 12, ДИФФЕРЕНЦИРОВКА
5. DNM1L 65 ОРГАНИЗАЦИИ И БИОГЕНЕЗА МЕМБРАНЫ МТ ДИНАМИН 1 ПОДОБНЫЙ
6. VAMP1 9 СИНАПТОБРЕВИН 1, С ВЕЗИКУЛАМИ АССОЦИАЦИЯ БЕЛОК МЕМБРАН 1
7. COX6A1 3 ОКСИДАЗА ЦИТОХРОМА-С, СУБЪЕДИНИЦА 6А, ПОЛИПЕПТИД 1
8. ATP5B 8 B-ПОЛИПЕПТИД АТФ-СИНТАЗЫ, H-ТРАНСПОРТ, F1 КОМПЛЕКС
9. SUOX 8 МЕТИОНИН-СУЛЬФИТ-ОКСИДАЗА
10. NDUFA9 38 NADH-ДЕГИДРОГЕНАЗА, 39 КДА 1А СУБКОМПЛЕКС 9
11. ACADS 14 АЦИЛ-КОА-ДЕГИДРОГЕНАЗА, КОРОТКАЯ ЦЕПЬ
12. CYP27B1 5 ВИТАМИНА Д БИОСИНТЕЗ, ЦИТОХРОМ P-450, СЕМЕЙСТВО 27B1
13. MTERFD3 10 ТРАНСКРИПЦИИ ТЕРМИНАТОР
14. LOC144363 1 ОКСИДОРЕДУКТАЗА, ГИПОТЕТИЧЕСКИЙ БЕЛОК
15. MRPS35 45 РИБОСОМ БЕЛОК, ДЕТЕКЦИЯ ДНК ПОВРЕЖДЕНИЙ
16. ATP5G2 12 АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0 КОМПЛЕКС, СУБЪЕДИНИЦА С2
17. CS 28 ЦИТРАТ-СИНТЕТАЗА
18. GLS2 18 ГЛУТАМИНАЗА 2, ЛЕГКИЕ
19. LOC644745 3 ПОДОБЕН 60 КДА БЕЛКУ ТЕПЛОВОГО ШОКА, ШАПЕРОНИН
20. SHMT2 5 СЕРИН-ГИДРОКСИМЕТИЛ-ТРАНСФЕРАЗА 2
21. MON2 126 MON2-ГОМОЛОГ S. CEREVIS.
22. LOC645328 3 ПОДОБЕН БЕЛКУ РИБОСОМ L40
23. MRPL42 35 РИБОСОМ БЕЛОК L42
24. LOC283398 4 ПОДОБЕН СУКЦИНИЛ-КОА-ЛИГАЗЕ, ЦЕПЬ B
25. SLC25A3 9 ПЕРЕНОСЧИК ФОСФАТ-ИОНА
26. CRY1 102 КРИПТОХРОМ 1, ПОДОБЕН ДНК-ФОТОЛИАЗЕ, ЦИРКАДИАННЫЙ РИТМ
27. LOC644203 10 ПОДОБЕН ГЛУТАРИЛ-КОА-ДЕГИДРОГЕНАЗЕ
28. NIFUN 7 ПОДОБЕН ФИКСАТОРУ АЗОТА, FE-S
29. MMAB 18 МЕТИЛ-МАЛОНАТ АЦИДУРИЯ, КОБАЛАМИН ЗАВИСИМАЯ АДЕНОЗИЛ-ТА
30. ALDH2 44 АЛЬДЕГИД-ДЕГИДРОГЕНАЗА 2, АЛКОГОЛЬ
31. COQ5 26 КОЭНЗИМ-Q5 ГОМОЛОГ, S-АДЕНОЗИЛМЕТИОНИН-МЕТИЛ-ТРАНСФЕРАЗА
32. DIABLO 18 ДЬЯВОЛ, АКТИВАТОР КАСПАЗ, ГОМОЛОГ D. MELAN.
33. MRPL51 1 РИБОСОМ БЕЛОК L51
34. LOC731007 3 ПОДОБЕН АДЕНИЛАТ-КИНАЗЕ
35. YARS2 10 ТИРОЗИН-ТРНК-СИНТЕТАЗА 2
36. LOC659538 8 ПОДОБЕН АСПАРТАТ-АМИНО-ТРАНСФЕРАЗЕ
37. MGST1 17 МИКРОСОМАЛЬНАЯ ГЛУТАТИОН-S-ТРАНСФЕРАЗА 1
38. LOC390298 1 ПОДОБЕН ТРАНСЛОКАЗЕ TIM17B
39. LOC645619 3 ПОДОБЕН АДЕНИЛАТ-КИНАЗЕ 4
40. LOC653324 1 ПОДОБЕН АТФ-СИНТАЗЕ, H-ТРАНСПОРТ, F0 КОМПЛЕКС, СЕ F2B
ХРОМОСОМА 13
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. PCCA 441 ПРОПИОНИЛ-КОА-КАРБОКСИЛАЗА А-ПОЛИПЕПТИД
2. LOC390424 - ПОДОБЕН АТФ-СИНТАЗЕ ЛИПИД-СВЯЗЫВАЮЩИЙ БЕЛОК
95
3. MRP63 3 БЕЛОК РИБОСОМЫ 63
4. MIPEP 159 ПЕПТИДАЗА-ПОСРЕДНИК , БЕЛКОВ ПРОЦЕССИНГ
5. MTIF3 15 ФАКТОР ИНИЦИАЦИИ ТРАНСЛЯЦИИ 3
6. LOC122038 - ПОДОБЕН ТРАНСЛОКАЗЕ TIM22 ГОМОЛОГ
7. LOC647298 2 ПОДОБЕН 60KDA БЕЛКУ ТЕПЛОВОГО ШОКА
8. MRPS31 41 БЕЛОК РИБОСОМЫ S31
9. SLC25A15 20 L-ОРНИТИНА ПЕРЕНОСЧИК , ЦИКЛ МОЧЕВИНЫ
10. MTRF1 47 ФАКТОР 1 ОСВОБОЖДЕНИЯ ТРАНСЛЯЦИИ
11. KIAA0564 394 УКЛАДЧИК БЕЛКОВ
12. LOC341651 4 ПОДОБЕН ФУМАРАТ-ГИДРАТАЗЕ
13. SLC25A30 23 ПЕРЕНОСЧИК РАСТВОРОВ, ПОЧКИ
14. LOC652170 2 ПОДОБЕН ЦИТОХРОМ-С-ОКСИДАЗЕ СУБЪЕДИНИЦА 4 ИЗОФОРМА 1
15. SUCLA2 59 СУКЦИНАТ-КОА-ЛИГАЗА АДФ B-СУБЪЕДИНИЦА
ХРОМОСОМА 14
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. OXA1L 5 ОКСИДАЗЫ ЦИТОХРОМА-С СБОРЩИК 1 ПОДОБНЫЙ
2. MRPL52 5 БЕЛОК РИБОСОМЫ L52
3. BCL2L2 5 BCL2 ПОДОБНЫЙ 2, АНТИАПОПТОЗ, СПЕРМАТОГЕНЕЗ
4. DHRS4 18 ДЕГИДРОГЕНАЗА-РЕДУКТАЗА NADP SDR-СЕМЕЙСТВО ЧЛЕН 4
5. PCK2 9 ФОСФО-ЕНОЛ-ПИРУВАТ-КАРБОКСИКИНАЗА 2
6. SLC25A21 493 ПЕРЕНОСЧИК ОКСОДИКАРБОКСИЛАТОВ
7. LOC644589 - ПОДОБЕН ТРАНСЛОКАЗЕ TIMM
9. L2HGDH 66 L-2-ГИДРОКСИГЛУТАРАТ-ДЕГИДРОГЕНАЗА
10. LOC647340 1 ПОДОБЕН АТФ-СИНТАЗЕ F1-КОМПЛЕКС ГАММА ИЗОФОРМА H, СЕРДЦЕ
11. UNQ9438 12 ПОДОБЕН TIMM9
12. TIMM9 19 ТРАНСЛОКАЗА БЕЛКОВ
13. ESR2 112 ЭСТРОГЕН РЕЦЕПТОР 2
14. MTHFD1 71 МЕТИЛЕН-ТЕТРАГИДРОФОЛАТ-ДЕГИДРОГЕНАЗА
15. ARG2 32 АРГИНАЗА 2, ОКИСЬ АЗОТА БИОСИНТЕЗ, ЦИКЛ МОЧЕВИНЫ, ПОЧКИ
16. SYNJ2BP 45 СИНАПТОДЖАНИН 2 СВЯЗИ БЕЛОК, ПОСРЕДНИК АКТИВИН-РЕЦЕПТОРА
17. PSEN1 84 ПРЕСЕНИЛИН 1, ПРОТЕОЛИЗ, БЕЛКОВ ПРОЦЕССИНГ, АЛЬЦГЕЙМЕР 3
18. ACOT2 6 АЦИЛ-КОА-ТИОЭСТЕРАЗА 2
19. ALDH6A1 24 АЛЬДЕГИД-ДЕГИДРОГЕНАЗА СЕМЕЙСТВА 6 ЧЛЕН А1
20. DLST 22 ДИГИДРОЛИПОАМИД-S-СУКЦИНИЛ-ТРАНСФЕРАЗА
21. GSTZ1 11 ГЛУТАТИОН-ТРАНСФЕРАЗА Z1 , АРОМАТИЧЕСКИХ АМИНОКИСЛОТ ОБМЕН
22. C14ORF159 110 ГИПОТЕТИЧЕСКИЙ БЕЛОК
23. NDUFB1 6 NADH-ДЕГИДРОГЕНАЗА B1 СУБКОМПЛЕКС 1, 7 КДА
24. COX8C 1 ЦИТОХРОМ-С-ОКСИДАЗА СУБЪЕДИНИЦА 8С
25. LOC341965 1 VDAC 3 ПОДОБНЫЙ АНИОН-КАНАЛ
26. SLC25A29 16 КАРНИТИН И АЦИЛКАРНИТИН-ТРАНСЛОКАЗЕ ПОДОБЕН
27. C14ORF68 7 ТРАНСПОРТНЫЙ БЕЛОК
28. C14ORF2 9 ГИПОТЕТИЧЕСКИЙ БЕЛОК
29. LOC122867 1 ПОДОБЕН ЦИТОХРОМ-С-ОКСИДАЗЕ СУБЪЕДИНИЦА 4
30. LOC646121 1 ПОДОБЕН АТФ-СИНТАЗЕ А-ЦЕПЬ
ХРОМОСОМА 15
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. MRPL46 7 БЕЛОК РИБОСОМ L46
2. MRPS11 10 БЕЛОК РИБОСОМ S11, ПОВРЕЖДЕНИЯ ДНК
3. POLG 19 ДНК-ПОЛИМЕРАЗА ГАММА, РЕПАРАЦИЯ , РЕПЛИКАЦИЯ
4. IDH2 19 ИЗОЦИТРАТ-ДЕГИДРОГЕНАЗА 2, NADP
5. IVD 13 ИЗОВАЛЕРИЛ-КОА-ДЕГИДРОГЕНАЗА
6. CKMT1B 7 КРЕАТИН-КИНАЗА 1B
7. CKMT1A 6 --- 1A
8. LOC645229 1 ПОДОБЕН АТФ-СВЯЗЫВАЮЩЕЙ КАССЕТЕ, СЕМЕЙСТВО B10
9. IDH3A 21 ИЗОЦИТРАТ-ДЕГИДРОГЕНАЗА 3A, NAD
10. GATM 31 ГЛИЦИН-АМИДИНО-ТРАНСФЕРАЗА
11. SQRDL 56 СУЛЬФИД-ХИНОН-РЕДУКТАЗЕ ПОДОБЕН
12. DUT 12 ДЕЗОКСИ-УТФ-ПИРОФОСФАТАЗА
13. BCL2L10 3 BCL2-ПОДОБЕН 10, ДЛЯ АПОПТОЗА, ЖЕНСКИХ ГАМЕТ ГЕНЕРАЦИЯ
14. LACTB 20 B-ЛАКТАМАЗА, БЕЛОК L56
15. KIAA0101 16 ГИПОТЕТИЧЕСКИЙ БЕЛОК
16. MTFMT 27 МЕТИОНИЛ-ТРНК-ФОРМИЛ-ТРАНСФЕРАЗА
17. CLPX 35 КАЗЕИН ПЕПТИДАЗА X, ГОМОЛОГ E. COLI, ТРАНСПОРТ, УКЛАДКА БЕЛКОВ
18. CYP11A1 28 ЦИТОХРОМ P-450, СЕМЕЙСТВО 11A, ПОЛИПЕПТИД 1
19. COX5A 18 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 5A
20. IMP3 2 IMP3 ГОМОЛОГ, МЯ-РНК, РРНК ПРОЦЕССИНГ, БЕЛОК РИБОСОМ S4
21. ETFA 95 ЭЛЕКТРОН-ПЕРЕНОСЯЩИЙ-ФЛАВОБЕЛОК, A-ПОЛИПЕПТИД
ХРОМОСОМА 16
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. LOC645443 3 ПОДОБЕН АТФ-СИНТАЗЕ А-ЦЕПЬ
2. DHODH 17 ДИГИДРООРОТАТ-ДЕГИДРОГЕНАЗА, СИНТЕЗ ПИРИМИДИНОВ
3. LDHD 5 ЛАКТАТ-ДЕГИДРОГЕНАЗА D
96
4. KARS 20 ЛИЗИЛ-ТРНК-СИНТЕТАЗА
5. LOC124496 1 ПОДОБЕН АТФ-СИНТАЗЕ, B-ЦЕПЬ
6. WWOX 370 WW-ДОМЕН СОДЕРЖАЩИЙ ОКСИДОРЕДУКТАЗЫ
7. GCSH 13 ГЛИЦИН-РАСЩЕПЛЯЮЩЕЙ СИСТЕМЫ БЕЛОК-H, АМИНОМЕТИЛ-ПЕРЕНОСЧИК
8. MLYCD 17 МАЛОНИЛ-КОА-ДЕКАРБОКСИЛАЗА
9. COX4NB 21 COX4-СОСЕД, ФУНКЦИЯ НЕИЗВЕСТНА
10. COX4I1 7 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 4, ИЗОФОРМА 1
11. CA5A 48 АНГИДРАЗА УГОЛЬНОЙ КИСЛОТЫ 5A
12. LOC731439 19 ПОДОБЕН АНГИДРАЗЕ УГОЛЬНОЙ КИСЛОТЫ
13. CYBA 8 ЦИТОХРОМ B-245, А-ПОЛИПЕПТИД, МЕТАБОЛИЗМ СУПЕРОКСИДА
14. SPG7 49 СПАСТИЧЕСКАЯ ПАРАПЛЕГИЯ 7, ПРОТЕОЛИЗ, АДГЕЗИЯ, ЦНС РАЗВИТИЕ
15. AFG3L1 24 АТФ-АЗА СЕМЕЙСТВА 3, ПОДОБЕН 1
16. MRPL28 3 БЕЛОК РИБОСОМ L28, МЕЛАНОМЫ АНТИГЕН
17. NME4 3 НЕМЕТАСТАТИЧЕСКИЕ КЛЕТКИ 4, НУКЛЕОЗИД-ДИФОСФАТ-КИНАЗА 4
18. MRPS34 2 БЕЛОК РИБОСОМ S34
19. RHOT2 6 RAS-ГОМОЛОГ, СЕМЕЙСТВО T2, ГТФ-АЗА, СИГНАЛ-ТРАНСДУКТОР
20. NDUFB10 2 NADH-ДЕГИДРОГЕНАЗА 1, B-СУБКОМПЛЕКС 10, 22 КДА
21. DCI 12 ДОДЕЦЕНОЛ-КОА-ДЕЛЬТА-ИЗОМЕРАЗА
22. TRAP1 59 TFN-РЕЦЕПТОР-СВЯЗАННЫЙ БЕЛОК 1, ТУМОР НЕКРОТИЧЕСКИЙ ФАКТОР
23. MAGMAS 13 БЕЛОК ПЕРЕДАЮЩИЙ СИГНАЛ, ФСК ГРАНУЛОЦИТОВ И МАКРОФАГОВ
24. DNAJA3 31 DNAJ-ГОМОЛОГ D. MELAN. СУБСЕМЕЙСТВО A3, АПОПТОЗ, HSP40
25. ABAT 110 4-АМИНОБУТИРАТ-АМИНО-ТРАНСФЕРАЗА, ГАМК МЕТАБОЛИЗМ, СИНАПСЫ
26. MRV17L 13 MRV17 - ПОДОБЕН
27. COQ7 13 КОЭНЗИМ-Q7 ГОМОЛОГ
28. ACSM 73 АЦИЛ-КОА-СИНТЕТАЗА, СРЕДНИХ ЦЕПЕЙ СЕМЕЙСТВО, ЧЛЕН 1
29. LOC57149 24 ГИПОТЕТИЧЕСКИЙ БЕЛОК, ОКСИДОРЕДУКТАЗА
30. EARS2 36 ГЛУТАМИЛ-ТРНК-СИНТЕТАЗА 2
31. NDUFAB1 16 NADH-ДГ 1, AB-СУБКОМПЛЕКС 1, 8 КДА, АЦИЛ-ТРАНСПОРТ
32. CLN3 14 ЦЕРОИД-ЛИПОФУСЦИНОЗ, ЮВЕНИЛЬНЫЙ НЕЙРОНАЛЬНЫЙ 3, УКЛАДЧИК
33. TUFM 4 ФАКТОР ЭЛОНГАЦИИ ТРАНСЛЯЦИИ TU
34. BCKDK 4 РАЗВЕТВЛЕННЫХ ЦЕПЕЙ КЕТОКИСЛОТ ДЕГИДРОГЕНАЗЫ КИНАЗА
35. LOC649171 12 ПОДОБЕН АНГИДРАЗЕ УГОЛЬНОЙ КИСЛОТЫ 5A
36. COQ9 13 КОЭНЗИМ-Q9 ГОМОЛОГ S. CEREVIS.
37. GOT2 27 ГЛУТАМАТ-ОКСАЛОАЦЕТАТ-ТРАНСФЕРАЗА 2
38. TK2 41 ТИМИДИН-КИНАЗА 2, РЕПЛИКАЦИЯ ДНК
39. PDP2 7 ПИРУВАТ-ДЕГИДРОГЕНАЗЫ ФОСФАТАЗА 2
40. DDX28 3 DEAD-БОКС ПОЛИПЕПТИД 28, ASP-GLU-ALA-ASP И HIS, ХЕЛИКАЗА
41. PDF 2 ПЕПТИД-ДЕФОРМИЛАЗА
42. CYB5B 42 ЦИТОХРОМ B5, ТИП B
43. COX6A2 1 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 6A, ПОЛИПЕПТИД 2
ХРОМОСОМА 17
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. TIMM22 5 ТРАНСПОРТЕР БЕЛКОВ
2. YWHAE 56 ТИРОЗИН-3-МАО И ТРИПТОФАН-5-МАО АКТИВИРУЮЩИЙ БЕЛОК ЭПСИЛОН
3. SLC25A11 3 ТРАНСПОРТ ОКСОГЛУТАРАТА
4. C1QBP 7 КОМПЛЕМЕНТА КОМПОНЕНТ 1, Q-СУБКОМПЛЕКС СВЯЗЫВАЮЩИЙ БЕЛОК
5. ACADVL 5 АЦИЛ-КОА-ДЕГИДРОГЕНАЗА , ОЧЕНЬ БОЛЬШИЕ ЦЕПИ
6. TP53 19 БЕЛОК ОПУХОЛЕЙ P53, РЕГУЛЯТОР ПРОНИЦАЕМОСТИ МИТОХОНДРИЙ
7. SCO1 17 SCO-ЦИТОХРОМ-ОКСИДАЗА, СБОРКА КОМПЛЕКСА, ГОМОЛОГ ДРОЖЖЕЙ
8. COX10 139 COX10-ГОМОЛОГ, ЦИТОХРОМ-С-ОКСИДАЗЫ, СОБИРАЮЩИЙ БЕЛОК
ПРОТОГЕМ-9-ФАРНЕЗИЛ-ТРАНСФЕРАЗА
9. AKAP10 73 ДВОЙНОЙ СПЕЦИФИЧНОСТИ А-КИНАЗА, ЗАКРЕПЛЯЕТ БЕЛОК 10
10. NT5M 44 5, 3-НУКЛЕОТИДАЗА
11. PEMT 86 ФОСФАТИДИЛЭТАНОЛАМИН-N-МЕТИЛ-ТРАНСФЕРАЗА
12. ATPAF2 21 АТФ-СИНТАЗА, F1-КОМПЛЕКС, СОБИРАЮЩИЙ ФАКТОР 2
13. FDXR 10 ФЕРРЕДОКСИН-РЕДУКТАЗА
14. ATP5H 8 АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0-КОМПЛЕКС, СУБЪЕДИНИЦА D
15. MRPS7 5 БЕЛОК РИБОСОМ S7
16. SLC25A19 17 ТРАНСПОРТЕР ДЕЗОКСИНУКЛЕОТИДОВ
17. MRPS38 6 БЕЛОК РИБОСОМ S38
18. MRPL12 5 БЕЛОК РИБОСОМ L12
19. SLC25A10 8 ТРАНСПОРТЕР ДИКАРБОНОВЫХ КИСЛОТ
20. LOC651191 1 ПОДОБЕН ФАКТОРУ ЭЛОНГАЦИИ TU
21. CENTA2 37 ЦЕНТАУРИН A2, СВЯЗЫВАЕТ БЕЛКИ МОСТИКОМ, РЕГУЛЯЦИЯ ГТФ-АЗЫ
22. RHOT2 84 RAS-ГОМОЛОГ, СЕМЕЙСТВО T 1, ГТФ-АЗА, СИГНАЛ-ТРАНСДУКТОР
23. MRM1 7 РРНК-МЕТИЛ-ТРАНСФЕРАЗА 1, ГОМОЛОГ S. CEREVIS.
24. MRPL45 3 БЕЛОК РИБОСОМ L45
25. STARD3 26 БЕЛОК РЕГУЛЯЦИИ СРОЧНОГО СТЕРОИДОГЕНЕЗА, ТРАНСПОРТ
26. NAGS 4 N-АЦЕТИЛ-ГЛУТАМАТ-СИНТЕТАЗА, ЦИКЛ МОЧЕВИНЫ
27. CGI-69 5 ГИПОТЕТИЧЕСКИЙ БЕЛОК , ТРАНСПОРТ
28. MRPL10 8 БЕЛОК РИБОСОМ L10
29. ATP5G1 3 АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0 СУБКОМПЛЕКС, СУБЪЕДИНИЦА C1
30. PHB 11 ПРОХИБИТИН, РЕГУЛЯЦИЯ АПОПТОЗА, ДНК РЕПЛИКАЦИИ, ЦИКЛА
31. PDK2 16 ПИРУВАТ-ДЕГИДРОГЕНАЗЫ КИНАЗА, ИЗОЭНЗИМ 2
32. MRPL27 5 БЕЛОК РИБОСОМ L27
33. COX11 17 COX11-ГОМОЛОГ, ЦИТОХРОМ-С-ОКСИДАЗЫ, КОМПЛЕКС СБОРЩИК
97
34. AKAP1 36 К А-КИНАЗЕ ЗАЯКОРЕННЫЙ БЕЛОК 1, СВЯЗВАЕТ РНК, СПЕРМАТИДЫ
35. MRPS23 11 БЕЛОК РИБОСОМ S23
36. BZRAP1 27 БЕНЗОДИАЗЕПИНОВ РЕЦЕПТОР АССОЦИИРОВАННЫЙ БЕЛОК 1
37. SEPT4 12 СЕПТИН 4, АПОПТОЗ, КЛЕТОЧНЫЙ ЦИКЛ
38. PTRH2 10 ПЕПТИДИЛ-ТРНК-ГИДРОЛАЗА 2, BCL2-ИНГИБИТОР ТРАНСКРИПЦИИ
39. POLG2 20 ДНК-ПОЛИМЕРАЗА ГАММА 2, ВСПОМОГАТЕЛЬНАЯ СУБЪЕДИНИЦА
40. LOC651054 18 ПОДОБЕН ДНК-ЗАВИСИМОЙ РНК-ПОЛИМЕРАЗЕ
41. LOC284100 42 ПОДОБЕН 14-3-3E, СТИМУЛЯЦИЯ ВВОДА В МИТОХОНДРИИ
42. LOC653479 38 ПОДОБЕН БЕЛКУ РИБОСОМ L45
43. BIT1 10 BCL2-ИНГИБИТОР ТРАНСКРИПЦИИ, АПОПТОЗ
ХРОМОСОМА 18
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЯ
1. LOC650194 1 ПОДОБЕН ПЕРЕНОСЧИКУ ТРИПЛЕТНЫХ ПОВТОРОВ
2. NDUFV2 31 NADH-ДГ ФЛАВОБЕЛОК2 24KDA, НЕРВНОЙ СИСТЕМЫ РАЗВИТИЕ
3. NARG 25 N-ЭТИЛМАЛЕИМИД-ЧУВСТВИТЕЛЬНЫЙ ФАКТОР СОЕДИНЕН БЕЛОК ГАММА,
ТРАНСПОРТ И СБОРКА БЕЛКОВ
4. AFG3L2 48 AFG3-АТФАЗА СЕМЕЙСТВО 3 ПОДОБНЫЙ 2, ПРОТЕОЛИЗ
5. MIB1 130 MINDBOMB - ГОМОЛОГ 1 ДРОЗОФИЛЫ, БЕЛКОВ УБИКВИТАЦИЯ
6. LOC440490 - ПОДОБЕН СТРЕСС БЕЛКУ 70, МОРТАЛИН
7. MCART2 1 ПЕРЕНОСЧИК ТРИПЛЕТНЫХ ПОВТОРОВ 2
8. ATP5A1 14 АТФ-СИНТАЗА, H-ТРАНСПОРТ, F1 КОМПЛЕКС A, СУБЪЕДИНИЦА 1, СЕРДЦЕ
9. ACAA2 30 АЦЕТИЛ-КОА-АЦИЛ-ТРАНСФЕРАЗА 2
10. ME2 69 МАЛИК-ЭНЗИМ 2, HAD
11. FECH 39 ФЕРРОХЕЛАТАЗА, ГЕМ БИОСИНТЕЗ, ПРОТОПОРФИРИЯ
12. BCL2 197 B-КЛЕТОЧНАЯ ЛИМФОМА 2, ОСВОБОЖДЕНИЕ ЦИТОХРОМА-С ИЗ МТ,
АПОПТОЗ
13. LOC731095 1 ПОДОБЕН АТФ-СИНТАЗЕ
14. LOC653892 2 --
15. CYB5A 39 ЦИТОХРОМ B5 ТИП А
16. C18ORF22 12 R-RNA ПРОЦЕССИНГ
ХРОМОСОМА 19
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. UQCRFS1 5 УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА, РИСКЕ FE-S ПОЛИПЕПТИД 1
2. COX6B1 9 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 6B, ПОЛИПЕПТИД 1
3. COX7A1 2 --- 7A, ПОЛИПЕПТИД 1
4. ECH116 16 ЕНОЛ-КОА-ГИДРАТАЗА 1
5. SARS2 15 СЕРИЛ-ТРНК-СИНТЕТАЗА 2
6. MRPS12 2 БЕЛОК РИБОСОМ S12
7. TIMM50 11 БЕЛКОВ ТРАНСЛОКАТОР
8. BCKDHA 27 ВЕТВЕЙ ЦЕПИ КЕТОКИСЛОТ-ДЕГИДРОГЕНАЗА, ПОЛИПЕПТИД A
9. ETHE1 22 ЭТИЛ-МАЛОНОВАЯ ЭНЦЕФАЛОПАТИЯ 1
10. TOMM40 13 БЕЛКОВ ТРАНСЛОКАЗА
11. OPA3 57 ЗРИТЕЛЬНАЯ АТРОФИЯ 3
12. BBC3 11 BLC2-СВЯЗЫВАЮЩИЙ КОМПОНЕНТ, АПОПТОЗ
13. BCAT2 16 ВЕТВЕЙ ЦЕПИ АМИНОТРАНСФЕРАЗА 2
14. BAX 7 BCL2-СВЯЗАННЫЙ БЕЛОК X, АПОПТОЗ
15. CPT1C 22 КАРНИТИН-ПАЛЬМИТОИЛ-ТРАНСФЕРАЗА 1C
16. POLRMT 6 РНК-ПОЛИМЕРАЗА
17. ETFB 21 ЭЛЕКТРОН-ПЕРЕНОСЯЩИЙ-ФЛАВОПРОТЕИН, ПОЛИПЕПТИД B
18. PPP2R1A 36 ПРОТЕИН-ФОСФАТАЗА 2
19. NDUFA3 4 NADH-ДЕГИДРОГЕНАЗА, 9 КДА СУБКОМПЛЕКС 3
20. COX6B 5 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 6B, ПОЛИПЕПТИД 2, ТЕСТИС
21. LOC440544 3 ПОДОБЕН ГЛИЦЕРОЛ-3-ФОСФАТ-ДЕГИДРОГЕНАЗЕ
22. LOC649204 1 -
23. GPX4 3 ГЛУТАТИОН-ПЕРОКСИДАЗА 4, СЕЛЕН
24. ATP5D 3 АТФ-СИНТАЗА, H-ТРАНСПОРТ, F1 КОМПЛЕКС, ДЕЛЬТА
25. NDUFS7 12 NADH-ДЕГИДРОГЕНАЗА, 20 КДА FE-S БЕЛОК 7
26. UQCR 9 УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА, СУБЪЕДИНИЦА 6, 4 КДА
27. TIMM13 3 БЕЛКОВ ТРАНСЛОКАТОР
28. MRPL54 4 БЕЛОК РИБОСОМ L54
29. PRSS15 29 СЕРИН-ПРОТЕАЗА 15
30. NDUFA11 9 NADH-ДЕГИДРОГЕНАЗА, 14, 7 КДА СУБКОМПЛЕКС A11
31. CLPP 9 КАЗЕИНОЛИТИЧЕСКАЯ ПРОТЕАЗА , ГОМОЛОГ E. COLI.
32. MGC34725 9 ГИПОТЕТИЧЕСКИЙ БЕЛОК
33. SLC25A23 20 ПЕРЕНОСЧИК , КАЛЬЦИЙ
34. TIMM44 17 БЕЛКОВ ТРАНСЛОКАТОР
35. NDUFA7 10 NADH-ДЕГИДРОГЕНАЗА, 14, 5 КДА СУБКОМПЛЕКС A7
36. MRPL4 8 БЕЛОК РИБОСОМ L4
37. GCDH 9 ГЛУТАРИЛ-КОА-ДЕГИДРОГЕНАЗА
38. NDUFB7 6 NADH-ДЕГИДРОГЕНАЗА, 18 КДА СУБКОМПЛЕКС B7
39. LOC648662 1 ПОДОБЕН РНК-ПОЛИМЕРАЗЕ
40. MRPL34 1 БЕЛОК РИБОСОМ L34
41. GTPBP3 5 ГТФ-СВЯЗЫВАЮЩИЙ БЕЛОК 3
42. MGC26694 49 ГИПОТЕТИЧЕСКИЙ БЕЛОК
98
43. NDUFA13 13 NADH-ДЕГИДРОГЕНАЗА, 1 A СУБКОМПЛЕКС 13
44. LOC654085 1 ПОДОБЕН ГЛИЦИН-РАСЩЕПЛЯЮЩЕМУ БЕЛКУ
ХРОМОСОМА 20
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. IDH3B 6 ИЗОЦИТРАТ-ДЕГИДРОГЕНАЗА 3B
2. MRPS26 3 БЕЛОК РИБОСОМ S26
3. VISA 21 АНТИВИРУСНЫЙ СИГНАЛЬНЫЙ БЕЛОК
4. PANK2 35 ПАНТОТЕНАТ-КИНАЗА 2
5. CDS2 65 ЦИТИДИЛ-ТРАНСФЕРАЗА 2
6. CRLS1 31 КАРДИОЛИПИН-СИНТЕТАЗА 1
7. ACSS1 51 АЦИЛ-КОА-СИНТЕТАЗА 1
8. COX4I2 7 ЦИТОХРОМ-С-ОКСИДАЗА 4I2
9. BCL2L1 59 BCL2 ПОДОБНЫЙ ФАКТОР АНТИАПОПТОЗА 1
10. NFS1 30 АЗОТА ФИКСАТОР 1 ГОМОЛОГ S. CEREV.
11. TOMM34 18 ТРАНСЛОКАЗА
12. CYP24A1 1 ЦИТОХРОМ-P-450 СЕМЕЙСТВО 24 A1
13. ATP5E 3 АТФ-СИНТАЗА H-ТРАНСПОРТ КОМПЛЕКС E
14. PRPR6 51 СПЛАЙСИНГ
15. C20ORF14 51 ПРЕДПОЛАГАЕМЫЙ РЕЦЕПТОР ВВОДА БЕЛКОВ И СПЛАЙСИНГ
ХРОМОСОМА 21
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. MRPL39 22 БЕЛОК РИБОСОМ L39
2. ATP5J 11 АТФ-СИНТАЗА H-ТРАНСПОРТ КОМПЛЕКС J
3. ATP50 12 --
4. MRPS6 70 БЕЛОК РИБОСОМ S6
5. NDUFV3 16 NADH-ДЕГИДРЛГЕНАЗА ФЛАВОПРОТЕИН 3
6. C21ORF33 12 ГОМОЛОГ E. COLI ES1
7. C21ORF2 10 ЗНАЧЕНИЕ НЕИЗВЕСТНО
ХРОМОСОМА 22
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. HSC20 15 КО-ШАПЕРОН
2. NIPSNAP1 27 ГОМОЛОГ C. ELEGANS
3. UCRC 3 УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА КОМПЛЕКС
4. MTP18 3 БЕЛОК АПОПТОЗА 18 КДА
5. LOC441996 1 ПОДОБЕН АКОНИТАЗЕ 2
6. TXN2 15 ТИОРЕДОКСИН 2
7. TST 9 ТИОСУЛЬФАТ-СЕРА-ТРАНСФЕРАЗА
8. MPST 10 МЕРКАПТОПИРУВАТ-СЕРА-ТРАНСФЕРАЗА
9. GCAT 9 ГЛИЦИН-С-АЦЕТИЛ-ТРАНСФЕРАЗА
10. TOMM22 3 ТРАНСЛОКАЗА БЕЛКОВ
11. SLC25A17 50 РАСТВОРОВ ТРАНСПОРТ
12. ACO2 60 АКОНИТАЗА 2
13. NDUFA6 6 NADH-ДЕГИДРОГЕНАЗА
14. MT 9 МАЛОНИЛ-ТРАНСФЕРАЗА
15. TSPO 12 ТРАНСЛОКАТОР
16. SAMM50 41 ГОМОЛОГ S. CEREVIS.
17. TRMU 22 МЕТИЛ-ТРАНСФЕРАЗА ПРОЦЕССИНГ ТРНК
18. SCO2 2 ЦИТОХРОМ-ОКСИДАЗА
19. ECGF1 5 ФАКТОР РОСТА ЭНДОТЕЛИЯ СОХРАНЯЕТ ГЕНОМ МТ
20. SLC25A18 28 РАСТВОРОВ ТРАНСПОРТ
21. BCL2L13 90 BLC2-ПОДОБНЫЙ КАСПАЗ АКТИВАТОР
22. BID 40 BH3-ПОСРЕДНИК УСИЛИТЕЛЬ СМЕРТИ
23. PRODH 24 ПРОЛИН-ДЕГИДРОГЕНАЗА
24. SLC25A1 3 РАСТВОРОВ ТРАНСПОРТ
25. MRPL40 4 БЕЛОК РИБОСОМ L40
26. TXNRD2 65 ТИОРЕДОКСИН-РЕДУКТАЗА 2
27. LOC646677 - ПОДОБЕН АКОНИТАЗЕ 2
28. BZRP 11 РЕЦЕПТОР БЕНЗОДИАЗЕПИНОВ
ХРОМОСОМА X
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. SLC9A6 62 РАСТВОРОВ ТРАНСПОРТ
2. SLC25A6 6 ТРАНСПОРТ АТФ, АДФ
3. HCCS 11 ГОЛОЦИТОХРОМ-С-СИНТАЗА
4. CA5B 47 КАРБОНАТ-ДЕГИДРАТАЗА 5B
5. PDHA1 16 ПИРУВАТ-ДЕГИДРОГЕНАЗА A1
6. ACOT9 40 АЦИЛ-КОА-ТИОЭСТЕРАЗА 9
7. PDK3 69 КИНАЗА ПИРУВАТ-ДЕГИДРОГЕНАЗЫ 9
8. GK 78 ГЛИЦЕРОЛ-КИНАЗА
9. IDH3G 9 ИЗОЦИТРАТ-ДЕГИДРОГЕНАЗА 3G
10. MTCP1 10 ФАКТОР ПРОЛИФЕРАЦИИ ЗРЕЛЫХ Т-КЛЕТОК 1
11. LOC648605 38 ПОДОБЕН ТРИМЕТИЛЛИЗИН-ДИОКСИГЕНАЗЕ
99
12. OTC 69 ОРНИТИН-КАРБАМОИЛ-ТРАНСФЕРАЗА
13. MAOA 87 МОНОАМИНО-ОКСИДАЗА А
14. MAOB 116 -- B
15. NDUFB11 3 NADH-ДЕГИДРОГЕНАЗА НЕЙРОНОВ
16. LOC648399 - ПОДОБЕН ОРНИТИН-АМИНО-ТРАНСФЕРАЗЕ
17. TIMM17B 5 ТРАНСЛОКАЗА БЕЛКА
18. LOC648603 1 ПОДОБЕН 3-КЕТОАЦИЛ-КОА-ТИОЛАЗЕ
19. HADH2 3 ГИДРОКСИАЦИЛ-КОА-ДЕГИДРОГЕНАЗА 2
20. ALAS2 22 АМИНОЛЕВУЛИНАТ-СИНТАЗА 2 , СИНТЕЗ ГЕМА
21. LOC644924 54 ПОДОБЕН АСТ
22. ABCB7 103 АТФ-СВЯЗЫВАЮЩАЯ КАССЕТА 7
23. COX7B 5 ЦИТОХРОМ-С-ОКСИДАЗА 7B
24. TIMM8A 3 ТРАНСЛОКАЗА БЕЛКА
25. MCART6 57 ПЕРЕНОСЧИК
26. LOC203427 55 ПЕРЕНОСЧИК РАСТВОРОВ
27. SLC25A5 3 --
28. NDUFA1 5 NADH-ДЕГИДРОГЕНАЗА A1
29. GLUD2 3 ГЛУТАМАТ-ДЕГИДРОГЕНАЗА 2
30. PDCD8 36 ПРОГРАММА СМЕРТИ ПОСЛЕ ДНК ПОВРЕЖДЕНИЯ 8
31. SLC25A14 33 ПЕРЕНОСЧИК АНИОНОВ, БЕЛОК-РАЗОБЩИТЕЛЬ /UNCOUPLING/
32. CYBB 33 ЦИТОХРОМ-B-245
33. LOC643554 - ПОДОБЕН ОРНИТИН-АМИНО-ТРАНСФЕРАЗЕ
34. LOC643687 6 ПОДОБЕН 3-КЕТОАЦИЛ-КОА-ТИОЛАЗЕ
35. PIN4 16 ПАРВУЛИН 4
36. LOC644394 - ПОДОБЕН TIMM8
37. TMLHE 123 3-МЕТИЛЛИЗИН-ГИДРОКСИЛАЗА
ХРОМОСОМА Y
ГЕН РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. SLC25A6 6 ПЕРЕНОСЧИК
Приложение 2.
ВАРИАНТ ГЕНОМА МИТОХОНДРИИ ЧЕЛОВЕКА ИЗ АФРИКИ, ЙОРУБА. Размер 1-16571 п. н.
ГЕН РАЗМЕР П. Н. НАЗВАНИЕ И ПРИМЕЧАНИЕ
1. TRNF 579-649 ТРНК ФЕНИЛАЛАНИНА
2. RNR1 650-1603 12S РНК РИБОСОМЫ
3. TRNV 1604-1672 ТРНК ВАЛИНА
4. RNR2 1673-3230 16S РНК РИБОСОМЫ
5. TRNL1 3231-3305 ТРНК 1 ЛЕЙЦИНА UUA/UUG
6. ND1 3308-4264 NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 1
7. TRNI 4264-4332 ТРНК ИЗОЛЕЙЦИНА
8. TRNQ 4330-4401 ТРНК ГЛУТАМИНА
9. TRNM 4403-4470 ТРНК МЕТИОНИНА
10. ND2 4471-5514 NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 2
11. TRNW 5513-5580 ТРНК ТРИПТОФАНА
12. TRNA 5580-5656 ТРНК АЛАНИНА
13. TRNN 5658-5730 ТРНК АСПАРАГИНА
14. TRNC 5762-5827 ТРНК ЦИСТЕИНА
15. TRNY 5827-5892 ТРНК ТИРОЗИНА
16. COX1 5905-7446 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЕДИНИЦА 1
17. TRNS1 7446-7517 ТРНК 1 СЕРИНА UCN
18. TRND 7519-7586 ТРНК АСПАРАГИНОВОЙ КИСЛОТЫ
19. COX2 7587-8270 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 2
20. TRNK 8396-8365 ТРНК ЛИЗИНА
21. ATP8 8367-8573 АТФ-СИНТАЗА, F0 КОМПЛЕКС, СУБЪЕДИНИЦА 8
22. ATP6 8528-9208 АТФ-СИНТАЗА, F0 КОМПЛЕКС, СУБЪЕДИНИЦА 6
23. COX3 9208-9988 ЦИТОХРОМ-С-ОКСИДАЗА, СУБЕДИНИЦА 3
24. TRNG 9992-10052 ТРНК ГЛИЦИНА
25. ND3 10060-10405 NADH-ДЕГИДРОГЕНАЗА, СУБЪЕДИНИЦА 3
26. TRNR 10406-10470 ТРНК АРГИНИНА
27. ND4L 10471-10767 NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 4L
28. ND4 10761-12138 NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 4
29. TRNH 12139-12207 ТРНК ГИСТИДИНА
30. TRNS2 12208-12266 ТРНК 2 СЕРИНА AGU/AGC
100
31. TRNL2 12267-12337 ТРНК 2 ЛЕЙЦИНА CUN
32. ND5 12338-14149 NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 5
33. ND6 14150-14674 NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 6
34. TRNE 14675-14743 ТРНК ГЛУТАМИНОВОЙ КИСЛОТЫ
35. CYTB 14748-15882 ЦИТОХРОМ B
36. TRNT 15889-15954 ТРНК ТРЕОНИНА
37. TRNP 15954-16024 ТРНК ПРОЛИНА
Приложение 3.
Список генов-гигантов, размером более 400 тпн и их функция. Сделал и
перевел Курносов М.Н.2008 год.
Проведен анализ функции и экспрессии генов большого размера. Гены общего
назначения, которые функционируют в разных тканях, обозначены буквой "о".
Гены неизвестной функции "х".
Гены работающие преимущественно в нервной системе "н".
Их количество составило "х" - 25, "о" - 139, "н" - 160. Таким образом среди
генов-гигантов размером более 400 тпн, количество генов имеющих отношение
к ЦНС составило около 49, 4 процентов.
В связи с тем, что геном недостаточно изучен, этот процент может быть
значительно больше.
ХР ГЕН РАЗМЕР МАКС-ИНТРОН НАЗВАНИЕ И ПРИМЕЧАНИЕ
1 CLCC1 490 o i4 -153 Хлорид-канал 1
CAMTA1 990 н i3 -264 Кальмодулин связывающий активатор
транскрипции 1,
делеция при глиоме, нейробластоме
KIAA1026 470 x i2 -362 Гипотетический белок
CSMD2 650 н i67-100 CUB и SUSHI мембранные домены 2,
повышена экспрессия в мозге
MACF1 406 o i3 -146 Микротрубочки-актин соединяющий фактор
1, WNT путь, развитие эмбриона
HIVEP3 409 o i8 -218 Иммунодефицита вируса энхансер 3,
воспаление, апоптоз, масса кости
AGBL4 462 o i5 -204 АТФ-ГТФ-связывающий белок 4
FAF1 520 x i9 -122 FAS ассоциированный фактор 1
DAB1 1253 н i16-366 DISABLED гомолог 1, развитие коры
нервной системы
ROR1 404 н i1 -232 Рецептор тирозин-киназы подобной орфан
рецептор 1, модуляция роста нейритов
в ЦНС
NEGR1 880 н i6 -347 Регулятор роста нейронов 1
SLC44A5 404 н i22-145 Переносчик, холина транспорт, курение,
Альцгеймера болезнь
ST6GALNAC3 560 o i1 -239 ST6GALNAC3
DPYD 843 o i3- 94 Дигидропиримидин-дегидрогеназа
DNM3 572 н i14-123 Динамин 3, высокая экспрессия в мозге
RABGAP1L 798 о i19-145 RAB GTP-азу активирующий белок 1
подобный, пролиферация и инвазия меланом
HMCN1 456 о i1 -111 Гемицентрин 1, иммуноглобулин семейство,
макулы дегенерация
DISC1 415 н i8 -140 Поврежден при шизофрении 1
SLC35F3 420 о i2 -326 Переносчик
RYR2 791 о i1 -226 Рианодин рецептор 2, сердечная мышца
RGS7 582 о i16-257 Регулятор G-белка сигналинга 7
PLD5 445 х i9 -176 Фосфолипаза D 5
SMYD3 668 о i7 -397 SET - MYND домены 3, раки , сперматогенез
KCNH1 451 н i4 -114 Калий-канал H 1, выокая экспрессия
в мозге
ESRRG 586 н i6 -262 Эстроген связанный рецептор развития G,
регуляция развития, высокий уровень
в фетальном мозге
101
2 DPP10 682 о i5 -164 Дипептидил-пептидаза 10, астма
CNTNAP5 890 н i1 -196 Контактин ассоциированный белок 5,
нервная система, адгезия и рецепция
клеток
FLJ34870 644 х i6 -214 Гипотетический белок
KIAA1679 687 х i11-130 Абнормальное гонад развитие
LRP1B 1901 о i89-329 ЛПНП-связанный белок 1B
ARHGAP15 639 о i6 -189 Rho-GTPase - активирующий белок 15
BRE 448 н i8 -108 BRE, мозг и гонады экспрессия, ответ на
ДНК повреждение и ретиноевую кислоту
ALK 729 н i28-202 Анапластическая лимфома киназа, ведущая
роль в развитии мозга и работы нейронов
LTBP1 452 о i3 -89 Скрытый трансформирующий фактор роста
связывающий белок 1
PRKCE 536 н i1 -191 Протеин-киназа, различные сигнальные пути,
активация нейронных каналов,
поведение тревоги
NRXN1 1108 н i17-299 Неурексин 1, адгезия и рецепция в
нервной системе
FLJ16124 648 х i4 -208 Гипотетический белок
SEC15L2 650 н i2 -151 SEC15 гомолог, высокая активность в
амигдале мозга, синаптосомы, экзоцитоз
CTNNA2 1135 н i7 -484 Катенин A 2, ключевой нейральный
регулятор кадхерина и мультиклеточной
организации
AFF3 595 о i18-169 AF4-FMR2 семейство 3, лимфоидное
развитие и онкогенез
MYT1L 542 н i23-112 Миелина транскрипции фактор 1 L
GALNT13 509 о i1 -196 GALNT13
KCNH7 467 н i14-299 Калий-вольтаж-канал 7
TTC21B 612 о i1 -533 Тетратрикопептидный домен 21 B
MYO3B 476 о i7 -99 Миозин 3 B, экспрессия в палочки и
колбочки сетчатки
PDE11A 444 о i18-109 Фосфодиэстераза цАМФ цГМФ 11 A, кушинга
болезнь
ZNF533 419 н i7 -224 Zn - фингер, умственное развитие
ALS2CR19 1070 н i3 -276 БАС, моторные нейроны
ERBB4 1156 о i27-413 Эритробластной лейкемии онкоген 4, рак
SPAG16 1126 о i10-372 Спермы антиген 16
CENTG2 631 н i1 -214 Центаурин G 2, высокая экспрессия в
мозге взрослых
3 FAM19A1 541 н i2 -411 Семейство 19 A 1, мозг специфические
хемокины или нейрокины
FOXP1 628 о i18-134 FOXP1, форкхеад бокс, транскрипции
фактор, тумор супрессия
ROBO2 607 н i2 -379 Обходной путь 2, аксон направитель,
нейрональная миграция
ROBO1 992 н i29-464 Обходной путь 1, аксон направитель,
нейрональная миграция
EPHA6 938 о i3 -239 Эфрин рецептор A 6
ZBTB20 809 н i5 -193 Zn фингер и BTB домен 20, пирамидальных
клеток коры развитие
LSAMP 635 н i6 -358 Лимбической системой ассоциированный,
нейрональное взаимодействие мембранный
белок
STXBP5L 513 н i4 -86 Синтаксин связанный белок подобный 5,
нейротрансмиссия
KALRN 627 н i1 -133 Калирин, ключевая роль в работе
синапса, связь с хунтингтином,
шизофрения
102
CPNE4 500 о i14-182 Копин 4, кальций сигналинг
EPHB1 465 н i3 -154 Эфрин рецептор B 1, развитие и
в нервной системе, шизофрения
STAG1 415 о i33-122 Стромы антиген 1, компонент когезина,
работа хромосом
CLSTN2 632 н i2 -227 Калсинтенин 2, модулятор эпизодической
памяти, нейрональная экспрессия
SLC9A9 583 н i12-101 Переносчик, обмен натрий-протон,
гомеостаз катионов, внимание и
активность в поведении
KCNAB1 418 н i1 -301 Калий-вольтаж-канал 1, нейротрансмиссия,
возбудимость нейронов, эпилепсия
RSRC1 434 о i6 -106 Арг-Сер-богатый C-C домен 1, спайсосома
SCHIP1 624 н i1 -491 Шванномин взаимодействующий белок 1,
компонент перехвата Ранвье
MDS1 514 о i3 -282 Миелодисплазия 1
NLGN1 885 н i4 -468 Невролигин 1, белок поверхности нейрона,
функция и ремоделлинг синапсов
NAALADL2 946 о i1 -237 N-ацетилированная A-связанная кислая
дипептидаза подобная 2
LPP 667 о i2 -181 LIM домен липома, адгезия клеток
FGF12 586 н i4 -367 Фактор роста фибробластов 12, участвует
во многих процессах (развитие нервной
системы)
CNTN4 957 н i1 -238 Контактин 4, аксон ассоциированная
адгезия клеток, нервная сеть, аутизм
GRM7 881 н i1 -285 Глутамат рецептор 7
TBC1D5 583 н i20-115 TBC домен, возможная роль в атаксиях,
дегенерация клеток Пуркинье
RBMS3 724 о i4 -153 Одноцепочную РНК связывающий
основной 3
MYRIP 450 о i2 -143 Миозин взаимодействующий белок
ULK4 713 о i1 -148 UNC51 киназа 4
DOCK3 709 н i5 -130 Предназначенный цитокинезу 3, нервная
система, гуанин обменный фактор, адгезия,
пресенилин связывающий
CACNA2D3 952 о i2 -197 Кальций-вольтаж-канал A 2 D 3
CAST1 960 н i1 -172 CAZ-ассоциированный структурный белок
1, ERC2, пресинаптический белок
FHIT 1502 о i5 -523 Ломких триад гистидина ген, тумор
супрессор, бис-5'-аденозил трифосфатаза
PTPRG 732 о i2 -241 Протеин-тирозин-фосфатаза
рецепторная G
CADPS 477 н i26-109 Кальций-зависимый активатор секреции,
нейроэндокринные клетки
MAGI1 685 о i22-416 Мембрана ассоциированная гуанилат-
киназа WW и PDZ домены содержащая 1,
папиллома вирус, плотные соединения
клеток
4 SCFD2 493 н i5 -128 SEC1 семейство домен содержащий 2,
синтаксин связывающий белок 1 подобный,
работа синапса
LPHN3 575 н i1 -90 Латрофилин 3, работа мозга, внимания
дефицит-гиперактивности расстройство
FRAS1 487 о i3 -180 Фразер синдром 1, развитие,
экстрацеллюлярный матрикс
MGC35043 628 х i3 -286 Гипотетический белок
ARHGAP24 507 о i3 -202 Rho GTP-ase активирующий белок 24,
участвует в ремоделлинге актина,
клеточной миграции и полярности
103
MAPK10 437 н i12-160 Митоген активируемая протеин
киназа 10, нейрональная
MGC48628 547 х i5 -159 Гипотетический белок
GRID2 1468 н i2 -494 Глутамат рецептор ионотропный D 2,
работа нейронального рецептора, клетки
Пуркинье, апоптоз нейронов
MGC46496 585 х i1 -154 Гипотетический белок
COL25A1 488 о i35-250 Коллаген 25 A 1
MAML3 438 о i4 -262 мастерминд гомолог дрозофилы 3,
связывает NOTCH1, сигнальный путь
LRBA 751 о i17-97 Везикул перенос в иммунных клетках
FSTL5 780 о i12-144 Фоллистатин 5
SPOCK3 507 о i10-151 Тестикан 3, протеогликан
экстрацеллюлярного матрикса
PALLD 432 о i10-179 Палладин, организация актинового
цитоскелета
ODZ3 558 н i3 -254 ODZ гомолог 3, теневрин, высокий уровень
экспрессии в ядрах мозга
STK32B 450 о i3 -163 Серин-треонин-киназа 32 B
SORCS2 551 н i1 -203 рецепторный белок для VPS10,
нейропептид сигнальный путь
KCNIP4 574 н i7 -453 Калий-вольтаж-канал связанный белок 4,
возбудимость нейронов, взаимодействие с
пресенилином
PCDH7 423 о i4 -222 Протокадхерин 7, адгезия и рекогниция
клеток
5 ARHGAP26 458 о i1 -102 Rho-GTP-ase активирующий белок 26
PPP2R2B 491 н i9 -224 Белок-фосфатаза 2 регуляторная
единица B, спино-церебеллярная атаксия,
нейрональная
ADCY2 434 н i2 -106 Аденилат-циклаза 2 мозга
SEMA5A 508 н i22-108 SEMA домен 5A , аксона направитель при
невральном развитии
CTNND2 933 н i20-167 Катенин D 2, адгезия клеток, мозга и
глаз развитие
FBXL7 439 о i2 -311 F-бокс и лейцин богатый повтор белок 7,
убиквитин-лигаза комплекса часть
CDH18 509 н i11-141 Кадхерин 18, кальций-зависимая адгезия
клеток, нейрональный, аксон вырост и
направитель, синапсов адгезия
CDH12 1103 н i14-347 Кадхерин 12, нейрональное развитие,
синаптогенезис
HCN1 434 н i6 -184 Гиперполяризация К-канала, цАМФ цГМФ,
спонтанная ритмическая активность
сердца и мозга
SGCD 439 о i3 -164 Саркогликан D, мышц
EBF 402 н i10-233 Раннего включения фактор транскрипции,
обонятельный, нейрональный
ODZ2 979 н i1 -302 ODZ гомолог, высокая экспрессия в мозге
DOCK2 446 о i27-152 Предназначенный цитокинезу 2,
гемопоэтических клеток, миграция
лимфоцитов
RANBP17 438 о i14-202 RAN-связанный белок 17, участвует в
импорте белка с лидером через ядерную
пору
ARL15 426 о i1 -227 АДФ-рибозилирования фактор 15,
адипонектина уровень, ожирение
PDE4D 615 о i14-370 Фосфодиэстераза 4 D cAMP, передача
сигнала у многих клеток
EDIL3 442 о i10-130 EGF и дискордин 1 подобные домены 3,
лиганд интегрина, роль в ангиогенезе
104
GPR98 606 н i85-83 G-протеин-объединяющий-рецептор 98,
экспрессия в ЦНС, Ашер синдром
C5ORF21 457 х i1 -155 Открытая рамка чтения 21, FAM172A
MCTP1 577 о i21-266 Множество C2-домены трансмембранные 1
FBXL17 522 о i3 -165 F-бокс и лейцин богатый повтор
белок 17, F-бокс белок
FSTL4 416 о i13-166 Фоллистатин подобный 4
SPOCK1 524 о i9 -232 SPARC-остеонектин CNCV Kazal подобный
домен протеогликан 1, тестикан 1,
протеогликан семинальной плазмы,
ингибитор протеаз
6 PACRG 588 н i3 -248 Корегулятор PARK2, шаперон и шаперонин
связывающий , белок Паркинсона болезни
UTRN 559 н i1 -111 Утрофин, нейромускулярный синапс,
постсинаптическая поддержка, кластер
ацетилхолинового рецептора
RPS6KA2 453 н i20-320 Рибосомы белка S6 киназа A 2, развитие
мозга, нейритов вырост
ATXN1 462 н i3 -158 Оливопонтоцеребеллярная атаксия,
атаксин 1
PARK2 1379 н i7 -470 Синдром Паркинсона молодых 2
DST 385 н i93-108 Организация и генез цитоскелета
дистонин, заякоривание нейральных
промежуточных филаментов,
нейродегенерация
BTBD3 422 х i5 -232 BTB домен
BAI3 752 н i2 -291 Ангиогенеза ингибитор мозга 3
KCNQ5 572 н i1 -381 Вольтаж- калий-канал тип Q 5, мозга и
мышц, мускариновый рецептор
TRDN 422 о i41-66 Триадин, отношение к рианодин рецептору
скелетных мышц
SYNE1 515 о i144-88 Оболочки ядра специфический повтор 1,
спиноцеребеллярная атаксия 8
PHACTR1 569 о i3 -303 Регулятор актина и фосфатаза 1
CDKAL1 698 х i9 -109 CDK5-ассоциированный белок подобный 1,
метилтиотрансфераза, функция неизвестна
SUPT3H 549 о i9 -206 Супрессор Ty 3 гомолог,
ТАТА связывающий белок-ассоциированный
фактор
PKHD1 472 о i7 -85 Поликистоз почек и гепатит 1
KHDRBS2 606 о i3 -161 KH домен РНК связывает, сигнала
передача 2
RIMS1 514 н i2 -128 Регулятор экзоцитоза синапсов 1
GMDS 621 о i4 -184 ГДФ-манноза-4, 6-дегидратаза, работа
NK лимфоцитов
FARS2 510 о i6 -158 Фен-тРНК-синтетаза МТ
GRIK2 670 н i1 -223 Глутамат рецептор ионотропный
каинатный 2
SLC35F1 410 о i1 -247 Переносчик
PTPRK 552 о i29-122 Белок-тирозин-фосфатаза рецепторная K,
многие ткани, контакт и адгезия клеток
LAMA2 634 о i1 -167 Ламинин A 2, компонент основной
мембраны, внеклеточный, конгенитальная
мышечная дистрофия
GRM1 409 н i2 -145 Глутамат рецептор метаботропный 1
ARID1B 431 о i5 -149 Домен взаимодействует с
AT-богатыми 1 B
7 PMS2L2 501 х i2 -484 Постмейотическая сегрегация 2
подобный 2
105
MAGI2 1437 н i21-446 Мембранная гуанилат-киназа WW и
PDZ домены
содержашая 2, взаимодействие с
атрофином 1
CACNA2D1 594 н i36-164 Кальций-вольтаж-канал A2
субъединица D1,
пресинаптические терминали, нейрон
FLJ32110 577 х i1 -458 Гипотетический белок
CUTL1 468 о i2 -112 CUT - CCAAT-работающий белок, CUX1,
гомеодомен се6мейство ДНК связывающих
белков
RELN 518 н i62-84 Реелин, экстрацеллюлярного матрикса
белок, нейронов миграция при развитии
мозга
LHFPL3 579 о i1 -407 Липома, слияния с HMGIC партнер
подобный 3
IMMP2L 899 о i3 -523 Внутренней мембраны пептидаза
подобная 2
DOCK4 481 н i51-202 Предназначенный цитокинезу 4, контакты
клеток, миграция, активатор ГТФазы,
аутизм
KCND2 476 н i1 -457 Калий-вольтаж-канал D 2
CADPS2 567 н i27-149 Кальций-активируемый белок для
секреции 2, регулирует экзоцитоз
синаптических везикул
GRM8 804 н i8 -202 Глутамат рецептор метаботропный 8
SND1 441 о i10-86 Стафилококк-нуклеазы домен 1
EXOC4 813 н i10-187 Экзоцисты комплекс компонент 4,
транспорт везикул в нейронах
DGKI 457 о i33-157 Диацил-глицерол-киназа I
CNTNAP2 2305 н i1 -657 Контактин-ассоциированный белок 2, член
неурексина семейства, клеток адгезия и
рецепция в нервной системе
MAD1L1 417 о i1 -82 Митоза остановка дефицит 1 подобный 1,
сборки веретена контрольная точка
SDK1 964 н i1 -317 (Сайдекик) Дружок гомолог 1, ламина
специфическая синаптическая связь
KIAA0960 457 х i27-195 Гонад абнормальное развитие
DGKB 693 о i3 -161 Диацил-глицерол-киназа B, ключевая роль
в клеточных процессах и сигналинге
HDAC9 501 о i2 -89 Гистон-деацилаза 9
CREB5 527 о i1 -195 Ответ на цАМФ элемент белок
связывающий 5
PTHB1 476 о i19-118 Ответ на паратиреоидный гормон B 5,
BBS9
ELMO1 595 о i6 -118 Поглощение и подвижность фагоцитов 1,
взаимодействие с DOCK
POU6F2 458 о i4 -132 POU-домен 6 F 2, ДНК связывающие домены
C7ORF10 726 о i12-188 Открытая рамка чтения и
Русселя-Сильвера синдром,
глютаровая ацидурия
HECW1 450 н i2 -130 HECT, C2, WW домены с E3 убиквитин-
белок-лигазой 1, нейрональная
ABCA13 449 н i53-52 АТФ-связывающая кассета, кандидат на
шизофрению, биполярное расстройство и
аутизм
AUTS2 1194 н i4 -302 Аутизм предрасположенность кандидат 2
WBSCR17 580 о i1 -202 Вильямса-Беурена синдром и полипептид-
N-ацетил-галактозамин-трансфераза
CALN1 629 н i2 -213 Калнейрон 1, мозг специфический кальций
связывающий белок
106
8 CNBD1 517 о i4 -266 Циклические-нуклеотиды связывающий
домен, содержащий 1
PGCP 498 о i1 -140 Плазменная глутамат-карбокси-пептидаза
VPS13B 864 н i19-109 Вакуолярных белков сортировщик 13 B,
участвует в функции глаз и ЦНС
RIMS2 433 н i17-230 Регулятор экзоцитоза синапса 2
ZFPM2 485 о i5 -155 Zn-фингер мультитип 2
CSMD3 1214 о i68-122 CUB-SUSHI-множественные домены 3
NIBP 726 н i6 -197 NIK IKK -связывающий белок, мозга
развитие
CSMD1 2057 о i68-387 CUB-SUSHI-множественные домены 1
DLC1 432 о i13-189 Удален при раке печени 1, rho ГТФазу
активирующий белок
SGCZ 1148 о i7 -683 Саркогликан Z , часть дистрофин-
гликопротеиновый комплекса, соединяет
цитоскелет и экстрацеллюлярный матрикс
PSD3 484 о i7 -109 Плекстрин и SH3-домен 3,
АДФ рибозилирования фактор
гуанин нуклеотид фактор 6
KIAA0146 475 х i8 -155 Гипотетический белок
SNTG1 881 н i1 -260 Синтрофин гамма 1, экспрессия в мозге,
содержит PH и PDZ домены
XKR4 424 о i1 -254 Келл-группа крови субъединица 4
FAM77D 751 о i1 -330 Семейство 77 член D, натрий-калий
АТФаза субъединица
KCNB2 401 н i2 -368 Калий-вольтаж-канал B 2
9 TRPM3 587 н i22-80 Временный рецептор катион-канала
GABBR2 421 н i18-130 ГАМК-рецептор 2
ASTN2 990 н i4 -131 Астротактин 2 , экспрессия в мозге,
нейрональная миграция
DENND1A 550 н i9 -100 DENN-MADD домен 1 A , клатрин связанное
везикул синапсов функционирование
PTPRD 701 н i33-285 Белок-тирозин-фосфатаза рецепторная D,
нейритов рост, аксон направитель
BNC2 461 о i4 -144 Базонуклин, регулятор транскрипции
LRRN6C 771 н i2 -283 Лей-богатые повторы нейрональный 6 C
10 PRKG1 1221 о i3 -337 Протеин-киназа цГМФ зависимая 1
PCDH15 980 о i30-149 Протокадхерин 15, кальций-адгезия
клеток, сетчатка и улитка
CTNNA3 1776 о i11-405 Катенин A 3, адгезия клеток, сердце и
тестис
CDH23 419 о i3 -63 Кадхерин подобный 23, улитка, глухота
ADK 558 н i6 -127 Аденозин-киназа, много функций
аденозина, также в мозге
C10ORF11 775 о i4 -266 Открытая рамка чтения, лейцин-богатый
повтор содержащий белок
KCNMA1 768 н i28-234 Калий-канал большой кальций
активируемый
DIP2C 414 н i36-203 Диско-взаимодействующий белок 2 C,
экспрессия в нервной системе,
ацил-КоА-синтетаза
CAMK1D 480 о i1 -204 Кальций-кальмодулин зависимая
киназа 1 D, гранулоциты
FRMD4A 687 о i23-471 FERM домен 4 A
NRG3 1110 н i1 -481 Неурегулин 3, лиганд для ERBB3 и 4,
эмбриогенез, нейробласт, шизофрения
GRID1 767 н i12-222 Глутамат рецептор ионотропный 1
HPSE2 777 о i9 -400 Гепараназа 2
SORCS3 624 н i1 -201 Сортилин, VPS10 домен содержащий
рецепторный белок 3, нервная система
107
SORCS1 591 н i25-208 Сортилин, VPS10 домен содержащий
рецепторный белок 1, нервная система
ATRNL1 856 о i26-178 Аттрактин подобный 1
CACNB2 401 н i2 -251 Кальций-вольтаж-канал бета 2, мозг,
мышцы, Ламберта-Итона миастения
C10ORF112 499 о i12-100 Открытая рамка чтения, МАМ и LDL
домены содержащий
PLXDC2 464 о i1 -185 Плексин домен 2, ангиогенез
GPR158 427 х i2 -175 Предполагаемый G-белок объединяющий
рецептор 158
PARD3 704 о i23-179 PAR3 дефект, клеточная полярность,
ориентация веретена, эндотелий сосудов
DOCK1 482 о i26-141 Предназначенный цитокинезу 1, адгезия
клеток, фагоцитоз
11 DLG2 1469 н i22-388 Диски большие гомолог 2, мембрана
ассоциированная гуанилат киназа,
канал-ассоциированный
постсинаптический белок
GRM5 540 н i7 -198 Глутамат рецептор метаботропный 5
FAT3 546 н i3 -173 FAT3, кадхерина домены, адгезия клеток,
мозг
CNTN5 1335 н i1 -304 Контактин 5, нейрональный
иммуноглобулин, адгезия,
аксона взаимодействие
KIRREL3 576 н i16-437 KIRREL3, нефрин подобный,
экспрессия в мозге и почках
HNT 426 н i1-236 Неуротримин, нейрональный
иммуноглобулин, адгезия, нейритов вырост
OPCML 1117 н i7 -589 Опиоид связывающий белок
KCNQ1 404 н i11-107 Калий-вольтаж-канал Q 1
SBF2 515 н i38-151 SET-связывающий фактор 2, миотубуларин
связанный белок, нейропатия, нарушение
укладки миелина
SOX6 506 н i15-135 Половых различий регион бокс 6,
ДНК связывающий фактор транскрипции,
развитие мозга, хряща и мышц
NAV2 408 н i1 -119 Нейрон навигатор 2
NELL1 906 н i15-164 NEL подобный 1, протеин киназа С
связывающий белок, остеогенез,
мозгоспецифичный
LUZP2 586 н i1-237 Лейцин-застежка молния (zipper)
белок 2, экспрессия только в мозге
12 PPFIA2 500 н i29-215 Белок-тирозин-фосфатаза рецепторная
взаимодействующий 2, липрин, участвует
в направлении аксона
TMTC2 447 х i1 -169 Трансмембранный и тетратрикопептидный
повтор 2
MGAT4C 860 о i7 -292 MGAT4C, N ацетил глюкозаминил-
трансфераза
ANKS1B 1249 н i9 -221 Анкирин повтор и стерил-домен 1 B,
амилоид бета ассоциированный белок,
экспрессия в тестис и мозге
CACNA1C 640 н i3 -329 Кальций-вольтаж-канал 1 C
TMEM132C 440 х i1 -136 Трансмембранный белок 132 C
TMEM132D 832 х i8 -202 Трансмембранный белок 132 D
GRIN2B 419 н i11-112 Глутамат рецептор NMDA 2 B
SOX5 1030 о i14-386 Половых различий регион бокс 5,
регулятор транскрипции, хондрогенез
ITPR2 501 о i56-65 Инозитол-3-фосфат рецептор 2
TMEM117 553 х i3 -199 Трансмембранный белок 117
108
FAM19A2 484 н i4 -324 Семейство 19 A 2, нейрокины,
мозгоспецифичные хемокины
GRIP1 456 н i23-207 Глутамат рецептор связанный белок 1
13 ATP8A2 551 о i17-128 АТФаза 8 A 2, фосфолипид трпнспортная
KIAA0774 479 о i3 -180 Микротубулы ассоциированный рака
супрессор 2
PIG38 454 о i15-183 Пролиферацию индуцирующий белок 3,
ENOX1, дисульфид-тиол обменник,
осциллятор в 24 минуты
PCDH9 928 н i2 -580 Протокадхерин 9, синапсов соединения
KLHL1 408 н i10-132 Келч гомолог подобный 1, актин
связывающий белок мозгоспецифичный
DACH1 429 о i5 -190 DAC гомолог 1, связан с транскрипцией,
формирование глаз в развитии
KLF12 448 о i7 -138 Круппель фактор 12, цинк фингер
GPC5 1469 н i7 -722 Глипикан 9, гепарин сульфат
протеогликан, высокая экспрессия
в развивающемся мозге
GPC6 1177 н i1 -318 Глипикан 6, поверхностный рецептор для
многих факторов, контроль роста и
разделения, фетальный мозг
HS6ST3 749 о i1 -741 Гепарин-сульфат-трансфераза 3
PCCA 441 о i19-57 Пропионил-КоА-карбоксилаза, митохондрия
FGF14 679 н i4 -526 Фактор роста фибробластов 14, развитие
нервной системы, аксональный транспорт,
церебральная атаксия
MYR8 612 о i1 -69 Миозин 8 тяжелая цепь
14 AKAP6 504 н i1 -104 A-киназы якорный белок 6, высокая
экспрессия в мозге, сердце и скелетных
мыщцах
NPAS3 862 н i1 -276 Нейрональный PAS-домен 3
SLC25A21 493 о i9 -297 Переносчик оксодикарбоксилатный
митохондриальный
MAMDC1 503 н i15-83 MAM-домен 1, меприн, MDGA2,
иммуноглобулин домен,
нервной системы развитие
GPHN 675 н i1 -172 Гефирин, постсинаптический цитоскелет,
якорный, рецептора домен и тубулин
RAD51L1 776 о i7 -405 RAD51 подобный 1, ДНК репарация при
гомологической рекомбинации
RGS6 631 н i2 -387 Регулятор G-белка сигналинга 6, может
модулировать нейрональную активность
NRXN3 1461 н i12-479 Неурексин 3, нервная система, адгезия
и рецепция
C14ORF145 443 о i6 -143 Открытая рамка чтения, CEP128,
центросомальный белок
15 RYR3 555 н i1 -163 Рианодин рецептор 3, мозга
UNC13C 616 х i1 -127 UNC13C
THCD4 642 н i6 -249 Тромбоспондин 4, развитие и сигналинг в
нервной системе, нейритов вырост, адгезия
клетка-клетка, клетка-матрикс, THBS4
ZNF291 536 о i9 -69 Zn - фингер 291, SCAPER, S-фазы циклин
A-ассоциированный белок ЭПР
16 FTO 410 о i8 -177 FTO, жира масса, не гемового железа
оксигеназа
CDH13 1170 н i1 -232 Кадхерин 13, адгезия клеток, негативная
регуляция роста аксона при
нейрональном развитии
109
A2BP1 1693 н i4 -466 Атаксин 2 связывающий белок 1,
РНК связывающий белок,
нейродегенеративные расстройства
17 CA10 529 н i6 -183 Угольная ангидраза 10, нервной системы,
развитие мозга
MSI2 443 н i5 -140 MSI2, РНК связывающий белок Мусаши 2,
развитие, регуляция в нейронах
BCAS3 715 о i22-284 Груди рак амплифицированный участок 3
CCDC46 556 о i6 -101 C-c домен (биспиральный) 46,
центросомальный белок 112 кд
PRKCA 508 о i2 -191 Протеин-киназа С связанная с возрастом,
различные сигнальные пути
SLC39A11 447 о i4 -113 Переносчик цинка
18 PTPRM 839 о i1 -207 Белок-тирозин-фосфатаза рецепторная,
клеточная адгезия
C18ORF1 434 х i4 -183 Открытая рамка чтения
C18ORF34 503 х i3 -119 Открытая рамка чтения
FHOD3 483 о i3 -129 Формин домен 3, регуляция актинового
цитоскелета
DYM 417 н i4 -93 Димеклин, развитие скелета и функция
мозга
DCC 1190 н i1 -411 Удален при раке толстого кишечника,
нетрин 1 рецептор, направление аксона
DOK6 441 о i1 -163 Докинг белков 6
19 -----
20 PLCB1 752 о i4 -280 Фосфолипаза-C B 1, трансдукция внутрь
клетки многих внешних сигналов
C20ORF133 2057н i5 -545 Открытая рамка чтения, MACROD2,
АДФ-рибозу связывающий сайт,
Кабуки синдром с умственной задержкой,
экспрессия в мозге и других тканях
SLC24A3 510 н i2 -235 Переносчик калия, натрия, кальция,
проведение электричества, высокая
экспрессия в мозге и других тканях
PTPRT 1117 н i30-304 Белок-тирозин-фосфатаза рецепторная,
сигнала проведение и адгезия в ЦНС
TSHZ2 515 о i1 -280 Теаширт-семейство Zn фингер
CDH4 685 н i2 -489 Кадхерин 4, адгезия клеток, ведущая роль
в сегментации мозга и нейрональном
выросте
X ARHGAP6 528 о i12-410 Rho GTP-ase активирующий белок 6,
актина ремоделлинг
PDZK10 584 н i1 -360 PDZ домен содержащий 10,
поддержка синаптической передачи
IL1RAPL1 1369 н i2 -493 IL1 рецептор связанный белок
подобный 1, умственная задержка,
экспрессия в гиппокампе,
память и обучение
DMD 2220 н i35-248 Дистрофин, связь цитоскелета и
экстрацеллюлярного матрикса,
Дюшенна мышечная дистрофия,
Бекера мышечная дистрофия, шизофрения,
умственная задержка,
при ДМД - фрамешифт,
при БМД - ненормальное укорочение
дистрофина, разные изоформы
110
TTC28 702 о i21-364 Тетратрикопептидов повтор домен 28,
ожирение
DACH2 684 н i1 -228 Dachshund (собака такса) гомолог,
экспрессия при развитии в мозге
PCDH11X 844 н i3 -322 Протокадхерин 11 X, незаменим для
сегментации и функции ЦНС
DIAPH2 794 о i4 -123 Diaphanous (прозрачный) гомолог,
функция яичников
IL1RAPL2 1201 н i2 -537 IL1 рецептор связанный белок
подобный 2, умственная задержка
ODZ1 584 н i28-157 ODZ гомолог 1, теневрин, экспрессия в
нейронах, передача сигналов
GPC3 450 о i6 -199 Глипикан 3, клеточный рост и деление,
мембранный протеогликан
AFF2 500 н i1 -151 AF4-FMR2 - семейство,
ломкости Х умственная задержка
21 C21ORF34 537 х i4 -160 Открытая рамка чтения
NCAM2 541 н i1 -282 Нейрональных клеток молекула адгезии 2
GRIK1 403 н i15-245 Глутамат рецептор ионотропный
каинатный 1
TIAM1 439 н i27-125 Т-лимфома инвазия и метастазирование 1,
высокая экспрессия в мозге, нейритов
вырост в коре и гиппокампе
DSCAM 834 н i30-323 Дауна синдром клеток адгезии молекула,
межклеточная адгезия, развитие мозга
22 SYN3 494 н i7 -268 Синапсин 3, цитоплазматическая
поверхность синаптических везикул,
шизофрения
LARGE 647 н i14-158 Гликозил трансфераза подобный, мышечная
дистрофия и умственная задержка
Y PCDH11Y 742 н i4 -155 Протокадхерин 11 Y
Приложение 4. Гены сплайсинга.Список сделал и перевел Курносов М.Н.
6 февраля 2009.
Хр Ген Размер Название и примечание. СС - сплайсосома, ССС - ядерных
мРНК сплайсинг через СС.
1.DDX20 12 DEAD-бокс полипептид 20, сборка трех sn-RNP (мя-РНП),
РНК-хеликаза АТФ-зависимая, ССС.
BCAS2 14 Рака груди умноженная последовательность 2, ассоцииро-
ванная с СС.
TTF2 43 Фактор терминации транскрипции РНК-полимеразы 2,
АТФ-зависимая хеликаза, ССС.
RBM8A 4 РНК-связывающий главный белок 8A, транспорт мРНК из
ядра, ССС.
FUSIP1 14 FUS-взаимодействующий белок1, сер-арг богатый, выбор сайта
сплайсинга, транспорт мРНК из ядра, сборка sn-RNP,
негативная регуляция ССС, регуляция транскрипции.
SRRM1 31 Сер-арг повторяющийся матрикс 1, РНК процессинг, ССС.
PPP1R8 21 Белок-фосфатаза 1, регулятор субъединица 8 - ингибитор,
рибонуклеаза E, ССС.
SFRS4 34 Сплайсинг-фактор 4, сер-арг богатый, ССС.
WDR57 37 WD - повтор домен 57, U5 sn-RNP специфичный, ССС.
SFPQ 9 Сплайсинг-фактор про-глн богатый, ассоциирован с поли-
пиримидиновый тракт связывающим белком, ССС, репарация и
рекомбинация ДНК, регуляция транскрипции.
LSM10 5 LSM10, U7 - sn-RNP ассоциированый, ССС.
SF3A3 33 Сплайсинг-фактор 3, субъединица A3, 60 kDa, ССС, 3 - конца
111
сайт сплайсинга нахождение.
RRAGC 21 RAS - GTP - связывающий С, сплайсинг, апоптоз, рост,
транскрипция, гетеродимеризация белка.
PPIH 19 Пептидил-пролил-изомераза H, snRNP ввод в ядро,
ССС, фольдинг и сборка белков, циклофилин H.
YBX1 19 Y-бокс связывающий белок 1, ССС, регуляция транскрипции,
большой комплекс гистосовместимости 2.
MAGOH 12 mago-nashi гомолог D. melan. , ССС, экспорт мРНК из ядра,
женских гамет генерация.
SFRS11 46 Сплайсинг-фактор арг-сер богатый 11, ССС.
ZRANB2 18 Zn-фингер RAN домен содержащий 2, сплайсинг.
PTBP2 93 Полипиримидиновый тракт связывающий белок 2, нейральный,
сплайсинг регулятор, процессинг РНК.
RTCD1 26 РНК-концевой фосфат-циклаза домен 1, сборка СС
три-sn-RNP.
TARDBP 12 TAR DNA связывающий белок, ССС, транскрипция.
SF3B4 5 Сплайсинг-фактор 3b, субъединица 4, ССС, U2 sn-RNP.
PRPF3 32 PRP3 пре-мРНК процессинг фактор 3, ССС, U4/U6
ассоциированный сплайсинг-фактор, пигментозный ретинит 18.
TNRC4 14 Тринуклеотидов повтор содержащий 4, CAG/CTG 4, CCC,
нервной системы развитие.
IVNS1ABP 21 Гриппа вирус NS1A связывающий белок, РНК сплайсинг, СС,
ответ на вирус, запуск транскрипции с РНК-пол 3.
SNRPE 9 Sn-RNP полипептид E, СС, сплайсосомы сборка.
SYF2 11 SYF2 гомолог, РНК сплайсинг.
2.SF2B14 9 Сплайсинг-фактор 3B, ССС, пре-мРНК развилка сайта, 14 кДа.
SFRS7 8 Сплайсинг-фактор арг-сер богатый 7, ССС, с возрастом
ассоциированный белок.
SNRPG 12 Sn-RNP полипептид G, сборка СС.
MPHOSPH10 20 M-фазы фосфобелок 10, U3 sn-RNP,рРНК процессинг,сплайсинг.
ZNF638 104 Zn-фингер, РНК сплайсинг.
USP39 33 Убиквитин-специфичная пептидаза 39, ССС, сборка sn-RNP,
U4/U6, U5 три sn-RNP ассоциированный белок 65 кДа.
ASCC3L1 32 Активатор сигнала коинтеграции в комплекс, субъединица 3,
подобен 1, ССС, U5 sn-RNP, цис-сборка U2 типа
предкаталитической СС.
SF3B1 43 Сплайсинг-фактор 3B, субъединица 1, ССС, 155 кДа.
GEMIN6 4 Гем ассоциированный белок 6, сборка СС, биогенез sn-RNP.
PPIG 53 Пептидил-пролил-изомераза G, РНК сплайсинг, циклофилин G.
DDX1 40 DEAD бокс полипептид 1, АТФ-хеликаза-РНК, рибосом
биогенез, сборка СС.
3.SFRS10 21 Сплайсинг-фактор арг-сер богатый 10, ССС.
LSM3 19 LSM3 гомолог, U6 sn-RNP, ССС.
TSEN2 48 Сплайсинг эндонуклеаза тРНК 2, мРНК процессинг.
LOC645852 1 Подобен сплайсинг-фактору 3A, субъединица 2, 66 кДа.
LOC729418 1 -
NCBP2 7 Ядерный кэп связывающий белок 2, 20 кДа, сплайсинг и про-
цессинг, экспорт из ядра мРНК и мя-РНК, пролиферация.
4.YTHDC1 40 YTH домен содержащий 1, ССС.
LSM6 14 LSM6 гомолог, U6 sn-RNP ассоциированный белок, ССС.
PLRG1 14 Плейотропный регулятор 1, СС, ССС, передача сигнала,
активация корепрессора транскрипции.
PPARGC1A 98 Пероксисом пролиферации активатор рецептора G,
коактиватор 1A, сплайсинг, процессинг РНК, сборка белков и
много других процессов.
DHX15 57 DEAD/H бокс полипептид 15, минорный U12- зависимый СС,
АТФ-хеликаза, ССС.
LOC391718 3 Подобен сплайсинг-эндонуклеазе 2 тРНК.
112
5.GEMIN3 50 Гем ассоциированный белок 3, СС, белков сборка, sn-RNP
биогенез.
LSM11 13 LSM11, U7 sn-RNP ассоциированный, ССС.
SLU7 16 Сплайсинг-фактор 7, второго шага, выбор сайта сплайсинга
и процессинг РНК.
THOC3 8 THO комплекс 3, ССС, экспорт мРНК из ядра.
P18SRP 46 Сплайсинг регулирующий белок P18.
SFRS12 22 Сплайсинг-фактор арг-сер богатый 12, СС, ССС.
SMN1 28 Аварийный для моторного нейрона 1, теломерный, тело Cajal,
СС сборка, спинальная мышечная атрофия.
LOC402229 2 Подобен сплайсинг-фактору 4 , псевдо.
PPP2CA 29 Белок-фосфатаза 2, каталитическая субъединица A, РНК
сплайсинг и много других процессов.
6.WTAP1 29 Вильямса рак 1 ассоциированный белок, сплайсинга
регулятор летальный женский.
QKI 159 Квакинг-гомолог, РНК связывающий белок, ССС, экспорт мРНК
из ядра.
DNX16 20 DEAH бокс полипептид 16, ССС, АТФ-хеликаза-РНК, регуляция
прохождения клеточного цикла.
BAT1 12 HLA-B ассоциированный транскрипт 1, АТФ-хеликаза-РНК,
DEAD бокс, ССС, идентичный белок связывает, мРНК экспорт
из ядра.
LSM2 9 U6 - sn-RNP Sm подобный белок, ССС.
SNRPC 16 Sn-RNP полипептпд C, сплайсинг, sn-RNP U1.
SRPK1 88 SFRS - белок-киназа 1, ССС, много других процессов.
SFRS3 9 Сплайсинг-фактор арг-сер богатый 3, ССС.
CDC5L 59 Цикла клетки разделение, 5 подобный, СС, ССС, регуляция
транскрипции.
SYNCPIP 29 Синаптотагмин связывающий, с РНК цитоплазмы
взаимодействующий белок, ССС.
SRRP35 19 Сер-арг репрессор белок, 35 кДа, сборка СС три sn-RNP,
негативная регуляция ССС, альтернативный ССС,
5-сайта мРНК сплайсинга определение.
PRPF4B 44 Пре-мРНК процессинг фактор 4B, сер-тре-протеин-киназа,
ССС.
C6ORF151 22 Открытая рамка чтения 151, ССС, СС.
CDC40 51 Цикла клетки разделение 40, ССС.
RFXDC1 55 Регуляторный фактор X домен содержащий 1, тРНК-интрон-
эндонуклеаза, сплайсинг тРНК, регуляция транскрипции.
MYB 38 Миелобластный вирусный онкоген, ССС, клеточный цикл,
транскрипция.
SF3B5 1 Сплайсинг-фактор 3B, субъединица 5, 10 кДа, ССС.
7 SRPK2 272 SFRS-протеин-киназа 2, каскад сер-тре-киназ ,
сборка СС, сплайсинг РНК, дифференцировка.
LSM8 9 LSM8 гомолог, U6 sn-RNP ассоциированный, ССС.
TRA2A 27 Трансформер 2 альфа, ССС.
HNRPA2B1 9 Гетерогенный ядерный РНП A2/B1, ССС.
LSM5 3 LSM5 гомолог, U6 sn-RNP ассоциированный, ССС.
RP9 23 Пигментозный ретинит 9, РНК сплайсинг, зрительная
рецепция.
LOC647145 12 Подобен арг-сер богатый сплайсинг-фактор, 46 кДа.
8.RBPMS 188 РНК связывающий белок для множественного сплайсинга
и процессинга.
LSM1 13 LSM1 гомолог, U6 sn-RNP ассоциированный белок, ССС.
SIAHBP1 13 Разделения-связывания белок посредник репрессор,
пиримидиновый тракт связывающий сплайсинг-фактор.
9.NCBP1 38 Ядерной РНК кэп связывающий белок, субъединица 1, 80 кДа,
сплайсинг РНК, регуляция процессинга 3-конца,
113
экспорт мРНК из ядра.
PRPF4 17 Пре-мРНК процессинг-фактор 4, РНК сплайсинг, ССС.
CIZ1 38 CDKN1A посредник Zn-фингер белок 1, ССС.
10.HNRPH3 12 Гетерогенный ядерный РНП H3, CCC.
SMNDC1 12 Сборка СС, апоптоз, нейрон.
RBM17 28 РНК связывающий главный белок 13, ССС.
PRPF18 44 Пре-мРНК процессинг-фактор 18, ССС.
LOC644251 5 Подобен сплайсинг коактиватор субъединице SRm300.
11.PRPF19 16 Пре-мРНК процессинг-фактор 19, ССС.
TRPT1 72 Сплайсинг тРНК, тРНК-фосфотрансфераза 1.
SF1 15 Сплайсинг-фактор 1, сборка СС.
SF3B2 17 Сплайсинг-фактор 3B, субъединица 2, ССС.
RBM4 8 РНК связывающий главный белок 4, ССС.
RBM4B 13 RBM30, ---------------------- 4B, ССС.
SPR46 2 Сплайсинг-фактор арг-сер богатый, 46 kDa.
PPP2R1B 39 Белок-фосфатаза 2, регуляторная субъединица A, бета.
SART1 19 Чешуйчатых клеток раковый антиген Т-клеток 1, ССС.
RBM4B 13 РНК связывающий главный белок 4B.
API5 33 Апоптоз ингибитор 5, СС цитоплазмы.
CUGBP1 84 CUG триплет повтор РНК связывающий белок 1, выбор
сайта сплайсинга в РНК, эмбриональное развитие.
LOC401703 1 Подобен SF U2AF, 35 kDa.
12.WBP11 17 WW домен связывающий белок 11, рРНК процессинг, мРНК
сплайсинг через СС, одноцепочную ДНК связывает.
SFRS2IP 9 Сплайсинг-фактор арг-сер богатый, посредник для РНК-
полимеразы 2.
DDX23 23 DEAD бокс полипептид 23, хеликаза, ССС.
SNRPF 8 Sn-RNP полипептид F, ССС.
SFRF9 9 Сплайсинг-фактор арг-сер богатый 9, ССС.
FLJ11021 22 Подобен сплайсинг-фактору арг-сер богатому 4.
SFRS8 89 Сплайсинг-фактор арг-сер богатый 8, ССС, выбор сайта
сплайсинга , регуляция транскрипции.
HNRPA1 5 Гетерогенный ядерный РНП A1, ССС, мРНК экспорт из ядра.
13.PSPC1 108 Paraspeckle компонент, регуляция транскрипции, ССС.
WBP4 23 WW домен связывающий белок 4, ССС.
14.HNRPC 59 Гетерогенный ядерный РНП С, ССС.
NOVA1 152 Нейро-раковый вентральный антиген 1, сплайсинг,
синаптическая передача, поведение.
SIP1 22 Аварийный моторного нейрона белок взаимодействующий
белок 1, активатор сплайсинга, сборка СС.
SFRF5 5 Сплайсинг-фактор арг-сер богатый 5, выбор сайта
сплайсинга, ССС.
RBM25 62 РНК связывающий главный белок 25, ССС.
SNW1 44 SNW домен содержащий 1, ССС.
WDR25 154 WD повтор домен 25, сплайсинг-фактор.
15.LOC441722 1 U2AF подобен
RBPMS2 36 РНК связывающий белок для множественного сплайсинга 2.
CPEB1 96 Поли-A связывающий фактор цитоплазмы, ССС.
SNRPA1 14 U2 sn-RNP полипептид A, ССС.
SNURF 24 Sn-RNP полипептид N, особого входа рамка чтения,
тканеспецифический сплайсинг.
16.LKAP 49 Лимкаин B1, ССС.
NOL3 1 Ядрышка белок 3, антиапоптоз, ССС.
SF3B3 49 Сплайсинг-фактор 3B, субъединица 3, ССС.
TXNL4B 9 Тиоредоксин подобный 4B, CCC.
114
DNX38 20 DEAH бокс полипептид 38, АТФ-хеликаза, ССС.
RNPS1 15 РНК связывающий белок S1, сер-богатый домен, сплайсинг.
SRRM2 19 SRm субъединица, коактиватор сплайсинга, арг-сер богатый
без конца повторов матрикс 2.
17.GEMIN4 7 Ассоциированый с гем белок 4, рРНК процессинг,ССС, sn-RNP.
SFRS1 3 Выбор сайта сплайсинга, ССС, сплайс-фактор арг-сер
богатый 1
PRPF8 34 От U5 sn-RNP белок 8, ССС, пре-мРНК процессинг.
CROP 33 Резистентности к цисплатинату белок , РНК сплайсинг.
C1QBP 6 Q-субъединицу связывающий комплемент 1 и SF2.
RAD52B RAD52B и СС.
LOC644422 1 На арг-сер богатый фактор сплайсинга 6 похожий.
THOC4 4 Особый THO комплекс 4, ССС, мРНК экспорт из ядра.
SERS2 3 Сплайсинг-фактор арг-сер богатый 2, ССС.
EFTUD2 48 От фактора элонгации Tu-GTP связывающий домен 2, ССС.
PPP1R9B 17 B9 регулятор субъединица белок-фосфатазы 1, цикл клетки.
DHX8 40 DEAH бокс полипептид 8, ССС, АТФ-хеликаза-РНК.
TSEN54 9 Сплайсинга эндонуклеаза тРНК 54.
TADA2L 70 Транскрипции адаптор 2 похожий, ССС.
18.THOC1 54 THO комплекс 1, ССС, экспорт мРНК из ядра.
SNRPD1 18 Sn-RNP D1 полипептид, ССС.
TXNL4A 15 Тиоредоксин похожий 4A, СС сборка, ССС, цикл клетки.
19.U2AF1L3 3 U2 sn-RNP вспомогательный фактор 1 подобный 3, СС.
U2AF1L4 3 U2 sn-RNP --------------------------------- 4, СС.
SNRPA 15 Sn-RNP полипептид A, U1 sn-RNP.
SFRS16 32 Сплайсинг-фактор арг-сер богатый 16.
SNRPD2 5 Sn-RNP полипептид D2, ССС.
SNRP70 24 U1 sn-RNP 70 kDa полипептид, ССС.
HNRPM 44 Гетерогенный ядерный РНП M, ССС.
SR-A1 22 Сплайсинг-фактор арг-сер богатый A1.
PPP2R1A 36 Белок-фосфатаза 2 регуляторная субъединица A, сплайсинг
и много других процессов.
TSEN34 3 Эндонуклеаза сплайсинга тРНК 34.
U2AF2 21 U2 sn-RNP вспомогательный фактор 2, ССС.
PTBP1 15 Полипиримидиновую дорожку связывающий белок 1, ССС.
SF3A2 12 Сплайсинг-фактор 3A, субъединица 2, ССС.
LSM7 7 U6 sn-RNP связывающий фактор, ССС, LSM7 гомолог.
KHSRP 11 Сплайсинг регулирующий фактор KH типа, ССС, экспорт РНК
из ядра.
XAB2 10 XPA связывающий белок 2, РНК процессинг и сплайсинг.
PPAN 5 Peter pan гомолог, сплайсинг-фактор 1 второй шаг.
DDX39 10 DEAD бокс полипептид 39, АТФ-хеликаза-РНК, ССС.
LSM4 16 LSM4 гомолог, U6 sn-RNP ассоциированный белок, ССС.
SFRS14 43 Сплайсинг-фактор арг-сер богатый 14.
SF4 45 Сплайсинг-фактор 4, СС, ССС.
20.SNRPB 9 Sn-RNP полипептид B/B1, СС, мРНК процессинг и сплайсинг.
SFRS6 6 Сплайсинг-фактор арг-сер богатый 6, ССС, выбор сайта
сплайсинга.
PRPF6 52 Пре-мРНК процессинг фактор, сборка СС, U5 sn-RNP
ассоциированный белок 102 кДа.
SNRPB2 12 Sn-RNP B2, U2 sn-RNP, ССС.
CRNKL1 121 CRN гомолог, сборка СС, функция неизвестна.
RBM39 39 РНК связывающий главный белок 39, процессинг мРНК, ССС.
21.SFRS15 61 Сплайсинг-фактор арг-сер богатый 15, сплайсинг пре-мРНК.
U2AF1 15 U2 sn-RNP вспомогательный фактор 1, ССС.
LOC402026 1 Подобен арг-сер богатый 9.
115
22.SNRPD3 17 Sn-RNP D3 полипептид, 18 кДа, ССС, белок центра sn-RNP.
SF3A1 25 Сплайсинг-фактор 3A, субъединица 1, 120 кДа, ССС,
определение 3-сайта сплайсинга.
PHF5A 9 PHD-фингер белок 5A, U2 sn-RNP, СС.
NHP2L1 15 Негистоновый белок хромосом 2, подобный 1, ССС, рибосом
сборка и биогенез, U4/U6, U5 - три sn-RNP связывающий
РНК белок, 15, 5 кДа.
X.U2AF1L2 33 U2 sn-RNP вспомогательный фактор 1, подобен 2 минорный
компонент U12 СС.
THOC2 86 THO комплекс 2, ССС, экспорт мРНК из ядра.
NONO 18 Не POU домен октамер ATGCAAAT связывающий
белок, ССС, ДНК рекомбинация и репарация.
Y. -----
Всего 190 генов имеющих значение для сплайсинга.
ПРИЛОЖЕНИЕ 5. СПИСОК БОЛЬШИХ БЕЛКОВ ЧЕЛОВЕКА.
СОСТАВИЛ КУРНОСОВ М. Н. 14 АПРЕЛЯ 2011.
ABCA1 - 2261 AKAP9 - 3899 ATRX - 2288
ABCA10 - 1543 AKAP9 - 3907 ATRX - 2454
ABCA12 - 2277 AKAP9 - 3911 ATRX - 2492
ABCA12 - 2595 ALK - 1620 BAHCC1 - 2730
ABCA13 - 5058 ALMS1 - 4169 BAI1 - 1584
ABCA2 - 2436 ALPK3 - 1907 BAI2 - 1572
ABCA2 - 2466 ALS2 - 1657 BAI3 - 1522
ABCA3 - 1704 ANAPC1 - 1944 BAT2 - 2145
ABCA4 - 2273 ANK1 - 1719 BAT2 - 2157
ABCA5 - 1642 ANK1 - 1856 BAT2D1 - 2701
ABCA6 - 1617 ANK1 - 1880 BAZ1A - 1524
ABCA7 - 2008 ANK1 - 1881 BAZ1A - 1556
ABCA7 - 2146 ANK2 - 1872 BAZ2A - 1905
ABCA8 - 1581 ANK2 - 3957 BAZ2B - 2168
ABCA9 - 1624 ANK3 - 4377 BCOR - 1721
ABCC1 - 1531 ANKHD1 - 2542 BCORL1 - 1711
ABCC2 - 1545 ANKRD11 - 2663 BDP1 - 2254
ABCC3 - 1527 ANKRD12 - 2062 BIRC6 - 4829
ABCC6 - 1503 ANKRD17 - 2352 BRCA1 - 1567
ABCC8 - 1581 ANKRD17 - 2603 BRCA1 - 1598
ABCC9 - 1513 ANKRD26 - 1709 BRCA1 - 1624
ABCC9 - 1549 ANKRD31 - 1873 BRCA1 - 1822
ABCC9 - 1549 ANKRD31 - 1873 BRCA1 - 1863
ACACA - 2268 APC - 2843 BRCA1 - 1863
ACACA - 2288 APC2 - 2303 BRCA1 - 1863
ACACA - 2346 APOB - 4563 BRCA2 - 3418
ACACA - 2346 ARFGEF1 - 1849 BRWD1 - 2269
ACACA - 2383 ARFGEF2 - 1785 BRWD1 - 2320
ACACB - 2458 ARHGAP21- 1957 BRWD3 - 1802
ADAMTS12- 1594 ARHGAP23- 1684 BSN - 3926
ADAMTS20- 1502 ARHGAP5 - 1501 BTAF1 - 1849
ADAMTS20- 1908 ARHGAP5 - 1502 BTBD12 - 1834
ADAMTS7 - 1686 ARHGEF11- 1522 BZRAP1 - 1857
ADAMTS9 - 1935 ARHGEF11- 1562 C10ORF18- 2726
ADAMTSL3- 1691 ARHGEF12- 1544 C10ORF18- 2726
AGC1 - 2316 ARHGEF17- 2063 C10ORF79- 1665
AGC1 - 2415 ARHGEF5 - 1597 C10ORF93- 1642
AGL - 1515 ARID1A - 2068 C12ORF35- 1747
AGL - 1516 ARID1A - 2285 C14ORF78- 5048
AGL - 1532 ARID1B - 2178 C14ORF78- 6287
116
AGL - 1532 ARID1B - 2191 C17ORF27- 3280
AGL - 1532 ARID1B - 2231 C17ORF41- 1818
AGL - 1532 ARID2 - 1835 C17ORF41- 1844
AGRIN - 1823 ASCC3 - 2202 C1ORF173- 1530
AGRIN - 2045 ASCC3L1 - 2136 C20ORF174 1677
AHCTF - 2266 ASH1L - 2969 C20ORF174 1677
AHCTF1 - 2223 ASPM - 3477 C20ORF74- 1873
AHDC1 - 1603 ASXL1 - 1541 C2ORF16 - 1984
AHNAK - 5890 ATBF1 - 3703 C3 - 1663
AIM1 - 1723 ATM - 1708 C4A - 1744
AKAP11 - 1901 ATM - 3056 C4B - 1744
AKAP12 - 1684 ATP10B - 1520 C5 - 1676
AKAP12 - 1782 ATP10B - 1520 C8ORFK23- 1857
AKAP13 - 2813 ATP7A - 1500 C9ORF84 - 1508
AKAP6 - 2319 ATR - 2612 CABIN1 - 2220
AKAP9 - 1655 ATR - 2644 CACNA1A - 2261
CACNA1A - 2505 CHD1 - 1710 CPAMD8 - 1885
CACNA1B - 2339 CHD2 - 1739 CPS1 - 1500
CACNA1C - 2138 CHD3 - 1966 CR1 - 1520
CACNA1D - 2181 CHD3 - 2000 CR1 - 2039
CACNA1E - 2270 CHD3 - 2045 CR1 - 2489
CACNA1F - 1977 CHD4 - 1912 CREBBP - 2442
CACNA1G - 1555 CHD5 - 1954 CROCC - 2017
CACNA1G - 2243 CHD6 - 2715 CSMD1 - 3565
CACNA1G - 2250 CHD7 - 2997 CSMD2 - 3487
CACNA1G - 2261 CHD8 - 2302 CSMD3 - 3501
CACNA1G - 2266 CHD9 - 2898 CSMD3 - 3667
CACNA1G - 2273 CIC - 1608 CSMD3 - 3707
CACNA1G - 2284 CIT - 2027 CSPG2 - 3396
CACNA1G - 2298 CKAP5 - 1972 CSPG4 - 2322
CACNA1G - 2306 CKAP5 - 2032 CTTNBP2 - 1663
CACNA1G - 2321 CLASP1 - 1538 CUBN - 3623
CACNA1G - 2332 CLASP2 - 1506 CUL7 - 1698
CACNA1G - 2343 CLTC - 1675 CUTL1 - 1505
CACNA1G - 2354 CLTCL1 - 1569 CXXC6 - 2136
CACNA1G - 2377 CLTCL1 - 1626 DCHS1 - 3298
CACNA1H - 2347 CMYA1 - 1843 DCHS2 - 2916
CACNA1H - 2353 CMYA3 - 3345 DENND4A - 1865
CACNA1I - 2188 CMYA5 - 4069 DENND4B - 1708
CACNA1I - 2223 CNOT1 - 1551 DENND4B - 1725
CACNA1S - 1873 CNOT1 - 2376 DENND4C - 1557
CAD - 2225 COL11A1 - 1767 DEPDC2 - 1606
CAMTA1 - 1673 COL11A1 - 1806 DEPDC5 - 1572
CASC5 - 2316 COL11A1 - 1818 DICER1 - 1922
CASC5 - 2342 COL11A2 - 1629 DICER1 - 1922
CASP8AP2- 1982 COL11A2 - 1650 DIDO1 - 2240
CCDC108 - 1925 COL11A2 - 1736 DIP2A - 1571
CCDC131 - 1989 COL12A1 - 1899 DIP2B - 1576
CDC2L5 - 1512 COL12A1 - 3063 DIP2C - 1556
CDC42BPA- 1638 COL14A1 - 1796 DISP1 - 1524
CDC42BPA- 1719 COL16A1 - 1603 DKFZP586P0123 - 1963
CDC42BPB- 1711 COL18A1 - 1516 DLC1 - 1528
CDC42BPG- 1551 COL22A1 - 1626 DLEC1 - 1755
CDH23 - 3354 COL24A1 - 1714 DLEC1 - 1778
CDK5RAP2- 1814 COL27A1 - 1860 DLG5 - 1809
CDK5RAP2- 1893 COL4A1 - 1669 DMBT1 - 1784
CECR2 - 1548 COL4A2 - 1712 DMBT1 - 1785
CECR2 - 2548 COL4A3 - 1637 DMBT1 - 2403
CELSR1 - 3014 COL4A3 - 1670 DMBT1 - 2413
CELSR2 - 2923 COL4A4 - 1690 DMD - 2341
CELSR3 - 3312 COL4A5 - 1685 DMD - 2344
CENPE - 2701 COL4A5 - 1688 DMD - 3562
117
CENPF - 3114 COL4A6 - 1690 DMD - 3562
CENTD1 - 1704 COL4A6 - 1691 DMD - 3677
CENTD3 - 1544 COL5A1 - 1838 DMD - 3681
CEP110 - 2325 COL5A3 - 1745 DMD - 3685
CEP170 - 1584 COL6A3 - 2971 DMN - 1565
CEP192 - 1941 COL6A3 - 2976 DMXL1 - 3027
CEP250 - 2386 COL6A3 - 2977 DMXL2 - 3036
CEP250 - 2442 COL6A3 - 3010 DNAH1 - 4330
CEP290 - 2479 COL6A3 - 3177 DNAH11 - 4523
CEP350 - 3117 COL7A1 - 2944 DNAH3 - 4116
DNAH5 - 4624 FALZ - 2903 FRY - 3012
DNAH7 - 4024 FALZ - 2920 GARNL1 - 2036
DNAH8 - 4490 FAM38A - 2035 GARNL1 - 2083
DNAH9 - 4486 FAM44A - 3051 GBF1 - 1859
DNAJC13 - 2243 FANCM - 2048 GCC2 - 1583
DNHD3 - 4427 FASN - 2511 GCC2 - 1684
DNMBP - 1577 FAT - 4588 GCN1L1 - 2671
DNMT1 - 1616 FAT2 - 4349 GEMIN5 - 1508
DOCK1 - 1865 FAT3 - 4601 GLI2 - 1586
DOCK11 - 2073 FAT3 - 4601 GLI3 - 1580
DOCK2 - 1830 FAT4 - 3222 GLTSCR1 - 1509
DOCK3 - 2030 FBN1 - 2871 GOLGA4 - 2230
DOCK4 - 1966 FBN2 - 2912 GOLGB1 - 3259
DOCK5 - 1870 FBN3 - 2809 GON4L - 1529
DOCK6 - 2047 FCGBP - 3070 GON4L - 2240
DOCK7 - 2109 FCGBP - 5405 GPATC8 - 1502
DOCK8 - 2031 FER1L3 - 2048 GPR112 - 3080
DOCK9 - 2069 FER1L3 - 2061 GPR179 - 1668
DOPEY1 - 2465 FLG - 4061 GPR179 - 2367
DOPEY2 - 2298 FLG2 - 2391 GPR98 - 6307
DOT1L - 1537 FLG40176- 2452 GREB1 - 1949
DSCAM - 1571 FLJ10357- 1519 GRLF1 - 1513
DSCAM - 2012 FLJ13231- 2095 GTF3C1 - 2109
DSCAML1 - 2113 FLJ20035- 1712 GVIN1 - 2423
DSI - 2649 FLJ23577- 1822 GVIN1 - 2423
DSP - 2272 FLJ23588- 1501 HAK - 1933
DSP - 2871 FLJ30092- 3000 HCFC1 - 1938
DST - 3062 FLJ30092- 3000 HD - 3144
DST - 5171 FLJ31033- 1707 HEATR1 - 2144
DST - 5497 FLJ31033- 1723 HECTD1 - 2612
DUOX1 - 1551 FLJ34306- 1634 HECW1 - 1606
DUOX1 - 1551 FLJ36157- 1692 HECW2 - 1572
DUOX2 - 1548 FLJ36157- 1692 HELZ - 1942
DYNC1H1 - 4646 FLJ40176- 2452 HERC1 - 4861
DYNC2H1 - 4307 FLJ40243- 1585 HERC2 - 4834
DYNC2H1 - 4307 FLJ43950- 1596 HIVEP1 - 2717
DYNC2H1 - 4314 FLJ46321- 1576 HIVEP2 - 2500
DYSF - 2080 FLNA - 2647 HIVEP3 - 2406
EDD1 - 2799 FLNB - 2602 HMCN1 - 5636
EFCAB5 - 1503 FLNC - 2705 HSPG2 - 4391
EHBP1L1 - 1523 FMN2 - 1865 HUWE1 - 4374
EIF2AK4 - 1649 FN1 - 2176 IANC1 - 1861
EIF4G1 - 1512 FN1 - 2296 IFT172 - 1749
EIF4G1 - 1599 FN1 - 2330 IGF2R - 2491
EIF4G1 - 1599 FN1 - 2355 IGSF10 - 2623
EIF4G3 - 1585 FN1 - 2421 INADL - 1524
EML5 - 1977 FN1 - 2477 INADL - 1552
EP300 - 2414 FNDC1 - 1836 INADL - 1582
EP400 - 3122 FRAP1 - 2549 INADL - 1801
EPPK1 - 5065 FRAS1 - 4011 INOC1 - 1556
EPRS - 1512 FREM2 - 3169 INTS1 - 2381
ESPL1 - 2120 FREM3 - 2289 INTS1 - 2382
118
EVPL - 2033 FREM3 - 2289 INTS1 - 2382
EXPH5 - 1989 FRMPD1 - 1578 IQGAP1 - 1657
F5 - 2224 FRMPD3 - 1810 IQGAP2 - 1575
F8 - 2351 FRMPD3 - 1810 IQGAP3 - 1631
ITGB4 - 1752 KIAA1509- 2035 LBA1 - 3118
ITGB4 - 1805 KIAA1509- 2035 LCT - 1927
ITGB4 - 1822 KIAA1542- 1649 LMTK2 - 1503
ITPR1 - 2695 KIAA1549- 1884 LOC121006 1628
ITPR2 - 2701 KIAA1549- 1884 LOC121006 1951
ITPR3 - 2671 KIAA1549- 1884 LOC127602 3198
ITSN1 - 1721 KIAA1571- 2354 LOC127602 3198
ITSN2 - 1669 KIAA1571- 2354 LOC131873 2479
ITSN2 - 1696 KIAA1618- 1600 LOC131873 2479
JARID1A - 1722 KIAA1632- 2579 LOC150221 1639
JARID1B - 1544 KIAA1639- 1778 LOC285556 1826
JMJD1B - 1761 KIAA1666- 1639 LOC285556 1826
JMJD1C - 2303 KIAA1666- 1639 LOC339766 1806
JMJD3 - 1682 KIAA1679- 1577 LOC339766 1832
JMJD3 - 1684 KIAA1713- 1955 LOC440804 1639
KALRN - 1663 KIAA1713- 2223 LOC642103 1518
KALRN - 2985 KIAA1769- 1577 LOC642132 1602
KIAA0100- 2235 KIAA1787- 1560 LOC643677 3632
KIAA0133- 1524 KIAA1787- 1562 LOC647546 1527
KIAA0363- 1759 KIAA1797- 1801 LOC648187 1797
KIAA0363- 1782 KIAA1840- 2443 LOC648502 3534
KIAA0363- 1782 KIAA1856- 1687 LOC649768 5205
KIAA0367- 2724 KIAA1856- 1687 LOC650412 4107
KIAA0368- 2017 KIAA1856- 1687 LOC65120- 1572
KIAA0368- 2017 KIAA1863- 1706 LOC651200 1572
KIAA0372- 1564 KIAA2002- 1746 LOC651610 2932
KIAA0404- 1938 KIAA2002- 1746 LOC651758 1702
KIAA0423- 1720 KIAA2018- 2186 LOC651921 2011
KIAA0430- 1742 KIAA2022- 1516 LOC652147 1622
KIAA0467- 2533 KIDINS220 1771 LOC653489 1757
KIAA0556- 1618 KIF13A - 1805 LOC653489 1758
KIAA0564- 1905 KIF13B - 1826 LOC653489 1760
KIAA0586- 1504 KIF14 - 1648 LOC653489 1766
KIAA0802- 1586 KIF1A - 1690 LOC653877 2785
KIAA0947- 2556 KIF1B - 1770 LOC727851 1625
KIAA0947- 2659 KIF21A - 1661 LOC727851 1734
KIAA0960- 1657 KIF21B - 1624 LOC727851 1756
KIAA0960- 1657 KIF26A - 1882 LOC727851 1765
KIAA0960- 1657 KIF26A - 2042 LOC727897 5708
KIAA1109- 4975 KIF26B - 2108 LOC727957 1706
KIAA1109- 5005 KIF26B - 2108 LOC728307 1934
KIAA1210- 1569 KNDC1 - 1749 LOC728317 2028
KIAA1210- 1569 KNTC1 - 2209 LOC728763 1529
KIAA1212- 1843 LAMA1 - 3069 LOC728849 2493
KIAA1217- 1943 LAMA1 - 3075 LOC729197 3784
KIAA1239- 1742 LAMA2 - 3122 LOC729540 1655
KIAA1239- 1742 LAMA3 - 1724 LOC729540 1734
KIAA1244- 2106 LAMA3 - 3333 LOC729540 1756
KIAA1305- 1898 LAMA4 - 1816 LOC729540 1765
KIAA1305- 1898 LAMA5 - 3695 LOC729605 1545
KIAA1345- 1561 LAMB1 - 1786 LOC729792 1612
KIAA1345- 1561 LAMB2 - 1798 LOC729857 1745
KIAA1409- 2458 LAMB4 - 1761 LOC729857 1747
KIAA1414- 2071 LAMC1 - 1609 LOC729857 1763
KIAA1429- 1812 LAMC3 - 1575 LOC729859 1756
KIAA1509- 2028 LBA1 - 3118 LOC729871 3437
LOC730401 1521 MEGF6 - 1565 MYO10 - 2058
LOC730409 1521 MEGF8 - 2386 MYO15A - 3530
119
LOC730429 2796 MGA - 3033 MYO18A - 2039
LOC730839 1885 MGA - 3033 MYO18A - 2054
LOC730855 3141 MGA - 3114 MYO18B - 2567
LOC730979 2061 MGA - 3114 MYO3A - 1616
LOC731751 4096 MGAM - 1857 MYO5A - 1855
LOC732021 1521 MGC22014- 1660 MYO5B - 1848
LOC732294 1559 MGC22014- 1660 MYO5B - 1848
LOC90342- 2217 MIA3 - 1808 MYO5C - 1742
LOC90342- 2217 MIA3 - 1808 MYO7A - 2215
LOXHD1 - 1533 MIA3 - 1848 MYO7B - 2116
LPA - 4548 MIA3 - 1907 MYO7B - 2116
LRBA - 2863 MIA3 - 1907 MYO9A - 2548
LRKK2 - 2537 MKI67 - 3256 MYO9B - 2157
LRP1 - 4544 MLL - 3969 MYOM1 - 1685
LRP1B - 4599 MLL2 - 5262 MYR8 - 1858
LRP2 - 4655 MLL3 - 4025 MYST3 - 2004
LRP4 - 1905 MLL3 - 4911 MYST4 - 2073
LRP5 - 1615 MLL4 - 2715 N4BP2 - 1770
LRP6 - 1613 MLL5 - 1858 NAG - 2371
LRRC37A - 1606 MLL5 - 1858 NAV1 - 1874
LRRC7 - 1537 MLLT4 - 1612 NAV2 - 2429
LRRK1 - 2015 MLLT4 - 1651 NAV2 - 2488
LTBP1 - 1722 MLLT4 - 1834 NAV3 - 2363
LTBP2 - 1821 MON2 - 1717 NBEA - 2946
LTBP4 - 1587 MPDZ - 2042 NBEAL2 - 2833
LY75 - 1722 MPHOSPH1- 1780 NBEAL2 - 2833
LYST - 2001 MUC16 - 14507 NCOA6 - 2063
LYST - 3801 MUC17 - 4493 NCOR1 - 2440
MACF1 - 5430 MUC19 - 4516 NCOR2 - 2524
MACF1 - 5938 MUC19 - 7328 NEB - 6669
MADD - 1545 MUC2 - 5179 NES - 1621
MADD - 1565 MUC4 - 2169 NF1 - 2818
MADD - 1581 MUC6 - 1841 NFAT5 - 1531
MADD - 1588 MXRA5 - 2828 NHS - 1517
MADD - 1588 MYCBP2 - 4640 NHS - 1630
MADD - 1608 MYH1 - 1939 NHSL1 - 1977
MADD - 1647 MYH11 - 1938 NHSL1 - 1977
MAP1A - 2680 MYH11 - 1972 NIN - 2029
MAP1B - 2342 MYH13 - 1938 NIN - 2073
MAP1B - 2468 MYH14 - 1995 NIN - 2090
MAP2 - 1827 MYH15 - 1946 NIN - 2096
MAP3K1 - 1748 MYH15 - 1946 NIN - 2116
MAP3K1 - 1773 MYH2 - 1941 NIPBL - 2697
MAP3K4 - 1558 MYH3 - 1940 NIPBL - 2804
MAP3K4 - 1608 MYH4 - 1939 NISCH - 1504
MAPKBP1 - 1508 MYH6 - 1939 NOD27 - 1866
MASK-BP3- 2617 MYH7 - 1935 NOTCH1 - 2556
MAST1 - 1570 MYH7B - 1983 NOTCH2 - 2279
MAST2 - 1734 MYH8 - 1937 NOTCH2 - 2471
MCM3AP - 1980 MYH9 - 1960 NOTCH3 - 2321
MDC1 - 2089 MYLK - 1794 NOTCH4 - 2003
MDN1 - 5596 MYLK - 1845 NRAP - 1695
MED12 - 2212 MYLK - 1863 NRAP - 1730
MED12L - 2145 MYLK - 1914 NRK - 1582
NRXN2 - 1642 PIK3C2B - 1634 PTPN13 - 2490
NRXN2 - 1712 PIK4CA - 2044 PTPN23 - 1636
NSD1 - 2427 PIP5K3 - 1779 PTPRB - 1997
NSD1 - 2696 PIP5K3 - 2098 PTPRD - 1501
NUMA1 - 2115 PKD1 - 4302 PTPRD - 1899
NUP188 - 1749 PKD1 - 4303 PTPRD - 1903
NUP205 - 2012 PKD1L1 - 2849 PTPRD - 1912
NUP210 - 1887 PKD1L2 - 1817 PTPRF - 1888
120
NUP210L - 1591 PKD1L2 - 2459 PTPRF - 1897
NUP214 - 2090 PKD1L3 - 1731 PTPRQ - 2978
NUP98 - 1726 PKD1L3 - 1731 PTPRQ - 2978
NUP98 - 1800 PKDREJ - 2253 PTPRS - 1501
OBSCN - 6620 PKHD1 - 3396 PTPRS - 1505
OBSL1 - 1530 PKHD1 - 4074 PTPRS - 1910
OBSL1 - 1530 PKHD1L1 - 4243 PTPRS - 1948
ODZ1 - 2725 PLCE1 - 2303 PTPRZ1 - 2315
ODZ2 - 2029 PLCH1 - 1655 PXDN - 1559
ODZ2 - 2029 PLEC1 - 4515 QRICH2 - 1663
ODZ2 - 2029 PLEC1 - 4525 RAI1 - 1906
ODZ2 - 2535 PLEC1 - 4533 RANBP2 - 3224
ODZ2 - 2609 PLEC1 - 4547 RAPGEF2 - 1528
ODZ2 - 2609 PLEC1 - 4547 RAPGEF2 - 1528
ODZ3 - 2699 PLEC1 - 4551 RAPGEF2 - 1569
ODZ3 - 2699 PLEC1 - 4574 RAPGEF2 - 1569
ODZ3 - 2715 PLEC1 - 4684 RAPGEF2 - 1672
ODZ3 - 2736 PLXNA1 - 1873 RAPGEF2 - 1672
ODZ4 - 2769 PLXNA2 - 1894 RAPGEF6 - 1601
OTOF - 1997 PLXNA3 - 1871 RB1CC1 - 1594
OTOG - 2924 PLXNB1 - 2135 RBBP6 - 1758
OTOG - 2924 PLXNB2 - 1884 RBBP6 - 1792
PAPPA - 1627 PLXNB2 - 1901 RELN - 3458
PAPPA2 - 1790 PLXNB3 - 1909 RELN - 3460
PARC - 2517 PLXNC1 - 1568 RERE - 1566
PARP14 - 1518 PLXND1 - 1925 REV3L - 3052
PARP4 - 1724 POLE - 2286 RGNEF - 1651
PB1 - 1582 POLQ - 2590 RGNEF - 1651
PB1 - 1582 POLR1A - 1717 RGNEF - 1687
PB1 - 1602 POLR2A - 1970 RGPD2 - 1748
PCDH15 - 1955 PPARBP - 1581 RGPD5 - 1765
PCF11 - 1555 PPL - 1756 RICS - 1738
PCLO - 5010 PPRC1 - 1664 RICTOR - 1708
PCLO - 5011 PRDM15 - 1507 RIF1 - 2472
PCLO - 5021 PRDM2 - 1682 RIMS1 - 1692
PCM1 - 2022 PRDM2 - 1718 RLF - 1914
PCNT - 3336 PREX1 - 1659 RNF17 - 1623
PCNX - 2341 PRIC285 - 2080 ROBO1 - 1612
PCNXL3 - 1843 PRIC285 - 2649 ROBO1 - 1651
PCNXL3 - 1843 PRKDC - 4128 ROS1 - 2347
PCNXL3 - 1915 PRPF8 - 2335 RP1 - 2156
PCNXL3 - 1915 PRR12 - 2187 RP1L1 - 2480
PDCD11 - 1871 PSME4 - 1729 RREB1 - 1687
PDE4DIP - 2346 PTCHD2 - 1585 RREB1 - 1687
PDZD2 - 2839 PTCHD2 - 1586 RREB1 - 1742
PEG3 - 1588 PTPN13 - 2294 RTTN - 2226
PHF3 - 2039 PTPN13 - 2466 RUSC2 - 1516
PIK3C2A - 1686 PTPN13 - 2485 RYR1 - 5038
RYR2 - 4967 SPTA1 - 2429 TNRC6A - 1962
RYR3 - 4870 SPTAN1 - 2472 TNRC6B - 1722
SAC - 1610 SPTB - 2137 TNRC6C - 1690
SACS - 4432 SPTB - 2328 TNS1 - 1735
SAMD9 - 1589 SPTBN1 - 2155 TNXB - 4289
SAMD9L - 1584 SPTBN1 - 2364 TOP2A - 1531
SBF1 - 1867 SPTBN2 - 2390 TOP2B - 1621
SBF2 - 1849 SPTBN4 - 2559 TP53BP1 - 1972
SCN10A - 1956 SPTBN4 - 2564 TPR - 2349
SCN11A - 1791 SPTBN5 - 3674 TRIO - 3097
SCN1A - 1998 SRCAP - 2971 TRIOBP - 2365
SCN2A2 - 2005 SRRM2 - 2752 TRIP11 - 1979
SCN2A2 - 2005 STAB1 - 2570 TRIP12 - 1992
SCN2A2 - 2005 STARD9 - 4552 TRPM1 - 1603
121
SCN3A - 2000 STRC - 1775 TRPM2 - 1503
SCN4A - 1836 SUPT6H - 1726 TRPM3 - 1544
SCN5A - 1663 SVEP1 - 3568 TRPM3 - 1554
SCN5A - 2015 SVEP1 - 3568 TRPM3 - 1556
SCN5A - 2016 SVIL - 1788 TRPM3 - 1566
SCN7A - 1682 SVIL - 2214 TRPM3 - 1569
SCN8A - 1980 SYCP2 - 1530 TRPM3 - 1579
SCN9A - 1977 SYNE1 - 3321 TRPM3 - 1707
SCRIB - 1630 SYNE1 - 8749 TRPM6 - 2022
SCRIB - 1655 SYNE1 - 8797 TRPM7 - 1864
SDK1 - 2213 SYNE2 - 3269 TRRAP - 3830
SDK2 - 1851 SYNE2 - 6883 TSC2 - 1763
SETBP1 - 1542 SYNJ1 - 1573 TSC2 - 1764
SETD1A - 1707 TACC2 - 2948 TSC2 - 1807
SETD1B - 2145 TAF1 - 1872 TTBK2 - 1649
SETX - 2677 TAF1 - 1893 TTC28 - 2481
SHANK1 - 2161 TAF1L - 1826 TTC28 - 2481
SHANK3 - 1747 TANC2 - 1900 TTC3 - 2025
SHANK3 - 1823 TANC2 - 1900 TTC3 - 2025
SHPRH - 1659 TARBP1 - 1621 TTN - 26926
SHRM - 1995 TCF20 - 1938 TTN - 27051
SHROOM2 - 1616 TCF20 - 1964 TTN - 27118
SI - 1827 TDRD6 - 2096 TTN - 33423
SIGLEC1 - 1709 TECTA - 2155 TTN - 5604
SIPA1L1 - 1804 TEP1 - 2627 TUBGCP6 - 1819
SIPA1L3 - 1781 TEX15 - 2789 TULP4 - 1543
SKIP - 1671 TG - 2768 UBR1 - 1749
SLIT2 - 1529 THADA - 1953 UBR2 - 1755
SMARCA2 - 1572 THRAP1 - 2174 UGCGL1 - 1531
SMARCA2 - 1590 THRAP2 - 2210 UGCGL1 - 1555
SMARCA4 - 1647 TIAM1 - 1591 UGCGL2 - 1516
SMCHD1 - 1861 TIAM2 - 1701 UNC13A - 1724
SMCHD1 - 1861 TJP1 - 1668 UNC13A - 1791
SMCX - 1560 TJP1 - 1748 UNC13B - 1591
SMCY - 1539 TLN1 - 2541 UNC13C - 2214
SMG1 - 3661 TLN2 - 2542 UNC13C - 2214
SON - 2303 TMEM131 - 1770 USH2A - 1546
SON - 2426 TMEM131 - 1770 USH2A - 5202
SORL1 - 2214 TMEM131 - 1883 USP24 - 2454
SPAG17 - 2223 TNC - 2201 USP24 - 2460
SPEG - 3649 TNKS1BP1- 1729 USP32 - 1604
SPEN - 3664 TNRC6A - 1709 USP34 - 3395
USP9X - 2554 VWF - 2813 ZFP106 - 1883
USP9X - 2570 WDFY3 - 3526 ZFYVE16 - 1539
USP9Y - 2555 WDR62 - 1518 ZFYVE26 - 2539
UTP20 - 2785 WDR87 - 2602 ZMYM4 - 1548
UTRN - 3433 WDR90 - 1748 ZNF142 - 1524
VGCNL1 - 1738 WNK1 - 2382 ZNF236 - 1845
VPRBP - 1507 WNK2 - 2217 ZNF292 - 2723
VPS13A - 3069 WNK3 - 1743 ZNF294 - 1766
VPS13A - 3095 WNK3 - 1800 ZNF318 - 2099
VPS13A - 3135 XRN1 - 1706 ZNF462 - 2506
VPS13A - 3174 YLPM1 - 2146 ZNF469 - 3925
VPS13B - 3997 YLPM1 - 2146 ZNF608 - 1512
VPS13B - 3997 ZAN - 2721 ZNF638 - 1978
VPS13B - 4022 ZAN - 2812 ZNF638 - 1978
VPS13C - 3585 ZC3H13 - 1564 ZNF646 - 1832
VPS13C - 3628 ZCCHC11 - 1640 ZNFX1 - 1918
VPS13C - 3710 ZCCHC11 - 1644 ZUBR1 - 5183
VPS13D - 4363 ZCCHC11 - 1645 ZZEF1 - 2961
VPS13D - 4388 ZFHX4 - 3567
VPS13S - 3753 ZFNX2 - 1517
122
Приложение 6. Список повторов в изученных интронах генов-гигантов.Список генерирован программой для поиска повторов. Каждый интрон был разбит мной на
последовательные участки, которые по порядку названы локусами.Автор Курносов М.Н.
GENE - DISC1-i9
LOCUS 0. 001 23144 bp
DEFINITION
repeat_region complement(3207. . 3484)
/note= "Alu"
repeat_region complement(4129. . 4541)
/note= "MSTC"
repeat_region complement(8483. . 8768)
/note= "Alu"
repeat_region 8501. . 8636
/note= "SVA"
repeat_region complement(10859. . 11134)
/note= "Alu"
repeat_region 10872. . 11014
/note= "FRAM"
repeat_region complement(11154. . 11561)
/note= "LTR7"
repeat_region 11156. . 11470
/note= "RETROVIRAL4"
repeat_region 11570. . 11940
/note= "RETROVIRAL2"
repeat_region 12297. . 13225
/note= "RETROVIRAL3"
repeat_region 16721. . 17034
/note= "RETROVIRAL4"
repeat_region 16960. . 17108
/note= "RETROVIRAL4"
repeat_region complement(16719. . 17156)
/note= "LTR7"
repeat_region complement(21115. . 21488)
/note= "MSTA"
repeat_region complement(22201. . 22298)
/note= "Alu"
repeat_region 22489. . 22637
/note= "MER46"
LOCUS 0. 002 23139 bp
DEFINITION
repeat_region 2568. . 2834
/note= "MER21B"
repeat_region complement(2780. . 2942)
/note= "MER4A"
repeat_region complement(2780. . 3012)
/note= "MER4B"
repeat_region 3010. . 3274
/note= "Alu"
repeat_region complement(3402. . 3598)
/note= "MER4B"
repeat_region complement(5371. . 5761)
/note= "MLT1B"
repeat_region complement(5511. . 5761)
/note= "MLT1C"
repeat_region complement(7470. . 7759)
/note= "Alu"
repeat_region 7500. . 7755
/note= "SVA"
repeat_region 7492. . 7625
/note= "FRAM"
repeat_region 13218. . 13354
/note= "FRAM"
repeat_region 11588. . 11932
/note= "MER7A"
repeat_region 11588. . 11864
/note= "MER7B"
repeat_region complement(13068. . 13355)
/note= "Alu"
repeat_region complement(17606. . 17795)
/note= "MLT1D"
repeat_region complement(17604. . 17965)
/note= "MLT1A"
repeat_region 18621. . 18838
/note= "MER46"
repeat_region complement(21585. . 21870)
/note= "Alu"
123
repeat_region 22722. . 23008
/note= "Alu"
LOCUS 0. 003 23136 bp
DEFINITION
repeat_region 3781. . 3913
/note= "Alu"
repeat_region 3920. . 4091
/note= "Alu"
repeat_region 4583. . 4653
/note= "MER28"
repeat_region 4567. . 4653
/note= "TIGGER2-2"
repeat_region complement(4626. . 4784)
/note= "MSTC"
repeat_region complement(4626. . 4752)
/note= "MSTA"
repeat_region complement(9053. . 9350)
/note= "Alu"
repeat_region complement(9369. . 9659)
/note= "Alu"
repeat_region 9385. . 9513
/note= "SVA"
repeat_region 9794. . 9892
/note= "Alu"
repeat_region 9831. . 10125
/note= "Alu"
repeat_region 11269. . 11379
/note= "THE1B"
repeat_region 11269. . 11694
/note= "MSTA"
repeat_region 11600. . 11694
/note= "THE1B"
repeat_region 11512. . 11694
/note= "MSTC"
repeat_region 14242. . 14470
/note= "MER46"
repeat_region 15173. . 15583
/note= "MSTC"
repeat_region 15174. . 15579
/note= "MSTA"
repeat_region 15173. . 15277
/note= "MLT1A"
repeat_region complement(16422. . 16837)
/note= "MLT1B"
repeat_region complement(16579. . 16837)
/note= "MLT1C"
repeat_region complement(21078. . 21459)
/note= "MLT1A"
repeat_region complement(22073. . 22360)
/note= "Alu"
LOCUS 0. 004 23145 bp
DEFINITION
repeat_region 528. . 811
/note= "Alu"
repeat_region 3175. . 3395
/note= "MER30"
repeat_region 4945. . 5237
/note= "Alu"
repeat_region 10715. . 11004
/note= "Alu"
repeat_region complement(10855. . 10991)
/note= "SVA"
repeat_region 11277. . 11442
/note= "MER5A"
repeat_region 14409. . 14673
/note= "Alu"
repeat_region 17402. . 17696
/note= "Alu"
repeat_region 17696. . 18012
/note= "MER42C"
repeat_region complement(18098. . 18384)
/note= "Alu"
repeat_region complement(19231. . 19928)
/note= "L1-4"
repeat_region complement(19929. . 21743)
/note= "L1-3"
repeat_region complement(21744. . 23145)
/note= "L1-2"
124
LOCUS 0. 005 23138 bp
DEFINITION
repeat_region complement(1. . 422)
/note= "L1-2"
repeat_region complement(423. . 1682)
/note= "L1-1"
repeat_region complement(1840. . 2094)
/note= "Alu"
repeat_region 4422. . 4708
/note= "Alu"
repeat_region 5315. . 5582
/note= "Alu"
repeat_region complement(5428. . 5561)
/note= "SVA"
repeat_region complement(9837. . 10133)
/note= "Alu"
repeat_region 9867. . 9991
/note= "SVA"
repeat_region 11917. . 12215
/note= "Alu"
repeat_region complement(12060. . 12194)
/note= "SVA"
repeat_region 13602. . 13739
/note= "SVA"
repeat_region complement(13587. . 13875)
/note= "Alu"
repeat_region 14472. . 14937
/note= "MLT1C"
repeat_region 14483. . 14841
/note= "MLT1D"
repeat_region 14801. . 14937
/note= "MLT1B"
repeat_region complement(17271. . 18200)
/note= "L1-2"
LOCUS 0. 006 23136 bp
DEFINITION
repeat_region 3888. . 4173
/note= "MLT1D"
repeat_region 4099. . 4343
/note= "MLT1D"
repeat_region 4191. . 4507
/note= "MLT1E"
repeat_region 5029. . 5127
/note= "MIR2"
repeat_region complement(5535. . 5822)
/note= "Alu"
repeat_region 5555. . 5684
/note= "SVA"
repeat_region complement(7266. . 7550)
/note= "Alu"
repeat_region 7286. . 7409
/note= "SVA"
repeat_region 8164. . 8453
/note= "Alu"
repeat_region complement(8304. . 8440)
/note= "SVA"
repeat_region complement(9516. . 9805)
/note= "Alu"
repeat_region 10555. . 11645
/note= "L1-2"
repeat_region 10608. . 11899
/note= "L1-2"
repeat_region 11900. . 13713
/note= "L1-3"
repeat_region 13715. . 14397
/note= "L1-4"
repeat_region complement(14661. . 14949)
/note= "Alu"
repeat_region 14679. . 14809
/note= "SVA"
repeat_region 17566. . 17767
/note= "Alu"
repeat_region 17694. . 17866
/note= "Alu"
repeat_region 17743. . 17866
/note= "Alu"
repeat_region complement(21279. . 21571)
/note= "Alu"
125
repeat_region 21300. . 21432
/note= "SVA"
repeat_region complement(21770. . 22213)
/note= "MER39"
LOCUS 0. 007 1474 bp
DEFINITION
GENE - NEGR1-i6
LOCUS 0. 001 23921 bp
DEFINITION
repeat_region complement(500. . 791)
/note= "Alu"
repeat_region complement(4505. . 4653)
/note= "MIR"
repeat_region complement(6427. . 6605)
/note= "MIR"
repeat_region complement(7205. . 7494)
/note= "Alu"
repeat_region 7226. . 7359
/note= "SVA"
repeat_region complement(7505. . 7695)
/note= "Alu"
repeat_region 9832. . 10035
/note= "MIR"
repeat_region 11545. . 11781
/note= "Alu"
repeat_region 16395. . 18126
/note= "TIGGER1-1"
repeat_region 17634. . 18317
/note= "TIGGER1-1"
repeat_region 18318. . 18583
/note= "TIGGER1-2"
repeat_region 23367. . 23652
/note= "Alu"
repeat_region complement(23506. . 23627)
/note= "SVA"
LOCUS 0. 002 23937 bp
DEFINITION
repeat_region 4922. . 5254
/note= "MALR-1"
repeat_region 9815. . 9930
/note= "FRAM"
repeat_region complement(9796. . 10086)
/note= "Alu"
repeat_region 11181. . 11468
/note= "Alu"
repeat_region 11675. . 11941
/note= "MLT1B"
repeat_region 13885. . 14096
/note= "Alu"
repeat_region complement(13941. . 14074)
/note= "SVA"
repeat_region 14100. . 14272
/note= "MLT1D"
repeat_region 14125. . 14272
/note= "MLT1B"
repeat_region 17813. . 18105
/note= "Alu"
repeat_region 19224. . 19450
/note= "L1-3"
repeat_region 19456. . 20072
/note= "L1-4"
LOCUS 0. 003 23937 bp
DEFINITION
repeat_region 5131. . 5388
/note= "Alu"
repeat_region complement(8635. . 8927)
/note= "Alu"
repeat_region 8657. . 8781
/note= "SVA"
repeat_region complement(9258. . 9558)
/note= "MER33"
repeat_region 11082. . 11371
/note= "Alu"
repeat_region complement(11076. . 11359)
/note= "SVA"
repeat_region 21180. . 21418
/note= "SVA"
126
repeat_region complement(21153. . 21378)
/note= "Alu"
LOCUS 0. 004 23937 bp
DEFINITION
repeat_region 8421. . 8503
/note= "Alu"
repeat_region 10865. . 10984
/note= "MIR2"
repeat_region 14752. . 15042
/note= "Alu"
repeat_region complement(14886. . 15010)
/note= "SVA"
repeat_region 18728. . 19016
/note= "Alu"
repeat_region complement(18862. . 18995)
/note= "SVA"
repeat_region complement(19834. . 20123)
/note= "Alu"
repeat_region 19854. . 19993
/note= "SVA"
repeat_region 22097. . 22228
/note= "Alu"
repeat_region complement(23102. . 23272)
/note= "Alu"
LOCUS 0. 005 23938 bp
DEFINITION
repeat_region 1704. . 1948
/note= "MIR"
repeat_region 4047. . 4344
/note= "LTR9"
repeat_region 5335. . 5624
/note= "Alu"
repeat_region complement(10752. . 10953)
/note= "MER33"
repeat_region 14331. . 14600
/note= "MSTA"
repeat_region 14331. . 14694
/note= "THE1B"
repeat_region 18135. . 18303
/note= "Alu"
repeat_region 19589. . 19936
/note= "MLT1F"
LOCUS 0. 006 23937 bp
DEFINITION
repeat_region complement(2657. . 3004)
/note= "MLT1B"
repeat_region 8344. . 8418
/note= "MADE1"
repeat_region 8463. . 8536
/note= "MADE1"
repeat_region complement(9719. . 10069)
/note= "CHARLIE2-2"
repeat_region 11488. . 11865
/note= "MLT1B"
repeat_region 11488. . 11865
/note= "MLT1A"
repeat_region 11637. . 11865
/note= "MLT1C"
repeat_region 14151. . 14283
/note= "Alu"
repeat_region 14298. . 14473
/note= "Alu"
repeat_region 21162. . 21273
/note= "MLT1A"
repeat_region 21189. . 21512
/note= "MLT1A"
repeat_region 21250. . 21509
/note= "MLT1B"
repeat_region 21370. . 21495
/note= "MLT1C"
repeat_region complement(21927. . 22216)
/note= "Alu"
repeat_region 21945. . 22225
/note= "SVA"
repeat_region 22532. . 22664
/note= "Alu"
127
repeat_region 22674. . 22842
/note= "Alu"
repeat_region complement(23672. . 23937)
/note= "Alu"
repeat_region 23701. . 23805
/note= "SVA"
LOCUS 0. 007 23937 bp
DEFINITION
repeat_region 1770. . 1916
/note= "MIR"
repeat_region 2615. . 2762
/note= "MIR2"
repeat_region 5604. . 5754
/note= "MIR2"
repeat_region 6774. . 7062
/note= "Alu"
repeat_region 8224. . 8524
/note= "Alu"
repeat_region complement(8356. . 8509)
/note= "SVA"
repeat_region complement(8777. . 8979)
/note= "Alu"
repeat_region 8707. . 8980
/note= "SVA"
repeat_region 9291. . 9461
/note= "MER5A"
repeat_region 10345. . 10504
/note= "MIR"
repeat_region complement(13746. . 14037)
/note= "Alu"
repeat_region 14137. . 14423
/note= "Alu"
repeat_region complement(17759. . 17930)
/note= "Alu"
repeat_region 17773. . 17911
/note= "SVA"
repeat_region complement(17935. . 18066)
/note= "Alu"
repeat_region complement(21832. . 22212)
/note= "MLT1B"
LOCUS 0. 008 23937 bp
DEFINITION
repeat_region 1300. . 1797
/note= "MLT1D"
repeat_region 2580. . 2706
/note= "Alu"
repeat_region 7313. . 7381
/note= "L1-4"
repeat_region 11228. . 11516
/note= "MLT2C2"
repeat_region 11228. . 11559
/note= "MLT2D"
repeat_region 11515. . 11595
/note= "MLT2C2"
repeat_region 11459. . 11594
/note= "MLT2D"
repeat_region 16764. . 16975
/note= "MER20"
LOCUS 0. 009 23938 bp
DEFINITION
repeat_region 384. . 683
/note= "Alu"
repeat_region complement(531. . 663)
/note= "SVA"
repeat_region 1934. . 2433
/note= "MLT2B2"
repeat_region 1934. . 2112
/note= "MLT2D"
repeat_region 5027. . 5320
/note= "Alu"
repeat_region 6900. . 7110
/note= "MER33"
repeat_region complement(7431. . 7714)
/note= "Alu"
repeat_region complement(7958. . 8248)
/note= "Alu"
128
repeat_region 8307. . 8595
/note= "Alu"
repeat_region 8937. . 10281
/note= "L1-3"
repeat_region 10282. . 10952
/note= "L1-4"
repeat_region complement(13922. . 14265)
/note= "CHARLIE2-2"
repeat_region complement(13488. . 13760)
/note= "MSTC"
repeat_region complement(20395. . 20746)
/note= "THE1B"
repeat_region complement(20515. . 20746)
/note= "MSTA"
repeat_region complement(22244. . 22598)
/note= "THE1B"
repeat_region complement(22364. . 22598)
/note= "MSTA"
repeat_region 22813. . 23101
/note= "Alu"
LOCUS 0. 010 23937 bp
DEFINITION
repeat_region 1139. . 1813
/note= "L2-3"
repeat_region 1723. . 2414
/note= "L1-4"
repeat_region 10662. . 10832
/note= "MER20"
repeat_region complement(10964. . 11265)
/note= "Alu"
repeat_region 11444. . 11745
/note= "Alu"
repeat_region complement(11592. . 11725)
/note= "SVA"
repeat_region 15533. . 16197
/note= "L1-4"
repeat_region complement(16577. . 16840)
/note= "MER33"
repeat_region 17320. . 17556
/note= "SVA"
repeat_region complement(17288. . 17577)
/note= "Alu"
repeat_region 17882. . 18178
/note= "Alu"
repeat_region complement(21879. . 22259)
/note= "MLT1D"
repeat_region complement(21879. . 22001)
/note= "MLT1E"
repeat_region complement(22290. . 22580)
/note= "Alu"
repeat_region 22943. . 23225
/note= "Alu"
LOCUS 0. 011 23937 bp
DEFINITION
repeat_region complement(4079. . 5031)
/note= "L1-3"
repeat_region 7550. . 7838
/note= "Alu"
repeat_region 21465. . 21605
/note= "MER46"
repeat_region 21825. . 22108
/note= "Alu"
LOCUS 0. 012 23938 bp
DEFINITION
repeat_region 1171. . 1398
/note= "L1-3"
repeat_region 1403. . 2065
/note= "L1-4"
repeat_region 3465. . 4299
/note= "TIGGER1-1"
repeat_region 3733. . 5087
/note= "TIGGER1-1"
repeat_region 5106. . 5496
/note= "TIGGER1-2"
repeat_region 7180. . 7350
/note= "Alu"
129
repeat_region 15054. . 15271
/note= "L1-2"
repeat_region 15272. . 17082
/note= "L1-3"
repeat_region 17083. . 17752
/note= "L1-4"
LOCUS 0. 013 23937 bp
DEFINITION
repeat_region 394. . 562
/note= "MER3"
repeat_region 4532. . 4743
/note= "MIR"
repeat_region 5307. . 5549
/note= "MIR"
repeat_region 5574. . 5903
/note= "MLT2C2"
repeat_region 5574. . 6056
/note= "MLT2B2"
repeat_region 5835. . 6056
/note= "MLT2C2"
repeat_region 5911. . 6056
/note= "MLT2D"
repeat_region 9536. . 9825
/note= "Alu"
repeat_region 11802. . 12221
/note= "L1-3"
repeat_region 12226. . 12731
/note= "L1-4"
repeat_region 13402. . 13903
/note= "L1-4"
repeat_region complement(14787. . 14949)
/note= "MLT1A"
repeat_region 20784. . 20866
/note= "MIR"
LOCUS 0. 014 23937 bp
DEFINITION
repeat_region complement(853. . 1289)
/note= "THE1BR"
repeat_region complement(183. . 1289)
/note= "MSTAR"
repeat_region complement(1792. . 2082)
/note= "Alu"
repeat_region complement(2184. . 2396)
/note= "Alu"
repeat_region 2533. . 2895
/note= "MLT1A"
repeat_region 2533. . 2666
/note= "MSTC"
repeat_region 2625. . 2886
/note= "MLT1B"
repeat_region 3485. . 3855
/note= "MLT2D"
repeat_region 3485. . 3738
/note= "MLT2C2"
repeat_region complement(4974. . 5283)
/note= "MER2"
repeat_region 7946. . 8234
/note= "Alu"
repeat_region complement(8080. . 8209)
/note= "SVA"
repeat_region complement(9084. . 9373)
/note= "Alu"
repeat_region 9104. . 9236
/note= "SVA"
repeat_region complement(9510. . 9738)
/note= "MER33"
repeat_region 10566. . 10854
/note= "Alu"
repeat_region complement(10700. . 10833)
/note= "SVA"
repeat_region 11655. . 11875
/note= "MER20"
LOCUS 0. 015 11907 bp
DEFINITION
130
repeat_region 1270. . 1641
/note= "THE1B"
repeat_region 1462. . 1641
/note= "MSTA"
repeat_region 1522. . 1641
/note= "MSTC"
repeat_region 5407. . 5694
/note= "Alu"
Приложение 7. Примеры участков, которые сразу бросаются в глаза,
визуально-особые участки генома. Примеры цитированы из генома
человека от http://ncbi.nlm.nih.gov.
Хромосома 1 человека , просмотр начальных 2.500.000 нуклеотидов, визуально
особые участки.
1
2
3
4
131
5
6
7
132
8
9
10
11
11
12
13
133
14
15
16
17
18
19
20
134
21
22
23
24
25
Хромосома 1 Данио, просмотр начальных 1. 000. 000 нуклеотидов, визуально
особые участки.
1
2
135
3
4
5
6
7
8
136
9
10
11
12
13
137
14
15
16
17
18
19
138
20
21
22
23
24
25
139
26
27
28
29
30
31
140
32
33
Приложение 8. Примеры участков генома микоплазмы гениталиум G37, подобные
повторам и транспозонам человека.Сравнение сделал Курносов М.Н.2009 год.
Repeat: "CHARLIE2-2"- неавтономный транспозон типа MER1.
Нижняя цепь соответствует геному M. genitalium - регион 371 - 729.
Верхняя цепь соответствует повтору из генома человека.
Участок подобный повтору CHARLIE2 расположен вначале хромосомы
микоплазмы и частично заходит на первый ген dnaN - ДНК
полимераза 3, бета цепь.
Число соответствий 229 из 359 нуклеотидов, мутировало 36,2 процента.
Query 381 390 400 408 416 426
atgatcacag gaaaaaaa t ttatttcaac t t acataa ct at tttt gttacagatc
|| |||| | ||||||| | |||||| | | | ||||| | || || | || |||
ataatcagat taaaaaaatt ttattt atc tgaaacatat ttaatcaatt g aactgatt
Repeat 12 22 31 41 51 60
Query 435 444 454 463 473 483
agtataag a ct atcaata aaagtttcaa ccata aaaa taaaatatat tctgataaaa
| | | || | | || ||| | | | | | |||| | | | | || | | | || ||
attttcagca gtaat aatt aca tatgta catagtaca t atgtaaaa tatcat taa
Repeat 70 79 88 97 106 115
Query 493 502 512 522 529 538
ttctatggta acatgaaaa ataaatatta gtcgaagcag a aaaaga aacaat ata
|| | || || | || || | || |||| | | || || | || | || || ||
tt tctgtta tatat aata gtatctatt ttag ag ag tattaattat tactataatt
Repeat 124 133 142 150 160 170
Query 547 556 565 572 581 591
aaacattca actttgtca aaggac agt t tg cc at ttttta aaa tgaacaatgg
|| |||| | ||| | | || | | | | || | | || || | | | | |
aagcatttat gcttaattat aa g ctttt tatgaacaaa attatagaca t tttagttc
Repeat 180 190 198 208 218 227
141
Query 601 610 619 629 639 647
ttgacaacaa attagt gtt att tagatt cctttgaata tatttaaata taata aa a
|| | || || | || | | | ||| ||| | || | || ||||| |||| | |
tt ataataa a taatagat attaaaga a a ataaaaa aatagaaata aatatcata
Repeat 236 245 254 262 272 281
Query 657 664 673 680 690 699
acactttatt ta a ag aa ttaatactt a g a aatg ccagagatta tacct ttgg
|| ||| | | | || || ||||||||| | | |||| | | |||| | | |
acccttga t aacccagaaa ttaatactta atcaaaaatg aaaatatta a ttaataa
Repeat 290 300 310 320 329 337
Query 709 718 728
tatttatatt catgacaat ttttaa
| | | ||| || | ||| ||| ||
aagtga att gaat aaaat tttgaa
Repeat 346 355 365
Repeat: "L2-3" - транспозон типа LINE.
Нижняя цепь - M. genitalium регион 448298-448642.
Верхняя цепь - человек.
Участок подобный транспозону L2 человека расположен внутри гена
MG350 - гипотетический белок.
Число соответствий - 229 из 340 нуклеотидов, мутировало 32,7 процента.
Query 1473 1483 1493 1503 1513 1523
aaagaagact gagttttttt attttaagtt tttaaagttt ttataatttt taagaattat
|||||| | || | ||||| ||| || || | ||| |||| | ||| || |||
aaagaa aag ga tattttt tttcaa tt tacaaa a g aataa cat taacaa tat
Repeat 315 324 332 340 348 357
Query 1533 1543 1550 1559 1568 1578
catcccaact gcttctatga tt a t gtg acaa aactg ccaacaaca aaaagcaaaa
| | |||| |||| || | | ||| | || | || || || | |||||
g g c a gcttgtatg ttaacttgtg a aatagcta agaaaaatat aaaagttgct
Repeat 361 370 380 389 399 409
Query 1586 1595 1603 1611 1618 1628
ataa a agc tgttatag g ttct tt tc ata at cca gaa t a tg gatgataaat
||| | ||| | || || | || | | | || || || | | || | | || ||
ttaattta t tgtga agaa tt tgttagc agatatgaca aaagttattg aaaggtagat
Repeat 418 427 436 446 456 466
Query 1636 1645 1654 1664 1673 1679
g gcttgta cctgga tgg a gacggcaa taagtaatca tattctat a ttt g t a
| | || || | | | | | || ||||| ||||||||| ||||| || ||| | | |
gatgatt ta aatttacttg atga ggcaa aagtaatca tattc attg gtttaggtca
Repeat 475 485 494 503 512 522
Query 1687 1696 1703 1713 1722 1732
tttaca t t t atagccac ataa t t t gctggtacac tga atatga tttactagaa
| | | | | ||| || | || | | | || || | ||| | | | ||| || ||
ggaaagttt tcata aca aaaactatat cttgttta tgaca aggc ttt ttataa
Repeat 531 539 549 557 566 575
Query 1742 1752 1761 1769 1778 1786
accaaagggt gtcaagaaag actaaagat t tt tggct t gaacaact tat g aatg
| | | | | |||| | |||||| | || | | | | || ||| ||| | |||
a t t gttt tttga aaag a aaagatg ttttcttttt tagcactact tatagtgatg
Repeat 582 591 599 609 619 629
Query 1794 1804 1814
g agattg t ctagtgtgat ac
| | || | | || | | | ||
gta atggat taat tcaa ac
Repeat 638 646 656
Repeat: "RETROVIRAL2" - участок эндогенного ретровируса человека.
Нижняя цепь - микоплазма гениталиум локус 576244-576656.
Верхняя цепь - участок, выделенный из хромосомы человека.
Последовательность подобная участку ретровируса человека
расположена на конце гена MG468 ABC-транспортер-пермеаза
и на начале гена MG526 ABC-транспортер-АТФ-связывающий.
Число соответствий 214 из 413 нуклеотидов, мутировало 48,2
процента.
142
Query 1753 1762 1772 1781 1791 1801
tgtcttctta tattaataa ggaaaataaa acaaa atag tggtaaagtg ttgggttcgt
||| ||| | ||||| | ||||||| ||||| ||| | ||| | |
tgt ttc aa ggaaaataat gctaaataaa acaaagataa ttccaaa ta at a a aaa
Repeat 11 21 31 41 50 57
Query 1811 1821 1831 1841 1851 1859
gaaaaatttt gtgggtgata tggaaagata atgggcaatt ttctcagggc t tc tttga
||| || ||| | | ||| | ||| || || || | | || || |
gaagaacttt ttaagcgat t taaatat ctgtttaaaa aaagaaaaca tctcaattaa
Repeat 67 76 84 94 104 114
Query 1868 1878 1888 1897 1907 1917
gc aagatta tgggtcacat gggaaactag agtggga ga gattaagctg aaggaagatt
| || | | | || || || | | | | || | ||| | || || ||
actcagttaa tttgttcgat ggtttttgg attctgattt aaataa tc aacgattatc
Repeat 124 134 143 153 161 171
Query 1926 1936 1945 1955 1964 1971
ttgtggt aa gcagtgatat tttgggatt gttagaagga gtat ttgtc atat a aa
||| | | | | | || | | || | || | ||| || || | | |
ttgccatcat ggattttaat tacccgttta gctaattcca ctatcttttc gttgtgggta
Repeat 181 191 201 211 221 231
Query 1981 1991 2001 2011 2021 2030
atgattggta aaggcctaga tatggctttg taagaattga gaaactaaat ggaaga cac
| ||| || || || | || | | | | | | ||| || | | || |
actattacta tagtagtacc tttgtcacga ttatattcca caaa aaatt gcaatatttt
Repeat 241 251 261 271 280 290
Query 2040 2048 2058 2066 2076 2086
aaggtccaaa t aaga gaa gtagaaaaag agg tattc aaggactaag aattgtgagg
| | | | || | || | | || ||| | || | | || |||| | |||
tttggaaata tcaatattaa ct gctccag taggttcatc accaaacaa aatt ttagg
Repeat 300 310 319 329 338 347
Query 2096 2105 2112 2122 2132 2142
acccagtaca tcaaa ttag ag agt gc ccaaggggat tcagtttggg tggtgagttt
| || | | ||| | || | | || || | | | | | | ||||||
ttcttta a ttaaagcccg agcaatagca acacgttg t tgttgtccac cagagagttt
Repeat 355 365 375 384 394 404
Query 2152 2161
tttggctcta
| || |
atgaactttc
Repeat 414 423
Приложение 9.Примеры сравнения двух геномов - Mycoplasma genitalium и HERVK.
Сравнение произведено с помощью программы BLAST. Всего обнаружено 111
участков соответствия, они имеют разную длину и процент идентичности.
Query - это HERVK, а Sbjct - микоплазма. Сделал Курносов М.Н.
Range 31: 474214 to 474266 Graphics
Alignment statistics Expect Identities Gaps Strand
31. 2 bits(68) 1. 7 37/53(70%) 0/53(0%) Plus/Plus
Query 192 AGCTTTATTAAAATTCTTTTAAAAAGAGGGGGAGTTAAAGTATCTACAAAAAA
244 ||||| || ||| || |||||| || || ||||||| |||| ||||
Sbjct 474214 AGCTTAATAAAACTTTTTTTAATAAAAGTTAAAGTTAAATCTTCTATTCAAAA
474266
Range 74: 545394 to 545443 Graphics
Alignment statistics Expect Identities Gaps Strand
29. 9 bits(65) 4. 2 35/50(70%) 0/50(0%) Plus/Minus
Query 7036 TGATCAAAAATTGGCAAATCAAATTAATGATCTTAGACAAACTGTCATTT
7085 ||||||||| || | |||||| || |||||| || | ||| |||
Sbjct 545443 TGATCAAAACTTCCAAGATCAAACTATCGATCTTTTACCATATGTGCTTT
545394
143
Range 111: 555834 to 555851 Graphics
Alignment statistics Expect Identities Gaps Strand
29. 1 bits(63) 7. 7 17/18(94%) 0/18(0%) Plus/Plus
Query 6256 ATTTGGAACTATTATAGA 6273
||||||||||||||| ||
Sbjct 555834 ATTTGGAACTATTATTGA 555851
Примеры сравнения двух участков ДНК - Mycoplasma genitalium и LINE 1.
Сравнение сделал Курносов М.Н.
Всего обнаружено 110 участков.
Range 12: 100623 to 100642 Graphics
Alignment statistics Expect Identities Gaps Strand
32. 5 bits(71) 0. 56 19/20(95%) 0/20(0%) Plus/Plus
Query 4145 AAGCTGATAAGCAACTTCAG 4164
||||||||||||||||| ||
Sbjct 100623 AAGCTGATAAGCAACTTAAG 100642
Range 24: 159048 to 159064 Graphics
Alignment statistics Expect Identities Gaps Strand
31. 2 bits(68) 1. 4 17/17(100%) 0/17(0%) Plus/Plus
Query 3596 AACATTGATGCAAAAAT 3612
|||||||||||||||||
Sbjct 159048 AACATTGATGCAAAAAT 159064
Range 39: 305560 to 305594 Graphics
Alignment statistics Expect Identities Gaps Strand
30. 4 bits(66) 2. 5 29/36(81%) 1/36(2%) Plus/Minus
Query 3124 ACTAATAAAGaaaaaaaGAGAGAAGAATCAAATAGA 3159
||||||| | ||||| ||||| | ||||||| |||
Sbjct 305594 ACTAATAGA-AAAAACAGAGAAGATAATCAAAAAGA 305560
Range 102: 416250 to 416284 Graphics
Alignment statistics Expect Identities Gaps Strand
28. 6 bits(62) 8. 4 28/35(80%) 1/35(2%) Plus/Minus
Query 2963 AAGCAAGAGCAAA-CACATTCAAAAGCTAGCAGAA 2996
|| |||| ||||| || ||||||| |||||| ||
Sbjct 416284 AAACAAGTGCAAAACAACTTCAAAAACTAGCAAAA 416250
Приложение 10. Пример использования программы CODONS.
Разбивка гена PUSHKIN на отдельные кодоны. Сделал Курносов М.Н.
PUSHKIN
AAA AAA AAA AAA AAA AAA AAA AAA AAA CAT AGG GAG CAG CGA ATC GGC GAG AAC CAT AAA
AAT AAA CAA CAT ATA AAA GAA AGA GAG CAA TAC CGT TGG TAG ATA AAA AGT CAT AAC GAA
ACA AAA CAG GAG AAA AAT GGG CAT GAA TAG AGT AAA AGC CAA ATC AAA AAA AAA AAA AAA
AAA AAA AAA AAA GAA GAG AGA GAC ACA AAT TAG CAG ATC CAT TAT AGT GGC AAG AGA CGA
AAA AGC GAC AAA CAG ACA AGG AGT AGC CAC TAG TAC AAA ACT AAA AGC GAC AAA AGA CAT
TGG ACA AAA CAT AGT AGA GGC GGG ACA GAG AGT CAC CAT AGG TAC GAG GAA CAG TAG GAG
AAA TAC TAG AGG AGT TGC AAA AGG AAA CAG ACA AAC TAG GGG AAA AGG AAT CAT TAG GGG
AAA AAT GAG AGT AAT GAG ATA ATC GAA CAT GGG CAG AGC TAC AAA CAT AGG GAG CAG CAG
TAG ATA AAA GGG TAC ACA GAA AAA ACT AAA GAA CAT AGA CAT AAC ACA AAA CAC AGA CAT
CAA GAG AGA TAA ACA GAG AGT ATC GAC AGC AGA GGC ACA AAA GAG TGG GAG AAA AAG GAG
GAC TAG AGT AAA TAA ACA AAA CAA GAG TAC CGA CAG TAG GGT AGC AAA AGA AGC GGC GAG
ATA ATT CAG CAT AAA CAC AGA AGC GAA AAA AGC GAC GAG AAA TAA ACA AGG AGT TGC TAC
ATT AAA AGG CAT AGG GAG GAA AAA CAA CAT ATA AAA CAC CAT AGG CAC GAG TGA ACA GAG
AGT AAT AAA CAT AGT TGT GAG TAA GAC TAG GAG AAA CAC CAT TAC GGC AAA AGG AAA CAT
GGG CAT AGT CAT CGT AAA AGG AAT CAT GAG ATA ATT TAG AAA AGG AGT AGA ACA GAC GAA
AGC AGT AAA CAT TAA TAG CAA TAG AAA CAT AGT AAA AAG GAG TGA GAG CAG CAT ATA AAA
144
TAA ACA AAG ACA AAT TGC ATT TAG AAA AAG AGC GAA TAG AGT AAA TAC ACA ATA AAA AGG
CAT AAG ACA TAT AAA AGC AGG CAG AGC AAT TGA TAG GAG AAA GAA AGC AAG AGA ACA AAT
TGC ATC AGT GAG CAC GAG AGA CGA AAA CAA CAT GGC AAA CAC CAT AGA ACA ATT AAA GGC
AAA CAG GAG AAA TAC CGT AAG TAC CGT AAA AAT GAG AGG CAG TGC ATT AGG TAT AGC GGC
CAG ACA AAA CAA CAG GAG AAA CAT AGT AGT GAG CAC GAG TAC CGA ATT AAA AAT CAT CAG
CGA ATT AAA AAC AGA GGC TAA CGA AAA ACT AAA AAT GAG AGG CAG CAT ATA AAA GGC AAA
AAG CAT TAC GAG CAG ATT TAT AGA CAT AAT CGA AAA AAG AGA CAT GAA TAG AGT ATT AAA
GGC AGC AAT AGG AGT AAT ACA ATT AAA AGC CAA AAA AGT CAT AGG TAT CAT CGT AAA AGG
AGT GAG AGG CAG GAG CAG TGC ATC AGG AGC AGA CAT AAT CAT CGT AAA TAA TAG CAA CAT
ATA AAA GGC AAA AAG CAT TAC GAG GAG AAA GAA CAT AAT CAT TAC GAG CAG ATT TAC CGT
AAG TAC CGT AAA GAG GAG AAA AGG CAG GAG AAC ACA ATT AAA AAT AAA CAC AGA TAG AGG
Количество различных кодонов в гене PUSHKIN.
Вместо нуклеотида T программа подсчитала U.Сделал Курносов М.Н.
CODON USAGE TABLE
PUSHKIN has 3420 codons
RSCU RSCU RSCU RSCU
UUU 0 1. 00 UCU 0 . 00 UAU 84 . 83 UGU 2 . 06
UUC 0 1. 00 UCC 0 . 00 UAC 119 1. 17 UGC 65 1. 94
UUA 0 1. 00 UCA 0 . 00 UAA 50 . 00 UGA 15 . 00
UUG 0 1. 00 UCG 0 . 00 UAG 183 . 00 UGG 12 1. 00
CUU 0 1. 00 CCU 0 1. 00 CAU 275 1. 62 CGU 33 . 56
CUC 0 1. 00 CCC 0 1. 00 CAC 64 . 38 CGC 0 . 00
CUA 0 1. 00 CCA 0 1. 00 CAA 105 . 72 CGA 58 . 98
CUG 0 1. 00 CCG 0 1. 00 CAG 187 1. 28 CGG 3 . 05
AUU 92 1. 46 ACU 14 . 27 AAU 136 1. 45 AGU 161 4. 15
AUC 44 . 70 ACC 0 . 00 AAC 52 . 55 AGC 72 1. 85
AUA 53 . 84 ACA 193 3. 73 AAA 513 1. 81 AGA 122 2. 07
AUG 0 . 00 ACG 0 . 00 AAG 55 . 19 AGG 138 2. 34
GUU 0 1. 00 GCU 0 1. 00 GAU 0 . 00 GGU 12 . 36
GUC 0 1. 00 GCC 0 1. 00 GAC 31 2. 00 GGC 92 2. 75
GUA 0 1. 00 GCA 0 1. 00 GAA 102 . 57 GGA 1 . 03
GUG 0 1. 00 GCG 0 1. 00 GAG 253 1. 43 GGG 29 . 87
Приложение 11. Пример трансляции гена PUSHKIN. Для примера приведен только транслят с краю. Сделал Курносов М.Н.
Translation in forward direction:
frame +1 - 3424 codons
KKKKKKKKKHREQRIGENHKNKQHIKEREQYRW*IKSHNETKQEKNGHE*SKSQIK
145
Translation in reverse direction:
frame -1 -3424 codons
146
Приложение 12.Промилле кодонов для человека.
Цитировано с www. kazusa. or. jp.
Gly GGG 16, 47 Trp TGG 13, 17
Gly GGA 16, 47 End TGA 1, 56
Gly GGT 10, 75 Cys TGT 10, 58
Gly GGC 22, 22 Cys TGC 12, 62
Glu GAG 39, 59 End TAG 0, 79
Glu GAA 28, 96 End TAA 0, 99
Asp GAT 21, 78 Tyr TAT 12, 19
Asp GAC 25, 1 Tyr TAC 15, 31
Val GTG 28, 12 Leu TTG 12, 93
Val GTA 7, 08 Leu TTA 7, 67
Val GTT 11, 03 Phe TTT 17, 57
Val GTC 14, 46 Phe TTC 20, 28
Ala GCG 7, 37 Ser TCG 4, 41
Ala GCA 15, 82 Ser TCA 12, 21
Ala GCT 18, 45 Ser TCT 15, 22
Ala GCC 27, 73 Ser TCC 17, 68
Arg AGG 11, 96 Arg CGG 11, 42
Arg AGA 12, 17 Arg CGA 6, 17
Ser AGT 12, 13 Arg CGT 4, 54
Ser AGC 19, 46 Arg CGC 10, 42
Lys AAG 31, 86 Gln CAG 34, 23
Lys AAA 24, 44 Gln CAA 12, 34
Asn AAT 16, 96 His CAT 10, 86
Asn AAC 19, 1 His CAC 15, 09
Met ATG 22, 04 Leu CTG 39, 64
Ile ATA 7, 49 Leu CTA 7, 15
Ile ATT 16 Leu CTT 13, 19
Ile ATC 20, 82 Leu CTC 19, 59
Thr ACG 6, 05 Pro CCG 6, 92
Thr ACA 15, 11 Pro CCA 16, 92
Thr ACT 13, 12 Pro CCT 17, 54
Thr ACC 18, 89 Pro CCC 19, 79
Программа Countcodon - 3420 кодонов в гене PUSHKIN. Кодон-промилле-число.
UUU 0. 0( 0) UCU 0. 0( 0) UAU 24. 6( 84) UGU 0. 6( 2)
UUC 0. 0( 0) UCC 0. 0( 0) UAC 34. 8( 119) UGC 19. 0( 65)
UUA 0. 0( 0) UCA 0. 0( 0) UAA 14. 6( 50) UGA 4. 4( 15)
UUG 0. 0( 0) UCG 0. 0( 0) UAG 53. 5( 183) UGG 3. 5( 12)
CUU 0. 0( 0) CCU 0. 0( 0) CAU 80. 4( 275) CGU 9. 6( 33)
CUC 0. 0( 0) CCC 0. 0( 0) CAC 18. 7( 64) CGC 0. 0( 0)
CUA 0. 0( 0) CCA 0. 0( 0) CAA 30. 7( 105) CGA 17. 0( 58)
CUG 0. 0( 0) CCG 0. 0( 0) CAG 54. 7( 187) CGG 0. 9( 3)
AUU 26. 9( 92) ACU 4. 1( 14) AAU 39. 8( 136) AGU 47. 1( 161)
AUC 12. 9( 44) ACC 0. 0( 0) AAC 15. 2( 52) AGC 21. 1( 72)
AUA 15. 5( 53) ACA 56. 4( 193) AAA150. 0( 513) AGA 35. 7( 122)
AUG 0. 0( 0) ACG 0. 0( 0) AAG 16. 1( 55) AGG 40. 4( 138)
GUU 0. 0( 0) GCU 0. 0( 0) GAU 0. 0( 0) GGU 3. 5( 12)
GUC 0. 0( 0) GCC 0. 0( 0) GAC 9. 1( 31) GGC 26. 9( 92)
GUA 0. 0( 0) GCA 0. 0( 0) GAA 29. 8( 102) GGA 0. 3( 1)
GUG 0. 0( 0) GCG 0. 0( 0) GAG 74. 0( 253) GGG 8. 5( 29)
147
Литература.
1. M. Volgraf, P. Gorostiza, R. Numano, R. Kramer, E. Isacoff, D. Trauner.
Allosteric control of an ionotropic glutamate receptor with
an optical switch.
Nature Chemical Biology 2006. 2. 47-52.
2. Скулачев В. П. Энергетика биологических мембран. Наука. 1989, стр. 272.
3. Лузиков В. Н. Адресованный транспорт белков в клетке. Молекулярная
биология. 1987. Том 21. Вып 5. Стр 1157-1171.
4. Биология старения. Руководство по физиологии. 1982. с. 267.
5. Trifunovic A, Larsson NG. Mitochondrial dysfunction as a cause of
ageing. J Intern Med. 2008. 263. 167–178.
6. Trifunovic A, Wredenberg A, Falkenberg M, Spelbrink JN, Rovio AT,
Bruder CE, Bohlooly YM, Gidlof S, Oldfors A, Wibom R, Tornell J,
Jacobs HT, Larsson NG. Premature aging in mice expressing defective
mitochondrial DNA polymerase. Nature. 2004. 429. 417-423.
7. Vermulst M, Wanagat J, Kujoth GC, Bielas JH, Rabinovitch PS,
Prolla TA, Loeb LA. DNA deletions and clonal mutations drive
premature aging in mitochondrial mutator mice.
Nat Genet. 2008. 40. 392-394.
8. Kraytsberg Y, Simon DK, Turnbull DM, Khrapko K. Do mtDNA
deletions drive premature aging in mtDNA mutator mice.
Aging Cell. 2009. 4. 502-506.
9. Sato A, Kono T, Nakada K, Ishikawa K, Inoue S, Yonekawa H,
Hayashi J. Gene therapy for progeny of mito-mice carrying
pathogenic mtDNA by nuclear transplantation.
Proc Natl Acad Sci U S A. 2005.
10. Edgar D, Shabalina I, Camara Y, Wredenberg A, Calvaruso MA,
Nijtmans L, Nedergaard J, Cannon B, Larsson NG, Trifunovic A.
Random point mutations with major effects on protein-coding
genes are the driving force behind premature aging in mtDNA
mutator mice. Cell Metab. 2009. 10. 131-138.
11. Dogan S. A, Trifunovic A. Modelling Mitochondrial Dysfunction
in Mice. Physiol. Res. 2011. 60(Suppl. 1). 61-70.
12. Edgar D, Trifunovic A. The mtDNA mutator mouse:Dissecting
mitochondrial involvement in aging. Aging. December 2009, Vol. 1
No. 12. 1028-1032.
13. Taylor R. W, Turnbull D. M. Mitochondrial DNA mutations in human
disease. Nat Rev Genet. 2005 May. 6(5). 389–402.
14. Aubrey de Grey. Ending aging. 2007. N. Y.
15. Физиология речи. Руководство по физиологии. Наука. Ленинград.
1976. Чистович Л. А. и др.
16. Bedell J, Korf I, Yandell M. BLAST. O. Reilly, 2003, p 360.
17. Злыдников Д. М. , Казанцев А. П. , Шаманова М. Г. Микоплазмоз
человека. Медицина. 1975.
18. Репродуктивное здоровье. Под редакцией Кейта Л. Г. ,
Бергера Г. С. , Эдельмана Д. А. Том 1 и Том 2. Медицина. 1988.
19. Global transposone mutagenesis a minimal mycoplasma genome.
Science. 10 december 1999, v. 286, 5447, pp 2165-2169.
20. Zhang S, Tsai S, Lo S. Alteration of gene expression profiles
during mycoplasma-induced malignant cell-transformation.
BMC Cancer. 2006. 6. 116.
21. Jensen J. Mycoplasma genitalium infections. Danish Medicine
Bulletin. 2006. 1. v 53. p 1-27.
22. Rottem S. Interaction of Mycoplasmas With Host Cells.
Physiol. Rev. 83. 2003. 417-432.
23. Razin S, Yogev D, Naot Y. Molecular Biology and Pathogenicity
of Mycoplasmas. Microbiol. Mol. Biol. Rev. 1998. v 62.
24. Гаврилов Л. А, Гаврилова Н. С. Биология продолжительности жизни. 1991.
Наука. Стр. 158.
25. Венерические болезни. Руководство. Под. ред. Шапошникова О. К. 1991.
Медицина. Стр. 416.
148
26. D. Graur, Y. Zheng, N. Price, R. B. R. Azevedo, R. A. Zufall, E. Elhaik.
On the Immortality of Television Sets: “Function” in the
Human Genome According to the Evolution-Free Gospel of ENCODE.
Genome Biol. Evol. 5(3):578–590. February 20, 2013.
27. L. D. Hurst. Open questions: A logic (or lack thereof)of
genome organization. BMC Biology 2013, 11:58.
28. B. Maher . (September 2012). ENCODE: The human encyclopaedia.
Nature. 489. (7414): 46–8.
29. Bernstein B. E, Birney E, Dunham I, Green E. D, Gunter C, Snyder M
(September 2012). An integrated encyclopedia of DNA elements
in the human genome. Nature. 489. (7414): 57–74.
30. Ермишин А. П. Генетически модифицированные организмы: мифы и
реальность. Минск. 2004.
31. Большакова Е. И, Клышинский Э. С, Ландэ Д. В, Носков А. А, Пескова О. В,
Ягунова Е. В. Автоматическая обработка текстов на естественном языке
и компьютерная лингвистика. МИЭМ. 2011.
32. B. Bergeron. Bioinformatics Computing. 2002.
33. Bioinformatics methods and protocols. Edited by S. Misener, S. A.
Krawetz. (Methods in molecular biology v. 132). 2000.
34. Bioinformatics for Geneticists. Edited by M. R. Barnes, I. C. Gray
2003.
35. BIOINFORMATICS. Practical Guide to the Analysis of Genes and Proteins.
METHODS OF BIOCHEMICAL ANALYSIS. Volume 43.
A. D. Baxevanis, B. F. Ouellette. 2001.
149
Оглавление.
Предисловие. 3
Введение в современную ДНК информатику. 4
10 лет генома человека - все еще только начинается. 6
Тексты ДНК. Медицина и биология будущего. 8
Музыка генов человека. Сообщение 1. 8
Вопросы по музыке генов. Сообщение 2. 9
Музыка генов дрожжей. Сообщение 3. 10
Алгоритм музыки генов. Белковые домены. Сообщение 4. 11
Дополнения по музыке генов. Сообщение 5. 13
Музыка генов вируса герпеса типа 2. Сообщение 6. 14
Методика создания музыки генов. 15
Музыка белковых комплексов. Сообщение 7. 16
Геном человека и митохондрия. Часть 1. 17
Геном человека и митохондрия. Часть 2. 18
Управляемые наномашины - основа терапии будущего. 21
Гены-гиганты в геноме человека. Сообщение 1. 22
Гены-гиганты в геноме человека. Сообщение 2. 25
Гены-гиганты в геноме человека. Интрогены. Сообщение 3. 27
Гены-гиганты в геноме человека. Транспозоны. Сообщение 4. 27
Гены-гиганты в геноме человека. Дефрагментация генов -
природный феномен. Сообщение 5 30
Дополнение по генам гигантам 31
Где находится память у человека. 32
Микоплазма, транспозоны, эволюция и здоровье человека.
Часть 1. 34
Микоплазма, транспозоны, эволюция и здоровье человека.
Часть 2. 37
Полезные гены животных, растений и микробов -
в геном человека. 38
Растения - генные контейнеры и химические лаборатории. 39
Что же такое - разумное послание в геномах? 40
Кодоны в ДНК и разумность последовательности. 41
Генное программирование и ДНК говорит. Ген PUSHKIN. 44
Стихотворение А. С. Пушкина "Осень" в виде гена. 45
Функциональные элементы генома и ДНК информатика 50
Биоинформатика и белки. 52
ДНК говорит. Способы кодирования. Часть 1. 53
ДНК говорит. Способы кодирования. Часть 2. 54
ДНК говорит. Способы кодирования. Часть 3. 54
ДНК говорит. Способы кодирования. Часть 4. 55
ДНК говорит. Ввод биологической части словаря. 57
ДНК говорит. Способы кодирования. Введение графических
изображений с помощью ДНК. Часть 5. 58
ДНК говорит. Способы кодирования. Визуально-особые,
магические участки генома. Часть 6. 59
ДНК говорит. Способы кодирования. Гены-маркеры.
Часть 7. 61
ДНК говорит. Способы кодирования. Структура ДНК -
возможный маркер посланий. Часть 8. 62
ДНК говорит. Способы кодирования. Особенности живой ДНК.
Часть 9. 64
ДНК говорит на языке человека. 65
Пример искаженной информационной последовательности и ее
коррекция. 70
Самые большие белки, кодируемые геномом человека. 75
Теломера хромосомы и теории старения. 77
Гены поддержки высших психических свойств человека. 83
Окончание. 87
Заключение. 88
Об авторе. 88
150
Гены компонентов митохондрий в хромосомах ядра человека.
Приложение 1. 89
Гены митохондрии человека. Приложение 2. 100
Список генов-гигантов человека, размером более 400 тпн и
их функция. Приложение 3. 101
Гены сплайсинга. Приложение 4. 111
Список больших белков человека. Приложение 5. 116
Список повторов в изученных интронах генов-гигантов.
Приложение 6. 123
Примеры участков, которые сразу бросаются в глаза,
визуально-особые участки генома. Приложение 7. 131
Примеры участков генома микоплазмы гениталиум G37,
подобные повторам и транспозонам
человека. Приложение 8. 141
Примеры сравнения микоплазмы гениталиум с HTRVK и LINE 1
с помощью программы BLAST. Приложение 9. 143
Разбика гена PUSHKIN на отдельные кодоны и количество
различных кодонов в гене PUSHKIN.Приложение 10. 144
Пример трансляции гена PUSHKIN. Приложение 11. 145
Промилле кодонов для человека. Количество различных
кодонов в гене PUSHKIN. Приложение 12. 147
Литература 148
Оглавление. 150
151
Свидетельство о публикации №215022600894