Обратная мутация или мои генетические тесты

Игорь Чернышев
Данные заметки можно назвать заметками о моих генетических тестах 2015 года
так как уходящий 2015 год был годом углубленного анализа моих гентестов на фоне
поступления новой информации связанной с генеалогической генетикой.
Нужно напомнить что у меня есть 3 генетических теста сделанных в FTDNA:
1) аутосомный тест Family Finder тестирующий небольшое число участков на каждой
хромосоме за исключением мужской половой хромосомы и мт-ДНК 2) тест
моей мужской половой хромосомы-7 снипов,37 STR-маркеров 3) полный тест
моей мт-ДНК (там больше нечего тестировать).
Сейчас по состоянию на конец декабря 2015 года я остался один в моем
R-L1280 кластере,моя мт-ДНК гаплогруппа H1 совсем не означает родство
с другими H1 а аутосомные тесты просто вздор.


мт-ДНК гаплогруппа H1

В этом году в полку моих "родственников" c отличием в одну мутацию от
меня прибыло:4 человека в базе данных FTDNA которая регулярно оповещает
меня о родственниках по мт-ДНК.3 "родственника" Северо-Запад Европы.
Когда смотришь таблицу с родственниками на моей странице на сайте FTDNA
думаешь "А причем тут Россия?".Смотря таблицу хочется протестировать
бабушку Олю чтобы узнать действительно ли она мать моей матери настолько
все там западное.Но бабушка Оля давно умерла и ее нельзя попросить протестироваться.
Моя мт-ДНК гаплогруппа по сути тупик(какая от нее генеалогическая польза?)
тем более что "Unlike other branches of the mega-haplogroup H the defining mutation
for H1(3010A) has likely happened many times in the history of H" или другими
словами хотя у меня гаплогруппа H но может быть недавно это была не H1
("В отличие от других ветвей мега-гаплогруппы H определяющая мутация для
H1(3010A) возможно появлялась много раз в истории H"-информация на странице
проекта гаплогруппы H на сайте FTDNA).
В целом мои маркеры хорошо подходят просто для гаплогруппы H1 a к другим
веткам H1 они не подходят.


Мужская гаплогруппа R-L1280

Недавно зайдя на страницу R1a проекта FTDNA я обнаружил что меня отправили
в особый кластер и еще приписали мне возможность обратной мутации в FGC19283!
У меня нет FGC19283 также как и FGC11555 и генеалогическая картина в плане
R-L1280 может быть следующая:
Гаплогруппа R-L1280 появилась 2500 лет тому назад(может быть и не 2500 лет
тому назад-все вопросы к тем кто занимается датировками и публикует их
в Интернете) и это был первый мужчина с этой мутацией так что все ныне
живущие мужчины R-L1280 потомки одной сладкой пары которая родила сыновей
которые родили сыновей которые родили сыновей и так далее до настоящего
времени.Если у пары был один сын то все мужские линии сходятся к нему,
если два и больше то я могу быть прямым потомком например его старшего
сына или среднего или младшего.Если считать три поколения за сто лет
то между мной и моим праотцом 60 человек за две тысячи лет и 15 человек
за 500 лет до нашей эры или 75 предков каждый из которых имел жену и хотя
бы одного сына(у моего деда Ивана Трифоновича было 3 сына).Когда-то но
уже довольно давно среди потомков праотца появились новые мутанты с FGC19283
и FGC11555 и некоторые другие(уже известные).Современные мужчины с FGC19283
происходят от первого потомка с этим новым снипом а мужчины с другими снипами
от других потомков.Поскольку у меня новых снипов нет то я не их родственник
в пределах R-L1280 и вероятно ничем не отличаюсь от моего праотца по мужской
половой хромосоме.Если вся моя мужская хромосома ничем не отличается от
мужской хромосомы моего праотца то я как бы мой праотец увековечивший себя
в своем потомке.Возможно также что успешные мужские линии отражают высокий
статус основателей этих родов так что первый мужчина R-L1280 мог быть например
вождем.Ну а что касается обратной мутации то это изменение в определенном
участке хромосомы которое было но куда-то смылось.Была она или не была
неизвестно но согласно тесту моей половой хромосомы FGC19283 у меня нет
и следовательно скорее всего и не было.


Аутосомные тесты

Сами по себе тесты мужской половой хромосомы и митохондриальной ДНК мало что
значат хотя и могут быть признаками например хотя бы небольшой нерусской
примеси (например какая-то неевропейская мужская гаплогруппа или  мт-ДНК
гаплогруппа) но к сожалению аутосомные тесты или тесты всех остальных
хромосом это нечто совершенно абсурдное и неудовлетворительное!Многие
думают что аутосомные тесты определяют какие-то особые снипы на всех
хромосомах в результате чего довольный чистокровный Русский или может быть
довольный метис публикует где-нибудь данные своего аутосомного теста
вот мол смотрите 1 % South Asian,древняя примесь,общие предки с South Asians,
лактозный ген,снипы голубых глаз,снипы связанные с белой кожей и японская
близорукость которая однако не свойственна китайцам,романтика аутосомных
калькуляторов и предковых аутосомных компонентов!!Сделавшие аутосомные
тесты судя по Интернету подразделяются на три группы:первая группа это те кто
принимает все результаты и не задумывается,вторая это те кто испытывает
мучительное чувство непонимания и третья группа это те кто пытается разобраться
в снипах,результатах,компьютерных программах с их "кластерами" и процентами
"примеси".

Результаты аутосомного теста Family Finder в FTDNA(который я сделал летом-осенью
2013 года) это простой текстовый файл с перечнем протестированных участков
хромосом который клиент может скачать на своей  странице на сайте FTDNA.

Вот начало моего Family Finder'а:

RSID,CHROMOSOME,POSITION,RESULT


Каждая  строчка это "снип"(SNP)-участок хромосомы.


Rs и цифры это имя снипа.


"1"-номер хромосомы.


"752566"-место снипа на данной хромосоме


"AA"-особенности данного участка хромосомы(снипа) или "генотип".

Наиболее важны имя снипа и генотип.

[Если текст вышеуказанного файла не отображается то можно посмотреть
скриншот http://www.imagebam.com/image/b8da05520940690]

Family Finder тестирует около 700 тысяч снипов или другими словами
небольшое число снипов на каждой хромосоме(кроме мужской половой
хромосомы и митохондриальной ДНК).

Тестируются гены и не-гены.

Аутосомный тест не является заменой изучения вашей родословной.

Легче всего понять результаты аутосомного теста и работу генетических
программ(калькуляторов) если ответить на вопрос "Чем отличаются
результаты теста одного индивидуума от результатов теста другого индивидуума?"

Эти индивидуумы например происходят из разных стран которые могут
располагаться даже на разных континентах.

Понятно что тестируются одни и те же участки хромосом а если бы
тестировались разные участки то результаты были бы не сравнимыми
между собой.

Различия таким образом могут быть только по буквам в скобках.

Буквы в скобках также называются "генотипы".

Возможные результаты сравнения тестов двух человек(двух простых текстовых
файлов со списком снипов):

1) Все снипы одинаковые

2) Все снипы разные(то есть участки одни и те же а буквы-особенности этих участков-разные)

3) Ну например один снип отличается или другие варианты

Если у двух человек протестировали 10 снипов и 5 снипов разные то 50 % снипов отличаются.

Например берем два снипа

rs1426654

rs16891982

и тестируем эти снипы у трех индивидуумов принадлежащих к разным народам


Результаты:


1-ый тестированный

rs1426654 (A;A)

rs16891982 (G;G)


2-ой

rs1426654 (G;G)

rs16891982 (C;C)


3-й

rs1426654 (G;G)

rs16891982 (C;C)

Из этих трех энтузиастов гентестов можно вручную(то есть без всяких
программ)сформировать две группы:


Первая группа или "кластер"

Мужчина у которого A и G(полученные от обоих родителей)


Вторая группа или второй "кластер"

Два мужчины у которых G и C (пол в данных тестах не важен)


Или по другому

Первый  снип A G G (три человека)

Второй снип  G C C (три человека)


По первому снипу в первой группе состоящей  из одинокого индивидуума

100 % "A" (потому что в группе всего один человек)

По этому же снипу во второй группе 100 % "G" (группа из двух человек)

Первый индивидуум далек от двух остальных(в рамках только этого теста)
особенно с учетом того что и второй снип у него другой.

Если мы теперь протестируем еще одного индивидуума и его результаты
будут rs1426654(A;A) и rs16891982(G;G) то мы вполне можем добавить
этого индивидуума в первую группу где уже есть первый тестированный
с теми же (A;A) и (G;G).

Выбирая тестирующихся мы можем знать что первый тестирующийся происходит
из Европы а два остальных не из Европы.

О четвертом тестировавшемся может быть вообще ничего неизвестно
но тем не менее по результатам теста его можно отнести к Европе.

Если продолжить размышления о том что можно сделать с результатами
тестов то можно например протестировать 10 Поляков и 10 Русских
и посчитать проценты этих двух снипов в двух вышеуказанных группах.

Результаты могут быть такие что все или почти все эти Поляки и Русские
унаследовали одни и те же снипы от своих предков или другими словами
проценты "A" и "G"(два разных снипа) очень велики и  очень близки у
двух этих групп.

Можно также сравнивать блоки или "сегменты" снипов(то есть целые
последовательности снипов идущих подряд) у разных тестировавшихся
и например обнаружить дальнее родство у двух русских.

Так как снипы наследуются  блоками то можно попытаться предсказать
не тестированные снипы на основе часто встречающихся блоков снипов
(у данной расы,у группы народов,у данного народа) по принципу "если
есть этот снип-протестированный-то возможно есть и тот-нетестированный".

Результаты аутосомных тестов удобно пояснить на примере результатов
тестов мужской хромосомы(наследуется от отца к сыну) и митохондриальной ДНК
(наследуется от матери к детям) или точнее использование статистики
в "генетических" программах или калькуляторах.Если у Литовцев
гораздо больше мужчин с гаплогруппой N1c и гораздо меньше мт-ДНК гаплогруппы
H1 чем у Русских то к какому из двух народов вероятнее принадлежит неизвестный
индивидуум с мужской гаплогруппой N1c и мт-ДНК гаплогруппой U5?Можно сказать
что он вероятно Литовец хотя конечно такой "ответ"ничего не значит просто потому
что статистика не может ответить на вопрос почему у него эта гаплогруппа
и статистика в данном случае это так сказать "глубокомыслие" в сочетании
с незнанием причин которые являются как правило простыми житейскими фактами
прошлого(Литовцы и Русские так сказать давно произошли и об их происхождении
почти ничего неизвестно).Понятно также что у Литовцев тоже есть митохондриальная
гаплогруппа H1 а у Русских тоже есть мужская гаплогруппа N1c.С другой  стороны
очень многие вещи не нуждаются  в доказательствах например то что наши предки
дышали,ели,пили,занимались сексом,рожали детей или то что все или почти все
Русские имеют руки и ноги независимо от того знаете ли вы их или не знаете
и т.д. и т.п.Когда разные шарлатаны напирают на "объективные данные" то
можно сказать что и густой туман это объективные данные и что эти
объективные данные подделывают как таблетки продающиеся в аптечных киосках
или другие товары в магазинах.Кроме того глаза материальны и зрительная
система мозга материальна и чтобы видеть нужно затрачивать массу и энергию.
Если вы идете вдоль высокого забора то высокий забор это физическое препятствие
из-за которого вы не знаете что происходит за забором и вы можете например
перечислить разные варианты того что там может быть.Раньше Европейцы
не знали о других континентах и нужно было отправиться на другой континент
чтобы нанести на карту гору или реку.Археология,история,физическая антропология,
Индо-Европейская лингвистика,генетические тесты древних останков как наверно
понятно это абстракции за которыми стоят те или иные индивидуумы которые
являются конечно же простыми смертными и один такой индивидуум не может быть
умней десяти индивидуумов которые интересуются тем или иным вопросом
например  "Где когда и при каких обстоятельствах появился Прото-Индо-
Европейский язык?".
Естественный вопрос также может быть "А вы видели как появился Прото-Индо-
Европейский язык?"Тот или иной индо-европеист может блеснуть в сфере
какой-нибудь Балтской топонимики но всегда возникает вопрос а что же все таки
действительно значит название данной речки и из какого оно языка не по мнению
автора статьи или книжки изданной маленьким тиражом а в действительности.
Тем более что "эксперт" даже не в состоянии запомнить два номера мобильных
телефонов а может даже и запомнить один номер для него непосильная задача.
Годы которые "эксперт" тратит на "обдумывание" темы чаще свидетельствуют
об его умственных способностях а не о теме.И  конечно не стоит читать
в газетах или на сайтах популярных изданий или телеканалов о всяких
"командах исследователей которые".
В продолжении речь пойдет о генетических программах или аутосомных
калькуляторах и о процентах "примесей"(admixtures) и о некоторых других вещах
связанных с аутосомными тестами.


10 января 2016

Компьютерные программы включая и "генетические"  типа Plink,Structure,Admixture,
аутосомные калькуляторы основанные на программе Dodecad очень примитивны и
используют самую примитивную "логику"(типа "истинно-ложно",если введенное
имя Igor написать в окне программы "Hello,Igor!" и т.д.).
Если программа сравнивает снипы двух индивидуумов то неудивительно что
поскольку это компьютерная программа разработчик программы может
например сравнивать снипы следующим образом:

Снип 1

Если у  1-ого тестировавшегося AA а у второго TT то "сходство" равно нулю

Снип 2

AA и AT "сходство" равно 1

Снип 3

GG и GG "сходство" равно 2(одинаковые снипы)

Если все снипы как Снип 1 то сходство равно нулю(0+0+0...и так все снипы
которых например протестировано десятки тысяч).

Например DNA Land предоставила мне файл с моими предсказанными снипами
(о которых я писал выше)в котором для наиболее распостраненных букв("аллелей")
используется ноль а для редких букв на том или ином участке хромосомы цифра 1.

От родителей можно унаследовать две одинаковые буквы(очень частое явление)
или две разные.

Если известны результаты тестов энного числа индивидуумов происходящих
из разных стран и подсчитаны частоты(проценты) выбранных снипов в каждой
стране то можно попробовать погадать в плане того какие снипы и какие
проценты снипов были у предков этих индивидуумов являющимися членами
этих групп(например Русские,Литовцы,Шведы,Китайцы,Австралийские аборигены).
Если в далеком прошлом было 3 разных группы от которых произошли эти разные
народы то какими были проценты снипов в каждой группе?Какие проценты имеются
сейчас известно а какие были в прошлом если предположить что тогда были
только три народа?

Сейчас статистика по снипу rs1426654(по данным аутосомных тестов)

Русские (A;A) 100 %

Литовцы (A;A) 100 %

Шведы   (A;A) 100 %

Китайцы (A;A)   0 %

Австралийские аборигены  0 %

По этому снипу вышеуказанные народы происходят от двух народов живших
в прошлом а если учесть что Австралийские аборигены не Китайцы то тогда
от трех таинственных народов.

А сколько отличий имеется сейчас по десяткам тысяч снипов и какие отличия
были в прошлом при условии что может быть было три разных народа?

Как взаимосвязаны частоты снипов в прошлом(в трех разных группах) и
у их потомков(пять разных современных групп)?

Частоты(проценты)снипов у предков и потомков должны быть близки.

Если у нескольких современных народов различий в процентах протестированных
снипов мало то и у их общего предка должна была быть очень похожая частота
встречаемости каждого снипа.

Если предположить трех разных предков то Русские,Литовцы,Шведы происходят
от одного предка,Китайцы от другого,Австралийские Аборигены от третьего
судя по близости процентов снипов в группах предков и у современных
народов.

Программа может сравнить частоты снипов у вышеупомянутых народов и
сгруппировать эти народы в меньшее число предковых групп.

Программа добавляет неизвестного индивидуума в ту или иную группу
на основе того в какой из предковых групп чаше всего встречается
каждый его снип.

Если какие то снипы встречаются чаще в другой группе то у данного
индивидуума возможно имеется примесь.

Если сейчас у Русских очень много мужской гаплогруппы R1a и женской
гаплогруппы H то и у их предков было много этих гаплогрупп.

Если у Китайцев этих гаплогрупп очень мало то и в прошлом их было
очень мало или вообще не было.

Поскольку проценты каждого снипа часто не 100 % то важно большое число
снипов.

Гаплогруппа R1a есть везде но у разных народов разные проценты.

Данные 10 снипов есть у разных народов но наибольшие проценты
этих букв в скобках в Восточной Европе.

Если ваш генотип (A;A) на данном протестированном участке данной хромосомы
минимален в Африке(в группе протестированных Африканцев) то у вас нет
Африканской примеси.

Если ваш генотип (A;A) достигает максимума(50 % или даже 95 %) в группе
протестированных Восточных Европейцев то вы происходите из Восточной Европы.
В других группах (A;A) часто тоже есть но проценты в этих группах менее высокие.

Какие снипы у разных народов?

У разных народов одни и те же снипы.

Проценты "примеси" это проценты чего?

Это уникальные снипы которые есть у всех в одной группе и которых нет в других
группах?

Проценты это проценты чего?Проценты снипов?Проценты частоты?

Данный мужчина имеет 10 % снипов которые чаще всего встречаются у Индусов
о чем известно по результатам тестирования десятков или сотен представителей
разных народов включая и Индусов.Возможно этот мужчина имеет примесь
Южной Азии.Но возможно также что частота этих снипов у некоторых Индусов
связана с древними миграциями из Восточной Европы.Возможны и другие
варианты.

В трех Московских компаниях зарплата 50 тысяч рублей причем
эти три компании отличаются частотой выплаты зарплаты.В первой компании
платят раз в месяц,во второй 2 раза а в третьей еженедельно.Эти компании
отличаются друг от друга.Если в какой-то неизвестной компании платят
еженедельно то эта компания образует кластер с третьей компанией.

Какова вероятность того что этот мужчина может стать вождем племени
если в этом племени только десять мужчин и только мужчина может быть
вождем?Вероятность 10 % или одна десятая(вождь может быть только один
а потенциальных вождей десять).Естественно что подобная "арифметика"
не может предсказать кто станет вождем и не отвечает на вопрос почему
именно данный мужчина стал вождем но по крайней мере читатель познакомился
с принципами работы алгоритмов известных генетических программ Structure
и Admixture пытающихся предугадать частоты снипов если разбить всех
протестированных на энное число предковых групп,сравнивающих эти частоты
с частотами в протестированных группах и добавляющих неизвестных индивидуумов
в ту или иную группу на основе их снипов и процентов этих снипов в предковых
группах.

Результаты сравнения результатов моего аутосомного теста а различных
аутосомных калькуляторах:


2013 год


FTDNA Population Finder

Ирландия,Англия,Франция больше 45 %

Россия больше 54 %


2014 год

FTDNA myOrigins

Восточная Европа(включая 3 % "Финляндия и Северная Сибирь") 96 %

Северо-Восточная Азия 2 %

Центральная Азия(с максимумом в Афганистане) 2 %


2013-2015 годы

Аутосомные калькуляторы Dodecad(разные версии) и калькуляторы на его основе
но с разными снипами(Harappa,MDLP,Eurogenes) включая и снипы протестированные
в древних захоронениях(обычно это отдельные калькуляторы)


Dodecad dv3


West_European 38.72

East_European 34.22

Mediterranean 16.52

West_Asian 4.68

Northeast_Asian 2.76

South_Asian 1.98

Southwest_Asian 1.01

Southeast_Asian 0.12



2015 год


DNA Land


Северо-Восточный Европейский компонент(North/east European) более 93 %

Другое(невозможно отнести к какой-либо группе) более 6 %

North/east European это Финляндия,Прибалтика,Украина,Молдавия,Россия.
В North/east European не входят Польша и Балканы например.


Программа SPA

Программе требуется указать происходят ли ваши родители из одной страны
или из двух стран.

Мои результаты(сравнения с другими Европейцами)

Если мои родители происходят из одной страны то страна моего происхождения

Германия(ее центральная часть).

Если мои родители происходят из двух стран то кто-то(мать или отец)
происходит из западной части Ирландии и из западной части Центральной
России.


11 апреля 2016

Сегодня у меня наконец появилось желание написать окончание данных заметок
что я и делаю.Смысл аутосомных тестов это частота встречаемости снипов
в разных группах которая может быть естественно и 100 % и 0 %.Компьютерные
программы сравнивают снипы разных индивидуумов выборочно а если бы
сравнивались все снипы то программа считала бы слишком долго.Проценты
это проценты в среднем(процент на одной хромосоме+процент на другой и
разделить на число хромосом).Есть снипы которые очень часто встречаются
в России и в Европе.Есть снипы которые часто встречаются например на
Северо-Западе Европы и редки в Восточной Европе(например снипы
связанные с рыжими волосами).В какой группе чаще встречаются
ваши снипы к такой вы вероятно и принадлежите.

Для Восточной и Северной Европы например характерны следующие снипы
(rs и цифры это имя участка той или иной хромосомы а буквы это "генотипы")


rs1426654(A;A)

rs16891982(G;G)

rs12913832(G;G)

rs12896399(T;T)

rs1015362(G;G)

rs2217262(A;A)




Такие снипы называют Ancestry Informative Markers(AIMs).

Такие снипы могут быть у всех в данной протестированной группе или быть у
большинства или быть только у некоторых протестированных в данной группе
и отсутствовать во всех других группах.

Если программа насчитала какой-то процент "примеси"(admixture)то
естественны следующие вопросы:

Какие это снипы?

Как часто эти снипы встречаются в этой группе?

Почему эти снипы чаще встречаются в данной группе?


Без конкретных ответов на эти конкретные вопросы обсуждение результатов
программы Admixture это пустая трата времени.

На этом я и закончу.Спасибо что прочитали!