Новости

ДНК-тест теперь определяет 548 этносов России и мира

Мы разработали новый алгоритм определения происхождения человека с применением искусственного интеллекта. Скоро все наши клиенты, сдавшие ДНК-тесты «Происхождение» и «Генетический паспорт», получат обновление результатов в личном кабинете. Рассказываем, как и зачем мы это сделали.

Зачем мы обновляем результаты?

Генетика — активно развивающаяся наука. Новые открытия и данные появляются почти каждый месяц. Genotek стремится быть на передовом крае науки и предоставлять своим клиентам только проверенную и современную информацию. Поэтому мы следим за новыми научными публикациями и проводим собственные генетические исследования. 

Обновления результатов ДНК-тестов происходят при получении новых данных. Наша цель — предоставить наиболее точную и детальную информацию нашим клиентам.

Что обновилось в результатах?

Мы добавили в исследование этнического происхождения новые народы: например, в результатах появились поляки, цыгане, корейцы и многие другие. В списке анализируемых этносов стало в три раза больше популяций: раньше их было 168, теперь — 548 популяций по всему миру.

Мы разработали новый алгоритм, который выявляет сходство вашей ДНК с представителями определенных этносов. Теперь мы делаем это точнее: точность определения этноса составляет до 100%. Одни народы сильно отличаются по генетическим характеристикам от всех других: например, если живут долго изолированно, а браки заключаются только внутри популяции. Принадлежность человека к такой группе мы определяем со 100% точностью. Для других же народов точность может быть ниже: например, если было мало исследовано представителей или особенности ДНК схожи с другими популяциями.

Многие ранее не разделяемые этносы мы научились выявлять по-отдельности, причем с указанием процентного соотношения. Например, теперь для большинства клиентов можем отделить украинцев от русских, а поволжских татар — от чувашей. В некоторых случаях разделение народов может быть более сложным процессом: это зависит от индивидуальных генетических особенностей человека.

На интерактивной карте теперь указываем конкретные регионы, в которых вероятнее всего проживали ваши предки. Для России, Украины и Казахстана мы уточняем регион, для других стран — страну.

А еще мы сразу показываем ваших близких и дальних родственников, которые произошли из этого региона или имеют оттуда корни — так искать общего предка стало еще проще.

Мы изменили представление страницы с этническим составом, чтобы результаты стали еще понятнее и нагляднее.

Как мы это сделали?

Сотрудники Genotek исследуют генетические особенности этносов, проживающих в России и за рубежом. Мы анализируем родословные клиентов, находя среди них эталонных представителей народов России — тех, чьи бабушки и дедушки причисляли себя к одному и тому же народу и проживали в одном и том же регионе. С генетическими данными отобранных эталонных представителей разных этносов мы сравниваем ДНК человека для определения его этнического происхождения.

Здесь мы не полагаемся слепо на предоставленные данные, а используем многоэтапный контроль качества. Если генетические данные человека не совпадают с заявленными в родословной, то мы такой образец не включаем в базу эталонных геномов.

В результате огромной работы мы составили базу данных, в которой насчитывается более 100 000 геномов представителей 548 популяций. Это в 3 раза больше, чем было у нас раньше и у кого-либо в России. Это единственная и самая детальная база генетических данных народов, проживающих на территории России.
На рисунке ниже мы постарались представить результаты нашей работы наглядно. Здесь каждый геном обозначается точкой, а ее цвет соответствует этническому происхождению. Чем ближе точки на графике, тем сильнее они похожи генетически.
Мы разработали новый алгоритм, который с помощью методов машинного обучения (например, метода случайного леса) и статистических моделей (например, скрытой марковской модели) может находить и сравнивать участки в геноме человека. Новый алгоритм не только повысил точность результатов, но и позволил различать между собой даже очень близкие популяции. Это возможно сделать для большинства клиентов Genotek, за исключением случаев, когда близкие популяции не удается отделить из-за индивидуальных генетических особенностей. 

Но даже если наш алгоритм определил, что человек по происхождению на 100% русский, возможна дальнейшая детализация результатов. Теперь мы можем определить, из какого региона России происходят его предки. 

Исследование происхождения похоже на увлекательный квест – по крупицам собирать свою историю, чтобы в итоге получить полную картину и узнать о себе и своей семье больше. Обновление результатов определения этнического происхождения поможет клиентам Genotek получить еще больше информации, полезной в этом поиске.