Геномное предсказание агрономических признаков в коллекции зародышевой плазмы разнородного льна
18.02.2024 - 296 просмотровГеномное предсказание агрономических признаков в коллекции зародышевой плазмы разнородного льна (Linum usitatissimum L.), Ахасанул Хок, Джеймс В. Андерсон, Мухлесур Рахман
Genomic prediction for agronomic traits in a diverse Flax (Linum usitatissimum L.) germplasm collection. Ahasanul Hoque, James V. Anderson, Mukhlesur Rahman, Scientific Reportsvolume 14, Article number: 3196 (2024)
https://doi.org/10.1038/s41598-024-53462-w
АННОТАЦИЯ
Селекционные программы требуют исчерпывающего фенотипирования зародышевой плазмы, что требует времени и больших затрат. Геномное предсказание помогает селекционерам использовать разнообразие любой коллекции в обход фенотипирования. Здесь мы исследовали потенциал геномного прогнозирования урожайности семян и девяти агрономических признаков, используя 26 171 маркер однонуклеотидного полиморфизма (SNP) в наборе из 337 маркеров льна (Linum usitatissimum L. зародышевая плазма, фенотипированная в пяти средах. Мы оценили 14 моделей прогнозирования и несколько факторов, влияющих на прогностическую способность, на основе схем перекрестной проверки. Модели показали значительные различия в значениях прогностической способности по признакам для всего набора маркеров. Модель гребневой регрессии (RR), охватывающая аддитивное действие генов, дала лучшую прогностическую способность для большинства признаков, тогда как она была выше для признаков с низкой наследуемостью по моделям, учитывающим эпистатическое действие генов. Подмножества маркеров, основанные на расстоянии распада неравновесия сцепления, дали значительно более высокие прогностические способности для всего набора маркеров, но для случайно выбранных маркеров оно достигло плато выше 3000 маркеров. Маркеры, имеющие значительную связь с признаками, улучшали прогностические способности по сравнению со всем набором маркеров, когда отбор маркеров производился по всей популяции, а не по обучающему набору, указывающему на явное переобучение. Поправка на структуру популяции не повысила прогностические способности по сравнению со всей коллекцией. Однако стратифицированная выборка с отбором репрезентативных генотипов из каждого кластера улучшила прогностические способности. Способность косвенного прогнозирования признака была пропорциональна его корреляции с другими признаками. Эти результаты помогут селекционерам выбрать лучшие модели, оптимальный набор маркеров и подходящий набор генотипов для проведения косвенного отбора по количественным признакам в этой разнообразной коллекции зародышевой плазмы льна.
ВЫДЕРЖКИ
ВВЕДЕНИЕ
Лен (Linum usitatissimum L.), природный источник масла и клетчатки, выращивался во всем мире с доисторических времен и имеет значительное экономическое значение1. Льняное семя играет важную роль в питании человека2,3 поскольку содержит масло, богатое омега-3 жирными кислотами, пищевыми волокнами и антиканцерогенными лигнанами. Льняное масло используется для различных промышленных целей, таких как изготовление чернил, лакирование, покраска и дорожных ковровых покрытий, благодаря своим специфическим свойствам при сушке4. Кроме того, мука из семян льна имеет ценность в качестве корма для птицы и животных5,6, а льняное волокно используется в производстве льняных тканей и различных биоиндустриальных продуктов7.
Среди льноводческих стран Казахстан производит больше всего масличного льна, за ним следуют Российская Федерация, Канада, Китай и США, тогда как только Франция производит три четверти льна-долгунца в мире, за ней следуют Бельгия, Беларусь, Российская Федерация и Китай8. В Соединенных Штатах Северная Дакота (Северная Каролина) обладает наибольшим процентом посевных площадей льна, которые занимают около 71% (215 миллионов акров) и 80% (3,75 миллиарда бушелей) посевных площадей льна в США соответственно и ежегодно приносят в национальную экономику около 46 миллионов долларов США (Данные в среднем за период с 2017 по 2021 год)9. Как и многим другим возделываемым культурам, производству льна в Северной Каролине бросают вызов различные биотические и абиотические стрессы10,11. Для решения этих проблем и удовлетворения потребностей фермеров в высокоурожайных сортах с повышенным содержанием масла и белка Университет штата Северная Дакота (NDSU) запускает программу селекции льна среднего размера. Программа использует классические методы селекции, особенно модифицированные массовые методы для выведения сортов, что является дорогостоящим, трудоемким и отнимает много времени. Чтобы ускорить процесс селекции, самое время внедрить в программу передовые инструменты селекции, такие как маркерная селекция (MAS) и геномная селекция (GS).
Первоначально селекционеры использовали ассоциации маркерных признаков, выявленные с помощью картирования сцепления и общегеномного ассоциативного картирования MAS, в селекционных программах для повышения эффективности и генетического прироста12. На сегодняшний день MAS успешно используется для улучшения моногенных или олигогенных признаков многих основных культур, таких как рис13,14, пшеница15,16,17, кукуруза18,19,20 и др. Однако улучшение количественных признаков, контролируемых несколькими QTL, с незначительными эффектами является сложной задачей. Для улучшения количественных признаков можно использовать мультимаркерную систему MAS, но очень сложно идентифицировать и учесть все эффекты аллелей21,22. Селекционеры могут преодолеть ограничения MAS, используя общегеномный селекционный подход. Геномный отбор (GS), также известный как геномное предсказание, путем учета всех эффектов маркеров независимо от значимости, обещает ускорить темпы генетического прироста в случае количественных признаков23,24. GS впервые был успешно использован в животноводстве, где его применяли к молочному скоту25. В последние дни низкая стоимость генотипа по сравнению с фенотипической стоимостью сделала GS привлекательным инструментом принятия решений для отбора и оценки образцов в разнообразных коллекциях зародышевой плазмы.
На сегодняшний день разработано множество статистических моделей для GS. Первоначально широко использовалась модель RRBLUP23,26. Позже появилось множество линейных или параметрических моделей27,28,29,30 и нелинейных или непараметрических моделей31,32,33. Линейные модели учитывают только аддитивные эффекты действия генов, тогда как нелинейные модели учитывают аддитивные и неаддитивные взаимодействия (доминирование, эпистаз и плейотропия). Различные модели различаются по лежащим в их основе допущениям и алгоритмам, и многие авторы подтвердили, что ни одна модель не работала наилучшим образом по всем признакам, скорее, конкретная модель превосходила по конкретному признаку34,35,36,37. Вот почему всегда рекомендуется тестировать несколько моделей по признакам для достижения максимальной точности прогнозирования. Наряду с моделями учитываются различные факторы, такие как взаимосвязь между обучающим набором и набором для проверки38,39, корреляция между изучаемыми признаками40,41, наследуемость признаков, плотность маркеров, размер QTL с эффектами34,42,43,44,45,46 и генетическое разнообразие изучаемой коллекции 36,47,48 также влияют на точность прогнозирования.
Селекционеры успешно использовали GS для ускорения процесса развития сортов риса49,50,51,52, пшеницы53,54, 55,56,57, кукурузы58,59,60,61 и других культур. Несмотря на широкое применение GS во многих культурах, его использование в селекции льна-долгунца еще не достигло расцвета. Поскольку доступно очень мало отчетов об использовании GS в двуродственных популяциях льна 62,63 и разнообразных64, существует большой потенциал для оценки GS в разнообразных коллекциях льна.
Целью данного исследования является:
(1) изучение возможности реализации геномного прогнозирования различных агрономических признаков,
(2) определение наиболее эффективных моделей прогнозирования и оптимального количества маркеров для максимизации прогностических способностей по признакам
(3) оценка того, как ассоциации маркеров и признаков, структура популяции и корреляции признаков влияют на прогностические способности по различным признакам.
МАТЕРИАЛЫ И МЕТОДЫ
Растительные материалы
Мы собрали 500 образцов льна и их диких сородичей с Северо-Центральной региональной станции интродукции растений (NCRPIS), Эймс, Айова, США. Все генотипы выращивали в поле одиночными рядами. Мы отказались от разнородных рядов и сохранили однородные линии для родительского поголовья. Наконец, мы составили базовую коллекцию из 337 образцов зародышевой плазмы льна, которая включает однородные линии из NCRPIS, сорта, выпущенные NDSU, и линии передовой селекции, а также сорта, разработанные различными институтами в США и Канаде (Дополнительная таблица S1). Передовые селекционные линии (поколение F7) были получены путем скрещивания разных родителей в различных комбинациях. Основная коллекция поддерживается путем самоорганизации. NCRPIS и NDSU являются государственными учреждениями, которые соблюдают все необходимые правила использования семенного материала в исследовательских целях.
РЕЗУЛЬТАТЫ
Фенотипическая изменчивость
Коллекция генотипов показала непрерывную изменчивость по всем признакам во всех условиях (дополнительный рисунок. S2). При пяти условиях окружающей среды количество дней до цветения составляло от 36 до 67, высота растения - от 20,0 до 82,8 см, техническая длина - от 6,5 до 60,7 см, количество ветвей - от 2,7 до 12,3, а количество коробочек - от 5 до 50. Среди признаков для числа коробочек максимальное значение CV в 36,2% наблюдалось в E3. Однако признаки, связанные с семенами, имели относительно более низкие значения CV по сравнению с другими признаками. Среди них масса тысячи семян имела максимальное значение CV 16,0% в E1. Урожайность семян оценивали в четырех средах, которая варьировалась от 87 до 630 г на делянку при CV от 35,7 до 41,4%. Количество коробочек и урожайность семян имели самую низкую наследуемость (< 0,40) по сравнению с другими признаками во всех условиях. Дни до цветения, количество ветвей и ширина посева указывали как на низкую, так и на высокую (от 0,18 до 0,93) наследуемость в зависимости от окружающей среды, тогда как она была высокой (> 0,60) для высоты растения, технической длины, массы тысячи семян, площади посева и длины семени. Все признаки демонстрировали высокую наследуемость (> 0,65) во всех средах, кроме номера ветви. Подробности фенотипической изменчивости представлены в Дополнительной таблице S2.
Фенотипическая корреляция
Мы исследовали фенотипическую связь между различными признаками и урожайностью семян (дополнительный рис. S3) во всех средах. Дни до цветения показали как положительные, так и отрицательные слабые корреляции с другими признаками в разных условиях. Высота растения, техническая длина, количество ветвей, количество коробочек и урожайность семян имели положительную значимую корреляцию между собой в разных условиях. Среди всех комбинаций была обнаружена наилучшая положительная значимая корреляция между высотой растения и технической длиной (r > 0,77), количеством коробочек и урожайностью семян (r = 0,69-0,79) во всех средах. Признаки, определяющие количество семян, такие как масса тысячи семян, площадь посева, ширина и длина, значительно положительно коррелировали друг с другом, но они демонстрировали в основном слабые корреляции с остальными признаками и урожайностью семян в разных условиях.
--------------
https://www.nature.com/articles/s41598-024-53462-w
События прошедшей недели свидетельствуют о росте внимания к конопле и льну как к источникам пи...
Оборудование для производства масел и экстрактов фармацевтического и косметического назначения...
Каждый третий договор страхования урожая в России относится к малым формам хозяйствования