科学家将算法叠加在一起 以改进对提高产量的作物性状的预测

导读 高光谱数据包括全光谱;这个连续光谱信息数据集有很多应用,从了解大堡礁的健康状况到挑选更高产的作物品种。为了帮助研究人员更好地预测高

高光谱数据包括全光谱;这个连续光谱信息数据集有很多应用,从了解大堡礁的健康状况到挑选更高产的作物品种。为了帮助研究人员更好地预测高产作物性状,伊利诺伊大学的一个团队将六种用于解释高光谱数据的高功率机器学习算法叠加在一起 ​​- 他们证明了这种技术提高了预测能力。与仅使用一种算法相比,最近的研究高达15%。

“我们正在授权来自许多领域的科学家,他们不一定是计算分析方面的专家,将他们庞大的数据集转化为有益的结果,”伊利诺斯州的博士后研究员,第一作者彭富说,他领导这项工作进行了一项名为“实现”的研究项目。提高光合效率(RIPE)。“现在,科学家们不需要抓住他们的头脑来确定使用哪种机器学习算法;他们可以应用六种或更多算法 - 以一种价格 - 来做出更准确的预测。”

由伊利诺伊州领导的RIPE通过改善光合作用来提高作物的生产力,这是所有植物用来将阳光转化为能量和产量的自然过程。RIPE得到比尔和梅林达盖茨基金会,美国食品和农业研究基金会(FFAR)以及英国政府国际发展部(DFID)的支持。

在最近发表在环境遥感中的一项研究中,该团队引入光谱分析作为快速识别可提高产量的光合作用改良的手段。在这项发表在植物科学前沿的新研究中,该团队使用机器学习将其先前的光合能力预测提高了多达15%,其中计算机在没有人工帮助的情况下自动将这六种算法应用于其数据集。

伊利诺伊州RIPE博士后研究员Katherine Meacham-Hensold领导了之前的环境遥感研究,他说:“我很高兴看到当你可以利用计算能力来利用数据获取所有价值时,可能会发生什么。”。“看到像彭这样的数据分析师可以对我的数据做些什么是令人兴奋的。现在,其他非数据分析师科学家可以测试几种强大的算法来确定哪一种能够帮助他们最大限度地利用他们的数据。”

然而,需要更多的研究来证明这种堆叠算法技术与植物科学界和其他研究领域的相关性。

“通过应用数据分析师的专业知识来满足像我这样的植物生理学家的需求,我们最终完善了一种与其他高光谱数据集相关的技术,”共同作者,美国科学研究中心的RIPE研究负责人和科学家Carl Bernacchi说。农业,农业研究服务处,总部设在伊利诺伊州的Carl R. Woese基因组生物学研究所。“下一步是在更多作物物种的数据集上测试更多堆叠的机器学习算法,并探索这种技术用于估计其他参数的效用,例如干旱或疾病的非生物胁迫。”

“作为科学家,我们应该尝试利用我们的领域知识来解释机器学习方法的先进性能,”伊利诺伊州农业,消费者和环境科学学院(ACES)助理教授,共同作者Kaiyu Guan说。“结合计算方法和领域学科使我们可能解开导致高光谱数据集中可测量差异的原因 - 这是我们工作中尚未解决的谜团,值得未来探索。”