青岛黄海足球俱乐部-北京师范大学国度安全与济急处罚学院
你的位置:青岛黄海足球俱乐部 > 足球俱乐部队徽 > 北京师范大学国度安全与济急处罚学院
北京师范大学国度安全与济急处罚学院
发布日期:2024-07-10 08:45    点击次数:166

北京师范大学国度安全与济急处罚学院



稻米是内行最进军的农作物之一,实时、可靠和大范畴的稻米产量揣摸关于制定国度食粮安全发展计算意旨要紧。国安院张朝讲授团队在《Agricultural and Forest Meteorology》期刊发表论文,分别使用最小透彻松开与选拔算子(LASSO)转头,机器学习(当场丛林,RF),以及深度学习(Long - Short- Term Memory Networks, LSTM)模子来权衡中国县级水稻产量。

磋商布景:

稻米(Oryza sativa L.)是内行最进军的农作物之一,占内行东说念主口的50%以上。中国事天下上最大的稻米分娩国(年产量约为2.06亿吨),占天下稻米分娩的28%。水稻占中国食粮总产量的41%,仅占中国耕大地积的35%,是65%中国东说念主口的主粮。关联词,频年来水稻产量停滞不前。为了温暖国内需求,中国需要在2030年之前将大米产量升迁约20%。因此,实时,可靠和大区域的稻米估产将有意于政府制定科学合理的食粮安全发展计算,确保国度食粮安全。

频年来,很多产量估算方法仍然基于传统方法,包括面向历程的作物模子模拟以及基于作物产量和阐述要素之间的统计模子。面向历程的作物模子,举例APSIM,WOFOST,DSSAT不错天为步长模拟作物的滋长。关联词,机理历程模子高度依赖于翔实的泥土,田间处罚以及天气等数据,对计较机计较性能也有高大的要求。同期,品种,田间处罚践诺和环境(举例天气条目和泥土)具有高度的空间异质性,因此要竣工大区域永劫刻次第的估产具有极大的挑战,估算罢休也存在很大的不笃定性。此外,基于传统的统计方法——单产与自变量之间的特定反馈函数,由于其更浮浅的计较和较高的阐述力亦然一种常用的估产方法。然则,由于传统的造就转头模子一样具有局限性和有限的空间泛化性,在实质应用中还存在很多问题。因此,有必要建筑新方法来缩小计较本钱的同期还能升迁估产精度,竣工大鸿沟、实时、精准的农作物估产。

革新点:

本磋商诊治三种机器/深度学习模子来权衡水稻水稻产量,发现LSTM推崇优于RF和LASSO模子;都集EVI和SIF用于权衡水稻产量优于单独使用EVI或SIF。本磋商建筑了一个可彭胀,浮浅和低本钱的框架,不错用于快速权衡水稻产量。

磋商内容:

标题:

Integrating Multi-Source Data for Rice Yield Prediction across China using Machine Learning and Deep Learning Approaches

方法框架:

本磋商继承三种具有代表性的基于统计的模子(即传完满计方法——LASSO,机器学习——RF,深度学习——LSTM)来权衡每个水稻系统的水稻产量。分析分为四个法子:(1)将整个选拔变量和水稻产量归一化,并将通盘数据集当场分手为稽察数据(70%)和测试数据(30%);(2)仅针对稽察数据集,基于最高R2和最低RMSE对每个模子的要道参数进行10倍交叉考证;(3)进行2011-2015年的“留一年”实验,应用R2和RMSE对模子的性能和泛化进度进行评价;(4)比较EVI、SIF和ESI在产量权衡中的性能。不同的水稻系统有不同的输入变量。

图1

图1 输入数据与LSTM模子结构

进军罢休:

(一)各水稻系统的征象变量组合选拔

由于当然条目和品种不同,各水稻系统的最好征象变量组合也不同。图2为早稻产量权衡的要道变量选拔。注:(*)、(**)、(***)示意p值分别< 0.05、0.01、0.001的接洽所有(r)。NGDD、HKDD、CKDD、Pdsi、Pre和Pet分别代表泛泛滋长灵验积温(◦C)、热致死积温(◦C)、冷致死积温(◦C)、帕尔默干旱严重指数、降水(毫米)和蒸散(毫米)。Vpd、Vap、Tmin和Tmax分别是指蒸汽压差(kPa)、蒸汽压(kPa)、最高温度(◦C)和最低温度(◦C)。模子最终选拔了LST接洽变量来捕捉主要水稻产区的温度变化;在早稻产量权衡模子中选拔了NGDD、HKDD、Pre、Pet和Vpd;在晚稻权衡模子中选拔NGDD、CKDD、Pre、Pet、Vap;选拔NGDD、HKDD、CKDD、Pre、Pet权衡单季稻产量。

图2

图2 早稻产量权衡的要道变量选拔

(二)时序变量与产量的时空接洽分析

卫星植被指数EVI(图a,b)、SIF(图c,d)与单季稻和早稻(图a,c)、晚稻(图b,d)产量的时空接洽性如图3。在箱形图中,水平线示意最大值和最小值;中间线示意中位数;上边际和下边际分别披露第75和第25百分位。接洽性的空间方式以接洽所有最高的月份(箱型图中的红点)展示。EVI和SIF都与水稻产量均呈正接洽(除了滋永恒的临了月份,如7月和10月)且在作物滋长“峰值”阶段接洽性最高。在空间上,EVI和SIF在绝大部分区域均与产量呈权贵正接洽。

图3

图3 卫星植被指数与水稻产量的接洽性踱步

分享征象变量NGDD(图a,b)、Pre(图c,d)、Pet(图e,f)与单季稻和早稻(a,c,e)、晚稻(b,e,f)产量的时空接洽性如图4。私有征象变量HKDD(a,b)、CKDD(c,d)、Vap(f)、Vpd(g)与单季稻和早稻(a,c,e)、晚稻(b,e,f)产量的时空接洽性如图5。产量与NGDD(图5a-b)、HKDD(图6b)和CKDD(图6d)之间的接洽性大多为负接洽,这是因为这三个征象规划都能捕捉到极点温度对产量的影响。除西南和东北地区小鸿沟单稻体系外,产量与降水存在正均质接洽联系,阐述降水对产量有促进作用,尤其在滋长“峰值”阶段。三种水稻体系的Pet、早稻的Vap、晚稻的Vpd等需水接洽变量,与水稻产量接洽性的空间方式在不同水稻系统之间存在明显各异,这可能是由于素质水稻的环境和分娩系统的空间异质性。

图4

图4 分享征象变量与水稻产量的接洽性踱步

图5

图5 私有征象变量与水稻产量的接洽性踱步

(三)集成不同卫星VIs对产量权衡性能的孝敬

在通盘滋长季使用不同VIs输入的三种模子R2和RMSE分别如图6和图7。当场测试数据集的过失线为R2的±15%。EVI、SIF和ESI分别代表增强植被指数、太阳提醒的叶绿素荧光和两者的组合。总体而言,ESI在权衡县级水稻产量方面优于单独使用EVI和SIF,机器学习和深度学习方法明显优于传统的线性转头方法。因此,在接下来的分析中,使用ESI当作卫星植被指数输入,并使用两种非线性方法(即RF和LSTM)。

图6

图6 各模子使用不同植被指数输入的R2

图7

图7 各模子使用不同植被指数输入的RMSE

(四)ML和DL模子的县级季末权衡时刻

以2001~2014年的不雅测数据当作稽察数据集,对2015年使用ML和DL模子进行权衡,对每个水稻系统的产量权衡性能进行了比较。散点图披露,县次第上双季(即早稻和晚稻)的揣摸值和纪录产量接近1:1线,而单季稻模子斜率老是小于1,这标明单季稻权衡模子容易低估低产和/或高估高产。总体而言,LSTM模子在不同输入变量下的估产成果明显优于RF。

图8

图8 2015年RF和LSTM估算产量与县次第普查产量的散点图

通过RF (b和e)和LSTM (c和f)揣摸2015年产量的空间踱步,以及2015年县次第官方普查产量(a和d)如图9。图a-c代表单季稻和早稻,图d-f代表晚稻。在空间上,高产县主要踱步在磋商区南部,即中国南边的双季稻。而单稻制低产县则稀疏踱步在磋商区中部地区。2015年产量估算的空间方式与官方普查的产量很是吻合,尤其是LSTM模子;LSTM模子在一些高产县和低产县的推崇优于RF模子。

图9

图9 官方普查产量和模子权衡产量的空间踱步

2015年单稻、早稻(a和b)和晚稻(c和d)的RF(a和c)和LSTM(b和d)模子权衡罢休的RMSE空间踱步如图10所示。RF模子在通盘磋商区域产生了较大的正负过失(≥20%和≤-20%)且主要为正好,标明RF模子高估了2015年县级水稻产量。两种模子对单稻系统的高估主要踱步在东北和云贵高原,这两个地区极点干旱和热威胁发生频率较高。与RF比较,LSTM权衡成果更佳,独特是在捕捉极点天气事件无聊影响方面。

图10

图10 模子权衡罢休的RMSE空间踱步

(五)ML和DL模子的县级季末权衡时刻

在2015年对RF和LSTM方法在每个阶段的产量权衡性能进行了比较,LSTM模子(a,c)与RF模子(b,d)的R2(a,b)和RMSE(c,d)如图11所示。总的来说,DL和ML的推崇都随积存变量的增多而增多。LSTM模子通过在逐次阶段次第输入信息,在揣摸产量反馈方面优于RF。各滋长阶段所带来的效益和信息是不同的。在作物滋长“峰值”阶段,两个模子的RMSE缩小和R2增量最为权贵,阐述该阶段的信息对产量估算至关进军。“峰值”期是升迁权衡时刻的要道期间,标明该模子在锻真金不怕火前(单稻2个月傍边,双稻1个月傍边)即可达到较好的产量权衡智商。

图11

图11 2015年使用基于前向滋长阶段的不雅测数据估算产量的模子推崇

论文援用:

[1] Cao J, Zhang Z, Tao F, et al. Integrating multi-source data for rice yield prediction across china using machine learning and deep learning approaches[J]. Agricultural and Forest Meteorology, 2021, 297: 108275.

磋论说文:

[1]   Han J, Zhang Z, Cao J, et al. Prediction of winter wheat yield based on multi-source data and machine learning in China[J]. Remote Sensing, 2020, 12(2): 236.

[2]   Cao J, Zhang Z, Luo Y, et al. Wheat yield predictions at a county and field scale with deep learning, machine learning, and google earth engine[J]. European Journal of Agronomy, 2021, 123: 126204.

[3]   Zhang L, Zhang Z, Luo Y, et al. Combining optical, fluorescence, thermal satellite, and environmental data to predict county-level maize yield in China using machine learning approaches[J]. Remote Sensing, 2020, 12(1): 21.

[4]   Zhang Z, Li Z, Chen Y, et al. Improving regional wheat yields estimations by multi-step-assimilating of a crop model with multi-source data[J]. Agricultural and Forest Meteorology, 2020, 290: 107993.

[5]   Li L, Wang B, Feng P, et al. Crop yield forecasting and associated optimum lead time analysis based on multi-source environmental data across China[J]. Agricultural and Forest Meteorology, 2021, 308: 108558.

作家简介:

第一作家简介:曹娟,北京师范大学地舆科学学部减灾与济急处罚磋商院博士磋商生,磋商标的为征象变化与食粮安全。



相关资讯