摘 要:為了解長期定位試驗(yàn)下苧麻纖維產(chǎn)量的變化趨勢(shì),推動(dòng)苧麻種植產(chǎn)業(yè)增產(chǎn)提效,基于苧麻多倍體1號(hào)品種2010—2019年共30個(gè)收獲期的纖維產(chǎn)量數(shù)據(jù),構(gòu)建ARIMA纖維產(chǎn)量預(yù)測(cè)模型,并對(duì)模型精度進(jìn)行驗(yàn)證。結(jié)果表明:ARIMA(2,0,3)模型最佳,4個(gè)收獲期中纖維產(chǎn)量預(yù)測(cè)值與實(shí)測(cè)值的平均相對(duì)誤差百分比為7.72%,整體預(yù)測(cè)效果較好,適用于該地區(qū)多倍體1號(hào)纖維產(chǎn)量的短期預(yù)測(cè)
關(guān)鍵詞:苧麻;ARIMA模型;時(shí)間序列;產(chǎn)量預(yù)測(cè)
苧麻是多年生草本植物,是我國重要的特色經(jīng)濟(jì)作物。課題組利用自回歸滑動(dòng)平均模型(Autoregressive Integrated Moving Average Model,即ARIMA)對(duì)長期定位試驗(yàn)下苧麻的纖維產(chǎn)量展開分析和預(yù)測(cè),能夠探究其長期生產(chǎn)過程中的內(nèi)在潛力和時(shí)空變化,為相關(guān)部門制定苧麻產(chǎn)業(yè)政策等提供依據(jù)。關(guān)于作物產(chǎn)量預(yù)測(cè)研究,常用的方法有多元回歸?神經(jīng)網(wǎng)絡(luò)和時(shí)間序列等,而時(shí)間序列方法中采用ARIMA模型的比較多。ARIMA模型主要從變量間的因果關(guān)系分析著手,重點(diǎn)探究產(chǎn)量與因素間的相互聯(lián)系,在產(chǎn)量的短期預(yù)測(cè)方面有著廣泛應(yīng)用?;跁r(shí)間序列方法對(duì)苧麻纖維產(chǎn)量預(yù)測(cè)展開的研究較少,且采ARIM模型進(jìn)行預(yù)測(cè)分析的更是鮮見報(bào)道。
1 試驗(yàn)情況介紹
1.1 試驗(yàn)設(shè)計(jì)
試驗(yàn)用地位于湖南農(nóng)業(yè)大學(xué)國家麻類長期定位試驗(yàn)基地,試驗(yàn)品種為苧麻多倍體1號(hào)。課題組于2009年5月采集嫩枝扦插育苗,同年6月移栽,株距45cm,栽培密度3.30×104株·hm-2,面積20m2,品種重復(fù)4次。
1.2 數(shù)據(jù)選取
選取苧麻多倍體1號(hào)2010—2019年所有收獲期(每年3個(gè)收獲期,共30個(gè))的纖維產(chǎn)量數(shù)據(jù),另外從2020年?2021年的收獲期中各選2個(gè)收獲期的數(shù)據(jù)進(jìn)行比較,驗(yàn)證模型精度。
1.3.1 數(shù)據(jù)平穩(wěn)性檢驗(yàn)
圖1為2010—2019年多倍體1號(hào)各收獲期纖維產(chǎn)量的時(shí)間序列圖。由圖1可知,雖然多倍體1號(hào)的纖維產(chǎn)量序列整體來看圍繞某一數(shù)值上下波動(dòng),但是難以直接判斷該數(shù)列是否處于平穩(wěn)狀態(tài),因而需要對(duì)其進(jìn)行檢驗(yàn)。
圖1多倍體1號(hào)纖維產(chǎn)量時(shí)間序列圖
利用Eviews軟件對(duì)纖維產(chǎn)量時(shí)間序列進(jìn)行ADF檢驗(yàn),結(jié)果見表1。由表1可知:ADF統(tǒng)計(jì)量的P值為0.01,明顯小于0.05,可以認(rèn)為苧麻纖維產(chǎn)量序列在1%顯著性水平下是平穩(wěn)序列。由此,確認(rèn)多倍體1號(hào)纖維產(chǎn)量序列屬于平穩(wěn)數(shù)列,不需要進(jìn)行差分處理。
表1 多倍體1號(hào)纖維產(chǎn)量序列ADF檢驗(yàn)表
1.3.2 模型系數(shù)的選取
ARIMA模型的表達(dá)式為ARIMA(p,d,q)。其中:AR是自回歸,p為自回歸項(xiàng);MA為移動(dòng)平均,q為移動(dòng)平均項(xiàng)數(shù),d為時(shí)間序列成為平穩(wěn)序列時(shí)所做的差分次數(shù)。一般通過判斷序列的自相關(guān)系數(shù)(ACF)和偏自相關(guān)系數(shù)(PACF)的拖尾或結(jié)尾情況確定p?q值。由表1可看出多倍體1號(hào)纖維產(chǎn)量為平穩(wěn)序列,因此ARIMA(p,d,q)預(yù)測(cè)模型中的d值取0,即確定為ARIMA(p,0,q),最后對(duì)模型中的兩個(gè)參數(shù)p和q進(jìn)行多種組合選擇,利用擬合優(yōu)度R2?AIC和BIC準(zhǔn)則評(píng)判擬合模型的優(yōu)劣,從中選擇R2最大?AIC和BIC值最小的模型。采用SPSS軟件對(duì)多倍體1號(hào)纖維產(chǎn)量數(shù)據(jù)進(jìn)行處理,可知自相關(guān)系數(shù)和偏自相關(guān)系數(shù)均存在拖尾現(xiàn)象,可以初步確定模型中p?q階數(shù)為2和3。為找出最佳模型,將p?q階數(shù)為2或3的模型進(jìn)行比對(duì),相關(guān)參數(shù)結(jié)果見表2。
表2 多倍體1號(hào)纖維產(chǎn)量ARIMA系列模型的各項(xiàng)參數(shù)構(gòu)成
由表2可知,所列的9個(gè)ARIMA纖維產(chǎn)量模型中以ARIMA(2,0,3)?ARIMA(3,0,3)的R2值最高,均為0.75,其次為ARIMA(3,0,1),其R2值為0.72,而其他模型的R2值均小于0.70,基本上可以排除。接下來再對(duì)上述3個(gè)模型的AIC和BIC值大小進(jìn)行比較:從數(shù)值來看,ARIMA(2,0,3)模型的AIC?BIC值分別為89.90?99.70,小于ARIMA(3,0,3)模型的數(shù)值93.77?104.98,也小于ARIMA(3,0,1)模型的數(shù)值92.98?101.39,因此,可以進(jìn)一步排除ARIMA(3,0,3)和ARIMA(3,0,1)兩個(gè)模型,從而得到最優(yōu)的多倍體1號(hào)纖維產(chǎn)量預(yù)測(cè)模型,即ARIMA(2,0,3),該模型的相關(guān)評(píng)價(jià)指標(biāo)如表3所示。
表3 多倍體1號(hào)纖維產(chǎn)量ARIMA(2,0,3)模型參數(shù)表
1.3.3 模型預(yù)測(cè)與精度驗(yàn)證
通過對(duì)時(shí)間序列的分析處理,可以對(duì)其未來的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)[3]。將ARIMA(2,0,3)纖維產(chǎn)量預(yù)測(cè)模型獲取的2010—2019年共30期的纖維產(chǎn)量與實(shí)際值進(jìn)行擬合分析,同時(shí)比對(duì)2020?2021年4個(gè)收獲期(每年各選2期)的纖維產(chǎn)量的預(yù)測(cè)值和實(shí)測(cè)值,檢驗(yàn)?zāi)P偷念A(yù)測(cè)效果。
2 結(jié)果與分析
2.1 多倍體1號(hào)纖維產(chǎn)量的擬合結(jié)果分析
利用ARIMA(2,0,3)模型擬合的苧麻多倍體1號(hào)2010—2019年各收獲期纖維產(chǎn)量相關(guān)參數(shù)指標(biāo)如表4所示。由表4可知:模型的R2為0.75,RMSE為0.97×102kg·hm-2,平均誤差百分比(MAPE)為8.41%,小于10%,平均絕對(duì)誤差值(MAE)為0.59×102kg·hm-2,最大誤差百分比為32.34%,最小為0.22%,最大絕對(duì)誤差為2.83×102kg·hm-2,最小為0.02×102kg·hm-2。多倍體1號(hào)纖維產(chǎn)量中的大多數(shù)擬合值與實(shí)測(cè)值接近,表明模型的擬合精度較好。
表4 多倍體1號(hào)ARIMA(2,0,3)模型的估計(jì)和參數(shù)結(jié)果
2.2 多倍體1號(hào)纖維產(chǎn)量的預(yù)測(cè)結(jié)果分析
將多倍體1號(hào)在2020?2021年的4個(gè)收獲期的預(yù)測(cè)纖維產(chǎn)量與實(shí)測(cè)值進(jìn)行對(duì)比,結(jié)果如表5所示:4個(gè)收獲期苧麻纖維產(chǎn)量的絕對(duì)誤差值分別為0.05?0.03?0.76和1.13×102kg·hm-2,相對(duì)誤差百分比分別為0.67%?0.45%?9.74%和20.00%,平均相對(duì)誤差百分比為7.72%,其中2021年三麻的預(yù)測(cè)精度偏差較大,相對(duì)誤差百分比為20%;2020年三麻的纖維產(chǎn)量預(yù)測(cè)精度最佳,相對(duì)誤差百分比僅為0.45%;4個(gè)預(yù)測(cè)收獲期中有兩期的纖維產(chǎn)量相對(duì)誤差百分比小于1%。總體來看ARIMA(2,0,3)纖維產(chǎn)量模型的預(yù)測(cè)效果較好。
表5 多倍體1號(hào)2020?2021年的收獲期纖維產(chǎn)量預(yù)測(cè)精度比對(duì)
3 總結(jié)與討論
本文基于苧麻多倍體1號(hào)長期定位試驗(yàn)中2010—2021年的纖維產(chǎn)量數(shù)據(jù),引入ARIMA模型,同時(shí)結(jié)合前人的相關(guān)研究成果構(gòu)建了ARIMA(2,0,3)纖維產(chǎn)量預(yù)測(cè)模型。模型的決定系數(shù)R2為0.75,平均相對(duì)誤差為7.72%,預(yù)測(cè)精度高于趙嘉寶等和蔡承智等學(xué)者研究的精度,對(duì)苧麻種植地區(qū)無損預(yù)測(cè)纖維產(chǎn)量有較高應(yīng)用價(jià)值。本研究在構(gòu)建作物產(chǎn)量ARIMA預(yù)測(cè)模型時(shí),既不受作物外部生長的環(huán)境和氣象因素影響,也不考慮生產(chǎn)過程中相關(guān)要素的變動(dòng)情況,主要依托歷史產(chǎn)量的時(shí)間序列來集中對(duì)內(nèi)外部因素進(jìn)行動(dòng)態(tài)反應(yīng),預(yù)測(cè)結(jié)果取決于序列的平穩(wěn)性。與傳統(tǒng)作物產(chǎn)量預(yù)測(cè)模型構(gòu)建方法相比,此預(yù)測(cè)模型具有數(shù)據(jù)樣本少?運(yùn)算方便的特點(diǎn),但在預(yù)測(cè)效果上存在差異,精度有待進(jìn)一步提高。苧麻是多年生草本植物,其產(chǎn)量受多種因素影響,因此后續(xù)還可以引入多個(gè)影響因子,綜合運(yùn)用神經(jīng)網(wǎng)絡(luò)?隨機(jī)森林等機(jī)器學(xué)習(xí)算法開展苧麻纖維產(chǎn)量的組合模型研究,盡可能真實(shí)地推演苧麻多年栽種情況下纖維產(chǎn)量的變化。
參考文獻(xiàn)
[1] 楊潔,唐昀,申香英,等.我國苧麻產(chǎn)業(yè)現(xiàn)狀與振興發(fā)展[J].中國麻業(yè)科學(xué),2022(4):253?256.
[2] 高衛(wèi),張電學(xué),雷利君,等.中國糧食產(chǎn)量影響因素分析及研究方法綜述[J].安徽農(nóng)業(yè)科學(xué),2014(33):11954?11955,11958.
[3] 王霞,房少梅.數(shù)學(xué)建模經(jīng)驗(yàn)總結(jié)[J].教育現(xiàn)代化,2017(21):81?82,87.
[4] 趙嘉寶,陳杰,安霞,等.基于ARIMA模型的吐魯番市葡萄產(chǎn)量預(yù)測(cè)分析[J].江蘇科技信息,2019(31):34?39.
[5] 蔡承智,楊春曉,莫洪蘭,等.基于ARIMA模型的中國水稻單產(chǎn)預(yù)測(cè)分析[J].雜交水稻,2018(2):62?66.
文章摘自:王輝. 基于ARIMA模型的苧麻纖維產(chǎn)量預(yù)測(cè)研究[J]. 江蘇經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院學(xué)報(bào),2023,05.003.
