میرزایی, فرشته, امیریان چکان, علیرضا, تقی زاده مهرجردی, روح الله, متین فر, حمیدرضا. (1403). کارآیی سه مدل kNN، RF و SVM و مدل حاصل از ترکیب آنها به روش GR برای مدلسازی بافت خاک. سامانه مدیریت نشریات علمی, (), -. doi: 10.22092/ijsr.2024.364333.735
فرشته میرزایی; علیرضا امیریان چکان; روح الله تقی زاده مهرجردی; حمیدرضا متین فر. "کارآیی سه مدل kNN، RF و SVM و مدل حاصل از ترکیب آنها به روش GR برای مدلسازی بافت خاک". سامانه مدیریت نشریات علمی, , , 1403, -. doi: 10.22092/ijsr.2024.364333.735
میرزایی, فرشته, امیریان چکان, علیرضا, تقی زاده مهرجردی, روح الله, متین فر, حمیدرضا. (1403). 'کارآیی سه مدل kNN، RF و SVM و مدل حاصل از ترکیب آنها به روش GR برای مدلسازی بافت خاک', سامانه مدیریت نشریات علمی, (), pp. -. doi: 10.22092/ijsr.2024.364333.735
میرزایی, فرشته, امیریان چکان, علیرضا, تقی زاده مهرجردی, روح الله, متین فر, حمیدرضا. کارآیی سه مدل kNN، RF و SVM و مدل حاصل از ترکیب آنها به روش GR برای مدلسازی بافت خاک. سامانه مدیریت نشریات علمی, 1403; (): -. doi: 10.22092/ijsr.2024.364333.735
کارآیی سه مدل kNN، RF و SVM و مدل حاصل از ترکیب آنها به روش GR برای مدلسازی بافت خاک
1دانشجوی دکتری گروه مهندسی علوم خاک، دانشکده کشاورزی، دانشگاه لرستان، خرم آباد، ایران
2استادیار گروه مهندسی علوم خاک، دانشکده کشاورزی، دانشگاه لرستان، خرم آباد، ایران
3استادیار گروه مرتع و آبخیزداری، دانشکده کشاورزی و منابع طبیعی، دانشگاه اردکان، اردکان، ایران
4استاد گروه مهندسی علوم خاک، دانشکده کشاورزی، دانشگاه لرستان، خرم آباد، ایران
چکیده
بافت خاک یکی از مهمترین ویژگیهایی است که رفتار فیزیکی، شیمیایی و بیولوژکی خاک را کنترل میکند. روشهای مختلفی برای مدلسازی بافت خاک استفاده میشوند که هر کدام دارای مزایای خاص خود هستند. یکی از راهکارهای سود بردن از مزایای این مدلها ترکیب تخمین آنها است. با توجه به این که بافت خاک یک داده مرکب است، وقتی اجزاء آن جداگانه تخمین زده میشوند تضمینی برای برابر 100 شدن جمع سه جزء تخمینی وجود ندارد. برای تضمین برابر با 100 شدن تخمینهای سه جزء بافت میتوان از تبدیلهای log-ratio استفاده کرد. اطلاعات کمی در خصوص کارآیی مدلهای ترکیبی در مدلسازی دادههای تبدیلشده و نشده بافت وجود دارد و به نظر میرسد بر اساس این رویکرد تا کنون مطالعه-ای روی بافت خاک انجام نشده است. در این بررسی تعداد 200 نمونه سطحی از خاکهای منطقه کوهدشت برداشت شد. سه مدل جنگل تصادفی (RF)، k نزدیکترین همسایه (kNN) و ماشینهای بردار پشتیبان (SVM) و مدل حاصل از ترکیب آنها به روش Granger-Ramanathan (GR) برای مدلسازی، روشهای additive log-ratio (alr)، centred log-ratio (clr) و isometric log-ratio (ilr) برای تبدیل دادهها و دادههای حاصل از مدل رقومی ارتفاع (DEM) و تصاویر لندست 8 و سنتینل 2 به عنوان ورودی مدلها استفاده شدند. نتایج نشان داد متغیرهای استخراجشده از DEM اهمیت بیشتری در پیشبینی بافت خاک داشتند. بهطور کلی، هر چهار مدل با استفاده از تبدیل alr منجر به تخمینهای بهتری نسبت به تبدیلهای clr و ilr و دادههای تبدیلنشده (UT) گردیدند. مدل ترکیبی(GR) با مقادیر RMSE برابر با 07/5، 21/4، 81/5 و 09/6 درصد برای رس، مقادیر 11/7، 15/5، 04/9 و 70/6 درصد برای سیلت و مقادیر 20/9، 67/7، 69/11 و 74/8 درصد برای شن به ترتیب برای دادههای UT و تبدیلهای alr، clr و ilr منجر به بهبود تخمینها نگردید. بهطور کلی، مدل SVM با دادههای تبدیل شده به روش alr کارآیی کمی بیشتر از سایر مدلها داشت. نتایج نشان داد ترکیب چند مدل یادگیری ماشین الزاما باعث بهبود تخمینها نمیگردد و به جای ترکیب نتایج چند الگوریتم که ممکن است باعث پیچیدگی فرایند مدلسازی شود، میتوان از یک مدل مناسب برای برآورد بافت خاک استفاده کرد.
1Ph.D Student, Department of Soil Science, Faculty of Agriculture, Lorestan University, Khorramabad, Iran
2Assitant Professor, Department of Soil Science, Faculty of Agriculture, Lorestan University, Khorramabad, Iran
3Assitant Professor, Department of Rangeland and Watersghed Management, Faculty of Agriculture and Natural Resources, University of Ardakan, Ardakan, Iran.
4Professor, Department of Soil Science, Faculty of Agriculture, Lorestan University, Khorramabad, Iran.
چکیده [English]
Soil texture is one of the most important soil properties that governing soil physical, chemical and biological behaviors. In modeling soil textural fractions different models are used, each has its own advantages. To combine the benefit from different models, one approach is combining their predictions. Since soil texture is a compositional data, when its fractions are estimated separately there is no guarantee that the estimates will sum to 100. Log-ratio transformations before modeling are ways to deal with the problem. Little is known about modeling transformed and untransformed (UT) soil texture data using a combination of different models. In present study, 200 surface soil samples (0-30 cm) were collected from Kuhdasht region. Random forest (RF), k-nearest neighbors (kNN) and support vector machines (SVM) and their combination using Granger-Ramanathan (GR) method were used to model soil texture data. Additive log-ratio (alr), centroid log-ratio (clr) and isometric log-ratio (ilr) transformations were used to transform texture data. Environmental variables derived from Landsat 8 and Sentinel-2 images and a digital elevation model (DEM) were used as input for all models. Results indicated that covariates derived from DEM were more important in modeling soil texture. All models improved the estimates of soil texture fractions when used alr transformed data compare to when using UT, clr and ilr transformed data. The combined model (i.e. GR) did not show superiority over other models. Using GR model RMSE values for alr, clr, ilr transformed clay data and UT clay data were 5.07%, 4.21%, 5.81% and 6.09%, respectively. For silt RMSE values (in the same order as clay) were 7.11%, 5.15%, 9.04% and 6.70%, and for sand were 9.20%, 7.67%, 11.69% and 8.74%, respectively. Generally, SVM using alr transformed data showed a slightly higher potential for modeling soil texture. To sum up, results indicated that combining different machine learning algorithms does not necessarily improved the estimates. Therefore, instead of using a model combination approach that may result in more complexity, it is possible to use a single appropriate model for modeling soil texture.
کلیدواژهها [English]
Compositional data, Ensemble model, Log-ratio transformation, Random forest