Dr. Juro Miyasaka menyampaikan kuliah tamu bertajuk "Basic of Data Science and Applications to Agricultural Production" yang membahas penerapan sains data dalam sektor agrikultur. Dalam pemaparannya, ia mengawali dengan pengenalan proses standar penambangan data, yaitu Cross Industry Standard Process for Data Mining (CRISP-DM).
Menurut Dr. Juro, CRISP-DM umumnya digunakan dalam sektor bisnis dengan tahapan awal memahami bisnis itu sendiri. Namun, dalam penerapannya di bidang agrikultur, tahap pertama difokuskan pada pemahaman produksi agrikultur.
Lebih lanjut, ia menjelaskan bahwa sains data dapat diterapkan melalui berbagai metode machine learning, baik supervised learning maupun unsupervised learning, untuk mendukung pengembangan agrikultur.
Metode dalam Sains Data untuk Agrikultur
Beberapa metode yang digunakan antara lain regresi linear, yang biasa dipakai untuk memprediksi jumlah produksi berdasarkan data historis. Contohnya adalah prediksi produksi beras berdasarkan data beberapa tahun sebelumnya.
Dr. Juro mengingatkan bahwa pembuatan model dari data yang ada memang relatif mudah, namun hasilnya belum tentu optimal. Penting untuk memperhatikan risiko overfitting, yaitu ketika model hanya dilatih dengan data terbaik sehingga akurasinya menurun saat diuji dengan data berbeda.
Contoh Aplikasi Prediksi Penyakit dan Pertumbuhan Tanaman
Dalam bidang agrikultur, model prediksi juga dapat digunakan untuk memperkirakan kemungkinan terjadinya penyakit tanaman. Salah satu contohnya adalah prediksi penyakit Coleosporium plectranthi Barclay pada tanaman Perilla. Data yang dikumpulkan meliputi temperatur dan kelembaban tanaman, temperatur media tanam, serta tinggi tanaman. Pengambilan data dilakukan secara manual maupun menggunakan sensor setiap 10 menit. Metode yang digunakan untuk prediksi ini adalah support vector machine dan random forest.
Selain itu, Dr. Juro juga memaparkan contoh prediksi laju tumbuh tanaman Mizuna berdasarkan data lingkungan yang lebih kompleks. Variabel yang dikumpulkan antara lain rata-rata temperatur dan kelembaban media tanam, rata-rata temperatur lingkungan, temperatur malam hari, konsentrasi karbondioksida, dan kelembaban lingkungan, dengan data tinggi tanaman yang bervariasi. Metode yang digunakan untuk analisis ini adalah korelasi dan Adaboost k-nearest neighbor.
Kesimpulan
Dr. Juro Miyasaka menegaskan bahwa metode-metode dalam sains data masih sangat luas ruang eksplorasi dan aplikasinya dalam produksi agrikultur. Pemanfaatan teknologi ini diharapkan dapat meningkatkan efisiensi dan produktivitas di bidang pertanian.