Mengenal Overfitting dan underfitting

Noer Barrihadianto
2 min readDec 31, 2022

--

Overfitting dan underfitting adalah dua masalah yang sering terjadi dalam proses pembelajaran mesin (machine learning). Keduanya merupakan indikasi bahwa model yang digunakan tidak sesuai dengan data yang ada dan tidak mampu membuat prediksi yang akurat

Berikut adalah beberapa perbedaan utama antara overfitting dan underfitting:

  1. Definisi: Overfitting adalah suatu keadaan di mana suatu model terlalu spesifik terhadap data yang telah dilatihnya, sehingga model tersebut tidak mampu menangani data baru dengan baik. Sedangkan underfitting adalah suatu keadaan di mana suatu model terlalu sederhana dan tidak mampu menangani kompleksitas dari data yang ada.
  2. Penyebab: Overfitting terjadi karena model terlalu dipaksakan untuk menyesuaikan diri dengan noise atau variasi yang tidak relevan dalam data latih. Sedangkan underfitting terjadi karena model terlalu sederhana dan tidak memiliki cukup banyak fitur atau variabel untuk membuat prediksi yang akurat.
  3. Dampak: Overfitting akan menyebabkan model yang baik pada data latih, tetapi tidak mampu memprediksi output yang sebenarnya dengan baik pada data baru. Sedangkan underfitting akan menyebabkan model yang buruk pada data latih dan juga tidak mampu memprediksi output yang sebenarnya dengan baik pada data baru.
  4. Penanganan: Overfitting dapat dihindari dengan menggunakan teknik regulasi, seperti menggunakan teknik pembagian data latih dan validasi, atau menggunakan teknik penurunan dimensi. Underfitting dapat diatasi dengan menambah fitur atau variabel yang relevan, atau dengan menggunakan model yang lebih kompleks.

--

--

Noer Barrihadianto
Noer Barrihadianto

Written by Noer Barrihadianto

I am a Practitioner of Data Integration, BigData, Deep Learning, Machine Learning and Project Management