Training Data

Training data adalah data yang digunakan untuk melatih model machine learning. Sering disebut juga features. Contoh untuk model perhitungan prediksi nilai harga rumah, maka features adalah data luas tanah, luas bangunan, jumlah kamar, dan seterusnya.



Sementara data harga rumah adalah field special, pada data training untuk model supervised learning, ini digunakan untuk memberitahu model, nilai yang diharapkan bila feature diinput.

Aturan Penamaan

Untuk supervised learning model, biasanya feature akan diberi nama X, value yang akan diprediksi adalah Y. Dengan standar penamaan seperti ini, akan mempermudah kita berkomunikasi dengan programmer lainnya.



Besar Training Dataset

Model machine learning akan bekerja maksimum bila dataset training yang diinput memenuhi kombinasi dari semua feature yang dimiliki.
Minimum data yang dibutuhkan 10 x jumlah feature. Jika feature kita ada 10, maka minimal data yang diinput adalah 100.
Makin banyak data, tentu makin baik (namun bukan suatu keharusan)


Training Data Training Data Reviewed by noname needed on May 24, 2018 Rating: 5

No comments:

Powered by Blogger.