Training data adalah data yang digunakan untuk melatih model machine learning. Sering disebut juga features. Contoh untuk model perhitungan prediksi nilai harga rumah, maka features adalah data luas tanah, luas bangunan, jumlah kamar, dan seterusnya.
Sementara data harga rumah adalah field special, pada data training untuk model supervised learning, ini digunakan untuk memberitahu model, nilai yang diharapkan bila feature diinput.
Minimum data yang dibutuhkan 10 x jumlah feature. Jika feature kita ada 10, maka minimal data yang diinput adalah 100.
Makin banyak data, tentu makin baik (namun bukan suatu keharusan)
Sementara data harga rumah adalah field special, pada data training untuk model supervised learning, ini digunakan untuk memberitahu model, nilai yang diharapkan bila feature diinput.
Aturan Penamaan
Untuk supervised learning model, biasanya feature akan diberi nama X, value yang akan diprediksi adalah Y. Dengan standar penamaan seperti ini, akan mempermudah kita berkomunikasi dengan programmer lainnya.Besar Training Dataset
Model machine learning akan bekerja maksimum bila dataset training yang diinput memenuhi kombinasi dari semua feature yang dimiliki.Minimum data yang dibutuhkan 10 x jumlah feature. Jika feature kita ada 10, maka minimal data yang diinput adalah 100.
Makin banyak data, tentu makin baik (namun bukan suatu keharusan)
Training Data
Reviewed by noname needed
on
May 24, 2018
Rating:
No comments: