Setelah text preprocessing yang menghasilkan token, Langkah selanjutnya adalah Feature Extraction. Feature extraction adalah proses megubah token menjadi feature yang akan digunakan untuk model. Berikut beberapa metoda feature extraction :
Setiap token akan memiliki fitur kolom, yang kita sebut dengan text vectorization.
Berikut contoh bag of words
Permasalahan dari Bag of words adalah kita kehilangan susunan kata (susunan kata adalah hal penting untuk makna dari sebuah text)
Bag of Words
Bag of words digunakan untuk menghitung seberapa sering muncul token tertentu. Karena ini akan diguakan text qualifiction, maka tujuannya nanti kita akan mencari kata-kata tertentu seperti "excelent" atau "disappointed".Setiap token akan memiliki fitur kolom, yang kita sebut dengan text vectorization.
Berikut contoh bag of words
Permasalahan dari Bag of words adalah kita kehilangan susunan kata (susunan kata adalah hal penting untuk makna dari sebuah text)
Feature Extraction
Reviewed by noname needed
on
February 23, 2019
Rating:
No comments: