Feature Extraction

Setelah text preprocessing yang menghasilkan token, Langkah selanjutnya adalah Feature Extraction. Feature extraction adalah proses megubah token menjadi feature yang akan digunakan untuk model. Berikut beberapa metoda feature extraction :

Bag of Words

Bag of words digunakan untuk menghitung seberapa sering muncul token tertentu. Karena ini akan diguakan text qualifiction, maka tujuannya nanti kita akan mencari kata-kata tertentu seperti "excelent" atau "disappointed".

Setiap token akan memiliki fitur kolom, yang kita sebut dengan text vectorization.

Berikut contoh bag of words



Permasalahan dari Bag of words adalah kita kehilangan susunan kata (susunan kata adalah hal penting untuk makna dari sebuah text)
Feature Extraction Feature Extraction Reviewed by noname needed on February 23, 2019 Rating: 5

No comments:

Powered by Blogger.