Stemming Banyak Kata

Postingan pertama saya akan membahas mengenai STEMMING BAHASA INDONESIA. Stemming mungkin bukan hal yang baru bagi teman-teman yang sedang mempelajari ilmu linguistik atau sedang membuat skripsi/tugas/penelitian tentang Machine Learning maupun NLP. Menurut Penelitian Jelita Asian mengenai stemming indonesia, beberapa jenis stemming yang ada mulai dari Nazief adriani, Arifin-setiono, Tala, hingga Sembok. Stemming yang populer digunakan yaitu Nazief Adriani (NA) karena akurasi yang dihasilkan dapat dikatakan cukup tinggi hingga mencapai 94%. 

Saya tidak akan membahas bagaimana proses stemming karena sudah banyak artikel atau blog yang sudah memaparkannya plus memberikan source code PHP seperti disini. Yang sering jadi pertanyaan, bagaimana agar dapat melakukan stemming untuk banyak kata?? Kenapa source stemmingnya hanya satu kata sih??

Mari kita bahas.

1. Pastikan anda sudah men-download source code DISINI kemudian ekstrak. Pastikan isinya seperti dibawah ini 


2. Masukan ke dalam htdocs untuk yang menggunakan XAMPP seperti saya.

3. Untuk DB silahkan buat baru dengan tabel kamus kata dasar yang banyak tersedia online. Untuk koneksi.php silahkan disesuaikan dengan mysql yang dimiliki.

3. Jalankan XAMPP, WAMP, atau APPSERVER anda. Buka browser dan ketik localhost/stemmer indo dan hasilnya seperti dibawah ini

4. Silahkan masukan beberapa kata  dan liat hasilnya. Lakukan modifikasi sesuai keinginan.

Sebenarnya, source code lain juga dapat dimodif pada bagian indek.php, cukup menambahkan pemecahan teks menjadi kata, kemudian penghapusan token, kemudian di cek ke kamus, Gampang bukan??

SELAMAT MENCOBA, SELAMAT BELAJAR
First

5 comments

Write comments
Anonymous
AUTHOR
6 September 2015 at 14:44 delete

Terima kasih banyak, sangat membantu sekali. Semoga amalan Anda ini mendapat pahala yang besar... amin.

Reply
avatar
tian
AUTHOR
29 January 2016 at 14:16 delete

mas itu source code nya stemming apa ya ? nazief atau jelita asian ?

Reply
avatar
Unknown
AUTHOR
10 March 2016 at 06:07 delete

Itu masih pakai Nazief. Untuk beberapa penyempurnaan berdasarkan jelita asian bisa dilihat di https://github.com/sastrawi/sastrawi

Reply
avatar
coba-coba
AUTHOR
31 July 2016 at 18:19 delete

terima kasih banyaaakakkkkkk

Reply
avatar
Unknown
AUTHOR
20 March 2017 at 15:02 delete

Mas kalau stemming dengan inputan kata dasar dan output kata imbuhan bagaimana ya mas? Terima kasih atas jawabannya

Reply
avatar

Translate This Site