K-means adalah algoritma clustering untuk cluster dokumen
koleksi. K-berarti upaya untuk mengklasifikasikan dokumen
ke k-klaster [10]. K-berarti secara acak akan memilih K
dokumen sebagai pusat massa. Kemudian menghitung jarak kesamaan
antara setiap dokumen dan pusat massa. Dokumen
yang memiliki jarak yang lebih tinggi akan ditempatkan di sama
klaster. Centroid baru akan ditentukan ketika semua data
telah ditempatkan di cluster terdekat. Proses
penentuan massa dan penempatan data di dalam
cluster diulang sampai centroid berkumpul. Tabel
I menunjukkan pseudocode dari K-berarti algoritma [11].
Kesamaan cosinus dari dua dokumen didefinisikan menggunakan
Sedang diterjemahkan, harap tunggu..
