Di satu sisi, kita dapat melihat pengelompokan rekursif sebagai situasi di mana seorang anak belajar untuk membedakan antara dua set foto, yang diambil di hutan dan lain di padang pasir. Ada juga foto-foto di set yang menunjukkan derajat yang berbeda dari kombinasi hutan / padang pasir. Satu akan ingin mengelompokkan mereka sesuai dengan persentase ke hutan di dalamnya. Namun, bukan membedakan foto sekaligus, akan lebih masuk akal untuk pertama membedakan antara semua hutan dan semua foto gurun. Tingkat berikutnya akan membedakan antara hutan-dominan dan foto gurun-dominan. Foto-foto hutan dominan kemudian akan dikaitkan dengan foto-foto hutan dan padang pasir yang-dominan dengan foto-foto gurun dan sebagainya. Pendekatan, tidak seperti pengelompokan ensemble, tidak perlu menjalankan beberapa algoritma clustering dan menemukan konsensus di antara mereka, seperti pengelompokan dilakukan antara 2 subset data pada satu waktu. Ini diharapkan dapat menghemat waktu pelatihan.
Selain itu, kami berhipotesis bahwa hanya dua algoritma pengelompokan (satu global dan satu lokal di alam) yang diperlukan, yang bertentangan dengan banyak algoritma yang dibutuhkan oleh metode ensemble.
Definisi formal dari masalah pengelompokan rekursif dan kombinasi pola diberikan di bagian 2. Bagian 3 menyajikan algoritma belajar Recursive Unsupervised. Hasil eksperimen di bagian 4 dengan data baik sintetis dan nyata menggambarkan kekokohan metode yang diusulkan sebagai lawan clusterings individu yang dihasilkan oleh algoritma terkenal dan dibandingkan dengan metode pengelompokan ensemble.
II. MASALAH FORMULASI
Let X = {x1, x2, ... xn} menjadi representasi dari pola n. xi dapat didefinisikan, misalnya, lebih dari beberapa d dimensi
ruang fitur, d
xi% R. Sebuah algoritma clustering mengambil X sebagai masukan dan mengatur pola n ke dalam k cluster, menurut beberapa kesamaan ukuran antara pola, membentuk partisi data P. algoritma pengelompokan yang berbeda akan, secara umum, menghasilkan partisi yang berbeda untuk dataset yang sama. Hasil pengelompokan yang berbeda juga dapat diproduksi oleh yang sama algoritma clustering dengan menggunakan nilai parameter algoritmik yang berbeda atau inisialisasi berbeda.
Pertimbangkan X yang dibagi menjadi subset menggunakan N recursions algoritma clustering dan membiarkan P mewakili ansambel N subset. Oleh karena itu P disebut pengelompokan ensemble
Sedang diterjemahkan, harap tunggu..
