(dilambangkan dengan kolom vektor w) untuk setiap neuron. Memenangkan neuron j (x) adalah neuron yang memiliki korelasi tertinggi dengan input x, yaitu, itu adalah neuron yang w (j) T x adalah yang terbesar, yaitu,
j (x) argmaxw Tx (j)
= j (1)
Namun, penggunaan korelasi tertinggi atau kriteria yang cocok jarak minimum menyiratkan bahwa (a) fitur dari domain input bola, yaitu, penyimpangan adalah sama dalam semua dimensi dan (b) jarak antara fitur harus lebih besar dari jarak antara titik di fitur. Kedua implikasi dari data dapat diringkas dalam persamaan di bawah ini
& m, n% D, m $ n, λ m ("I) # λ n (" I) (2)
& x, y% I, XTY jika ( j (x) = j (y))> XT y jika (j (x) $ j (y)) (3)
Dalam persamaan di atas, "aku Operator mewakili kovarians matriks data yang saya, EM th
m eigenvalue,
D adalah dimensi input domain, x dan y adalah vektor data yang sewenang-wenang.
Untuk set sewenang-wenang data untuk memenuhi kondisi ini adalah kesulitan besar, terutama dalam kasus di mana distribusi seperti data sulit untuk memvisualisasikan dan mendeteksi karena dengan dimensi tinggi dari masalah. Bahkan ketika distribusi data yang terdeteksi melalui visualisasi, ketika kondisi yang dijelaskan dalam persamaan 2 dan 3 tidak puas, tidak ada jaminan bahwa penggunaan SOM akan memecahkan masalah.
Pertimbangkan, misalnya, pengaturan dari dua kelompok data dalam dua dimensi seperti yang ditunjukkan pada Gambar 1. Tabel 1 merangkum sifat-sifat dataset ini dalam hal kemampuan mereka untuk memenuhi persamaan 2 dan 3. Karena sifat dari data tidak ada jaminan bahwa SOM akan dapat mengelompok dengan benar set data selain data A.
Sedang diterjemahkan, harap tunggu..
