In other contexts, where 0 and 1 carry equivalent information (symmetr terjemahan - In other contexts, where 0 and 1 carry equivalent information (symmetr Bahasa Indonesia Bagaimana mengatakan

In other contexts, where 0 and 1 ca

In other contexts, where 0 and 1 carry equivalent information (symmetry), the SMC is a better measure of similarity. For example, vectors of demographic variables stored in dummies variables, such as gender, would be better compared with the SMC than with the Jaccard index since the impact of gender on similarity should be equal, independent of whether male is defined as a 0 and female as a 1 or the other way around. However, when we have symmetric dummy variables, one could replicate the behaviour of the SMC by splitting the dummies into two binary attributes (in this case, male and female), thus transforming them into asymmetric attributes, allowing the use of the Jaccard index without introducing the bias. By using this trick, the Jaccard index can be considered as making the SMC a fully redundant metric. The SMC remains however more computationally efficient in the case of symmetric dummy variables since it doesn't require adding extra dimensions.

In general, the Jaccard index can be considered as an indicator of local "similarity" while SMC evaluates "similarity" relative to the whole "universe". Similarity and dissimilarity must be understood in a relative sense. For example, if there are only 2 attributes (x,y), then A=(1,0) is intuitively very different from B=(0,1). However if there are 10 attributes in the "universe", A=(1,0,0,0,0,0,0,0,0,0) and B=(0,1,0,0,0,0,0,0,0) are not intuitively so different anymore. If the focus comes back to be just on A and B, the remaining 8 attributes are often considered as redundant. As a result, A and B are very different in a "local" sense (which the Jaccard Index measures efficiently), but less different in a "global" sense (which the SMC measures efficiently). From this point of view, the choice of using SMC or the Jaccard index comes down to more than just symmetry and asymmetry of information in the attributes. The distribution of sets in the defined "universe" and the nature of the problem to be modeled should also be considered.

The Jaccard index is also more general than the SMC and can be used to compare other data types than just vectors of binary attributes, such as Probability measures.
0/5000
Dari: -
Ke: -
Hasil (Bahasa Indonesia) 1: [Salinan]
Disalin!
Dalam konteks lain, dimana 0 dan 1 membawa setara informasi (simetri), SMC adalah ukuran lebih baik kesamaan. Sebagai contoh, vektor dari variabel-variabel demografik disimpan dalam variabel dummies, seperti jenis kelamin, akan lebih baik dibandingkan dengan SMC daripada dengan Jaccard indeks karena dampak gender pada kesamaan harus menjadi sama, independen dari Apakah laki-laki didefinisikan sebagai 0 dan laki-laki sebagai 1 atau sebaliknya. Namun, ketika kita memiliki variabel dummy simetris, salah satu bisa meniru perilaku SMC oleh membelah boneka ke dua sifat-sifat biner (dalam kasus ini, laki-laki dan perempuan), dengan demikian mengubah mereka menjadi atribut asimetris, memungkinkan penggunaan indeks Jaccard tanpa memperkenalkan bias. Dengan menggunakan trik ini, indeks Jaccard dapat dianggap sebagai membuat SMC metrik sepenuhnya berlebihan. SMC tetap namun lebih produk efisien dalam hal simetris dummy variabel karena tidak memerlukan menambahkan dimensi ekstra.Secara umum, indeks Jaccard dapat dianggap sebagai indikator lokal "kesamaan" sementara SMC mengevaluasi "kesamaan" relatif terhadap seluruh "alam semesta". Persamaan dan ketidaksamaan harus dipahami dalam pengertian relatif. Misalnya, jika hanya ada 2 atribut (x, y), maka A=(1,0) adalah intuitif sangat berbeda dari B=(0,1). Namun jika ada 10 atribut "alam semesta", A=(1,0,0,0,0,0,0,0,0,0) dan B=(0,1,0,0,0,0,0,0,0) yang tidak secara intuitif begitu berbeda lagi. Jika fokus kembali menjadi hanya di A dan B, atribut 8 sisa sering dianggap sebagai berlebihan. Sebagai akibatnya, A dan B adalah sangat berbeda dalam arti "lokal" (yang indeks Jaccard mengukur efisien), tapi kurang berbeda dalam arti "global" (yang SMC mengukur efisien). Dari ini sudut pandang, pilihan menggunakan SMC atau indeks Jaccard datang ke lebih dari sekedar simetri dan asimetri informasi dalam atribut. Distribusi set didefinisikan "alam semesta" dan sifat dari masalah yang akan dibuat modelnya juga harus dipertimbangkan.Indeks Jaccard juga lebih umum daripada SMC dan dapat digunakan untuk membandingkan data jenis lain daripada hanya vektor biner atribut, seperti langkah-langkah probabilitas.
Sedang diterjemahkan, harap tunggu..
 
Bahasa lainnya
Dukungan alat penerjemahan: Afrikans, Albania, Amhara, Arab, Armenia, Azerbaijan, Bahasa Indonesia, Basque, Belanda, Belarussia, Bengali, Bosnia, Bulgaria, Burma, Cebuano, Ceko, Chichewa, China, Cina Tradisional, Denmark, Deteksi bahasa, Esperanto, Estonia, Farsi, Finlandia, Frisia, Gaelig, Gaelik Skotlandia, Galisia, Georgia, Gujarati, Hausa, Hawaii, Hindi, Hmong, Ibrani, Igbo, Inggris, Islan, Italia, Jawa, Jepang, Jerman, Kannada, Katala, Kazak, Khmer, Kinyarwanda, Kirghiz, Klingon, Korea, Korsika, Kreol Haiti, Kroat, Kurdi, Laos, Latin, Latvia, Lituania, Luksemburg, Magyar, Makedonia, Malagasi, Malayalam, Malta, Maori, Marathi, Melayu, Mongol, Nepal, Norsk, Odia (Oriya), Pashto, Polandia, Portugis, Prancis, Punjabi, Rumania, Rusia, Samoa, Serb, Sesotho, Shona, Sindhi, Sinhala, Slovakia, Slovenia, Somali, Spanyol, Sunda, Swahili, Swensk, Tagalog, Tajik, Tamil, Tatar, Telugu, Thai, Turki, Turkmen, Ukraina, Urdu, Uyghur, Uzbek, Vietnam, Wales, Xhosa, Yiddi, Yoruba, Yunani, Zulu, Bahasa terjemahan.

Copyright ©2025 I Love Translation. All reserved.

E-mail: