Ini hanya klarifikasi perbedaan antara akurasi data dan kualitas data. Tapi bagaimana bisa Anda secara khusus menentukan kualitas data? Dapatkah Anda tahu secara intuitif apakah elemen data berkualitas tinggi atau tidak dengan memeriksa itu? Jika demikian, apa jenis pemeriksaan yang Anda melakukan, dan bagaimana Anda memeriksa data? Sebagai profesional TI, pernah bekerja dengan data dalam beberapa kapasitas, kita memiliki rasa apa data yang dan bagaimana untuk mengatakan apakah suatu elemen data adalah kualitas data yang tinggi atau tidak. Tapi konsep yang samar-samar kualitas data tidak me- madai untuk menangani data korupsi secara efektif. Jadi mari kita masuk ke beberapa cara konkret mengakui kualitas data dalam data warehouse. Daftar berikut adalah survei dari karakteristik atau indikator data berkualitas tinggi. Kami akan mulai dengan akurasi data, seperti yang dibahas sebelumnya. Mempelajari masing-masing mensions di- kualitas data dan menggunakan daftar untuk mengenali dan mengukur kualitas data dalam sistem yang memberi makan data warehouse Anda.
Akurasi. Nilai yang disimpan dalam sistem untuk elemen data adalah nilai yang tepat untuk itu terjadinya elemen data. Jika Anda memiliki nama pelanggan dan alamat disimpan dalam catatan, maka alamat adalah alamat yang benar untuk pelanggan dengan nama itu. Jika Anda menemukan jumlah memerintahkan 1000 unit dalam catatan untuk pesanan nomor 12345678, maka kuantitas yang kuantitas akurat untuk urutan itu. Domain Integritas. Nilai data atribut jatuh di kisaran yang diijinkan, de- nilai didenda. Contoh umum adalah nilai-nilai yang diijinkan menjadi "laki-laki" dan "laki-laki femali" untuk elemen data gender. Data Type.Value untuk atribut data yang sebenarnya disimpan sebagai tipe data yang ditetapkan untuk atribut itu. Ketika tipe data kolom nama toko didefinisikan sebagai "teks," semua sikap di- lapangan yang berisi nama toko ditampilkan dalam format tekstual dan tidak kode ic numer-. Konsistensi. Bentuk dan isi dari data lapangan adalah di beberapa sistem sumber yang sama. Jika kode produk untuk produk ABC dalam satu sistem adalah 1234, maka kode untuk produk ini harus 1.234 dalam setiap sistem sumber. Redundancy.The data yang sama tidak boleh disimpan di lebih dari satu tempat dalam suatu sistem. Jika, untuk alasan efisiensi, elemen data yang sengaja disimpan di lebih dari satu tempat dalam suatu sistem, maka redundansi harus diidentifikasi secara jelas. Completeness.There ada nilai-nilai yang hilang untuk atribut yang diberikan dalam sistem. Contohnya, dalam sebuah file pelanggan, ada nilai yang valid untuk "negara" lapangan. Dalam file untuk detail pesanan, setiap catatan rinci untuk pesanan terisi penuh. Duplikasi. Duplikasi catatan dalam sistem benar-benar diselesaikan. Jika file produk dikenal memiliki duplikat catatan, maka semua catatan duplikat untuk setiap komoditasnya diidentifikasi dan-referensi silang dibuat. Kesesuaian dengan Aturan Bisnis. Nilai-nilai masing-masing item data mematuhi aturan bisnis ditentukan. Dalam sistem lelang, palu atau penjualan harga tidak bisa kurang dari harga cadangan. Dalam sistem pinjaman bank, saldo pinjaman harus selalu positif atau nol. Definiteness struktural. Dimanapun item data secara alami dapat disusun menjadi komponen individual, item harus berisi struktur ini didefinisikan dengan baik. Sebagai contoh, nama individu secara alami terbagi menjadi nama pertama, awal tengah, dan nama terakhir. Nilai untuk nama individu harus disimpan sebagai nama pertama, awal tengah, dan nama terakhir. Ini karakteristik kualitas data menyederhanakan penegakan standar dan duces kembali nilai-nilai yang hilang.
Sedang diterjemahkan, harap tunggu..
