Mereka akan lari dari gudang data berbondong-bondong dan semua upaya dari
tim proyek akan sia-sia. Ini akan menjadi mustahil untuk mendapatkan kembali kepercayaan dari pengguna. Sebagian besar perusahaan melebih-lebihkan kualitas data dalam sistem operasional mereka. Sangat sedikit memiliki prosedur dan sistem untuk memverifikasi kualitas data di berbagai sistem erational op- mereka. Selama kualitas data yang cukup dapat diterima untuk melakukan fungsi sistem operasional, maka kesimpulan umumnya adalah bahwa semua data hadiah masukkan-baik. Untuk beberapa perusahaan membangun gudang data, kualitas data tidak prioritas yang lebih tinggi. Perusahaan-perusahaan ini menduga bahwa mungkin ada masalah, tetapi itu tidak begitu mendesak untuk menuntut perhatian segera. Hanya ketika perusahaan melakukan upaya untuk memastikan kualitas data mereka mereka kagum pada tingkat korupsi data. Bahkan ketika perusahaan menemukan tingkat tinggi polusi data, mereka cenderung meremehkan usaha yang diperlukan untuk membersihkan data. Mereka tidak mengalokasikan waktu yang cukup dan sumber daya untuk upaya bersih-bersih. Paling-paling, masalah tersebut tidak ditangani secara parsial. Jika perusahaan Anda memiliki beberapa sistem warisan yang berbeda dari yang rumah data Anda gudang harus menarik data, mulai dengan asumsi bahwa sumber data Anda mungkin akan korup. Kemudian mengetahui tingkat korupsi data. Tim proyek harus memberikan waktu yang cukup dan usaha dan memiliki rencana untuk mengoreksi data tercemar. Dalam bab ini, kita akan mendefinisikan kualitas data dalam konteks data warehouse. Kami akan mempertimbangkan jenis mon com- masalah kualitas data sehingga ketika Anda menganalisis sumber data Anda, Anda dapat mengidentifikasi jenis dan berurusan dengan mereka. Kami akan mengeksplorasi metode untuk pembersihan data dan juga meninjau fitur dari alat yang tersedia untuk membantu tim proyek di dertaking un- penting ini.
Sedang diterjemahkan, harap tunggu..
