Nilai-nilai yang salah. Kode Produk: 146, Nama Produk: Crystal Vase, dan Tinggi: 486 inci di titik rekor yang sama untuk beberapa jenis data ketidaktepatan. Nilai-nilai untuk nama produk dan tinggi tidak kompatibel. Mungkin kode produk juga di- benar. Bidang serbaguna. Nilai data yang sama dalam bidang dimasukkan oleh departemen yang berbeda dapat berarti hal yang berbeda. Bidang A bisa memulai sebagai kode area penyimpanan untuk menunjukkan tempat penyimpanan backroom di toko-toko. Kemudian, ketika perusahaan membangun gudang sendiri untuk menyimpan produk, dulu bidang yang sama untuk menunjukkan gudang. Jenis masalah diabadikan karena kode toko dan kode gudang yang berada di bidang yang sama. Kode Gudang masuk ke bidang yang sama dengan mendefinisikan kembali bidang kode toko. Jenis polusi data yang sulit untuk memperbaiki. Integrasi salah. Dalam sebuah perusahaan lelang, pembeli adalah pelanggan yang menawar di pelelangan dan membeli barang-barang yang dilelang. Penjual adalah pelanggan yang menjual barang-barang mereka melalui perusahaan lelang. Pelanggan yang sama mungkin pembeli dalam sistem lelang dan penjual dalam sistem pembuatan tanda terima properti. Asumsikan bahwa Tomer cus- nomor 12345 dalam sistem lelang adalah pelanggan yang sama yang jumlahnya 34.567 dalam sistem pembuatan tanda terima properti. Data untuk nomor pelanggan 12345 dalam sistem lelang harus terintegrasi dengan data untuk nomor pelanggan 34.567 dalam sistem pembuatan tanda terima properti. Sisi sebaliknya dari masalah integrasi data adalah ini: nomor pelanggan 55.555 dalam sistem lelang dan pelanggan nomor 55555 dalam sistem pembuatan tanda terima properti tidak pelanggan yang sama namun berbeda. Masalah-masalah ini tegration di- muncul karena, biasanya, setiap sistem warisan telah dikembangkan dalam isolasi pada waktu yang berbeda di masa lalu.
KUALITAS DATA TANTANGAN
Ada aspek menarik tetapi aneh inisiatif seluruh pembersihan data untuk data warehouse. Kami berusaha ke arah memiliki data bersih di gudang data. Kami ingin memastikan sejauh mana polusi. Berdasarkan kondisi data, kami berencana Data kegiatan pembersihan. Apa yang aneh tentang seluruh rangkaian ini keadaan adalah bahwa lution pol- data terjadi di luar gudang data. Sebagai bagian dari tim proyek data warehouse, Anda mengambil langkah-langkah untuk menghilangkan korupsi yang muncul di tempat yang di luar kendali Anda. Semua data warehouse perlu data historis. Sebagian besar dari data historis berasal dari sistem warisan kuno. Sering, pengguna akhir menggunakan data historis dalam gudang data untuk pengambilan keputusan strategis tanpa tahu persis apa data yang benar-benar berarti. Dalam kebanyakan kasus, metadata rinci hampir tidak ada untuk sistem warisan lama. Anda diharapkan untuk memperbaiki masalah pencemaran data yang berasal dari sistem operasional lama tanpa bantuan dari informasi yang memadai tentang data di sana.
Sumber Polusi Data Dalam rangka untuk datang dengan strategi yang baik untuk membersihkan data, maka akan bermanfaat untuk meninjau daftar sumber umum pencemaran data. Mengapa data rusak dalam sistem sumber? Mempelajari daftar berikut sumber pencemaran data terhadap latar belakang dari apa kualitas data sebenarnya.
Sedang diterjemahkan, harap tunggu..