Konversi sistem. Melacak evolusi pemrosesan order di setiap perusahaan. Perusahaan harus sudah mulai dengan sistem order entry-berkas berorientasi pada awal tahun 1970; perintah dimasukkan ke flat file atau file indeks. Tidak ada banyak verifikasi saham atau verifikasi kredit pelanggan selama masuknya pesanan. Laporan dan hard copy cetakan digunakan untuk melanjutkan proses mengeksekusi ders atau-. Maka sistem ini harus telah diubah menjadi sistem entry order online dengan file VSAM dan IBM CICS sebagai monitor pengolahan online. Versi con berikutnya pasti ke sistem database hirarkis. Mungkin itu adalah di mana sistem pemrosesan order Anda masih tetap-sebagai aplikasi warisan. Banyak perusahaan--perusahaan telah pindah sistem ke depan untuk aplikasi database relasional. Dalam kasus apapun, apa yang telah terjadi dengan data pesanan melalui semua konversi ini? Konversi sistem dan migrasi alasan utama untuk polusi data. Cobalah untuk memahami berdiri konversi ditempuh oleh masing-masing sistem sumber Anda. Penuaan data. Kami telah berurusan dengan data penuaan ketika kita Ulasan bagaimana selama bertahun-tahun nilai-nilai di bidang kode produk bisa membusuk. Nilai-nilai yang lebih tua kehilangan makna dan signifikansi mereka. Jika banyak dari sistem sumber Anda adalah sistem warisan lama, memberikan perhatian khusus terhadap kemungkinan data yang berusia di sistem tersebut. Integrasi sistem heterogen. Semakin heterogen dan berbeda sistem sumber Anda, semakin kuat kemungkinan data rusak. Dalam skenario yang pesimis seperti sce-, inkonsistensi data adalah masalah umum. Mempertimbangkan sumber untuk setiap tabel dimensi dan tabel fakta. Jika sumber-sumber untuk satu meja beberapa sistem heterogen, berhati-hati tentang kualitas data yang masuk ke dalam gudang data dari sistem ini. Desain database miskin. Desain database yang baik berdasarkan prinsip-prinsip suara mengurangi pengenalan kesalahan. DBMS menyediakan untuk mengedit lapangan. RDBMSs memungkinkan verifikasi kesesuaian untuk aturan bisnis melalui pemicu dan prosedur yang tersimpan. Mengikuti integritas entitas dan aturan integritas referensial mencegah beberapa jenis pencemaran data. Informasi yang tidak lengkap di entri data. Pada saat entri data awal tentang suatu entitas, jika semua informasi tidak tersedia, dua jenis polusi data yang biasanya skr kadang-. Pertama, beberapa field input tidak diselesaikan pada saat entri data awal. Hasilnya hilang nilai-nilai. Kedua, jika data tidak tersedia adalah wajib pada saat entri data awal, maka orang memasukkan data mencoba untuk memaksa nilai-generik-nilai ke dalam bidang wajib. Memasuki N / A untuk tidak tersedia di lapangan untuk kota adalah contoh dari jenis polusi data. Demikian pula, masuknya semua sembilan di bidang nomor Jaminan Sosial adalah polusi data. Kesalahan input. Di masa lalu ketika entri data panitera memasukkan data ke dalam komputer sistemik tems, ada langkah kedua verifikasi data. Setelah petugas entri data selesai batch, entri dari batch yang diverifikasi secara independen oleh orang lain. Sekarang, pengguna yang juga bertanggung jawab atas proses bisnis memasukkan data. Entri data tidak panggilan utama mereka. Akurasi data seharusnya dijamin oleh pemandangan verifikasi dan suntingan data yang ditanam di layar input. Entri data yang salah merupakan sumber utama korupsi data. Internasionalisasi / lokalisasi. Karena perubahan kondisi bisnis, struktur bisnis akan diperluas ke arena internasional. Perusahaan bergerak ke wilayah geografis yang lebih luas dan budaya yang lebih baru. Sebagai perusahaan yang interna-
alized, apa yang terjadi pada data dalam sistem sumber? Unsur-unsur data yang ada harus beradaptasi dengan nilai-nilai yang lebih baru dan berbeda. Demikian pula, ketika sebuah perusahaan ingin con- centrate pada area yang lebih kecil dan melokalisasi operasi, beberapa nilai untuk elemen data bisa dibuang. Perubahan dalam struktur perusahaan dan keputusan-revi- yang dihasilkan dalam sistem sumber merupakan sumber polusi data. Penipuan. Jangan terkejut mengetahui bahwa upaya sengaja untuk memasukkan data yang salah yang tidak biasa. Di sini, entri data yang salah sebenarnya pemalsuan untuk melakukan penipuan. Melihat keluar untuk bidang moneter dan bidang yang mengandung unit produk. Pastikan bahwa sistem sumber yang diperkaya dengan suntingan ketat untuk bidang tersebut. Kurangnya kebijakan. Dalam setiap perusahaan, kualitas data tidak hanya terwujud dengan sendirinya. Pencegahan yang masuk data korup dan pelestarian kualitas data dalam sumber sistemik tems adalah kegiatan yang disengaja. Suatu perusahaan tanpa kebijakan yang eksplisit pada kualitas data tidak dapat diharapkan untuk memiliki tingkat yang memadai dari kualitas data.
Validasi Nama dan Alamat Hampir setiap perusahaan menderita masalah duplikasi nama dan alamat. Untuk satu orang, beberapa catatan bisa eksis di antara berbagai sistem sumber. Bahkan dalam sistem sumber tunggal, beberapa catatan bisa eksis untuk satu orang. Namun dalam data warehouse, Anda perlu untuk mengkonsolidasikan semua kegiatan masing-masing orang dari berbagai catatan plicate du- yang ada untuk orang yang di beberapa sistem sumber. Jenis lem-masalah terjadi setiap kali Anda berhubungan dengan orang, apakah mereka adalah pelanggan, karyawan, dokter, atau pemasok. Ambil contoh spesifik perusahaan lelang. Pertimbangkan jenis cus- tomers dan berbeda tujuan yang pelanggan mencari jasa perusahaan lelang. Pelanggan membawa barang-barang properti untuk dijual, membeli di lelang, berlangganan log cata- untuk berbagai kategori lelang, dan membawa artikel yang akan dinilai oleh para ahli untuk tujuan asuransi dan untuk pembubaran real. Sangat mungkin bahwa ada sistem warisan yang berbeda pada rumah lelang untuk melayani pelanggan di daerah-daerah yang berbeda. Satu Tomer cus- mungkin datang untuk semua layanan ini dan rekor akan dibuat untuk pelanggan di masing-masing sistem yang berbeda. Pelanggan biasanya datang untuk layanan yang sama berkali-kali. Pada beberapa kesempatan, ada kemungkinan bahwa catatan duplikat dibuat untuk Tomer cus- yang sama dalam satu sistem. Entri data pelanggan yang terjadi di berbagai titik kontak dari pelanggan dengan perusahaan lelang. Jika ia adalah sebuah perusahaan lelang internasional, entri data Tomer cus- terjadi di situs lelang banyak di seluruh dunia. Dapatkah Anda bayangkan kemungkinan untuk duplikasi data pelanggan dan luasnya bentuk data korupsi? Nama dan alamat data yang ditangkap dalam dua cara (lihat Gambar 13-3). Jika entri data dalam format beberapa bidang, maka lebih mudah untuk memeriksa duplikat pada saat entri data. Berikut adalah masalah beberapa melekat dengan memasukkan nama dan alamat:
Tidak ada yang unik kunci Banyak nama pada satu baris Satu nama pada dua garis Nama dan alamat dalam satu baris Pribadi dan nama perusahaan dicampur alamat yang berbeda untuk orang nama yang berbeda sama dan ejaan untuk pelanggan yang sama
Sedang diterjemahkan, harap tunggu..
