Hasil (
Bahasa Indonesia) 1:
[Salinan]Disalin!
Sistem konversi. Melacak evolusi pemrosesan dalam setiap perusahaan order. Perusahaan harus sudah mulai dengan urutan berorientasi file sistem entri di awal 1970-an; perintah masuk ke flat file atau diindeks file. Tidak ada banyak saham verifikasi atau verifikasi kredit pelanggan selama entri dari urutan. Laporan dan hard-copy printout digunakan untuk melanjutkan proses mengeksekusi atau-ders. Kemudian sistem ini harus telah dikonversi menjadi sistem masuk pesanan dengan file VSAM dan IBM CICS sebagai monitor pengolahan online. Con-versi berikutnya pasti ke sistem data berhierarki. Mungkin itu adalah dimana sistem pemrosesan order Anda masih tetap — sebagai aplikasi warisan. Berbunga-beliau banyak telah pindah sistem maju untuk aplikasi database relasional. Dalam setiap kasus, apa yang terjadi pada data pesanan melalui semua konversi ini? Sistem konversi dan migrasi adalah terkemuka alasan untuk data polusi. Cobalah untuk konversi melewati oleh masing-masing sistem sumber Anda di bawah berdiri. Data penuaan. Kami sudah berurusan dengan data penuaan ketika kami meninjau bagaimana selama bertahun-tahun nilai di bidang kode produk bisa rusak. Nilai remaja kehilangan arti dan makna mereka. Jika Anda source sistem adalah sistem warisan lama, memberikan perhatian khusus terhadap kemungkinan umur data dalam sistem itu. Integrasi sistem heterogen. Semakin heterogen dan berbeda sistem sumber Anda, yang lebih kuat adalah kemungkinan data rusak. Seperti sce-nario, data inkonsistensi adalah masalah umum. Mempertimbangkan sumber-sumber untuk setiap tabel dimensi Anda dan tabel fakta. Jika sumber untuk satu meja beberapa sistem het-erogeneous, berhati-hati tentang kualitas data yang masuk ke gudang data dari sistem ini. Desain miskin database. Desain database yang baik berdasarkan prinsip-prinsip suara mengurangi pengenalan kesalahan. Kalangan menyediakan untuk mengedit bidang. RDBMSs memungkinkan verifica-tion dari kesesuaian untuk aturan bisnis melalui memicu dan prosedur yang tersimpan. Mengikuti entitas integritas dan aturan-aturan integritas referensial mencegah beberapa jenis data polusi. Informasi lengkap di entri data. Pada saat entri data awal tentang entitas, jika semua informasi ini tidak tersedia, dua jenis data polusi biasanya oc skr. Pertama, beberapa bidang masukan belum selesai pada saat data awal masuk. Hasil yang hilang nilai-nilai. Kedua, jika data tidak tersedia wajib pada saat entri data awal, maka orang yang memasukkan data yang mencoba untuk memaksa val-ues generik ke bidang yang wajib. Memasuki N/A untuk tidak tersedia di lapangan untuk kota adalah contoh dari jenis data polusi. Demikian pula, masuknya semua sembilan di bidang nomor jaminan sosial adalah data polusi. Input error. Di masa lalu ketika data entri Panitera memasukkan data ke komputer sys-tems, ada langkah kedua dari verifikasi data. Setelah data entri petugas selesai kumpulan, entri dari batch yang diverifikasi secara independen oleh orang lain. Sekarang, pengguna yang juga bertanggung jawab untuk proses bisnis memasukkan data. Entri data bukanlah pekerjaan utama mereka. Akurasi data seharusnya dipastikan dengan pandangan verifikasi dan data suntingan ditanam pada layar input. Keliru entri data adalah sumber utama data korupsi. Internasionalisasi/lokalisasi. Karena perubahan kondisi bisnis, struktur bisnis akan diperluas ke arena internasional. Perusahaan bergerak ke lebih luas wilayah geografis dan budaya baru. Sebagai sebuah perusahaan adalah erasanalized, apa yang terjadi pada data dalam sistem sumber? Elemen data yang sudah ada harus beradaptasi dengan nilai-nilai yang baru dan berbeda. Demikian pula, ketika sebuah perusahaan ingin mem - matematika pada area yang lebih kecil dan pelokalan operasinya, beberapa nilai untuk elemen data mendapatkan dibuang. Perubahan ini dalam struktur perusahaan dan kandungan revi dihasilkan dalam sistem sumber adalah sumber data pencemaran. Penipuan. Jangan terkejut untuk mengetahui bahwa usaha-usaha yang disengaja untuk memasukkan data yang salah tidak biasa. Di sini, data yang salah adalah benar-benar falsifications untuk melakukan penipuan. Melihat keluar untuk bidang moneter dan ladang yang mengandung unit produk. Pastikan bahwa sistem sumber yang sudah diperkuat dengan ketat suntingan untuk bidang tersebut. Kurangnya kebijakan. Dalam usaha apa pun, kualitas data tidak hanya terwujud dengan sendirinya. Pra-vention entri korup data dan pelestarian kualitas data dalam sumber sys-tems adalah kegiatan yang disengaja. Perusahaan tanpa eksplisit kebijakan kualitas data tidak dapat diharapkan untuk memiliki tingkat kualitas data yang memadai.Validation of Names and Addresses Almost every company suffers from the problem of duplication of names and addresses. For a single person, multiple records can exist among the various source systems. Even within a single source system, multiple records can exist for one person. But in the data warehouse, you need to consolidate all the activities of each person from the various du- plicate records that exist for that person in the multiple source systems. This type of prob- lem occurs whenever you deal with people, whether they are customers, employees, physicians, or suppliers. Take the specific example of an auction company. Consider the different types of cus- tomers and the different purposes for which the customers seek the services of the auction company. Customers bring property items for sale, buy at auctions, subscribe to the cata- logs for the various categories of auctions, and bring articles to be appraised by experts for insurance purposes and for estate dissolution. It is likely that there are different legacy systems at an auction house to service the customers in these different areas. One cus- tomer may come for all of these services and a record gets created for the customer in each of the different systems. A customer usually comes for the same service many times. On some of these occasions, it is likely that duplicate records are created for the same cus- tomer in one system. Entry of customer data happens at different points of contact of the customer with the auction company. If it is an international auction company, entry of cus- tomer data happens at many auction sites worldwide. Can you imagine the possibility for duplication of customer records and the extent of this form of data corruption? Name and address data is captured in two ways (see Figure 13-3). If the data entry is in the multiple field format, then it is easier to check for duplicates at the time of data entry. Here are a few inherent problems with entering names and addresses: Tidak ada kunci yang unik, banyak nama pada satu baris satu nama pada dua baris nama dan alamat dalam satu jalur pribadi dan perusahaan nama campuran alamat yang berbeda untuk nama orang yang sama berbeda dan ejaan untuk pelanggan sama
Sedang diterjemahkan, harap tunggu..
