Ekstraksi Data, Pembersihan, dan Transformasi Alat Outline Pendahuluan Alat Persyaratan Kriteria Seleksi Alat Penjual Pendekatan Akses ke Legacy data vendor Solusi Mesin Transformasi Pendahuluan Data Extraction, Cleanup, dan Transformasi: adalah komponen kunci dari arsitektur data warehouse. membutuhkan banyak waktu dalam membangun sebuah gudang data. membutuhkan satu set alat yang mendukung proses. alat tersebut merupakan faktor penentu keberhasilan untuk setiap proyek data warehouse. Alat Persyaratan (1) transformasi data dari satu format yang lain DBF ke SQL Server, Paradox ke Oracle, dll transformasi data dan perhitungan berdasarkan pada penerapan aturan bisnis yang memaksa transformasi tertentu. Lahir tanggal usia, jenis kelamin kode numerik untuk pria / wanita, dll Alat Persyaratan (2) data Konsolidasi dan Integrasi Menggabungkan beberapa catatan sumber ke tunggal record Metadata sinkronisasi dan manajemen Menyimpan dan / atau memperbarui definisi metadata tentang sumber data, transformasi, format, dll Seluruh proses Data sourcing dikendalikan oleh dan didokumentasikan dalam repositori metadata Kriteria Selection Tool (1) Kemampuan untuk mengidentifikasi sumber data. Dukungan untuk flat file, file indeks, dan DBMSs warisan. Kemampuan untuk menggabungkan data dari beberapa toko data. Spesifikasi antarmuka untuk menunjukkan data yang akan diekstrak dan kriteria konversi. Kemampuan untuk membaca informasi dari kamus data atau mengimpor informasi dari repositori produk. Kode yang dihasilkan oleh alat harus benar-benar dipertahankan dari dalam lingkungan pengembangan. ekstraksi data Selektif kedua elemen & catatan data. Alat Kriteria Seleksi (2) Pemeriksaan data lapangan tingkat untuk transformasi data. Kemampuan untuk melakukan data -jenis dan terjemahan karakter-set diperlukan ketika memindahkan data antara sistem yang tidak kompatibel. Kemampuan untuk membuat summarization, agregasi, dan catatan derivasi dan bidang sangat penting. Data warehouse DBMS harus mampu melakukan load langsung dari alat atau membuat flat file. stabilitas vendor dan dukungan untuk produk vendor Pendekatan Tugas menangkap data dari sistem sumber data, pembersihan dan mengubahnya, dan kemudian memuat hasilnya menjadi sistem target data dapat dilakukan oleh produk yang terpisah, atau dengan solusi terintegrasi. Categories solusi terintegrasi: generator Kode (buat disesuaikan program transformasi 3GL / 4GL) . alat replikasi data (menggunakan database memicu untuk menangkap perubahan sumber data dan menerapkan perubahan target data) Peraturan-driven mesin transformasi dinamis / pembangun Data mart (data sumber capture pada interval yang ditetapkan pengguna, mengubah data, dan mengirim hasilnya ke data target. Akses ke Legacy data Perusahaan / Access menyediakan akses ke data warisan (seperti data warisan berbasis mainframe). Perusahaan / Access menyediakan arsitektur tiga-tier (lapisan data, lapisan proses, dan lapisan pengguna) yang mendefinisikan bagaimana aplikasi dipartisi untuk memenuhi kedua integrasi jangka pendek dan tujuan migrasi jangka panjang. Dengan Usaha / Access, sistem warisan di hampir setiap platform dapat dihubungkan ke sebuah gudang data baru melalui antarmuka client / server tanpa signifikan waktu, biaya, atau risiko yang terlibat dalam rekayasa ulang aplikasi kode. Penjual Solusi: Prism Prism Gudang Manager menyediakan solusi yang komprehensif untuk data warehousing dengan sumber data pemetaan untuk DBMS sasaran untuk digunakan sebagai gudang. Gudang manajer menghasilkan kode untuk mengekstrak dan mengintegrasikan data, membuat dan mengelola metadata, dan membangun subjek berorientasi, basis sejarah. Sumber: DB2, IMS, UNIX, MVS Target: ORACLE, Sybase, Informix vendor Solusi : SAS Institute SAS System Tools melayani semua fungsi data warehousing. SAS data fungsi Repository dapat bertindak untuk membangun database informasi. Mesin SAS Data Access berfungsi sebagai alat ekstraksi. SAS Views melayani internetworking dan menyegarkan peran. pelaporan SAS, grafik, dan mendukung keputusan produk bertindak sebagai front end. mesin SAS dapat bekerja dengan database hirarkis dan relasional dan file sekuensial. Penjual Solusi: PASPOR dan metacenter (1) PASSPORT Carleton Corp adalah metadata-driven, data-pemetaan, dan data-migrasi yang canggih . fasilitas PASPOR Workbench berjalan sebagai klien pada berbagai platform PC dalam lingkungan tiga-berjenjang, termasuk Windows. Dua komponen PASPOR: Kumpulkan sumber data (berbasis mainframe) dan mengkonversi mereka ke Passport data Bahasa. Buat direktori metadata (workstation- based) dari yang membangun program COBOL untuk membuat ekstrak. Penjual Solusi: PASPOR dan metacenter (2) metacenter adalah alat suite terintegrasi yang dirancang untuk menempatkan pengguna dalam kontrol dari data warehouse tersebut. ekstraksi data dan transformasi Metadata menangkap dan browsing data mart berlangganan control Gudang fungsi pusat kendali acara dan pemberitahuan Penjual Solusi: lain Vality Corp .: Integritas Fokus pada kualitas data, menghindari GIGO. Evolusi Teknologi: ETI-EKSTRAK Secara keseluruhan, adalah alat ekstraksi data dan transformasi yang komprehensif dan matang. Pembangun Informasi: EDA / SQL Menyediakan akses SQL ke lebih dari 60 database yang berbeda pada 35 platform yang berbeda. Mesin Transformasi Informatica: Powermart Suite Menangkap teknis dan bisnis metadata di back-end yang dapat diintegrasikan dengan metadata dalam produk front-end mitra ', menyajikan pandangan terpadu metadata di seluruh perusahaan. Constellar: Hub Apakah dirancang untuk menangani gerakan dan transformasi data untuk kedua migrasi data dan distribusi data dalam sistem operasional, dan untuk menangkap data operasional untuk loading ke dalam data warehouse.
Sedang diterjemahkan, harap tunggu..
