Pertimbangan Teknis: DBMS (1)
Dua tantangan penting dari data warehouse:
Ukuran yang sangat besar database
Kebutuhan untuk memproses query yang kompleks ad hoc dalam waktu yang relatif singkat
Oleh karena itu, persyaratan yang paling penting bagi DBMS data warehouse adalah:
Kinerja
throughput
Skalabilitas Pertimbangan Teknis: DBMS (2) Mayoritas vendor Relational DBMS telah menerapkan paralelisme dalam produk mereka: DB2 Oracle Sybase Selain "tradisional" Relational DBMS, ada database yang telah dioptimalkan secara khusus untuk data warehousing, seperti Red Brick Gudang dari Red Brick Sistem Pertimbangan Teknis Komunikasi Infrastruktur Infrastruktur Komunikasi sering diabaikan selama perencanaan data warehouse Upaya terkait dengan membawa akses ke data perusahaan secara langsung ke desktop bisa menjadi signifikan, karena banyak organisasi besar biaya dan tidak memiliki pengguna yang besar populasi dengan akses elektronik langsung ke informasi jaringan Komunikasi telah diperluas, perangkat keras dan perangkat lunak baru mungkin harus dibeli Pelaksanaan Pertimbangan Langkah-langkah untuk membangun data warehouse Access Alat data ekstraksi, pembersihan, transformasi, dan migrasi strategi penempatan data Metadata tingkat kecanggihan Pengguna Langkah untuk membangun sebuah gudang data Mengumpulkan dan menganalisis kebutuhan bisnis Buat model data dan desain fisik untuk data warehouse Tentukan sumber data Pilih teknologi database dan platform untuk gudang Ekstrak data dari database operasional, mengubahnya, bersih itu, dan beban ke dalam database Pilih akses database dan alat pelaporan Pilih Database konektivitas perangkat lunak Pilih analisis data dan perangkat lunak presentasi Update data warehouse Alat Access Saat ini, tidak ada alat tunggal di pasar dapat menangani semua data warehouse mungkin kebutuhan akses Kebanyakan implementasi mengandalkan suite alat Cara terbaik untuk memilih suite ini meliputi definisi dari berbagai jenis akses ke data dan memilih alat terbaik untuk jenis akses Contoh jenis akses bentuk tabel sederhana melaporkan Ranking analisis multivariabel seri dan / atau waktu visualisasi data, grafik , charting, dan berputar pencarian tekstual Kompleks analisis statistik teknik AI untuk pengujian hipotesis, tren penemuan, definisi, dan validasi cluster Data pemetaan Informasi (Ie, pemetaan data spasial dalam sistem informasi geografis) Ad hoc query pengguna ditentukan Predefined pertanyaan berulang interaktif drill-down pelaporan dan analisis query Kompleks dengan multi-tabel bergabung, multi-level sub-query, dan kriteria pencarian canggih ekstraksi data, pembersihan, transformasi, dan migrasi Kriteria seleksi yang mempengaruhi proses transformasi: Kemampuan untuk menggabungkan data dari beberapa data yang toko Spesifikasi antarmuka untuk menunjukkan data yang akan diekstrak dan kriteria konversi Kemampuan untuk membaca informasi dari kamus data atau mengimpor informasi dari produk repositori Kode yang dihasilkan oleh alat harus benar-benar dipertahankan Selektif ekstraksi data dari kedua elemen data dan catatan memungkinkan pengguna untuk mengekstrak hanya data yang dibutuhkan Pemeriksaan Data tingkat lapangan untuk transformasi data menjadi informasi Kemampuan untuk melakukan data-jenis dan terjemahan karakter-set merupakan kebutuhan ketika memindahkan data antara sistem yang tidak kompatibel Kemampuan untuk membuat catatan summarization, agregasi, dan derivasi dan bidang sangat penting DBMS data warehouse harus dapat memuat langsung dari alat stabilitas vendor dan dukungan untuk produk harus dievaluasi data ekstraksi, pembersihan, transformasi, dan migrasi solusi Vendor: Prism Gudang Manager: Pendekatan berbasis model Informasi Builder: Pendekatan gerbang SAS Institute: semua fungsi gudang, termasuk ekstraksi Prism Gudang Manajer Maps sumber data ke DBMS target yang akan digunakan sebagai gudang Gudang manajer menghasilkan kode untuk mengekstrak dan mengintegrasikan data, membuat dan mengelola metadata, dan membangun subjek berorientasi, dasar sejarah The konversi standar, perubahan kunci, perubahan struktural, dan kondensasi diperlukan untuk mengubah data menjadi informasi operasional data warehouse secara otomatis dibuat
Sedang diterjemahkan, harap tunggu..
