Pertimbangan desain: Metadata
Metadata dicari oleh pengguna untuk menemukan definisi data atau bidang studi
Desain data warehouse harus memastikan bahwa ada mekanisme yang Mempopulai dan memelihara repositori metadata, dan bahwa semua jalur akses ke data warehouse memiliki metadata sebagai entry point
Dengan kata lain, desain gudang harus mencegah akses langsung ke data warehouse (terutama update) jika tidak menggunakan definisi metadata untuk mendapatkan akses Pertimbangan Desain: data Distribusi Fakta: volume data terus tumbuh, ukuran data warehouse cepat mengatasi server tunggal Bagaimana data harus dibagi di beberapa server, dan yang pengguna harus mendapatkan akses ke jenis data Penempatan data dan distribusi desain harus mempertimbangkan beberapa pilihan, termasuk distribusi data dengan mata pelajaran (misalnya, sumber daya manusia, pemasaran) , lokasi (misalnya, wilayah geografis), atau waktu (misalnya, saat ini, bulanan, triwulanan) Masalah dengan data terdistribusi: sejumlah besar transfer data antara server Pertimbangan Desain: Alat Alat menyediakan fasilitas untuk mendefinisikan transformasi dan pembersihan aturan, data pergerakan (dari sumber operasional ke gudang), permintaan pengguna akhir, pelaporan, dan analisis data desainer Data warehouse harus berhati-hati untuk tidak mengorbankan desain keseluruhan untuk menyesuaikan alat khusus Para desainer harus memastikan bahwa semua alat yang dipilih yang kompatibel dengan yang diberikan lingkungan data warehouse dan satu sama lain (repositori metadata umum) Pertimbangan Desain: Pertimbangan Kinerja Mengetahui bagaimana pengguna akhir perlu untuk mengakses berbagai data dapat membantu database desain gudang untuk menghindari operasi yang paling mahal seperti multi-tabel scan dan bergabung Misalnya, salah satu teknik desain adalah untuk mengisi gudang dengan sejumlah pandangan de-normalisasi mengandung diringkas, berasal, dan data agregat Jika dilakukan dengan benar, banyak pertanyaan pengguna akhir dapat mengeksekusi langsung terhadap pandangan-pandangan ini, dengan demikian mempertahankan tingkat kinerja secara keseluruhan sesuai Desain Data Warehouse Metodologi (Ralph Kimball) Memilih materi pelajaran Menentukan apa tabel fakta mewakili Mengidentifikasi dan sesuai dimensi Memilih fakta Menyimpan pre-kalkulasi di tabel fakta Pembulatan keluar tabel dimensi Memilih durasi database Kebutuhan untuk melacak pelan-pelan berubah dimensi Menentukan permintaan prioritas dan mode permintaan Langkah 1: Memilih subyek data mart tertentu Menurut Kimball, tempat yang bagus untuk memulai di kebanyakan perusahaan adalah untuk membangun data mart yang terdiri dari faktur pelanggan atau laporan bulanan Salah satu hukum Kimball adalah bahwa sumber data terbaik di setiap perusahaan adalah catatan "berapa banyak uang yang mereka berutang kita" Hindari menambahkan biaya dan profitabilitas untuk pertama data yang mart Langkah 2: Menentukan apa catatan tabel fakta mewakili Tabel fakta adalah meja tengah yang besar di desain dimensi yang memiliki kunci multi Setiap komponen kunci multipart adalah kunci asing ke tabel dimensi individu Dalam contoh faktur pelanggan, "gandum" dari tabel fakta adalah item baris individu pada faktur pelanggan Dengan kata lain, item baris pada faktur adalah fakta catatan tabel tunggal, dan sebaliknya Langkah 3: Mengidentifikasi dan sesuai dimensi Dimensi adalah driver dari data mart Dimensi adalah sumber header baris dalam laporan akhir pengguna Dimensi harus dipilih dengan gudang data jarak jauh dalam pikiran Jika dimensi apapun terjadi di mart dua data, mereka harus persis dimensi yang sama, atau seseorang harus menjadi bagian matematika yang lain Bila dimensi yang digunakan dalam dua data mart, dimensi ini dikatakan untuk menjadi serupa Pertimbangan Teknis Platform perangkat keras yang akan rumah gudang data Sistem manajemen database yang mendukung database gudang Infrastruktur komunikasi yang menghubungkan gudang, data mart, sistem operasional, dan pengguna akhir Platform perangkat keras dan perangkat lunak untuk mendukung metadata repositori Kerangka manajemen sistem yang memungkinkan manajemen terpusat dan administrasi seluruh lingkungan Pertimbangan Teknis: Platform Hardware Server data warehouse harus dapat mendukung volume data yang besar dan pemrosesan query yang kompleks Selain itu, itu harus terukur, karena data warehouse tidak pernah selesai, karena persyaratan baru pengguna, sumber data baru, dan lebih banyak data historis terus dimasukkan ke dalam gudang, dan populasi pengguna data warehouse terus berkembang Poin desain penting ketika memilih sebuah platform komputasi scalable adalah keseimbangan yang tepat antara semua komponen komputasi (misalnya prosesor dan I / O bandwidth) Ingat: Kurangnya hasil keseimbangan dalam kemacetan
Sedang diterjemahkan, harap tunggu..
