Saturday, September 8, 2012

Data Warehouse


Data Warehouse
Menurut W.H. Inmon dan Richard D.H., data warehouse adalah koleksi data yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan management.

Menurut Vidette Poe, data warehouse merupakan database yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan.

Menurut Paul Lane, data warehouse merupakan database relasional yang didesain lebih kepada query dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber lainnya. Data warehouse memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan organisasi menggabung/konsolidasi data dari berbagai macam sumber.

Jadi, data warehouse merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda. Dalam perancangan database tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik.

Dari definisi-definisi yang dijelaskan tadi, dapat disimpulkan data warehouse adalah database yang saling bereaksi yang dapat digunakan untuk query dan analisisis, bersifat orientasi subjek, terintegrasi, time-variant,tidak berubah yang digunakan untuk membantu para pengambil keputusan.

Data Warehouse Bersifat Berorientasi Subjek
Subject Oriented (Berorientasi subject)
Data warehouse berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu.
Gambar 1.0 Data Warehouse Subject Oriented

Pengertian lainnnya Data warehouse berorientasi subjek, adalah data warehouse berorientasi terhadap subjek-subjek utama dalam suatu perusahaan, seperti data warehouse untuk customer, produk, dan sebagainya. Dapat juga dikatakan bahwa data warehouse didesain untuk membantu dalam menganalisis data berdasarkan subjek-subjek tertentu sehingga hanya data yang benar-benar diperlukan yang dimasukkan ke dalam data warehouse.
Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan(customers,products dan sales) dan tidak  diorganisasikan pada area-area aplikasi utama(customer invoicing,stock control dan product sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data. Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses.

Decision Support System (DSS)
Istilah dari decision support system telah digunakan dengan banyak cara (Alter 1980) dan menerima banyak definisi yang berbeda menurut pandangan dari sang penulis (Druzdzel dan Flynn 1999). Finlay (1994) dan lainnya mendefiniskan DSS kurang lebih sebagai sebuah sistem berbasis komputer yang membantu dalam proses pengambilan keputusan.
Turban (1995) mendefinisikan secara lebih spesifik dengan, sesuatu yang interaktif,flexible dan dapat menyesuaikan diri(adaptable) dari sistem informasi berdasarkan komputer, khususnya pengembangan untuk mendukung pemecahan masalah dari non-struktur management, untuk meningkatkan pengambilan keputusan. Dengan menggunakan data, mendukung antar muka yang mudah digunakan dan memberikan wawasan untuk sang pengambil keputusan.
Definisi lainnya bisa jadi gugur dibandingkan dengan dua pandangan ekstrim berikut, Keen dan Scott Morton (1978), DSS adalah dukungan berdasar kan komputer  untuk para pengambil keputusan management yang berurusan dengan masalah semi-struktur. Sprague dan Carlson (1982), DSS adalah  sistem berdasarkan komputer interaktif yang membantu para pengambil keputusan  menggunakan data dan model-model untuk memecahkan masalah yang tak terstruktur(unstructured problem). Menurut Power (1997), istilah DSS mengingatkan suatu yang berguna dan istilah inklusif untuk banyak jenis sistem informasi yang mendukung pembuatan pengambilan keputusan. Dia dengan penuh humor menambahkan bahwa jika suatu sistem komputer yang bukan OLTP, seseorang akan tergoda untuk menyebutnya sebagai DSS.
Seperti yang kita lihat, DSS memiliki banyak arti dengan maksud yang kurang lebih hampir sama, yaitu suatu sistem komputer yang berguna bagi para pengambil keputusan untuk memecahkan masalah mereka yang kurang lebih berhadapan dengan masalah non-struktur atau semi-struktur.
Decision Support System (DSS) merupakan progresi alamiah dari system pelaporan informasi dan system pemrosesan transaksi. DSS bersifat interaktif, system informasi yang berbasis komputer yang menggunakan model keputusan dan secara khusus menggunakan database untuk membantu proses pengambilan keputusan bagi manajer dan pengguna akhir Informasi dihasilkan dalam bentuk laporan periodik dan khusus dan output dari model matematika dan sistem pakar.
Hubungan Data Warehouse Dengan DSS
data warehouse adalah sebuah model database yang berguna untuk menyimpan dan memproses data dengan pendekatan kepada kegunaan data dalam pengambilan keputusan bagi EIS atau DSS.
Sebuah DSS (tergantung dengan yang disupport-nya)membutuhkan data warehouse agar dapat menjalankan kerjanya dengan baik. Dan memang data warehouse sendiri dibangun untuk memenuhi kebutuhan DSS.
Spesifikasi DSS :
1.       Berfokus pada proses keputusan daripada proses transaksi
2.       Dirancang dengan mudah, sederhana, dapat diterapkan dengan cepat dan mudah diubah.
3.       Dirancang dan dioperasikan oleh manajer
4.       Mampu memberikan informasi yang berguna bagi analisis kegiatan manajerial.
5.       Berkaitan dengan hanya bagian kecil dari masalah besar
6.       Memiliki logika yang serupa dengan cara manajer menganilis situasi yang sama.
7.       Memiliki basis data berisi informasi yang disarikan dari file dan informasi lain organisasi yang berasal dari lingkungan eksternal.

Executive Information System (EIS)
Executive Information System (EIS) adalah sistem computer-based yang membantu executive dalam mengakses data dan informasi untuk mengetahui suatu permasalahan, meneliti solusi yang akan diberikan, dan menunjukkan proses strategic planning.
EIS mengintegrasikan data yang berasal dari sumber data internal maupun eksternal, kemudian melakukan transformasi data ke dalam bentuk rangkuman laporan yang berguna. Laporan ini biasanya digunakan oleh manajer dan level eksekutif untuk mengakses secara cepat laporan yang berasal dari seluruh perusahaan dan departemen, sehingga dapat diperoleh pengetahuan yang berguna bagi pihak eksekutif. Laporan ini digunakan untuk menemukan alternatif solusi untuk menekan permasalahan manajerial dan membuat perencanaan keputusan untuk perusahaan.
Data Yang Dibutuhkan Dalam EIS:
1.       Data terintegrasi dari berbagai database, student, finance, personnel, dibutuhkan untuk menganalisa dari berbagai sudut pandang.
2.       Kadang-kadang, executive membutuhkan data dari database on-line (ex. Kurs mata uang).
3.       Data lengkap yang berisi rangkuman data secara keseluruhan.
4.       Data eksternal (informasi umum).
5.       Record data sebelumnya.

Perbedaan Perancangan Database dan Data Warehouse

Peracangan Database
Perancangan Database adalah proses Pembuatan (develop) stuktur database sesuai dengan data yang dibutuhkan oleh user.

Tujuan Perancangan Database

·         Untuk memenuhi informasi yang berisikan kebutuhan-kebutuhan user secara khusus dan aplikasi – aplikasinya.
·         Memudahkan pengertian struktur informasi.
·         Mendukung kebutuhan-kebutuhan pemrosesan dan beberapa obyek penampilan (response time, processing time, dan storeage space).

Proses Perancangan Database

terdiri dari 6 tahap:
Ø  Tahap 1, Pengumpulan data dan analisis
Ø  Tahap 2, Perancangan database secara konseptual
Ø  Tahap 3, Pemilihan DBMS
Ø  Tahap 4, Perancangan database secara logika (data model mapping)
Ø  Tahap 5, Perancangan database secara fisik
Ø  Tahap 6, Implementasi Sistem database

Perancangan Data Warehouse
Menurut Kimball, perancangan database untuk data warehouse, yaitu :
1.       Langkah 1 : Pemilihan proses
-          Data mart yang pertama kali dibangun haruslah data mart yang dapat dikirim tepat waktu dan dapat menjawab semua pertanyaan bisnis yang penting
-          Pilihan terbaik untuk data mart yang pertama adalah yang berhubungan dengan sales, misal property sales, property leasing,property advertising.
2.       Langkah 2 : Pemilihan sumber
-          Untuk memutuskan secara pasti apa yang diwakili atau direpresentasikan oleh sebuah tabel fakta.
-          Misal, jika sumber dari sebuah tabel fakta properti sale adalah properti sale individual maka sumber dari sebuah dimensi pelanggan berisi rincian pelanggan yang membeli properti utama
3.       Langkah 3 : Mengidentifikasi dimensi
-          Set dimensi yang dibangun dengan baik, memberikan kemudahan untuk memahami dan menggunakan data mart
-          Dimensi ini penting untuk menggambarkan fakta-fakta yang terdapat pada tabel fakta
-          Misal,dimensi id_pelanggan,no_pelanggan,tipe_pelanggan,tempat_tinggal, dan lain sebagainya.
-          Jika ada dimensi yang muncul pada dua data mart,keduadata mart tersebut harus berdimensi sama,atau paling tidak salah satunya berupa subset matematis dari yang lainnya.
-          Jika sebuah dimensi digunakan pada dua data martatau lebih,dan dimensi ini tidak disinkronisasi,maka keseluruhan data warehouse akan gagal, karena dua data
·         mart tidak bisa digunakan secara bersama-sama setiappembeli

4.       Langkah 4 : Pemilihan fakta
-          Sumber dari sebuah tabel fakta menentukan fakta manayang bisa digunakan dalam data mart.
-          Semua fakta harus diekspresikan pada tingkat yang telah ditentukan oleh sumber

5.       Langkah 5 : Menyimpan pre-kalkulasi di tabel fakta
-          Hal ini terjadi apabila fakta kehilangan statement

6.       Langkah 6 : Melengkapi tabel dimensi
-          Pada tahap ini kita menambahkan keterangan selengkap-lengkapnya pada tabel dimensi
-          Keterangannya dipahami oleh pengguna harus

7.       Langkah 7 : Pemilihan durasi database
-          Misalnya pada suatu perusahaan asuransi, mengharuskan data disimpan selama 10 tahun atau lebih.

8.       Langkah 8 : Menelusuri perubahan dimensi yang perlahan
Ada tiga tipe perubahan dimensi yang perlahan, yaitu :
·           Tipe 1. Atribut dimensi yang telah berubah tertulis ulang
·           Tipe 2. Atribut dimensi yang telah berubah menimbulkan sebuah dimensi baru
·           Tipe 3. Atribut dimensi yang telah berubah menimbulkan alternatif sehingga nilai atribut lama dan yang baru dapat diakses secara bersama pada dimensi yang sama.

9.       Langkah 9 : Menentukan prioritas dan mode query
-          Pada tahap ini kita menggunakan perancangan fisik.

0 comments:

Post a Comment

~Terima Kasih Banyak~
Jangan Lupa Beri Komentarnya yah..

Powered by Blogger.