Pengertian Arsitektur sistem basis data
A. Mengenai arsitektur sistem basis data
Arsitektur sistem basis data adalah kerangka kerja bagi pembangunan basis data. Fungsinya adalah untuk memisahkan anatar fisik basis data dan program aplikasi pemakai. Arsitektur SMBD dikenal juga dengan sebutan asitektur tiga skema (three-schema architecture). Skema dalam arsitektur tersebut adalah:
· Level internal merupakan skema internal yang memuat deskripsi struktur penyimpanan basis data. Skema internal menggunakan model data fisikal dan mendefinisikan secara detail penyimpanan data dalam basis data, serta jalur pengaksesan data.
· Level konsptual merupakan skema konseptual yang memuat deskripsi struktur basis data secara keseluruhan untuk semua pemakai. Skema konseptual hanya memuat deskripsi tentang entiti, atribut, hubungan, dan konstrain tanpa memuat deskripsi data secara detail. Model data tingkat tinggi atau model data implementasi dapat digunakan dalam skema ini.
· Level eksternal merupakan skema eksternal (user views) yang mendefinisikan pandangan data terhadap sekelompok pemakai tersebut. Model data tingkat tinggi atau model data implementasi dapat digunakan dalam skema eksternal.
B. Model Data
Model data adalah sekumpulan konsep-konsep untuk menerangkan data, hubungan-hubungan antara data dan batasan-batasan data yang terintegrasi di dalam suatu organisasi. Penggunaan model data berarti penerapan model data pada saat mendisain sistem basis data agar diperoleh basis data stabil dengan normalisasi penuh. Tujuannya agar data terhindar dari kesalahan-kesalahan seperti tidak konsisten, tidak akurat, dll. Selain itu, model data dikenal juga sebagai konsep yang terintegrasi dalam menggambarkan hubungan (relationship) antara data dan batasan-batasan (constraint) data dalam suatu sistem database. Berdasarkan hubungan antar record dalam database, model data dibagi menjadi 3, yaitu:
a. Model Database Hierarki (Hierarchical Database Model)
b. Model Database Jaringan (Network Database Model)
c. Model Database Relasi (Relational Database Model)
C. Perbedakan model data object-oriented dan ER model?
Model data Object-Oriented
Sebuah model data adalah organisasi logika dari objek dunia nyata (entitas), kendala pada mereka, dan hubungan antara objek-objek.
Entity-Relationship model data
Dalam rekayasa perangkat lunak , model entity-relationship (ER model untuk pendek) adalah representasi abstrak dan konseptual data. Entity-relationship model adalah pemodelan database metode, yang digunakan untuk menghasilkan jenis sekema konseptual atau sistematik model data dari suatu sistem, sering merupakan database relasinal, dan persyaratan dalam top-down mode. Diagram diciptakan oleh proses ini disebut entity-relationship diagram atau diagram ER.
D. Perbedaan model data relasional, jaringan dan hierarkis
Model hirarkis atau biasa disebut model pohon ini menggunakan pola hubungan dengan istilah orang tua dan anak. Terdapat juga istilah simpul (bercirikan kotak atau lingkaran). Simpul yang berada diatas yang terhubung ke simpul pada level dibawahnya disebut orang tua. Setiap orang tua bisa memiliki satu (hubungan 1:1) atau beberapa anak (hubungan 1:M), tetapi setiap anak hanya memiliki satu orang tua. Simpul – simpul yang dibawahi oleh simpul orang tua disebut anak. Adapun hubungan antara anak dan orang tua disebut cabang. Perbedaannya adalah, record-record diorganisasikan sebagai tree (pohon) daripada graf.
Model jaringan direpresentasikan dengan sekumpulan record (Pascal),dan relasi antar data yang direpresentasikan oleh record & lin. Model ini menyerupai model hirarki. Perbedaannya terdapat pada suatu simpul anak bisa memilki lebih dari satu orang tua. Model ini bisa menyatakan hubungan 1:1 (satu arang tua punya satu anak), 1:M (satu orang tua punya banyak anak), maupun N:M (beberapa anak bisa mempunyai beberapa orangtua). Pada model jaringan, orang tua disebut pemilik dan anak disebut anggota.
Model relasional berbeda dengan model jaringan & hirarki.Pada model data relasional pemodelan menggunakan tabel untuk merepresentasikan data & relasi antar data. Setiap tabel terdiri atas kolom, dan setiap kolom mempunyai nama variable tertentu.Inti dari model ini adalah relasi, yang dimisalkan sebagai himpunan dari record. Pada model relasional, skema atau deskripsi data pada model relasi ditentukan oleh nama, nama dari tiap field (Atribut atau kolom), dan tipe dari tiap field.
E. Sebuah database beserta tabelnya dengan ketentuan sebagai berikut:
id_merk char 3
nama char 15
DATA MINING
A. Pengertian
Data mining adalah serangkaian proses untuk menggali nilai tambah
berupa informasi yang selama ini tidak diketahui secara manual dari suatu
basisdata. Informasi yang dihasilkan diperoleh dengan cara mengekstraksi
dan mengenali pola yang penting atau menarik dari data yang terdapat dalam
basisdata..
Datamining terutama digunakan untuk mencari pengetahuan yang
terdapat dalam basis data yang besar sehingga sering disebut Knowledge
Discovery in Databases (KDD). Proses pencarian pengetahuan ini
menggunakan berbagai teknik-teknik pembelajaran komputer (machine
learning) untuk menganalisis dan mengekstraksikannya. Proses pencarian
bersifat iteratif dan interaktif untuk menemukan pola atau model yang sahih,
baru, bermanfaat, dan dimengerti. Dalam penerapannya dataminig
memerlukan berbagai perangkat lunak analisis data untuk menemukan pola
dan relasi data agar dapat digunakan untuk membuat prediksi dengan akurat.
B. Manfaat
Pemanfaatan data mining dapat dilihat
dari dua sudut pandang, yaitu sudut
pandang komersial dan sudut
pandang keilmuan. Dari sudut pandang komersial,
pemanfaatan dataming dapat digunakan dalam menangani
meledaknya volume data.
Bagaimana mana menyimpannya, mengestraknya serta
memanfaaatkannya. Berbagai
teknik komputasi
dapat digunakan menghasilkan informasi yang dibutuhkan.
Informasi yang dihasilkan menjadi asset untuk meningkatkan
daya saing suatu
institusi.
Data mining tidak hanya digunakan
untuk menangani persoalan
menumpuknya data/informasi dan bagaimana menggudangkannya
tanpa kehilangan
informasi yang penting (warehousing). Data mining juga
diperlukan untuk
menyelesaikan permasalahan atau menjawab kebutuhan bisnis
itu sendiri, misalnya:
• Bagaimana mengetahui hilangnya pelanggan karena pesaing
Data Mining Bab I Pendahuluan
M. Fairuzabadi 3
• Bagaimana mengetahui item produk atau konsumen yang memiliki
kesamaan karakteristik
• Bagaimana mengidentifikasi produk-produk yang terjual
bersamaan dengan
produk lain.
• Bagaimana memprediski tingkat penjualan
• Bagaimana menilai tingkat resiko dalam menentukan jumlah
produksi suatu
item.
• Bagaimana memprediksi prilaku bisnis di masa yang akan
datang
Dari sudut pandang
keilmuan, data mining dapat digunakan
untuk
mengcapture, menganlisis serta menyimpan data yang bersifat
real-time dan
sangat besar, misalnya:
• Remote sensor yang ditempatkan pada suatu satelit
• Telescope yang digunakan untuk memindai langit
• Simulasi saintifik yang membangkitkan data dalam ukuran
terrabytes
Data mining
merupakan salah satu metode alternatif yang dapat
digunakan untuk mengolah data mentah, ketika metode
konvensional tidak
fisibel untuk dilakukan karena besarnya volume data yang
diolah. Hal ini
dapat terjadi karena datamining memiliki kemampuan mereduksi
data baik
melalui teknik katalogisasi, klasifikasi maupun segementasi.
C. Proses
Data mining
sesunggunghnya merupakan salah satu rangkaian dari
proses pencarian pengetahuan pada database (Knowledge
Discovery in
Database/KDD). KDD berhubungan dengan teknik integrasi dan penemuan
ilmiah, interprestasi dan visualisasi dari pola-pola
sejumlah kumpulan data.
KDD adalah keseluruhan proses non-trivial untuk mencari dan
mengidentifikasi pola (pattern) dalam data, dimana pola yang
ditemukan
bersifat sah, baru, dapat bermanfaat dan dapat dimengerti.
Serangkaian proses
tersebut yang memiliki tahap sebagai berikut (Tan,
2004):
1. Pembersihan
data dan integrasi data (cleaning and
integration)
Proses ini digunakan untuk membuang data yang tidak
konsisten dan
bersifat noise dari data yang terdapat di berbagai basisdata
yang mungkin
berbeda format maupun platform yang kemudian diintegrasikan
dalam
satu database datawarehouse.
2. Seleksi dan
transformasi data (selection and
transformation)
Data yang terdapat dalam database datawarehouse
kemudian direduksi
dengan berbagai teknik. Proses reduksi diperlukan untuk
mendapatkan
hasil yang lebih akurat dan mengurangi waktu komputasi
terutama utuk
masalah dengan skala besar (large scale problem). Beberapa cara seleksi,
antra lain:
• Sampling, adalah seleksi subset representatif dari
populasi data yang
besar. Data Mining
Bab I Pendahuluan
M. Fairuzabadi 5
• Denoising, adalah
proses menghilangkan noise dari data
yang akan
ditransformasikan
• Feature extraction,
adalah proses membuka spesifikasi data yang
signifikan dalam konteks tertentu.
Transformasi data diperlukan sebagai tahap pre-procecing, dimana data
yang diolah siap untuk ditambang. Beberapa cara transformsi,
antara lain
(Santosa, 2007):
• Centering, mengurangi setiap data dengan rata-rata dari
setiap atribut
yang ada.
• Normalisation, membagi setiap data yang dicentering dengan
standar
deviasi dari atribut bersangkutan.
• Scaling, mengubah data sehingga berada dalam skala
tertentu.
3. Penambangan data (data mining)
Data-data yang telah diseleksi dan ditransformasi ditambang
dengan
berbagai teknik.
Proses data mining adalah proses
mencari pola atau
informasi menarik dalam data terpilih dengan menggunakan
fungsi-fungsi
tertentu. Fungsi atau algoritma dalam data mining sangat
bervariasi.
Pemilihan fungsi atau
algoritma yang tepat sangat bergantung pada
tujuan dan proses pencaraian pengetahuan secara
keseluruhan.
4. Evaluasi pola dan presentasi pengetahuan
Tahap ini merupakan bagian dari proses pencarian pengetahuan
yang
mencakup pemeriksaan apakah pola atau informasi yang
ditemukan
bertentangan dengan fakta atau hipotesa yang ada sebelumnya.
Langkah
terakhir KDD adalah mempresentasikan pengetahuan dalam bentuk yang
mudah dipahami oleh pengguna.
D. Fungsi-fungsi
Fungsi-fungsi yang
umum diterapkan dalam data mining (Haskett, 2000):
• Assosiation, adalah
proses untuk menemukan aturan assosiatif antara
suatu kombinasi item dalam suatu waktu
• Secuence, hampir
sama dengan association bedanya
seccuence
diterapkan lebih dari satu periode.
• Clastering, adalah proses pengelompokan sejumlah
data/obyek ke
dalam kelompok-kelompok data (klaster) sehingga setiap
klaster akan
berisi data yang saling mirip.
• Classification, adalah proses penemuan model atau fungsi
yang
menjelaskan atau membedakan konsep atau kelas data, dengan
tujuan
untuk dapat memperkirakan kelas dari suatu objek yang
labelnya tidak diketahui.
• Regretion, adalah proses pemetaam data dalam suatu nilai
prediksi.
• Forecasting, adalah proses pengestimasian nilai prediksi
berdasarkan
pola-pola di dalam sekumpulan data
• Solution, adalah proses penemuan akar masalah dan problem
solving
dari persoalan bisnis yang dihadapi atau paling tidak
sebagai informasi
pendukung dalam pengambilan keputusan.
pendukung dalam pengambilan keputusan.
E. Disiplin ilmu dan
teknik-teknik
Data mining dalam
penerapannya menggabungkan berbagai bidang
ilmu, diantarnya: Sistem basis data, statistik, sistem
cerdas, pembelajaran
mesin, pengenalan pola, dan visualisasi.
banyak diterapakan melalui penggunaan SQL dan store procedure yang
kemudian menjadi semacam fungsi yang disebut Data Mining Query
Language (DMQL), sebagai contoh pada produk SQL Server dan
Oracle.
Statistik
deskriptif, pengujian hipotesa, regresi liner, regresi non
linier, poin estimasi, korelasi, dan analisis klaster merupakan
perhitungan/teknik analisis
statistic sangat dibutuhkan baik dalam preprocessing maupun proses data
mining.
Pembelajaran mesin,
pengenalan pola, jaringan syaraf tiruan,
algoritma genetika, logika samar merupakan teknik-teknik
sistem cerdas yang
utama dalam analisis data mining selain metode
statistik.
Tabel 1. Contoh aplikasi beserta fungsi dan teknik yang
dipergunakan (Bigus,
1996)
Contoh Aplikasi Fungsi Teknik
Basket Market
Analysis
Assosiation Statistik dan teori himpunan
Pola kunjungan
konsumen
Seccuence Statistik
dan teori himpunan
Segementasi Pasar
Clustering Jaringan syaraf
tiruan, statististik,
optimalisasi, analisis diskriminan
Target pemasaran
Classification Pohon keputusan
dan jaringan
syaraf tiruan
Prediksi penjualan
Regretion Statistik, regresi
linier, regresi non
linier, kurva, jaringan syaraf tiruan
Pola permintaan
Forecasting Statistik, regresi
linier, regresi non
linier, kurva, jaringan syaraf
tiruan, pengenalan pola
Optimasi jumlah
produk
Solution Regrsi,
logika samar, sistem pakar,
algoritma genetika Data Mining Bab I Pendahuluan
M. Fairuzabadi 9
F. Penerapan
Sebagai cabang ilmu baru di bidang komputer cukup banyak
penerapan yang
dapat dilakukan oleh Data Mining. Apalagi ditunjang
ke-kaya-an dan keanekaragam-an berbagai bidang ilmu (artificial intelligence,
database, statistik,
pemodelan matematika, pengolahan citra dsb.) membuat penerapan data mining
menjadi makin luas. Berikut beberapa penerapannya
• Analisa Pasar dan Manajemen
Untuk analisa pasar, banyak sekali sumber data yang dapat
digunakan seperti
transaksi kartu kredit, kartu anggota club tertentu, kupon
diskon, keluhan
pembeli, ditambah dengan studi tentang gaya hidup
publik.
Beberapa solusi yang bisa diselesaikan dengan data mining
diantaranya:
Menembak target pasar
Data mining dapat melakukan pengelompokan (clustering) dari
modelmodel pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai
dengan karakteristik yang diinginkan seperti kesukaan yang
sama, tingkat
penghasilan yang sama, kebiasaan membeli dan karakteristik
lainnya.
Melihat pola beli pemakai dari
waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli
seseorang dari waktu
ke waktu. Sebagai contoh, ketika seseorang menikah bisa saja
dia
kemudian memutuskan pindah dari single account ke joint account
(rekening bersama) dan kemudian setelah itu pola beli-nya
berbeda dengan
ketika dia masih bujangan.
Cross-Market Analysis
Kita dapat memanfaatkan data mining untuk melihat hubungan
antara penjualan
satu produk dengan produk lainnya. Berikut ini saya sajikan
beberapa contoh:
o Cari pola penjualan Coca Cola sedemikian rupa sehingga
kita dapat
mengetahui barang apa sajakah yang harus kita sediakan untuk
meningkatkan
penjualan Coca Cola?
o Cari pola penjualan IndoMie sedemikian rupa sehingga kita
dapat
mengetahui barang apa saja yang juga dibeli oleh pembeli
IndoMie. Dengan
demikian kita bisa mengetahui dampak jika kita tidak lagi
menjual IndoMie.
o Cari pola penjualan
Profil Customer
Data mining dapat membantu Anda untuk melihat profil
customer/pembeli/nasabah sehingga kita dapat mengetahui
kelompok customer
tertentu suka membeli produk apa saja.
Identifikasi Kebutuhan
Customer
Anda dapat mengidentifikasi produk-produk apa saja yang
terbaik untuk tiap
kelompok customer dan menyusun faktor-faktor apa saja yang
kira-kira dapat
menarik customer baru untuk bergabung/membeli.
Menilai Loyalitas Customer
VISA International Spanyol menggunakan data mining untuk
melihat kesuksesan
program-program customer loyalty mereka. Anda bisa lihat di
www.visa.es/ingles/info/300300.html
Informasi Summary
Anda juga dapat memanfaatkan data mining untuk membuat
laporan
summary yang bersifat multi-dimensi dan dilengkapi dengan
informasi
statistik lainnya.
• Analisa Perusahaan dan Manajemen Resiko
Perencanaan Keuangan dan
Evaluasi Aset
Data Mining dapat membantu Anda untuk melakukan analisis dan
prediksi
cash flow serta melakukan contingent claim analysis untuk
mengevaluasi
aset. Selain itu Anda juga dapat menggunakannya untuk
analisis trend. Data Mining Bab I Pendahuluan
M. Fairuzabadi 11
Perencanaan Sumber Daya
(Resource Planning)
Dengan melihat informasi ringkas (summary) serta pola
pembelanjaan dan
pemasukan dari masing-masing resource, Anda dapat
memanfaatkannya
untuk melakukan resource planning.
Persaingan (Competition)
o Sekarang ini banyak
perusahaan yang berupaya untuk dapat
melakukan competitive intelligence. Data Mining dapat
membantu
Anda untuk memonitor pesaing-pesaing Anda dan melihat market
direction mereka.
o Anda juga dapat
melakukan pengelompokan customer Anda dan
memberikan variasi harga/layanan/bonus untuk masing-masing
grup.
o Menyusun strategi
penetapan harga di pasar yang sangat kompetitif.
Hal ini diterapkan oleh perusahaan minyak REPSOL di Spanyol
dalam menetapkan harga jual gas di pasaran.
• Telekomunikasi
Sebuah perusahaan telekomunikasi menerapkan data mining
untuk melihat
dari jutaan transaksi yang masuk, transaksi mana sajakah
yang masih harus
ditangani secara manual (dilayani oleh orang). Tujuannya tidak lain adalah
untuk menambah layanan otomatis khusus untuk
transaksi-transaksi yang
masih dilayani secara manual. Dengan demikian jumlah
operator penerima
transaksi manual tetap bisa ditekan minimal.
• Keuangan
Financial Crimes Enforcement Network di Amerika Serikat
baru-baru ini
menggunakan data mining untuk me-nambang trilyunan dari
berbagai subyek
seperti property, rekening bank dan transaksi keuangan
lainnya untuk
mendeteksi transaksi-transaksi keuangan yang mencurigakan
(seperti money
laundry). Mereka menyatakan bahwa hal tersebut akan susah
dilakukan jika
menggunakan analisis standar. Data Mining Bab I Pendahuluan
M. Fairuzabadi 12
(www.senate.gov/~appropriations/treasury/testimony/sloan.htm.
Mungkin
sudah saatnya juga Badan Pemeriksa Keuangan Republik
Indonesia
menggunakan teknologi ini untuk mendeteksi aliran dana
BLBI.
• Asuransi
Australian Health Insurance Commision menggunakan data
mining untuk
mengidentifikasi layanan kesehatan yang sebenarnya tidak
perlu tetapi tetap
dilakukan oleh peserta asuransi. Hasilnya? Mereka berhasil
menghemat satu
juta dollar per tahunnya. Anda bisa lihat di
www.informationtimes.com.au/data-sum.htm. Tentu saja ini
tidak hanya bisa
diterapkan untuk asuransi kesehatan, tetapi juga untuk
berbagai jenis asuransi
lainnya.
• Olah Raga
IBM Advanced Scout menggunakan data mining untuk
menganalisis statistik
permainan NBA (jumlah shots blocked, assists dan fouls)
dalam rangka
mencapai keunggulan bersaing (competitive advantage) untuk
tim New York
Knicks dan Miami Heat.
• Astronomi
Jet Propulsion Laboratory (JPL) di Pasadena, California dan Palomar
Observatory berhasil menemukan 22 quasar dengan bantuan data
mining. Hal
ini merupakan salah satu kesuksesan penerapan data mining di
bidang
astronomi dan ilmu ruang angkasa.
• Internet Web Surf-Aid
IBM Surf-Aid menggunakan algoritma data mining untuk mendata
akses
halaman Web khususnya yang berkaitan dengan pemasaran guna
melihat
prilaku dan minat customer serta melihat ke-efektif-an
pemasaran melalui
Dengan melihat beberapa aplikasi yang telah disebutkan di
atas, terlihat sekali
potensi besar dari penerapan Data Mining di berbagai bidang.
Bahkan
beberapa pihak berani menyatakan bahwa Data Mining merupakan
salah satu
aktifitas di bidang perangkat lunak yang dapat memberikan
ROI (return on
investment) yang tinggi. Namun demikian, perlu diingat bahwa
Data Mining
hanya melihat keteraturan atau pola dari sejarah, tetapi
tetap saja sejarah tidak
sama dengan masa datang. Contoh: jika orang terlalu banyak minum Coca
Cola bukan berarti dia pasti akan kegemukan, jika orang
terlalu banyak
merokok bukan berarti dia pasti akan kena kanker paru-paru
atau mati muda.
Bagaimanapun juga data mining tetaplah hanya alat bantu yang
dapat
membantu manusia untuk melihat pola, menganalisis trend dsb.
dalam rangka
mempercepat pembuatan keputusan. Kapankah data mining akan banyak
digunakan di Indonesia? Kita tunggu saja.
Tidak ada komentar:
Posting Komentar