Tugas UAS



Pengertian Arsitektur sistem basis data 

A. Mengenai arsitektur sistem basis data 

Arsitektur sistem basis data adalah kerangka kerja bagi pembangunan basis data. Fungsinya adalah untuk memisahkan anatar fisik basis data dan program aplikasi pemakai. Arsitektur SMBD dikenal juga dengan sebutan asitektur tiga skema (three-schema architecture). Skema dalam arsitektur tersebut adalah:

· Level internal merupakan skema internal yang memuat deskripsi struktur penyimpanan basis data. Skema internal menggunakan model data fisikal dan mendefinisikan secara detail penyimpanan data dalam basis data, serta jalur pengaksesan data.

· Level konsptual merupakan skema konseptual yang memuat deskripsi struktur basis data secara keseluruhan untuk semua pemakai. Skema konseptual hanya memuat deskripsi tentang entiti, atribut, hubungan, dan konstrain tanpa memuat deskripsi data secara detail. Model data tingkat tinggi atau model data implementasi dapat digunakan dalam skema ini.

· Level eksternal merupakan skema eksternal (user views) yang mendefinisikan pandangan data terhadap sekelompok pemakai tersebut. Model data tingkat tinggi atau model data implementasi dapat digunakan dalam skema eksternal.

B. Model Data

Model data adalah sekumpulan konsep-konsep untuk menerangkan data, hubungan-hubungan antara data dan batasan-batasan data yang terintegrasi di dalam suatu organisasi. Penggunaan model data berarti penerapan model data pada saat mendisain sistem basis data agar diperoleh basis data stabil dengan normalisasi penuh. Tujuannya agar data terhindar dari kesalahan-kesalahan seperti tidak konsisten, tidak akurat, dll. Selain itu, model data dikenal juga sebagai konsep yang terintegrasi dalam menggambarkan hubungan (relationship) antara data dan batasan-batasan (constraint) data dalam suatu sistem database. Berdasarkan hubungan antar record dalam database, model data dibagi menjadi 3, yaitu:

a. Model Database Hierarki (Hierarchical Database Model)

b. Model Database Jaringan (Network Database Model)

c. Model Database Relasi (Relational Database Model)

C. Perbedakan model data object-oriented dan ER model?

Model data Object-Oriented

Sebuah model data adalah organisasi logika dari objek dunia nyata (entitas), kendala pada mereka, dan hubungan antara objek-objek.

Entity-Relationship model data

Dalam rekayasa perangkat lunak , model entity-relationship (ER model untuk pendek) adalah representasi abstrak dan konseptual data. Entity-relationship model adalah pemodelan database metode, yang digunakan untuk menghasilkan jenis sekema konseptual atau sistematik model data dari suatu sistem, sering merupakan database relasinal, dan persyaratan dalam top-down mode. Diagram diciptakan oleh proses ini disebut entity-relationship diagram atau diagram ER.

D. Perbedaan model data relasional, jaringan dan hierarkis

Model hirarkis atau biasa disebut model pohon ini menggunakan pola hubungan dengan istilah orang tua dan anak. Terdapat juga istilah simpul (bercirikan kotak atau lingkaran). Simpul yang berada diatas yang terhubung ke simpul pada level dibawahnya disebut orang tua. Setiap orang tua bisa memiliki satu (hubungan 1:1) atau beberapa anak (hubungan 1:M), tetapi setiap anak hanya memiliki satu orang tua. Simpul – simpul yang dibawahi oleh simpul orang tua disebut anak. Adapun hubungan antara anak dan orang tua disebut cabang. Perbedaannya adalah, record-record diorganisasikan sebagai tree (pohon) daripada graf.

Model jaringan direpresentasikan dengan sekumpulan record (Pascal),dan relasi antar data yang direpresentasikan oleh record & lin. Model ini menyerupai model hirarki. Perbedaannya terdapat pada suatu simpul anak bisa memilki lebih dari satu orang tua. Model ini bisa menyatakan hubungan 1:1 (satu arang tua punya satu anak), 1:M (satu orang tua punya banyak anak), maupun N:M (beberapa anak bisa mempunyai beberapa orangtua). Pada model jaringan, orang tua disebut pemilik dan anak disebut anggota.

Model relasional berbeda dengan model jaringan & hirarki.Pada model data relasional pemodelan menggunakan tabel untuk merepresentasikan data & relasi antar data. Setiap tabel terdiri atas kolom, dan setiap kolom mempunyai nama variable tertentu.Inti dari model ini adalah relasi, yang dimisalkan sebagai himpunan dari record. Pada model relasional, skema atau deskripsi data pada model relasi ditentukan oleh nama, nama dari tiap field (Atribut atau kolom), dan tipe dari tiap field.

E. Sebuah database beserta tabelnya dengan ketentuan sebagai berikut:

id_merk char 3

nama char 15






DATA MINING

A. Pengertian 
      Data mining adalah serangkaian proses untuk menggali nilai tambah 
berupa informasi  yang selama ini tidak diketahui secara manual dari suatu 
basisdata.  Informasi yang dihasilkan diperoleh dengan cara mengekstraksi 
dan mengenali pola yang penting atau menarik dari data yang terdapat dalam 
basisdata..
     Datamining terutama digunakan  untuk mencari pengetahuan yang 
terdapat dalam basis data yang besar sehingga sering disebut  Knowledge 
Discovery in Databases  (KDD).  Proses pencarian pengetahuan ini 
menggunakan berbagai teknik-teknik pembelajaran komputer (machine 
learning) untuk menganalisis dan mengekstraksikannya.  Proses pencarian 
bersifat iteratif  dan  interaktif untuk menemukan pola atau model yang sahih, 
baru, bermanfaat, dan dimengerti. Dalam penerapannya dataminig 
memerlukan berbagai perangkat lunak  analisis data untuk menemukan pola 
dan relasi data agar dapat digunakan untuk membuat prediksi dengan akurat. 


B. Manfaat
            Pemanfaatan data mining dapat dilihat dari dua sudut pandang, yaitu sudut
pandang komersial dan sudut  pandang keilmuan. Dari sudut pandang komersial,
pemanfaatan dataming dapat digunakan dalam menangani meledaknya volume data.
Bagaimana mana menyimpannya, mengestraknya serta memanfaaatkannya. Berbagai
teknik komputasi  dapat digunakan menghasilkan informasi yang dibutuhkan.
Informasi yang dihasilkan menjadi asset untuk meningkatkan daya saing suatu
institusi. 
             Data mining tidak hanya digunakan untuk menangani persoalan
menumpuknya data/informasi dan bagaimana menggudangkannya tanpa kehilangan
informasi yang penting (warehousing). Data mining juga diperlukan untuk
menyelesaikan permasalahan atau menjawab kebutuhan bisnis itu sendiri, misalnya:
       • Bagaimana mengetahui hilangnya pelanggan karena pesaing Data Mining   Bab I Pendahuluan 
          M. Fairuzabadi  3
       • Bagaimana mengetahui item produk  atau konsumen yang memiliki
          kesamaan karakteristik
       • Bagaimana mengidentifikasi produk-produk yang terjual bersamaan dengan
          produk lain.
       • Bagaimana memprediski tingkat penjualan
       • Bagaimana menilai tingkat resiko dalam menentukan jumlah produksi suatu
          item.
       • Bagaimana memprediksi prilaku bisnis di masa yang akan datang
           Dari sudut pandang keilmuan,  data mining dapat digunakan untuk
mengcapture, menganlisis serta menyimpan data yang bersifat real-time dan
sangat besar, misalnya: 
• Remote sensor yang ditempatkan pada suatu satelit
• Telescope yang digunakan untuk memindai langit
• Simulasi saintifik yang membangkitkan data dalam ukuran terrabytes

           Data mining merupakan salah satu metode alternatif yang dapat
digunakan untuk mengolah data mentah, ketika metode konvensional tidak
fisibel untuk dilakukan karena besarnya volume data yang diolah. Hal ini
dapat terjadi karena datamining memiliki kemampuan mereduksi data baik
melalui teknik katalogisasi, klasifikasi maupun segementasi.

C. Proses
      Data mining sesunggunghnya merupakan salah satu rangkaian dari
proses pencarian pengetahuan pada database (Knowledge Discovery in
Database/KDD). KDD berhubungan dengan teknik  integrasi dan penemuan
ilmiah, interprestasi dan visualisasi dari pola-pola sejumlah kumpulan data. 
KDD adalah keseluruhan proses non-trivial untuk mencari dan
mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan
bersifat sah, baru, dapat bermanfaat dan dapat dimengerti. Serangkaian proses
tersebut yang memiliki tahap sebagai berikut (Tan, 2004): 
1.  Pembersihan data  dan integrasi data (cleaning and integration)
     Proses ini digunakan untuk membuang data yang tidak konsisten dan
     bersifat noise dari data yang terdapat di berbagai basisdata yang mungkin
     berbeda format maupun platform yang kemudian diintegrasikan dalam
     satu database datawarehouse. 
2.  Seleksi dan transformasi data  (selection and transformation)

Data yang terdapat dalam database  datawarehouse  kemudian direduksi
dengan berbagai teknik. Proses reduksi diperlukan untuk mendapatkan
hasil yang lebih akurat dan mengurangi waktu komputasi terutama utuk
masalah dengan skala besar (large scale problem).  Beberapa cara seleksi,
antra lain:
• Sampling, adalah seleksi subset representatif dari populasi data yang
   besar. Data Mining   Bab I Pendahuluan 
   M. Fairuzabadi  5
• Denoising,  adalah proses   menghilangkan noise dari data yang akan
   ditransformasikan
• Feature extraction,  adalah proses membuka spesifikasi data yang
   signifikan dalam konteks tertentu.
   Transformasi data diperlukan sebagai tahap  pre-procecing, dimana data
   yang diolah siap untuk ditambang. Beberapa cara transformsi, antara lain
   (Santosa, 2007):
• Centering, mengurangi setiap data dengan rata-rata dari setiap atribut
   yang ada.
• Normalisation, membagi setiap data yang dicentering dengan standar
  deviasi dari atribut bersangkutan.
• Scaling, mengubah data sehingga berada dalam skala tertentu.


3. Penambangan data (data mining)
        Data-data yang telah diseleksi dan ditransformasi ditambang dengan
berbagai teknik.  Proses data mining  adalah proses mencari pola atau
informasi menarik dalam data terpilih dengan menggunakan fungsi-fungsi
tertentu. Fungsi atau algoritma dalam data mining sangat bervariasi.
Pemilihan fungsi  atau algoritma yang tepat sangat bergantung pada
tujuan dan proses pencaraian pengetahuan secara keseluruhan. 
4. Evaluasi pola dan presentasi pengetahuan
       Tahap ini merupakan bagian dari proses pencarian pengetahuan yang
mencakup pemeriksaan apakah pola atau informasi yang ditemukan
bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Langkah
terakhir KDD adalah mempresentasikan pengetahuan  dalam bentuk yang
mudah dipahami oleh pengguna.


D. Fungsi-fungsi
   Fungsi-fungsi yang umum  diterapkan dalam data mining (Haskett, 2000):
       • Assosiation,  adalah proses untuk menemukan aturan assosiatif antara
          suatu kombinasi item dalam suatu waktu
       • Secuence,  hampir sama dengan  association  bedanya  seccuence
         diterapkan lebih dari satu periode.
       • Clastering, adalah proses pengelompokan sejumlah data/obyek ke
         dalam kelompok-kelompok data (klaster) sehingga setiap klaster akan
         berisi data yang saling mirip.
      • Classification, adalah proses penemuan model atau fungsi yang
         menjelaskan atau membedakan konsep atau kelas data, dengan tujuan
         untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.
      • Regretion, adalah proses pemetaam data dalam suatu nilai prediksi.
      • Forecasting, adalah proses pengestimasian nilai prediksi berdasarkan
         pola-pola di dalam sekumpulan data
      • Solution, adalah proses penemuan akar masalah dan problem solving
        dari persoalan bisnis yang dihadapi atau paling tidak sebagai  informasi
        pendukung dalam pengambilan keputusan.


E. Disiplin ilmu dan teknik-teknik
          Data mining dalam penerapannya menggabungkan berbagai bidang
ilmu, diantarnya: Sistem basis data, statistik, sistem cerdas, pembelajaran
mesin, pengenalan pola, dan visualisasi. 
banyak diterapakan melalui penggunaan SQL dan  store procedure yang
kemudian menjadi semacam fungsi yang disebut  Data Mining Query
Language (DMQL), sebagai contoh pada produk SQL Server dan Oracle. 
  Statistik deskriptif, pengujian hipotesa, regresi liner, regresi non
linier, poin estimasi, korelasi,  dan analisis klaster merupakan
perhitungan/teknik analisis  statistic sangat dibutuhkan baik dalam preprocessing maupun proses data mining.
  Pembelajaran mesin, pengenalan pola, jaringan syaraf tiruan,
algoritma genetika, logika samar merupakan teknik-teknik sistem cerdas yang
utama dalam analisis data mining selain metode statistik. 
Tabel 1. Contoh aplikasi beserta fungsi dan teknik yang dipergunakan (Bigus,
1996)
Contoh Aplikasi Fungsi Teknik
Basket Market
Analysis
Assosiation Statistik dan teori himpunan
Pola kunjungan
konsumen
Seccuence  Statistik dan teori himpunan
Segementasi Pasar  Clustering  Jaringan syaraf tiruan, statististik,
optimalisasi, analisis diskriminan
Target pemasaran  Classification  Pohon keputusan dan jaringan
syaraf tiruan
Prediksi penjualan  Regretion  Statistik, regresi linier, regresi non
linier, kurva, jaringan syaraf tiruan
Pola permintaan  Forecasting  Statistik, regresi linier, regresi non
linier, kurva, jaringan syaraf
tiruan, pengenalan pola
Optimasi jumlah
produk
Solution  Regrsi, logika samar, sistem pakar,
algoritma genetika Data Mining   Bab I Pendahuluan 
M. Fairuzabadi  9
F. Penerapan 
Sebagai cabang ilmu baru di bidang komputer cukup banyak penerapan yang
dapat dilakukan oleh Data Mining. Apalagi ditunjang ke-kaya-an dan keanekaragam-an berbagai bidang ilmu (artificial intelligence, database, statistik,
pemodelan matematika, pengolahan citra  dsb.) membuat penerapan data mining
menjadi makin luas. Berikut beberapa penerapannya
• Analisa Pasar dan Manajemen 
Untuk analisa pasar, banyak sekali sumber data yang dapat digunakan seperti
transaksi kartu kredit, kartu anggota club tertentu, kupon diskon, keluhan
pembeli, ditambah dengan studi tentang gaya hidup publik. 
Beberapa solusi yang bisa diselesaikan dengan data mining diantaranya: 
ƒ Menembak target pasar 
Data mining dapat melakukan pengelompokan (clustering) dari modelmodel pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai
dengan karakteristik yang diinginkan seperti kesukaan yang sama, tingkat
penghasilan yang sama, kebiasaan membeli dan karakteristik lainnya. 
ƒ Melihat pola beli pemakai dari waktu ke waktu 
Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu
ke waktu. Sebagai contoh, ketika seseorang menikah bisa saja dia
kemudian memutuskan pindah dari  single account ke joint account
(rekening bersama) dan kemudian setelah itu pola beli-nya berbeda dengan
ketika dia masih bujangan. 
ƒ Cross-Market Analysis 
Kita dapat memanfaatkan data mining untuk melihat hubungan antara penjualan
satu produk dengan produk lainnya. Berikut ini saya sajikan beberapa contoh: 
o Cari pola penjualan Coca Cola sedemikian rupa sehingga kita dapat
mengetahui barang apa sajakah yang harus kita sediakan untuk meningkatkan
penjualan Coca Cola?
o Cari pola penjualan IndoMie sedemikian rupa sehingga kita dapat
mengetahui barang apa saja yang juga dibeli oleh pembeli IndoMie. Dengan
demikian kita bisa mengetahui dampak jika kita tidak lagi menjual IndoMie. 
o Cari pola penjualan 
ƒ Profil Customer 
Data mining dapat membantu Anda untuk melihat profil
customer/pembeli/nasabah sehingga kita dapat mengetahui kelompok customer
tertentu suka membeli produk apa saja. 
ƒ Identifikasi Kebutuhan Customer 
Anda dapat mengidentifikasi produk-produk apa saja yang terbaik untuk tiap
kelompok customer dan menyusun faktor-faktor apa saja yang kira-kira dapat
menarik customer baru untuk bergabung/membeli. 
ƒ Menilai Loyalitas Customer 
VISA International Spanyol menggunakan data mining untuk melihat kesuksesan
program-program customer loyalty mereka. Anda bisa lihat di
www.visa.es/ingles/info/300300.html
ƒ Informasi Summary 
Anda juga dapat memanfaatkan data mining untuk membuat laporan
summary yang bersifat multi-dimensi dan dilengkapi dengan informasi
statistik lainnya. 
• Analisa Perusahaan dan Manajemen Resiko 
ƒ Perencanaan Keuangan dan Evaluasi Aset 
Data Mining dapat membantu Anda untuk melakukan analisis dan prediksi
cash flow serta melakukan contingent claim analysis untuk mengevaluasi
aset. Selain itu Anda juga dapat menggunakannya untuk analisis trend.  Data Mining   Bab I Pendahuluan 
M. Fairuzabadi  11
ƒ Perencanaan Sumber Daya (Resource Planning) 
Dengan melihat informasi ringkas (summary) serta pola pembelanjaan dan
pemasukan dari masing-masing resource, Anda dapat memanfaatkannya
untuk melakukan resource planning. 
ƒ Persaingan (Competition) 
o  Sekarang ini banyak perusahaan yang berupaya untuk dapat
melakukan competitive intelligence. Data Mining dapat membantu
Anda untuk memonitor pesaing-pesaing Anda dan melihat market
direction mereka. 
o  Anda juga dapat melakukan pengelompokan customer Anda dan
memberikan variasi harga/layanan/bonus untuk masing-masing grup. 
o  Menyusun strategi penetapan harga di pasar yang sangat kompetitif.
Hal ini diterapkan oleh perusahaan minyak REPSOL di Spanyol
dalam menetapkan harga jual gas di pasaran. 
• Telekomunikasi 
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat
dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus
ditangani secara manual (dilayani oleh  orang). Tujuannya tidak lain adalah
untuk menambah layanan otomatis khusus untuk transaksi-transaksi yang
masih dilayani secara manual. Dengan demikian jumlah operator penerima
transaksi manual tetap bisa ditekan minimal. 
• Keuangan 
Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini
menggunakan data mining untuk me-nambang trilyunan dari berbagai subyek
seperti property, rekening bank dan transaksi keuangan lainnya untuk
mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money
laundry). Mereka menyatakan bahwa hal tersebut akan susah dilakukan jika
menggunakan analisis standar. Data Mining   Bab I Pendahuluan 
M. Fairuzabadi  12
(www.senate.gov/~appropriations/treasury/testimony/sloan.htm. Mungkin
sudah saatnya juga Badan Pemeriksa Keuangan Republik Indonesia
menggunakan teknologi ini untuk mendeteksi aliran dana BLBI. 
• Asuransi 
Australian Health Insurance Commision menggunakan data mining untuk
mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap
dilakukan oleh peserta asuransi. Hasilnya? Mereka berhasil menghemat satu
juta dollar per tahunnya. Anda bisa lihat di
www.informationtimes.com.au/data-sum.htm. Tentu saja ini tidak hanya bisa
diterapkan untuk asuransi kesehatan, tetapi juga untuk berbagai jenis asuransi
lainnya. 
• Olah Raga 
IBM Advanced Scout menggunakan data mining untuk menganalisis statistik
permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka
mencapai keunggulan bersaing (competitive advantage) untuk tim New York
Knicks dan Miami Heat. 
• Astronomi 
Jet Propulsion Laboratory (JPL) di  Pasadena, California dan Palomar
Observatory berhasil menemukan 22 quasar dengan bantuan data mining. Hal
ini merupakan salah satu kesuksesan penerapan data mining di bidang
astronomi dan ilmu ruang angkasa.
• Internet Web Surf-Aid 
IBM Surf-Aid menggunakan algoritma data mining untuk mendata akses
halaman Web khususnya yang berkaitan dengan pemasaran guna melihat
prilaku dan minat customer serta melihat ke-efektif-an pemasaran melalui

Dengan melihat beberapa aplikasi yang telah disebutkan di atas, terlihat sekali
potensi besar dari penerapan Data Mining di berbagai bidang. Bahkan
beberapa pihak berani menyatakan bahwa Data Mining merupakan salah satu
aktifitas di bidang perangkat lunak yang dapat memberikan ROI (return on
investment) yang tinggi. Namun demikian, perlu diingat bahwa Data Mining
hanya melihat keteraturan atau pola dari sejarah, tetapi tetap saja sejarah tidak
sama dengan masa datang. Contoh: jika  orang terlalu banyak minum Coca
Cola bukan berarti dia pasti akan kegemukan, jika orang terlalu banyak
merokok bukan berarti dia pasti akan kena kanker paru-paru atau mati muda.
Bagaimanapun juga data mining tetaplah hanya alat bantu yang dapat
membantu manusia untuk melihat pola, menganalisis trend dsb. dalam rangka
mempercepat pembuatan keputusan.  Kapankah data mining akan banyak
digunakan di Indonesia? Kita tunggu saja.  








Tidak ada komentar:

Posting Komentar