2.0    konsep GIS dan PANGKALAN DATA

Tujuan utama projek penyelidikan ini adalah menghasilkan sebuah pangkalan data yang mampu membantu dalam penyelidikan pembentukan warisan dengan analisis spatial menggunakan GIS dan analisis statistik menggunakan perisian SPSS. Bahagian ini akan menerangkan keperluan pangkalan data dalam sistem maklumat geografi, konsep pangkalan data, model data ruangan dan bukan ruangan dan prinsip-prinsip rekabentuk pangkalan data yang sesuai untuk kegunaan penyelidikan ini.

2.1      sistem maklumat geografi (gis)

2.1.1        Sistem Maklumat Geografi (GIS)

Maklumat yang dikendalikan dengan menggunakan sistem maklumat merupakan satu gabungan operasi yang melibatkan perancangan, pemerhatian, pengumpulan, penyimpanan, pengurusan serta penganalisisan data bagi menghasilkan maklumat yang boleh digunakan dalam proses pembuat keputusan. Oleh itu, sistem maklumat adalah berasaskan satu pengubahan data bagi menyediakan bantuan analitik kepada penganalisis dan pembuat keputusan. Bagi maklumat geografi, sistem maklumat yang digunakan ialah sistem maklumat geografi. Terdapat banyak tanggapan tentang sistem maklumat geografi sama ada dari segi definisi, komponen, keupayaan serta aplikasinya (Ruslan et al, 1998:16).

  

  Sumber: Ruslan et al (1998:17)

Rajah 2.1       Sistem maklumat secara ringkas

Sistem maklumat geografi boleh didefinisikan dengan pelbagai cara kerana terdapat pendekatan yang berlainan dan pengguna yang terdiri daripada pelbagai bidang. Clarke (1997) telah mencadangkan definisi yang umum GIS sebagai data ruangan yang unik yang boleh dihubungkan kepada peta geografi. Secara ringkasnya GIS boleh dikatakan sebagai sebuah pangkalan data, sebuah maklumat, dan cara menghubungkan kedua-dua pangkalan data dan maklumat. Beberapa pendekatan boleh digunakan untuk menghuraikan GIS termasuk :

2.1.1.1  GIS sebagai kotak alatan (toolbox)

GIS dilihat sebagai alat untuk menganalisis data ruangan. Secara amnya, GIS ialah alat memberi keupayaan dalam mengendalikan data ruangan. Burrough (1986) mendefinisikan GIS sebagai "Satu set alat yang berkuasa untuk mengumpul, menyimpan, mendapat semula sesuka hati, mengubah atau mentranformasi, dan memapar data ruangan dari dunia sebenar." Di sini GIS ditekankan sebagai alat yang direkabentuk untuk menyelesaikan masalah khusus. Jika dilihat GIS dari sudut fungsi, Clarke (1995:13) mendefinisikan GIS sebagai "Satu sistem bantuan komputer untuk mengumpul, menyimpan, mendapat semula, menganalisis dan memapar data ruangan."

2.1.1.2  GIS sebagai sistem maklumat (information system)

Jack Estes and Jeffrey Star (1990:2) mendefinisikan GIS sebagai "sebuah sistem maklumat yang direkabentuk untuk mengendalikan data berkaitan dengan ruangan dan koordinat geografi. Dengan kata lain, GIS ialah kedua-duanya sebagai sistem pangkalan data, dengan keupayaan mengendalikan data ruangan rujukan, dan sebagai satu set operasi mengendalikan data."

 

GIS sebagai sistem maklumat juga didefinisikan oleh Duecker (1979:6) sebagai "Satu kes sistem maklumat yang khas yang mana pangkalan data mengandungi pengamatan tentang sifat (features), aktiviti dan kejadian (events) yang bertaburan mengikut ruang yang didefinisikan dalam ruang sebagai titik, garisan, atau kawasan. Sistem maklumat geografi mengolah data tentang titik, garisan dan kawasan ini untuk mendapatkan semula data untuk pertanyaan dan analisis secara ad hoc."  Sistem maklumat yang khas di sini bermakna GIS mempunyai teknologi sistem maklumat. GIS tidak mencipta pengurusan pangkalan data yang mana sudah wujud dalam bidang sains komputer. Mengikut Duecker, pangkalan data sendiri mengandungi satu set pengamatan, yang merupakan pendekatan pengukuran saintifik. Ahli sains mengambil ukuran dan mencatatkan ukuran ke dalam sistem yang dapat membantu menganalisis data.

 

Pengamatan yang dijalankan adalah pengamatan tentang sifat, aktiviti dan kejadian. Sifat (feature) adalah istilah kartografi[1] tentang benda yang diletak pada peta. Sifat titik mewakili sesuatu lokasi; sifat garis mewakili beberapa lokasi sepanjang garisan, contohnya jalan dan sungai; sifat kawasan pula mewakili garis yang tertutup, contohnya tasik, lot tanah dan sebagainya. "Aktiviti" mempunyai hubungan dengan sains kemasyarakatan. Aktiviti manusia menjanakan taburan dan corak geografi. Ini memberikan peta taburan penduduk, peta banci, lokasi infrastruktur dan sebagainya yang menunjukkan kehidupan harian manusia. "Kejadian" dalam GIS menunjukkan data geografi bukan sahaja mempunyai dimensi ruang tetapi juga masa. Masa merupakan dimensi keempat yang menjadi sebahagian dalam data, dapat menunjukan perubahan yang berlaku pada sesuatu sifat pada tempoh tertentu.

2.1.1.3  GIS sebagai pendekatan kepada sains

Sebagai alat dan sistem maklumat, GIS telah mengubah pendekatan dalam analisis data ruangan. Sejajar dengan perkembangan teknologi ukur tanah, remote sensing, air photos, global positioning system (GPS), dan komputer dan komunikasi mudah alir telah menjadikan GIS berkembang dengan pesat. Teknologi GIS telah menjadi semakin mudah, murah dan telah diguna secara meluas dalam bidang perhutanan, antropologi, epidermiologi dan perniagaan. Perubahan ini telah menjadikan GIS sebagai sebuah pendekatan sains baru. Goodchild (1992) memanggil pendekatan sains ini sebagai sains maklumat geografi (geographical informaion science) dan mendefinisikan sebagai "isu berhubung dengan teknologi GIS, menghalang kejayaan pelaksanaan, atau wujudkan pemahaman tentang potensi keupayaannya." Beliau juga menyatakan ini meliputi penyelidikan dalam (research on) GIS dan penyelidikan dengan (research with) GIS.

2.1.2        Sistem Maklumat Geografi dalam Penggunaan Kajian Sosioekonomi

Penggunaan GIS biasanya dikaitkan dengan maklumat fizikal sama ada secara semula jadi atau buatan manusia. Penggunaan GIS dalam kajian sosioekonomi masih mempunyai potensi besar. Dalam mengkaji demografi dengan pendekatan GIS, data penduduk adalah merujuk kepada individu penduduk yang bertabur dalam ruangan geografi. Taburan individu penduduk ini adalah berbeza dengan taburan objek geografi seperti rumah, hutan, jalan, sungai yang mempunyai lokasi yang tetap. Namun, hubungan wujud antara kedua-dua fenomena dalam ruang geografi yang sama.

 

Data individu penduduk biasanya dihubung dengan objek ruangan lain seperti alamat isi rumah atau unit pengumpulan banci data. Berbeza dengan objek fizikal seperti jalan raya atau bukit, adalah sukar untuk memberi lokasi tepat seseorang individu. Berlanjutan daripada peningkatan minat terhadap teknik geodemografi di UK, dengan data berkenaan individu dikumpul oleh pelbagai organisasi yang sedia ada, satu sistem maklumat yang mampu mengolah dan mengurus data sosioekonomi dengan pendekatan GIS akan berkembang dengan pesat. Rangka kerja dan model data perlu dikukuhkan supaya dapat mewakili dunia sebenar, dan isu khusus berkenaan jenis data sosioekonomi perlu dikenalpasti (Martin, 1991).

2.1.3        Hubungan GIS dengan Pangkalan Data

Pangkalan data merupakan komponen penting dalam GIS. GIS merangkumi dua model data iaitu model data atribut dan model data ruangan. Tanpa pangkalan data, sesuatu GIS adalah tidak bermakna. GIS mampu menjawab dua soalan tentang "apa" dan "di mana". "Apa" merujuk kepada data atribut tentang sesuatu objek ruangan geografi yang disimpan dalam pangkalan data. "Di mana" merujuk kepada lokasi dalam peta suatu data atribut yang dirujuk. Oleh itu, model data atribut dan model data ruangan dapat dihubung dengan ID yang berkongsi (Clarke, 1997).

2.2              Rekabentuk pangkalan data dalam sistem kitaran hidup maklumat

Mengikut Batini et al (1992), rekabentuk pangkalan data memainkan peranan penting dalam kitaran hidup sistem maklumat (information systems life cycle). Rekabentuk sebuah sistem maklumat adalah aktiviti kompleks meliputi perancangan , spesifikasi, pembangunan setiap komponen sistem. Pembahagian tipikal kitaran hidup sistem maklumat ditunjukkan dalam Rajah 2.2 merangkumi peringkat kajian kemungkinan, pengumpulan keperluan dan analisis, rekabentuk, model percubaan (prototyping), pelaksanaan, pengesahan dan pengujian, dan operasi.

2.2.1        Kajian Kemungkinan (Feasibility Study)

Kajian kemungkinan adalah menentukan keberkesanan dari segi kos daripada pelbagai alternatif dalam rekabentuk sistem maklumat serta menentukan keutamaan daripada pelbagai komponen sistem.

2.2.2        Pengumpulan Keperluan dan Analisis (Requirement Collection and Analysis)

Pengumpulan keperluan dan analisis berkenaan dengan pemahaman misi sistem maklumat, iaitu aplikasi terhadap penyelesaian masalah dengan sistem tersebut. Fokus peringkat ini adalah menentukan keperluan pengguna sistem dan keperluan ini dikumpul melalui spesifikasi keperluan (requirement specifications).

2.2.3        Rekabentuk

Rekabentuk berkenaan dengan spesifikasi struktur sistem maklumat. Berbeza daripada rekabentuk pangkalan data dengan rekabentuk aplikasi, rekabentuk pangkalan data adalah rekabentuk struktur pangkalan data; manakala rekabentuk aplikasi pangkalan data adalah rekabentuk program aplikasi.

2.2.4        Model Percubaan (Prototyping)

Kebanyakan perisian mempunyai alat membangunkan model percubaan. Model percubaan membolehkan pengguna sistem mengesahkan keupayaan sistem maklumat memuaskan keperluan pengguna. Model percubaan yang berguna dapat membantu mengubahsuai keperluan sistem menurut pengalaman praktikal.

2.2.5        Pelaksanaan

Pelaksanan berkenaan dengan kerja memprogram pada peringkat akhir, dan mengoperasikan versi sistem maklumat. Pada peringkat ini, pelaksanaan alternatif dibanding dan disahkan supaya sistem akhir dapat memenuhi keperluan.

2.2.6        Pengesahan dan Pengujian (validation and testing)

Pengesahan dan pengujian adalah proses memastikan setiap peringkat rekabentuk diterima kualitinya dan transformasi yang tepat dari peringkat sebelumnya berlaku.

2.2.7        Operasi

Operasi bermula dengan kemasukan data dan berakhir apabila sistem menjadi usang dan perlu diganti. Semasa operasi berjalan, penyelenggaraan perlu dijalankan supaya sistem dapat menyesuai dengan keadaan baru, fungsi baru dan membetulkan kesalahan yang tidak dikesan semasa pengesahan.

 

Kitaran hidup adalah suatu rangka kerja rujukan. Dalam dunia rekabentuk projek sebenar, perbezaan antara fasa rekabentuk adalah kabur dan tidak diikuti sepenuhnya. Walaubagaimanapun, kitaran hidup menunjukkan rekabentuk pangkalan data harus didahului dengan analisis keperluan, dijalankan sejajar dengan rekabentuk aplikasi, diikuti oleh pelaksanaan sama ada model percubaan atau sistem akhir. 

 

 Sumber: Batini et al (1992)

 Rajah 2.2        Kitaran hidup sistem maklumat

 

2.3    konsep-KONSEP ASAS PANGKALAN DATA

Pangkalan data ialah sekumpulan data tidak melimpah yang dapat dikongsi oleh sistem-sistem aplikasi berlainan. Pendekatan-pendekatan pangkalan data dapat meningkatkan faedah-faedah yang boleh diperolehi daripada sesuatu maklumat termasuk sistem maklumat geografi. Kelebihan-kelebihan pendekatan ini adalah meminimumkan kelimpahan data; kekonsistanan data; pengintegrasian data; perkongsian data; penguatkuasaan piawaian; memudahkan pembangunan aplikasi; kawalan keselamatan, kerahsiaan, dan kesepaduan yang seragam; ketersampaian dan tindak balas data; ketidaksandaran data; dan penyelenggaraan program yang kurang (Ruslan et al, 1998:119).

2.3.1        Rekod, Lapangan dan Petunjuk

Organisasi data dalam sebuah fail dapat diterangkan dari segi rekod, lapangan dan petunjuk. Rekod merupakan satu kumpulan data yang berkaitan dan disimpan bersama. Satu rekod adalah bagaikan satu baris dalam jadual seperti Rajah 2.3. Dalam rajah ini, maklumat tentang sesebuah isi rumah adalah sebuah rekod. Satu rekod dibahagi kepada beberapa lapangan (field). Setiap lapangan merupakan satu item data  yang mendefinisikan ciri atau atribut sesuatu elemen. Lapangan dalam Rajah 2.3 diwakili dengan data seperti ID ketua rumah, bangsa, agama, umur, alamat dan bilangan ahli keluarga. Petunjuk digunakan untuk memudahkan perbezaan dan pencapaian kembali sesuatu rekod. Petunjuk mestilah unik untuk memudahkan pengenalpastian sesuatu rekod atau elemen. Dalam contoh di bawah, petunjuk diwakili oleh ID ketua rumah.

Petunjuk

ID Ketua Rumah

Bangsa

Agama

Umur

Alamat

Bil. Ahli Keluarga

101

Melayu

Islam

35

21, Jln 1, Tmn A

6

102

Cina

Buddha

30

2, Jln 2, Tmn A

5

103

India

Hindu

40

5, Jln 3, Tmn A

8

 

                        Rekod

 

Sumber: diubahsuai daripada Ruslan et al (1998)

Rajah 2.3        Rekod, lapangan dan petunjuk

2.3.2        Sistem Pengurusan Pangkalan Data (DBMS)

Sistem pengurusan pangkalan data (database management system - DBMS) merupakan satu sistem yang mengandungi satu set program yang menyediakan kemudahan untuk memanipulasi dan menyelenggara data dalam pangkalan data. Ia direkabentuk untuk memastikan kesepaduan pangkalan data dikekalkan. Antara ciri-ciri utama DBMS adalah berkaitan dengan kebebasan data, kamus data (data dictionary), pengstrukturan data, perakuan dan perolehan semula, pengawalan kelimpahan, pandangan-pandangan pengguna (Ruslan et al, 1998). Selain itu, DBMS juga mengandungi bahasa definisi data (data definition language), modul kemasukan data (data-entry modul), modul mengemaskini data (data update modul), penjanaan laporan (report generator), dan bahasa pertanyaan (query language) (Clarke, 1997).

2.3.3        Fasa Rekabentuk Pangkalan Data

Rekabentuk pangkalan data adalah proses kompleks yang meliputi peringkat membuat keputusan berlainan. Kompleksiti adalah mudah diuruskan jika masalah dipecahkan kepada masalah kecil dan menyelesaikan masalah secara berasingan. Rekabentuk pangkalan data dipecahkan kepada rekabentuk konseptual, rekabentuk logikal dan rekabentuk fizikal (Rajah 2.3). Pangkalan data bermula dengan rekabentuk kemudian diikuti dengan aplikasi penggunaan. Kaedah ini telah dibangunkan pada lewat tahun 1970-an dengan pembangunan teknologi pangkalan data.

2.3.4        Rekabentuk Konseptual

Rekabentuk konseptual bermula dengan spesifikasi keperluan dan menghasilkan skema konseptual pangkalan data. Skema konseptual adalah peringkat tinggi yang menerangkan struktur pangkalan data. Skema konseptual mewakili kesemua keperluan data yang sepatutnya disimpan dalam pangkalan data. Ia merupakan asas utama pangkalan data bersepadu direkabentuk, menyatakan keseluruhan elemen data, pertalian dan halangannya. Skema konseptual merupakan data yang kukuh dan stabil dan sepatutnya mampu berkembang apabila sesuatu organisasi berkembang. Model konseptual pula ialah bahasa yang digunakan untuk menerangkan skema konseptual. Rekabentuk konseptual adalah untuk menerangkan isi kandungan maklumat pangkalan data dan bukan struktur penyimpanan data. Model konseptual merupakan abstrak dunia sebenar yang mengambil kira cuma sifat-sifat yang difikirkan relevan kepada aplikasi yang sedang dijalankan. Ia adalah penerangan secara umum tentang suatu set entiti dan hubungan antara set-set entiti. Ia biasanya merupakan gambaran awal dan konseptualisasai manusia tentang cara mengorganisasikan data bagi mewakilkan dunia sebenar tanpa bersandarkan cara sebenar merekodkan (mengstruktur) data tersebut mengikut perkakasan atau pelaksanaan tertentu.

2.3.5        Rekabentuk Logikal

Rekabentuk logikal bermula dengan skema konseptual dan menghasilkan skema logikal. Skema logikal adalah penerangan tentang struktur pangkalan data yang dapat diproses oleh perisian DBMS. Model logikal ialah bahasa yang digunakan untuk menerangkan secara khusus skema logikal. Model logikal yang biasa digunakan terbahagi kepada tiga kelas iaitu: relational, network, dan hierarchical. Rekabentuk logikal bergantung kepada kelas model data yang digunakan oleh DBMS. Model logikal menggambarkan isu-isu implementasi atau penerangan secara terperinci fenomena ruangan secara praktikal.

2.3.6        Rekabentuk Fizikal

Rekabentuk fizikal bermula dengan skema logikal dan menghasilkan skema fizikal. Skema fizikal menerangkan pelaksanaan pangkalan data dalam ingatan sekunder (secondary memory). Ia menerangkan struktur penyimpanan dan kaedah pencapaian supaya berkesan dalam mencapai semula data. Model fizikal menerangkan pelaksanaan sebenar struktur-struktur ke dalam alat-alat storan fizikal. Rekabentuk fizikal berhubung terus dengan sistem DBMS tertentu (Batini et al, 1992, Ruslan et al, 1998).

 

Sumber: Batini et al (1992)

Rajah 2.4        Pendekatan data kepada rekabentuk sistem maklumat

2.4       DATA MODEL - PERWAKILAN DATA DALAM PANGKALAN DATA

Model data adalah cara penyusunan data dalam kegunaan sistem maklumat. Model data boleh didefinisikan sebagai 1) suatu model keperluan data pengguna yang dihuraikan dari segi model hubungan entiti atau model objek semantik; 2) suatu bahasa yang menjelaskan struktur dan pemprosesan pangkalan data seperti model hierarki, model rangkaian dan model data hubungan (Kroenke 1995). Pangkalan data GIS hanya dapat mengendalikan dua jenis data iaitu ruangan dan atribut. Kedua-dua jenis data ini adalah diasingkan dan boleh diproses sama ada individu atau bersepadu. Model data ruangan dan model data atribut membentuk sebuah sistem maklumat geografi, dengan model data ruangan menyimpan dan mengendalikan data perletakan dan sifat-sifat geografi lain, manakala model data atribut menyimpan data berkaitan dengan objek geografi yang diwakilkan. Pemilihan model atau struktur data adalah penting dalam membentuk sistem maklumat geografi (Ruslan et al, 1998).

2.4.1        Model Data Atribut/Bukan Ruangan

Model data atribut atau dikenali sebagai model data klasik, telah wujud sejak komputer diperkenalkan, lebih awal daripada model data ruangan. Cara menguruskan data ini telah matang dan lebih dikenali sebagai sistem pengurusan pangkalan data (DBMS). Terdapat  empat  model data klasik bagi pengurusan data atribut iaitu model jadual, model hierarki, model rangkaian, dan model hubungan.

2.4.1.1  Model Jadual

Model jadual adalah model paling ringkas. Data atribut dimasukkan sebagai lajur ke dalam fail dalam bentuk satu jadual yang besar. Model ini tidak fleksible dan mempunyai had yang ketara dari segi menjawab pertanyaan yang memerlukan perkaitan beberapa angkubah.

2.4.1.2  Model Data Hierarki

Model hierarki menyusun data dalam bentuk hierarki atau struktur ranting. Elemen data dalam model ini mempunyai pertalian satu dengan satu atau satu dengan banyak. Pertalian ini menyerupai pertalian yang wujud antara induk dengan anak. Model ini mampu mempersembahkan data ruangan dengan baik. Contohnya data banci yang disusun mengikut negeri, daerah, mukin dan kawasan bancian. Model data hierarki ini mudah difahami dan dikemaskini. Walaubagaimanapun, struktur ranting model ini tidak fleksible kerana pertalian-pertalian antara data hanya didefinisi secara menegak, tetapi tidak secara mendatar. Pertalian baru antara elemen atau objek tidak boleh didefinisikan apabila sesuatu hierarki telah dibentuk. Model ini juga tidak membenarkan elemen mempunyai banyak induk. Kekurangan ini dapat diselesaikan dengan model rangkaian.

2.4.1.3  Model Rangkaian

Model rangkaian menggunakan konsep pertalian banyak dengan banyak. Dalam model ini, sesuatu entiti boleh mempunyai banyak induk dan banyak anak dan tiada akar diperlukan. Oleh itu, rekod-rekod dapat dicari terus tanpa menerabas keseluruhan hierarki. Bagi pangkalan data yang kompleks, maklumat pertalian adalah banyak. Jika terdapat sebarang perubahan, masa banyak diperlukan untuk mengemaskinikan pertalian-pertalian ini.

2.4.1.4  Model Data Hubungan

Model data hubungan adalah cara yang mudah digunakan untuk mewakilkan dunia sebenar. Model ini tidak terdapat hierarki dan petunjuk utama (primary key) tidak diperlukan. Setiap lapangan boleh digunakan sebagai petunjuk. Data disimpan dalam bentuk rekod mudah dikenali sebagai tupel-tupel. Setiap tupel mengandungi satu kumpulan nilai atribut yang berkaitan tupel-tupel dikumpulkan bersama dalam jadual dua dimensi. Setiap jadual mewakilkan pertalian antara semua atribut yang terdapat dalam jadual tersebut dikenali sebagai hubungan. Setiap jadual biasanya disimpan sebagai satu fail berasingan. Rekod-rekod dalam sesebuah fail dikenal pasti dengan menggunakan kod-kod pengenalan yang berfungsi sebagai petunjuk yang unik.

 

Data boleh dicari daripada pangkalan data hubungan melalui prosedur yang membolehkan pengguna mendefinisikan perkaitan yang sesuai dengan pertanyaan yand hendak diuat. Pertalian ini tidak semestinya sudah wujud dalam fail-fail sedia ada.

 

2.4.2        Model Data Ruangan

Dalam sistem maklumat geografi, terdapat dua jenis model untuk mewakil atau menyusun data ruangan secara berdigit iaitu model vektor dan model raster.

2.4.2.1  Model Vektor

Dalam model vektor, fenomena dunia sebvenar diwakilkan oleh titik-titik dan garisan-garisan yang mendefinisi sempadannya. Cara persembahan ini hampir sama seperti dilukis di atas peta. Pendekatan ini juga dikenali sebagai perwakilan berasakan objek. Perletakan setiap entiti didefinisikan oleh kedudukannya dalam ruang peta yang disusun oleh satu sistem koordinat rujukan. Setiap kedudukan dalam ruang peta mempunyai nilai koordinat yang unik. Dalam model vektor, setiap entiti cuba diwakilkan dengan stepat yang mungkin dengan dunia sebenar.

2.4.2.2  Model Raster

Dalam model raster, ruang dipecahkan kepada unit-unit poligon ruangan (atau sel-sel) yang disusun dalam bentuk matriks yang juga dikenali sebagai jaringan, kekisi atau susunan. Unit-unit ruangan ini biasanya mempunyai saiz, bentuk atau orientasi yang seragam seperti segi empat, segi tiga atau heksagon (Ruslan et al, 1998). 

 

[1] Kartografi (cartography) bermaksud sains, seni dan teknologi dalam membuat, mengguna dan mengkaji peta.

 

sambung ke bab 3

back to home