Jumat, 06 Januari 2017

MAKALAH NATURAL LANGUAGE INTERFACE TO DATABASE




NAMA           : UNTUNG NUGROHO
NPM               : 1A114947
KELAS          : 3 KA 39

BAB I 
PENDAHULUAN


Informasi memainkan peran penting dalam kehidupan kita. Salah satu sumber utama informasi database. Database dan teknologi database mengalami dampak yang besar pada meningkatnya penggunaan komputer. Hampir semua aplikasi IT yang menyimpan dan mengambil informasi dari database. Mengambil informasi database membutuhkan pengetahuan tentang bahasa basis data seperti SQL. Query Language (SQL) norma terstruktur yang dikejar di hampir semua bahasa untuk sistem database relasional. Namun, tidak semua orang bisa menulis query SQL karena mereka mungkin tidak menyadari struktur database. Jadi ini telah menyebabkan pengembangan Intelligent Database System (IDBS). Ada kebutuhan besar untuk pengguna non-ahli untuk query database relasional dalam bahasa alami mereka bukan bekerja dengan nilai-nilai atribut. Akibatnya natural language interface to database telah dikembangkan, yang menyediakan pilihan fleksibel untuk memanipulasi query. Ide menggunakan Natural Language bukan SQL telah mendorong pengembangan jenis baru pengolahan disebut Natural Language Interface to Database. NLIDB adalah langkah menuju pengembangan Intellignt Database System  (IDBS) untuk meningkatkan pengguna dalam melakukan query fleksibel dalam database. Tulisan ini merupakan pengantar untuk Sistem Database Cerdas dan Interface Natural Language to Database.


 BAB II
PEMBAHASAN

Database merupakan yang  terpenting dalam berbagai macam bidang aplikasi menggunakan sistem informasi swasta dan publik. Database dibangun dengan tujuan untuk memfasilitasi kegiatan penyimpanan data, pengolahan, dan pengambilan terkait dengan pengelolaan data dalam sistem informasi. Karena kemajuan aplikasi teknologi komputer, aplikasi luas teknologi web di beberapa daerah menjadi akurat, database telah menjadi repositori dari volume besar data dalam database relasional, untuk mengambil informasi dari database, salah satu kebutuhan untuk merumuskan query sedemikian rupa bahwa komputer akan memahami dan menghasilkan output yang diinginkan. Query Language (SQL) norma terstruktur yang dikejar di hampir semua bahasa untuk sistem database relasional. Norma-norma SQL didasarkan pada interpretasi Boolean query. Tetapi beberapa persyaratan pengguna mungkin tidak dijawab secara eksplisit oleh sistem query klasik. Hal ini karena fakta bahwa karakteristik persyaratan 'tidak bisa diungkapkan dengan bahasa query biasa. Banyak aplikasi database generasi baru menetapkan manajemen informasi cerdas memerlukan interaksi efisien antara pengguna dan basis data. Dalam beberapa kali, ada meningkatnya permintaan untuk pengguna non-ahli untuk query database relasional dalam bahasa yang lebih alami meliputi variabel linguistik dan hal, bukannya beroperasi pada nilai-nilai atribut.
Oleh karena itu ide untuk menggunakan bahasa alami bukan SQL telah mendorong pengembangan jenis baru metode pengolahan yang disebut Natural Language Interface to Database (NLIDB). NLIDB adalah langkah menuju pengembangan sistem database cerdas (IDBS) untuk meningkatkan pengguna dalam melakukan query fleksibel dalam database.
  1.  Intelligent  Database System (IDBS)
Sebuah IDBS diberkahi dengan sistem manajemen data mampu mengelola sejumlah besar data persistem yang berbagai bentuk penalaran dapat diterapkan untuk menyimpulkan data dan informasi tambahan. Ini termasuk teknik pengetahuan representasi, teknik inferensi, dan antarmuka pengguna cerdas - antarmuka yang melampaui pendekatan bahasa query tradisional dengan memanfaatkan fasilitas bahasa alami . Teknik ini memainkan peran penting dalam meningkatkan sistem database: teknik representasi pengetahuan memungkinkan seseorang untuk mewakili baik di DB semantik dari domain aplikasi, teknik inferensi memungkinkan satu untuk alasan tentang data untuk mengambil data dan informasi tambahan, user interface Cerdas membantu pengguna untuk membuat permintaan dan menerima balasan.
Intelligent  Database System adalah sistem yang mengelola informasi dengan cara alami, membuat informasi yang mudah untuk menyimpan, mengakses dan menggunakan. Salah satu alasan utama untuk menggunakan Intelligent  Database System adalah bahwa kita hidup dalam keadaan kekenyangan informasi. Untuk sekadar bertahan hidup dalam masyarakat saat ini, kita perlu mengakses dan menggunakan informasi ini. Dengan menggunakan Intelligent  Database System kita dapat memiliki akses yang lebih baik dalam penggunaan, lebih banyak jenis informasi yang mereka bisa sebaliknya. Ini berarti Intelligent  Database System harus  memberikan tingkat tinggi alat cerdas yang memberikan wawasan baru ke dalam isi database dengan mengekstraksi pengetahuan dari data. Membuat informasi tersedia untuk sejumlah besar orang karena lebih banyak orang sekarang dapat memanfaatkan sistem karena kemudahan penggunaan. Meningkatkan proses pengambilan keputusan yang terlibat dalam menggunakan informasi setelah itu telah diambil dengan menggunakan model informasi tingkat yang lebih tinggi.
Saling berhubungan informasi dari sumber yang berbeda menggunakan media yang berbeda sehingga informasi lebih mudah diserap dan dimanfaatkan oleh pengguna. Gunakan pengetahuan dan inferensi, sehingga lebih mudah untuk mengambil, melihat dan membuat keputusan dengan informasi.
  1.  Natural Language Interface to Database (NLIDB)
Natural Language Interface to Database merupakan  untuk menerima permintaan dalam bahasa Inggris atau bahasa alam lainnya dan mencoba untuk 'memahami' mereka atau kita dapat mengatakan bahwa Natural Language Interface to Database (NLIDB) adalah sistem yang menerjemahkan kalimat bahasa alami ke dalam query database. Meskipun penelitian awal telah dimulai sejak akhir tahun enam puluhan , NLIDB tetap sebagai masalah penelitian terbuka. Sebuah sistem NLIDB lengkap akan menguntungkan kita dalam banyak cara. Siapapun dapat mengumpulkan informasi dari database dengan menggunakan sistem seperti .Additionally, mungkin mengubah persepsi kita tentang informasi dalam database. Secara tradisional, orang yang digunakan untuk bekerja dengan bentuk harapan mereka sangat tergantung pada kemampuan formulir. NLIDB membuat seluruh pendekatan yang lebih fleksibel, karena itu akan memaksimalkan penggunaan database. Ada banyak aplikasi yang dapat mengambil keuntungan dari NLIDB. Di PDA dan ponsel lingkungan, tampilan layar tidak selebar komputer atau laptop. Mengisi formulir yang memiliki banyak bidang dapat membosankan satu mungkin harus menavigasi melalui layar, untuk menggulir, untuk mencari nilai-nilai kotak scroll, dll Sebaliknya, dengan NLIDB, satu-satunya pekerjaan yang perlu dilakukan adalah dengan mengetikkan pertanyaan serupa dengan SMS (Short Messaging System).
2.1 Sub Komponen NLIDB
Komputasi ilmuwan telah membagi masalah akses Natural Language Interface to Database menjadi dua sub-komponen:
-          Komponen linguistik
-          komponen database
Komponen Linguistik
Hal ini bertanggung jawab untuk menerjemahkan masukan bahasa alami ke dalam query formal dan menghasilkan respon bahasa alami berdasarkan hasil dari database pencarian.
Komponen Database
Ini merupakan fungsi tradisional dari Database Management . Sebuah leksikon adalah tabel yang digunakan untuk memetakan kata-kata input alami ke objek formal (nama relasi, atribut nama, dll) dari database. Kedua parser dan juru semantik memanfaatkan leksikon. Sebuah generator bahasa alami mengambil tanggapan resmi sebagai masukan, dan memeriksa pohon parsing untuk menghasilkan respon bahasa alami yang memadai. sistem database bahasa alami memanfaatkan pengetahuan sintaksis dan pengetahuan tentang database sebenarnya dalam rangka untuk benar berhubungan masukan bahasa alami dengan struktur dan isi dari database tersebut. pengetahuan sintaksis biasanya berada dalam komponen linguistik dari sistem, khususnya dalam analisa sintaks sedangkan pengetahuan tentang database sebenarnya berada sampai batas tertentu dalam model data semantik digunakan. Pertanyaan yang dimasukkan dalam bahasa alami diterjemahkan ke dalam sebuah pernyataan dalam bahasa query formal. Setelah pernyataan itu jelas terbentuk, query diproses oleh sistem manajemen database untuk menghasilkan data yang dibutuhkan. Data ini kemudian diteruskan kembali ke komponen bahasa alami di mana rutinitas generasi memproduksi versi bahasa permukaan respon.
  1. Contoh Penerapan Aplikasi dari NLIDB
Masih sangat sedikit sekali aplikasi yang memperlihatkan interaksi pengguna dengan actor virtual. Untuk mempelajari kecocokan syarat-syarat teknis dalam lingkungan yang nyata, penelitian dari setiap kemungkinan manusia mengendalikan karakter dalam sebuah game dengan menggunakan instruksi bahasa natural. Game pada PC menyediakan lingkungan virtual dengan skala besar yang terbatas, dengan beberapa tugas yang dapat di definisikan; pada penelitian ini, mengambil sebuah game PC klasik berjudul DOOM™ sebagai contoh, karena game ini memiliki sumber daya dan desain yang cocok untuk sebuah game yang menggunakan metode pemrosesan bahasa natural. Karakter DOOM™ yang digunakan adalah karakter “dengan panduan” on-line yang bisa didapatkan di situs http://www.gamers.org . Panduan tersebut menjelaskan dalam bahasa natural tentang alur dari tiap-tiap level dari game tersebut seperti: penjabaran peta, lokasi-lokasi item, dan penjelasan tentang urutan langkah yang harus diambil oleh pemain. Berikut adalah contoh panduan dari game DOOM™:
Panduan tersebut berfungsi untuk mencocokan penjelasan yang diberikan kepada pemain sebelum sesi game dimulai. Beberapa penjelasan memasukkan saran sepanjang tiap aksi yang berkelanjutan di lakukan, termasuk akibat dari aksi sebelumnya (cth.

“masuki teleporter, sekarang kamu ada di ruangan bundar”). Dalam game ini terdapat banyak variable yang memunculkan instruksi-instruksi yang dibawa pada setiap aksi dasar, yang mana instruksi-instruksi tersebut membutuhkan pemrosesan bahasa natural.
Karakter dalam game ini memberi kesan keteraturan sosiolektal, yang dapat di kategorikan sebagai sub-bahasa. Kesan ini akan membawa dampak yang signifikan terhadap pemrosesan bahasa natural. Di lain pihak metode umum untuk merancang interaksi dari bahasa natural adalah dengan mengartikan bahasa yang sering digunakan manusia. Metode ini secara otomatis mendefinisikan pengendalian tata bahasa, yang di rancang untuk memfasilitasikan pemrosesan tata bahasa yang membuat parsing menjadi mudah dikerjakan. Di dalam tata bahasa yang umum digunakan manusia, pendekatan praktis, mengidentifikasi aksi target, menyelidiki tiap perintah yang di sampaikan, dan membangkitkan kumpulan dari aturan-aturan.
Komunikasi dengan actor virtual sampai pada dua paradigma: di satu pihak, dilihat dari aplikasi awalnya (game computer), sangat memungkinkan untuk menyadari kemunculan sub-bahasa yang actual. Di lain pihak, batasan pengenalan ucapan (speech recognition) dan parsing membuat sebuah celah antara actor virtual dengan tata-bahasa umum.
4. Keuntungan dan Kerugian NLIDB
4.1 Keuntungan NLIDB
  1.  Tidak ada Bahasa Buatan
Salah satu keuntungan dari NLIDB seharusnya bahwa pengguna tidak diperlukan untuk belajar bahasa komunikasi buatan. bahasa query formal seperti SQL sulit untuk belajar dan menguasai, setidaknya oleh non-komputer-spesialis.
  1.  Sederhana, mudah digunakan
Pertimbangkan database dengan bahasa query atau bentuk tertentu dirancang untuk menampilkan query. Sementara sistem NLIDB hanya membutuhkan input tunggal, bentuk berbasis mungkin berisi beberapa masukan (bidang, kotak scroll, kotak combo, radio tombol, dll) tergantung pada kemampuan formulir. Dalam hal bahasa query, pertanyaan mungkin perlu diungkapkan menggunakan beberapa pernyataan yang mengandung satu atau lebih pertanyaan sub dengan beberapa operasi bersama sebagai konektor. Saat ini semua sistem NLIDB hanya dapat menangani beberapa subset dari bahasa alami dan tidak mudah untuk menentukan subset ini. Bahkan beberapa sistem NLIDB tidak bisa menjawab pertanyaan-pertanyaan tertentu milik subset mereka sendiri. Hal ini tidak terjadi di bahasa formal. Cakupan bahasa formal jelas dan pernyataan yang mengikuti aturan yang diberikan dijamin untuk memberikan jawaban yang sesuai.
  1. Baik untuk Beberapa Pertanyaan
            Telah berpendapat bahwa ada beberapa jenis pertanyaan (mis pertanyaan yang melibatkan negasi, atau kuantifikasi) yang dapat dengan mudah dinyatakan dalam bahasa alami, tapi itu tampaknya sulit (atau setidaknya membosankan) untuk mengekspresikan menggunakan antarmuka grafis atau bentuk berbasis. Misalnya, "Yang departemen tidak memiliki programmer?" (Negasi), atau "Yang perusahaan memasok setiap departemen?" (Universal kuantifikasi), dapat dengan mudah dinyatakan dalam bahasa alami, tetapi mereka akan sulit untuk mengungkapkan dalam banyak grafis atau bentuk- antarmuka berbasis. Pertanyaan seperti di atas dapat, tentu saja, dinyatakan dalam bahasa query database seperti SQL, tapi ekspresi bahasa query database yang kompleks mungkin harus ditulis.
  1.  Toleransi kesalahan
Sebagian besar sistem NLIDB memberikan beberapa toleransi untuk kesalahan tata bahasa ringan, sementara di sistem komputer; sebagian besar waktu, leksikon harus persis sama seperti yang didefinisikan, sintaks harus benar mengikuti aturan-aturan tertentu, dan setiap kesalahan akan menyebabkan input secara otomatis ditolak oleh sistem. Dalam kasus kalimat tidak lengkap, sebagian besar computer sistem tidak memberikan dukungan apapun.
  1.  Mudah Digunakan untuk Beberapa Tabel Database
Pertanyaan yang melibatkan beberapa tabel database seperti "daftar alamat petani yang mendapat bonus lebih besar dari 10.000 rupee untuk tanaman gandum", sulit untuk membentuk di antarmuka pengguna grafis dibandingkan dengan antarmuka bahasa alami


4.2 Kerugian NLIDB
1.  cakupan linguistik tidak jelas
Saat ini semua sistem NLIDB hanya dapat menangani beberapa subset dari bahasa alami dan tidak mudah untuk menentukan subset ini. Bahkan beberapa sistem NLIDB tidak bisa menjawab pertanyaan-pertanyaan tertentu milik subset mereka sendiri. Hal ini tidak terjadi di bahasa formal. Cakupan bahasa formal jelas dan pernyataan yang mengikuti aturan yang diberikan dijamin untuk memberikan jawaban yang sesuai.
  1.  Linguistik vs kegagalan konseptual
Dalam kasus kegagalan sistem NLIDB, sering terjadi bahwa sistem tidak memberikan penjelasan tentang apa yang menyebabkan sistem gagal. Beberapa pengguna mungkin mencoba untuk ulang kata-kata pertanyaan atau hanya meninggalkan pertanyaan yang belum terjawab. Sebagian besar waktu, terserah kepada pengguna untuk menentukan penyebab kesalahan.
  1.  harapan palsu
Orang dapat disesatkan oleh kemampuan sistem ini NLIDB untuk memproses bahasa alami: mereka mungkin menganggap bahwa sistem cerdas .Oleh daripada meminta pertanyaan yang tepat dari database, mereka mungkin tergoda untuk mengajukan pertanyaan yang melibatkan ide-ide yang kompleks, penilaian tertentu, penalaran kemampuan, dll, yang sistem NLIDB tidak bisa diandalkan.


BAB III
PENUTUP

  
 KESIMPULAN
Saya memahami dari makalah diatas bahwa NLIDB (Natural Language Interface to Database) adalah sebuah sistem yang menerjemahkan kalimat bahasa alami ke dalam query database, sehingga dapat memudahkan pengguna dalam memaksimalkan penggunaan database. Bahasa alami ini dapat meningkatkan pengguna dalam melakukan query fleksibel dalam database dan NLIDB dibantu dengan IDBS( Intelligent  Database System )adalah sistem yang mengelola informasi dengan cara alami, membuat informasi yang mudah untuk menyimpan, mengakses dan menggunakannya baik diperuntungkan untuk pembuat ataupun pengguna(user).
SARAN
Saran saya mengenai NLIDB (Natural Language Interface to Database) sudah sangat membantu pengguna(user) dalam menggunakan database tapi dalam NLIDB tidak bisa menjawab pertanyaan-pertanyaan tertentu milik subset mereka sendiri. Dan harus menggunakan bahasa formal yang jelas dan pernyataan yang mengikuti aturan yang diberikan dijamin untuk memberikan jawaban yang sesuai. Diharapkan NLIDB dapat merubah agar bisa menjawab pertanyaan tertentu dalam subset-subset dan memberikan jawaban dengan bahasa yang sesuai dengan kebutuhannya.

REFERENSI
[1]. Bertino, B. Catania, G.P. Zarri, “Intelligent database systems”, Reading, Addsion Wesley Professional, 2001.

[2]. Kamran Parsaye, Mark Chignell, Setrag Khoshafian and Harry Wong, “Intelligent databases-object-oriented, deductive hypermedia technologies”, New York, John Wiley& Sons, 1989.

[3]. Androutsopoulos, G.D. Ritchie, and P. Thanisch, Natural Language Interfaces to Databases - An Introduction, Journal of Natural Language Engineering 1 Part 1 (1995), 29–81
[4]. Charniak E. 1993, “Statistical Language Learning”, MIT Press.
[5]. Church K., Mercer R. 1993, “Introduction to the special issue on computational linguistics using large corpora”,
      Computational Linguistics,19 (1), pp. 1-24.
[6]. Miikkulainen R. 1993, “Subsymbolic Natural Language Processing: An Integrated Model of Scripts, Lexicon, and Memory”, MIT Press, Cambridge, MA.

[7]. Marcus M., Santorini B., Marcinkiewicz M. 1993,” Building a large annotated corpus of English: The Penn Treebank”, Computational Linguistics, 19 (2), pp. 313-330.
[8]. McCarthy J, Lehnert W ,1995, “Using decision trees for coreference resolution”, Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence, pp. 1050-1055.