Linguistik pengiraan
- Rencana ini adalah mengenai bidang sains. Untuk jurnal, sila lihat Linguistik Pengiraan (jurnal).
Linguistik pengiraan ialah bidang antara disiplin yang berkait dengan pemodelan statistik dan logik bagi bahasa sejadi dari segi pengiraan. Pemodelan ini tidak terhad kepada mana-mana bidang linguistik yang khusus. Ahli-ahli linguistik pengiraan pada suatu ketika hanya terdiri daripada ahli-ahli sains komputer yang mengkhususkan dalam penggunaan komputer untuk pemprosesan bahasa sejadi. Penyelidikan yang baru-baru ini telah menunjukkan bahawa bahasa adalah lebih rumit daripada yang dianggap dahulu dan oleh itu, pasukan-pasukan kerja linguistik pengiraan kini kekadang bersifat antara disiplin, dan melibatkan ahli-ahli linguistik (yang dilatih secara khusus dalam bidang linguistik). Bidang linguistik pengiraan kini terdiri daripada ahli-ahli linguistik, sains komputer, kecerdasan buatan, psikologi kognitif, dan logik, antara lain.
Asal
suntingLinguistik pengiraan sebagai satu bidang mendahului kecerdasan buatan, satu bidang yang ia sering digolongkan. Ia berasal daripada usaha-usaha di Amerika Syarikat pada dekad 1950-an untuk menterjemahkan teks bahasa-bahasa lain ke dalam bahasa Inggeris, khususnya jurnal-jurnal saintifik Rusia, melalui komputer. Oleh sebab komputer mempunyai keupayaan untuk membuat matematik yang rumit dengan lebih cepat dan tepat berbanding dengan manusia, adalah dianggap bahawa komputer tidak lama lagi akan mencapai keupayaan yang sama untuk memproses bahasa apabila perincian-perincian teknikal dapat diatasi.
Apabila penterjemahan mesin (juga dikenali sebagai "penterjemahan mekanik") gagal untuk menghasilkan terjemahan yang tepat, masalah itu telah diakui jauh lebih rumit daripada apa yang dianggap sebelum itu. Linguistik pengiraan telah dilahirkan sebagai nama untuk sebuah bidang kajian yang baru yang menumpukan pada perkembangan algoritma dan perisian untuk memproses data-data bahasa dengan cerdas. Ketika kecerdasan buatan muncul pada dekad 1960-an, bidang lingusitik pengiraan menjadi satu subbahagian kecerdasan buatan yang berkenaan dengan pemahaman peringkat manusia dan penghasilan bahasa-bahasa sejadi.
Supaya dapat menterjemahkan sebuah bahasa ke dalam bahasa yang lain, pemahaman sintaksis kedua-dua bahasa, sekurang-kurangnya pada tahap morfologi (sintaksis kata) dan ayat-ayat lengkap, telah diperhatikan. Untuk memahami sintaksis, seseorang harus juga memahami semantik perbendaharaan kata, serta juga sedikit sebanyak tentang pragmatik yang berkenaan dengan bagaimana bahasa digunakan. Oleh itu, apa yang bermula sebagai suatu usaha untuk menterjemahkan bahasa telah berkembang menjadi sebuah disiplin yang menumpukan pada pemahaman bagaimana mewakili dan memproses bahasa-bahasa sejadi melalui komputer.
Subbidang
suntingLinguistik pengiraan boleh dibahagikan kepada bidang-bidang utama, bergantung kepada perantara yang digunakan untuk bahasa yang diproses (iaitu pertuturan atau teks), dan sebaik sahaja tugas itu dilaksanakan, adakah bahasa itu akan dianalisis (penghuraian) atau dicipta (penjanaan).
Pengecaman pertuturan dan sintesis pertuturan adalah berkenaan dengan bagaimana bahasa pertuturan dapat difahami atau dicipta melalui komputer. Penghuraian dan penjanaan merupakan subbahagian linguistik pengiraan yang masing-masing melibatkan pemecahan bahasa dan penggabungannya semula. Penterjemahan mesin masih merupakan satu subbahagian linguistik pengiraan yang berkenaan dengan penterjemahan komputer antara bahasa-bahasa.
Sesetengah bidang penyelidikan yang dikaji oleh ahli-ahi linguistik pengiraan termasuk:
- Linguistik korpus dibantu komputer
- Reka bentuk penghurai untuk bahasa-bahasa sejadi
- Reka bentuk teg seperti teg POS (teg golongan kata)
- Pentakrifan logik-logik yang khusus, seperti logik untuk Pemprosesan bahasa sejadi (NLP)
- Penyelidikan tentang hubungan antara bahasa-bahasa rasmi dan sejadi secara am
- Penterjemahan mesin, umpamanya oleh komputer penterjemahan.
Persatuan Linguistik Pengiraan mentakrifkan linguistik pengiraan sebagai:
- ...kajian saintifik bahasa dari segi pengiraan. Ahli-ahli linguistik pengiraan berminat untuk membekalkan model-model pengiraan untuk berbagai-bagai jenis fenomena linguistik.