Go

Bagaimana Cara Menyusun Korpora Untuk Tujuan Khusus

Ditulis oleh Aan Setyawan
Dipublikasikan pada 25 Mar 18 22:40 UTC
Share :

Ada dua tren dalam menyusun sebuah korpus, yaitu membuat korpus dengan ukuran sangat besar yang disebut juga sebagai mega-corpora atau membuat korpus khusus (specialised corpus). Korpus dengan ukuran yang sangat besar dan korpus khusus yang biasanya berukuran kecil memiliki kekurangan dan kelebihan masing-masing. Sinclair berpendapat korpus dengan ukuran kecil menciptakan sebuah limitasi karena terbatasnya jumlah sehingga ada kemungkinan suatu kata atau frasa tidak muncul. Karena adanya limitasi tersebut, korpus dengan ukuran kecil atau yang terspesialisasi memang lebih baik tidak digunakan untuk penelitian leksikon atau frasa. Namun, jenis korpus ini dapat digunakan untuk penelitian yang berkaitan dengan gramatikal karena elemen gramatikal, seperti pronomina, preposisi, atau modal sifatnya cenderung sering muncul.

Salah satu kekurangan dari korpus dengan ukuran yang sangat besar adalah jumlah data yang tidak terbayangkan sehingga peneliti perlu bekerja lagi dalam sub-unit hasil yang lebih kecil. Selain itu, untuk penelitian dengan tujuan tertentu, korpus dengan ukuran yang besar memberikan hasil yang tidak spesifik. Korpus yang dibuat dengan tujuan tertentu dan ukuran lebih kecil dapat menghubungkan data dengan konteksnya. Korpus berukuran kecil biasanya dibuat dengan tujuan merefleksikan fitur kontekstual dari data, seperti informasi tentang latar (setting), peserta, dan tujuan komunikasi. Data kuantitatif yang didapat dari korpus tersebut dapat diseimbangkan dengan penemuan kualitatif.

Dalam menyusun sebuah korpus, yang paling awal harus dipikirkan adalah ukuran dari korpus tersebut. Begitu juga dalam menyusun korpus dengan ukuran kecil dan terspesialisasi. Pertanyaan yang muncul adalah seberapa kecil dan seberapa khusus korpus tersebut disusun. Untuk menentukan hal ini, kita harus kembali pada tujuan awal penelitian kita untuk menggunakan korpus tersebut. Hal yang terpenting dalam menyusun sebuah korpus sebenarnya bukan jumlah, tetapi desain dan nilai representatif dari korpus tersebut. Ada tujuh parameter yang dapat dipertimbangkan dalam menyusun korpus khusus, yaitu tujuan spesifik, kontekstualisasi, genre, tipe teks atau wacana, topik, dan variasi bahasa. Korpus berukuran kecil biasanya menampilakn genre atau register tertentu dibandingkan korpus berukuran besar.

Seperti yang telah disebutkan di atas, representatif adalah salah satu poin utama yang harus dipertimbangkan dalam membuat korpus. Korpus dikatakan representatif apabila

sampelnya telah mencakup semua variabilitas dalam sebuah populasi. Biber mengidentifikasi ada dua variabilitas, yaitu situasional dan linguistik. Variabilitas situasional mengacu pada jangkauan register dan genre dalam target populasi. Artinya, situasi teks atau tuturan harus dimasukkan ke dalam korpus. Variabilitas linguistik merujuk pada distribusi linguistik yang ditemukan dalam populasi. Sampel yang terdapat dalam sebuah korpus harus memenuhi kedua variabilitas tersebut. Untuk variabilitas situasional, sampel mencakup semua situasi khas dan tidak condong hanya pada situasi tertentu karena tujuan korpus adalah memberikan pandangan secara umum. Sebuah korpus dapat dikatakan tidak representatif ketika hasilnya dalam beberapa hal mencondong ke arah tertentu. Variabilitas situasional ini perlu representatif karena nilai representatif variabilitas linguistik akan bergantung pada variabilitas situasional dan jumlah kata per teks sampel juga jumlah sampel per register atau genre. Biber menemukan bahwa fitur linguistik, seperti pronomina, preposisi, atau past tense kemunculannya relatif stabil pada sampel 1000 kata. Lalu kemunculan gejala linguistik cukup stabil pada lima sampai sepuluh sampel teks per genre atau register.

Salah satu kriteria dalam merancang korpus adalah penentuan jumlah kata yang digunakan dalam sebuah sampel. Hal tersebut sebenarnya bukan suatu yang mutlak untuk dipenuhi. Pada data berupa tuturan atau teks seperti email, setiap sampel ada kemungkinan tidak akan mencapai 1000 kata sehingga akan lebih baik menggunakan data dengan lengkap dibandingkan mengontrol jumlah kata yang digunakan sebagai sampel. Kaidah perancangan korpus mempertimbangkan kepraktisan berkaitan dengan keadaan data yang dikumpulkan dan bagaimana limitasi dapat diatasi. Setiap usaha yang dilakukan memang harus membuat korpus yang dibuat menjadi representatif, tetapi nilai representatif tersebut kemungkinan tidak selalu bisa maksimal. Namun, kembali lagi pada prinsip dasar perancangan korpus, korpus harus dirancang sesuai dengan tujuan penelitian. Korpus berukuran besar akan cocok untuk penelitian fenomena linguistik umum, sedakan korpus khusus yang berukuran kecil didesain untuk menjawab pertanyaan penelitian yang spesifik.

Dalam korpus khusus, informasi kontekstual sangat berguna karena dapat digunakan untuk interpretasi data dan dapat menjadi landasan untuk melakukan analisis kualitatif terhadap hasil. Metode observasi etnografi berupa pencatatan dan wawancara biasanya tidak berkaitan dengan kajian korpus, tetapi adanya catatan dan wawancara memberikan informasi latar belakang yang berguna pada data yang tidak ditranskripsi. Informasi latar belakang dapat berupa kelahiran, gender, pekerjaan, pendidikan, bahasa ibu, hubungan peserta tutur, topik, dan lain sebagainya. Informasi ini dapat ditulis di awal setiap teks. Informasi latar belakang ini juga menjadi bagian yang tidak terpisahkan dari rancangan korpus. Adanya informasi detail

mengenai penutur atau penulis, tujuan interaksi atau teks, dan latar tempat diproduksi membuat

praktik linguistik lebih mudah dihubungkan pada variabel kontekstual yang spesifik.

Korpus dapat disusun menggunakan teks atau tuturan yang dikumpulkan melalui rekaman. Korpus lisan berukuran kecil biasanya digunakan untuk menganalisis jeda, interupsi, ujaran yang tidak selesai, dan bahkan fitur interaksi non-linguistik, seperti tertawa. Salah satu langkah yang harus dilakukan dalam merancang korpus lisan adalah mentranskripsi data tuturan yang digunakan dalam korpus. Tujuan dari penelitian sangat menentukan sedetail apa transkripsi yang perlu dilakukan. Jika penelitian yang dilakukan tidak akan membahas tentang intonasi, fitur prosodi tidak perlu ditambahkan dalam mentranskripsi data. Korpus disusun dengan menggunakan file berupa plain text format sehingga kode konvensi yang digunakan dalam transkripsi harus sesuai dengan format tersebut. Kode yang digunakan dapat berupakan penggunaan huruf kapital untuk menyatakan penekanan dan tanda tanya untuk menandakan adanya penaikan intonasi, seperti contoh transkripsi yang digunakan Viena Oxford Corpus of Internatioanl English (VOICE) berikut.

S3: toMORow we have to work on the presentation already S1: that's what my next er slide? does

Korpus khusus yang berukuran kecil memang tidak bisa digunakan untuk semua jenis penelitian, tetapi jenis korpus ini dapat memberikan pandangan yang berguna bagi penggunaan bahasa pada area tertentu. Adanya informasi kontekstual dalam jenis korpus ini membantu memperkuat hasil yang ditemukan dalam korpus dengan menggunakan analisis kualitatif. Selain itu, informasi kontekstual juga dapat membantu memberikan pandangan mengapa suatu fenomena terjadi, misalnya menentukan faktor kontekstual yang mempengaruhi pemunculan sinonim. Cambridge and Nottingham Business English Corpuss (CANBEC) merupakan salah satu contoh korpus khusus yang bertemakan bisnis. Korpus ini juga menyediakan informasi kontekstual berupa topik dan tujuan rapat dan hubungan antara peserta. Penggunaan kata bersinonim issue dan problem yang ditemukan dalam korpus tersebut dapat dijelaskan frekuensi kemunculannya dengan menggunakan informasi konteks yang ada. Issue akan muncul pada rapat antara bagian sumber daya manusia dan pemasaran dan problem muncul pada rapat yang bersifat teknis antara manajer dan stafnya. Dari fakta tersebut, dapat dijelaskan lebih jauh lagi kaitannya dengan pragmatik.

Artikel ini ditulis oleh Khairani Fajrianisa, Mahasiswa Pascasarjana Linguistik FIB UI 2017

Artikel Lainnya

Dari Mana Asal Usul Proto Austronesia di Mana Bahasa Indonesia ada Di Dalamnya?
Apa Perbedaan Fonem dan Alofon?
Manakah yang Benar: Tampak atau Nampak?
Ilmu Bahasa di antara Ilmu Pengetahuan Sosial dan Ilmu Pengetahuan Alam: Batasan dan Relasinya
Bentuk dan Fungsi Afiks/Imbuhan Tidak Baku dalam Bahasa Indonesia Ragam Informal
©2017 BelajarBahasa.ID
Developed by Kodelokus Cipta Aplikasi