Wow! Intelejensia Buatan Melacak Bahasa Yang Hilang, Mungkinkah?

Wow! Intelejensia Buatan Melacak Bahasa Yang Hilang, Mungkinkah?

LAKBAN- Apa istimewanya tulisan? Lambang-lambang bunyi itu ternyata bisa menajdi jalan melacak bahasa yang hilang. Sejak penemuan menulis beberapa ribu tahun yang lalu, manusia telah menghasilkan banyak sekali skrip yang mengubah suara fonetis bahasa yang diucapkan menjadi sesuatu yang visual.

Sebagian besar bahasa tertulis ini telah diuraikan, dari hieroglif Mesir ke prasasti Maya ke tulisan Cina kuno. Para ahli bahasa kuno mampu membuka kode-kode yang tersimpan dan menguarai maksud dari berbagai prasasti.

Dalam beberapa kasus, ahli bahasa hanya beruntung ketika memecahkan kode bahasa yang hilang – dalam kasus Batu Rosetta, misalnya. Kalau di Indonesia kita banyak menemukan huruf Pallawa, Jawa Kuno dan sebagainya. Sementara bahasa yang digunakan adalah sanskrit atau sansekerta.   

Di waktu lain, mereka telah menghabiskan waktu bertahun-tahun menguraikan pola-pola halus dalam pengaturan huruf dalam kata-kata dan kata-kata dalam teks untuk membuka kunci. Pola yang bisa dipelajari dan dirumuskan serta dibuat kodingnya.

Tetapi beberapa bahasa yang hilang masih menyulitkan para epigraf, mereka yang mempelajari prasasti kuno. Sebagai contoh, tulisan-tulisan Olmec dan Zapotec masih merupakan misteri, seperti halnya naskah kuno Proto-Elam dari Mesopotamia.

Bahasa undeciphered yang paling menonjol mungkin adalah tulisan-tulisan peradaban Lembah Indus, yang telah melihat banyak upaya decoding, belum ada yang berhasil.

Saat ini, sejarawan yang frustrasi memiliki alat lain yang dapat mereka gunakan: kecerdasan buatan. Kemajuan baru, baik dalam komputasi maupun linguistik, memungkinkan algoritma untuk memulai pengodean bahasa kuno.

Dorongan terbaru datang dari tim peneliti di Laboratorium Ilmu Pengetahuan dan Kecerdasan Buatan MIT serta Google Brain, sebuah proyek kecerdasan buatan. Mereka telah menyusun algoritme yang dapat mulai mencocokkan kata-kata dari bahasa yang tidak dikenal dengan kata-kata yang terkait, atau kata serumpun, dalam bahasa yang memiliki akar yang sama.

Meskipun algoritme, yang diterbitkan pada server pracetak arXiv, belum menangani bahasa yang benar-benar tidak dapat diuraikan, ini merupakan langkah maju yang menjanjikan.

Mengambil bahasa kuno dengan AI memang menimbulkan beberapa masalah unik. Algoritma pembelajaran mesin biasanya dilatih tentang kumpulan data besar yang mereka gali untuk belajar melalui asosiasi. Sebagian besar skrip kuno hanya memiliki jumlah sampel terbatas, sehingga sulit untuk memberi makan algoritma data yang cukup untuk dipelajari.