Minggu, 23 September 2012

Text Mining : Morphologi Bahasa Indonesia

Untuk bisa melakukan text mining ada beberapa tahapan yang harus dilakukan. Mengetahui bagaimana morphologi Bahasa Indonesia adalah adalah satu yang harus diketahui.
Menurut tatabahasabm.tripod.com bahwa Bahasa Indonesia serupa dengan Bahasa Melayu.
Bahasa Indonesia termasuk bahasa yang lebih rumit dari Bahasa Inggris. Sampai saat ini belum adanya unsur-unsur baku dalam rangka persiapan melakukan teks mining Bahasa Indonesia, berbeda dengan Bahasa Inggris yang sudah memiliki pakem yang baku sehingga proses mining menjadi lebih mudah.

Inflectional

Bentuk paling sederhana dari sebuah kata. Sangat dipengaruhi oleh SUFFIXES. Penambahan Suffixes tidak pernah mengubah spelling dan arti dari rootnya.

SUFFIXES Tipe #1 : -lah, -kah, -pun, -tah ? untuk empashing/penyangat arti/membuat lebih jelas (particle)
SUFFIXES Tipe #2 : -ku, -mu, nya ? untuk sebagai possesive pronoun (kata ganti kepemilikan)

Jika 2 tipe suffixes tadi muncul bersamaan, maka SUFFIXES 2 selalu di depan SUFFIXES 1.

INFLECTIONAL = root + SUFFIXES#2 | root + SUFFICES#1 | root + SUFFIXES#2 +  SUFFICES#1


Derivational

PREFFIXES + SUFFIXES + CONFFIXES

Menurut HG Tarigan, Pengajaran Morfologi, Angkasa Bandung 1995, PREFFIXES yang paling sering digunakan adalah : ber-, di-, ke-, meng-, peng-, per-, ter-

Pada derivational ini, spelling bisa berubah tergantung kata bentukannya.

Preffixes yang spesial yang bisa mengubah kata rootnya :
meng-, peng-, per-, ter-  (contoh : meng+sapu = menyapu ? huruf “s” menghilang di root)
Penggunaan preffixes ini ada aturannya, tergantung huruf depan root yang ditambah

Suffixes tidak pernah mengganti spelling : -i, -kan, -an

Kombinasi dari penggunaan Preffixes dan Suffixes disebut sebagai CONFFIXES.


Illegal Conffixes
Double Preffixes


DERIVATIOANL =     PREFFIXED (preffixes + root) |
            SUFFIXED (root + suffixes ) |
            CONFFIXES (preffixes + root + suffixes)
            DOUBLE PREFFIXES (preffixes1 + preffixes2 | preffixes+conffixes |
                        preffixes1 + preffixes2 + suffixes )


KESIMPULAN :
Morphologi Bahasa Indonesia =
PREFFIXES 1 + PREFFIXES 2 + SUFFIXES + POSSESIVE PRONOUN + PARTICLES


Tidak ada komentar:

Posting Komentar