Untuk bisa melakukan text mining ada beberapa tahapan yang harus dilakukan. Mengetahui bagaimana morphologi Bahasa Indonesia adalah adalah satu yang harus diketahui.
Menurut tatabahasabm.tripod.com bahwa Bahasa Indonesia serupa dengan Bahasa Melayu.Bahasa Indonesia termasuk bahasa yang lebih rumit dari Bahasa Inggris. Sampai saat ini belum adanya unsur-unsur baku dalam rangka persiapan melakukan teks mining Bahasa Indonesia, berbeda dengan Bahasa Inggris yang sudah memiliki pakem yang baku sehingga proses mining menjadi lebih mudah.