Nama : Raditya Priyastama
NIM : A11.2018.10900
Kelompok : A11.4708
Sistem Temu Kembali
1. Text Preprocessing dan Kombinasi Pada Peringkas Dokumen Otomatis Teks Berbahasa Indonesia
Judul :
Teks Preprocessing dan kombinasi pada peringkas dokumen otomatis teks berbahasa Indonesia
Penulis :
Hadiyatun Najjichah, Abdul Syukur, Hendro Subagyo
Jurnal :
Jurnal Teknologi Informasi, Volume 15 Nomor 1, Januari 2019, ISSN 1907-3380
Review Jurnal
Rumusan penelitian ini adalah signifikansi kombinasi lima teknik teks processing, Segmentation, Tokenization, Stopword removal, Stemming dan N-Gram pada peringkasan dokumen teks. Penelitian ini meneliti pengaruh berbagai kombinasi atas ke lima teknik teks preprocessing yang umum digunakan diatas terhadap tingkat akurasi dan waktu komputasi peringkas otomatis berbasis fitur.
Metode Penelitian
- Pengmpulan data
Pengumpulan data awal dimulai dengan pengambilan dataset yang berasal dari data penelitian ilmiah.
- Tahap Preprocessing
Preprocessing adalah suatu tahapan mengubah teks asli sebagai masukan dan menerapkan beberapa rutinitas dasar untuk mengubah atau menghilangkan unsure tekstual yang tidak berguna dalam pengolahan lebih lanjut.
- Experimen dan Pengujian Model
Untuk pengujian prototipe dalam penelitian ini menggunakan Lucene sebagai Java library. Lucene menyediakan fungsi untuk Stopword removal dan Stemming untuk tahapan preprocessing.Lucene juga menyediakan perhitungan F-Measure untuk akurasi.
- Evaluasi dan Validasi hasil
Dalam penelitian ini digunakan F-Measure Untuk mengukur kinerja dari Summarization. F-Measure diperoleh dengan pengukuran recall dan precision. Recall adalah rasio dokumen yang relevan yang terambil dengan jumlah seluruh dokumen dalam koleksi dokumen, sedangkan precision adalah rasio jumlah dokumen relevan terambil dengan seluruh jumlah dokumen terambil. Nilai interval recall dan precision berada antara 0 dan 121.
Berdasar hasil percobaan disimpulkan bahwa kombinasi tahap teks preprocessing memberikan pengarus pada peringkas dokumen otomatis teks, pengaruh ini dapat dilihat pada tingkat F-Measure yang berbeda pada masing-masing tahapan teks preprocessing.
2. Temu Balik Informasi Pada Dokumen Teks berbahasa Indonesia Dengan Metode Vector Space Retrieval Model
Temu Balik Informasi Pada Dokumen Teks berbahasa Indonesia Dengan Metode Vector Space Retrieval Model
Penulis :
Giat Karyono, Fandy Setyo Utomo
Jurnal :
seminar Nasional Teknologi Informasi & Komunikasi Terapan 2012 (Semantik 2012)
Review Jurnal
Ketidak cocokan suatu hasil dokumen yang kita cari pada msin pencarian, maka untuk mencari dokumen teks tersebut menggunakan vector space retrieval model. Tujuan penelitian ini untuk menyediakan solusi pada mesin pencari agar dapat menyediakan informasi dokumen pada database yang tepat menggunakan kata kunci tertentu.
Metode Penelitian
- Tahapan Tokenizing
- Filtering
- Stemming
- Hasil indexing
- Pencarian
Sebagai mesin pencarian untuk pencarian dokumen teks berbahas indonesia dapat memudahakan untuk menemukan koleksi dokumen berdasar kebutuhan pengguna.
Tidak ada komentar:
Posting Komentar