BAB PENDAHULUAN
1.1. Latar Belakang Tugas akhir
merupakan kewajiban yang
harus diselesaikan setiap
mahasiswa yang ingin mendapatkan status kelulusan. Dalam
teknik penulisan tugas akhir salah satu ciri utamanya adalah keasliannya. Setiap karya
memiliki kekhasan penulisannya masingmasing
tergantung karakter dari
setiap penulis. Keaslian
suatu karya dapat ditunjukkan pula
dengan adanya copyright
dari pemilik tulisan
itu sendiri.
(Sonneborn, 2011) Dari penelitian
yang dilakukan oleh
Andrew Thompsett dan Jatinder
Ahluwalia (2010)
ada sekitar 89%
mahasiswa yang setuju
dan mengerti arti
dari plagiarisme dalam
dunia pendidikan, dan
menyarankan agar materi
tentang hal itu dijelaskan
pada awal perkuliahan. Tetapi sekitar 65% mengaku bahwa mereka merasa bingung dengan pengertian plagiat, 59%
diantaranya menyatakan bahwa mereka tidak diberi
tutorial yang cukup
untuk menghindari tindak
plagiat dalam menyelesaikan tugas mereka.
Kerugian dari
melakukan tindak plagiat
adalah dapat mematikan
kreativitas mahasiswa dalam
berkarya. Mereka juga
akan dikenakan sanksi/hukuman berupa peringatan dan pemberhentian secara tidak
hormat atas status kemahasiswaannya.
Banyak kendala
yang perlu diperhatikan
untuk melakukan pendeteksian kesamaan
yang mengacu pada
plagiarisme dari sebuah
karya ilmiah yang
berupa dokumen teks, seperti banyaknya dokumen yang sudah diartikan ke
berbagai bahasa dan dokumen
asli bersifat nonelektronik
(Henrieta Telepovska &
Frantisek Gajdos, 2010).
Namun tidak menutup
kemungkinan dewasa ini
sudah banyak karya
ilmiah yang diterbitkan dalam
bentuk elektronik sehingga proses
pendeteksian lebih mudah dan akurat.
Proses
pendeteksian dapat dilakukan
dengan mengurai isi
dokumen menjadi string
yang memiliki nilai dan dilakukan pencocokan dengan dokumen yang
tersedia di dalam database. Beberapa penelitian sebelumnya,
pendeteksian dilakukan dengan metode Latent
Semantic Analysis (Alfarisi,
2011), algoritma Rabin-Karp
(Nugroho, 2011), algoritma Smith-Waterman (Novanta, 2009), konsep Similarity
dan algoritma Rabin-Karp (Salmuasih, 2013).
Dalam awal
pendeteksian diperlukan proses
stemming. Melakukan proses stemming
berarti menghilangkan akhiran
dari suatu kata.
Proses ini sudah
sering dilakukan dalam
proses pencarian teks,
aplikasi kamus, pengklasifikasian subjek dokumen
perkantoran, dan mesin
pencari (Asian, 2005).
Berbeda dengan proses stemming
peeada bahasa Inggris,
proses stemming pada bahasa
Indonesia lebih sulit dilakukan karena
bahasa Indonesia mengenal
imbuhan awalan (prefixes),
sisipan (infixes), akhiran
(suffixes), dan kombinasi awalan dan akhiran (confixes).
Penelitian proses
stemming pada bahasa
Indonesia telah dilakukan sebelumnya.
Ada beberapa algoritma
yang digunakan untuk
melakukan stemming pada dokumen
teks berbahasa Indonesia, seperti, algoritma Nazief dan Adriani (1996), algoritma
Ahmad, Yussof, dan
Sembok (1996), algoritma
Vega (2001), algoritma Ariffin
dan Setiono (2002),
algoritma Confix Stripping
oleh Jelita Asian, pengembangan
algoritma Nazief dan
Adriani (2007), algoritma
Enhanced Confix Stripping Stemmer (2010).
Dalam penelitian yang akan dilakukan, algoritma Enhanced Confix Stripping Stemmer
dipilih untuk proses
penguraian teks dari
imbuhannya. Untuk menghitung nilai
kesamaan teks dengan
dokumen dalam database
digunakan algoritma Winnowing
dengan teknik rolling
hash. Algoritma Winnowing
membuang seluruh pemakaian karakter yang tidak relevan,
seperti, tanda baca, spasi, angka, dan karakter lainnya.
Hanya karakter berupa
huruf yang akan
diproses ke tahap
berikutnya (Purwitasari et al,
2010).
1.2. Rumusan Masalah Maraknya tindakan
plagiarisme di dunia
perkuliahan, baik plagiarisme
dalam hal penyelesaian
tugas maupun penynan
karya ilmiah dapat
mengurangi bahkan mematikan
kreativitas seseorang dalam
berkarya. Berdasarkan hal
tersebut, penulis dapat
merumuskan masalahnya, yaitu
bagaimana mendeteksi kesamaan
pada dokumen teks
sehingga didapatkan perbandingan
antara jurnal yang
diuji user dan jurnal
yang terdeteksi.
1.3. Batasan Masalah Adapun
batasan masalah dalam penelitian ini adalah: 1.
Dokumen teks bahasa
Indonesia yang digunakan
dengan format Portable Document File (.pdf).
2. Portable Document File yang terkunci
(secured) tidak dapat
di-parsing dengan aplikasi ini.
3. Sumber „kata dasar‟ dari
aplikasi ini diambil dari KBBI online.
4. Sumber dokumen karya ilmiah merupakan jurnal mahasiswa (data akses: repositori ).
5. Nilai gram
dan window pada perhitungan algoritma Winnowing
ditentukan oleh penulis.
1.4. Tujuan Penelitian Tujuan
dari penelitian tugas akhir ini adalah mendeteksi kesamaan pada dokumen teks dengan
mengombinasikan algoritma Enhanced
Confix Stripping Stemmer
dan algoritma Winnowing sehingga
memperoleh tingkat akurasi yang lebih baik.
1.5. Manfaat Penelitian Manfaat
dari penelitian tugas akhir ini, antara lain: 1. Mengurangi
adanya tindak plagiarisme
pada mahasiswa dalam
penyelesaian karya ilmiah.
2. Memudahkan
dosen untuk mengecek
tingkat plagiarisme yang
dilakukan mahasiswa dalam
menyelesaikan tugas akhirnya.
1.6. Metodologi Penelitian Metodologi
yang digunakan penulis adalah: 1. Studi Literatur Pada tahap
ini, penulis mencari
metode yang berbeda
dari penelitian sebelumnya
dan memahaminya, serta
mencari referensi yang
berkenaan dengan proses stemming
pada dokumen teks, berupa pdf.
2. Desain Sistem Pada tahap ini, penulis membuat flowchart system, use case, dan
arsitektur umum dari sistem yang
akan dibuat.
3. Pembuatan Sistem Pada tahap ini, penulis mulai mengodekan sistem yang akan dibuat dengan bahasa pemrograman PHP dan database MySQL.
4. Pengujian Sistem Pada tahap ini, penulis
melakukan pengujian dari sistem yang telah dibuat.
Pengujian akan menampilkan persentase tingkat plagiat dari dokumen yang di-input
oleh user dan
menampilkan dokumen yang
kemungkinan besar sama dengan dokumen yang dimasukkan oleh user
tersebut.
6. Dokumentasi Pada tahap ini, penulis menyn
laporan terhadap sistem yang telah dibuat.
Skripsi Teknologi Informasi:Pendeteksian Kesamaan Pada Dokumen Teks Menggunakan Kombinasi Algoritma Enhanced Confix Stripping Dan Algoritma Winnowing
Downloads Versi PDF >>>>>>>Klik Disini
Bab I
|
Downloads
| |
Bab II
|
Downloads
| |
Bab III - V
|
Downloads
| |
Daftar Pustaka
|
Downloads
| |
Lampiran
|
Downloads
|