Skripsi Teknologi Informasi:Pendeteksian Kesamaan Pada Dokumen Teks Menggunakan Kombinasi Algoritma Enhanced Confix Stripping Dan Algoritma Winnowing

BAB PENDAHULUAN

1.1. Latar Belakang Tugas akhir merupakan kewajiban yang harus diselesaikan setiap mahasiswa yang ingin mendapatkan status kelulusan. Dalam teknik penulisan tugas akhir salah satu ciri utamanya adalah keasliannya. Setiap karya memiliki kekhasan penulisannya masingmasing tergantung karakter dari setiap penulis. Keaslian suatu karya dapat ditunjukkan pula dengan adanya copyright dari pemilik tulisan itu sendiri.

(Sonneborn, 2011) Dari penelitian yang dilakukan oleh Andrew Thompsett dan Jatinder Ahluwalia (2010) ada sekitar 89% mahasiswa yang setuju dan mengerti arti dari plagiarisme dalam dunia pendidikan, dan menyarankan agar materi tentang hal itu dijelaskan pada awal perkuliahan. Tetapi sekitar 65% mengaku bahwa mereka merasa bingung dengan pengertian plagiat, 59% diantaranya menyatakan bahwa mereka tidak diberi tutorial yang cukup untuk menghindari tindak plagiat dalam menyelesaikan tugas mereka.

Kerugian dari melakukan tindak plagiat adalah dapat mematikan kreativitas mahasiswa dalam berkarya. Mereka juga akan dikenakan sanksi/hukuman berupa peringatan dan pemberhentian secara tidak hormat atas status kemahasiswaannya.

Banyak kendala yang perlu diperhatikan untuk melakukan pendeteksian kesamaan yang mengacu pada plagiarisme dari sebuah karya ilmiah yang berupa dokumen teks, seperti banyaknya dokumen yang sudah diartikan ke berbagai bahasa dan dokumen asli bersifat nonelektronik (Henrieta Telepovska & Frantisek Gajdos, 2010). Namun tidak menutup kemungkinan dewasa ini sudah banyak karya ilmiah yang diterbitkan dalam bentuk elektronik sehingga proses pendeteksian lebih mudah dan akurat.

Proses pendeteksian dapat dilakukan dengan mengurai isi dokumen menjadi string yang memiliki nilai dan dilakukan pencocokan dengan dokumen yang tersedia di dalam database. Beberapa penelitian sebelumnya, pendeteksian dilakukan dengan metode Latent Semantic Analysis (Alfarisi, 2011), algoritma Rabin-Karp (Nugroho, 2011), algoritma Smith-Waterman (Novanta, 2009), konsep Similarity dan algoritma Rabin-Karp (Salmuasih, 2013).

Dalam awal pendeteksian diperlukan proses stemming. Melakukan proses stemming berarti menghilangkan akhiran dari suatu kata. Proses ini sudah sering dilakukan dalam proses pencarian teks, aplikasi kamus, pengklasifikasian subjek dokumen perkantoran, dan mesin pencari (Asian, 2005). Berbeda dengan proses stemming peeada bahasa Inggris, proses stemming pada bahasa Indonesia lebih sulit dilakukan karena bahasa Indonesia mengenal imbuhan awalan (prefixes), sisipan (infixes), akhiran (suffixes), dan kombinasi awalan dan akhiran (confixes).

Penelitian proses stemming pada bahasa Indonesia telah dilakukan sebelumnya. Ada beberapa algoritma yang digunakan untuk melakukan stemming pada dokumen teks berbahasa Indonesia, seperti, algoritma Nazief dan Adriani (1996), algoritma Ahmad, Yussof, dan Sembok (1996), algoritma Vega (2001), algoritma Ariffin dan Setiono (2002), algoritma Confix Stripping oleh Jelita Asian, pengembangan algoritma Nazief dan Adriani (2007), algoritma Enhanced Confix Stripping Stemmer (2010).

Dalam penelitian yang akan dilakukan, algoritma Enhanced Confix Stripping Stemmer dipilih untuk proses penguraian teks dari imbuhannya. Untuk menghitung nilai kesamaan teks dengan dokumen dalam database digunakan algoritma Winnowing dengan teknik rolling hash. Algoritma Winnowing membuang seluruh pemakaian karakter yang tidak relevan, seperti, tanda baca, spasi, angka, dan karakter lainnya. Hanya karakter berupa huruf yang akan diproses ke tahap berikutnya (Purwitasari et al, 2010).

1.2. Rumusan Masalah Maraknya tindakan plagiarisme di dunia perkuliahan, baik plagiarisme dalam hal penyelesaian tugas maupun penynan karya ilmiah dapat mengurangi bahkan mematikan kreativitas seseorang dalam berkarya. Berdasarkan hal tersebut, penulis dapat merumuskan masalahnya, yaitu bagaimana mendeteksi kesamaan pada dokumen teks sehingga didapatkan perbandingan antara jurnal yang diuji user dan jurnal yang terdeteksi.

1.3. Batasan Masalah Adapun batasan masalah dalam penelitian ini adalah: 1. Dokumen teks bahasa Indonesia yang digunakan dengan format Portable Document File (.pdf).

2. Portable Document File yang terkunci (secured) tidak dapat di-parsing dengan aplikasi ini.

3. Sumber „kata dasar‟ dari aplikasi ini diambil dari KBBI online.

4. Sumber dokumen karya ilmiah merupakan jurnal mahasiswa (data akses: repositori ).

5. Nilai gram dan window pada perhitungan algoritma Winnowing ditentukan oleh penulis.

1.4. Tujuan Penelitian Tujuan dari penelitian tugas akhir ini adalah mendeteksi kesamaan pada dokumen teks dengan mengombinasikan algoritma Enhanced Confix Stripping Stemmer dan algoritma Winnowing sehingga memperoleh tingkat akurasi yang lebih baik.

1.5. Manfaat Penelitian Manfaat dari penelitian tugas akhir ini, antara lain: 1. Mengurangi adanya tindak plagiarisme pada mahasiswa dalam penyelesaian karya ilmiah.

2. Memudahkan dosen untuk mengecek tingkat plagiarisme yang dilakukan mahasiswa dalam menyelesaikan tugas akhirnya.

1.6. Metodologi Penelitian Metodologi yang digunakan penulis adalah: 1. Studi Literatur Pada tahap ini, penulis mencari metode yang berbeda dari penelitian sebelumnya dan memahaminya, serta mencari referensi yang berkenaan dengan proses stemming pada dokumen teks, berupa pdf.

2. Desain Sistem Pada tahap ini, penulis membuat flowchart system, use case, dan arsitektur umum dari sistem yang akan dibuat.

3. Pembuatan Sistem Pada tahap ini, penulis mulai mengodekan sistem yang akan dibuat dengan bahasa pemrograman PHP dan database MySQL.

4. Pengujian Sistem Pada tahap ini, penulis melakukan pengujian dari sistem yang telah dibuat.

Pengujian akan menampilkan persentase tingkat plagiat dari dokumen yang di-input oleh user dan menampilkan dokumen yang kemungkinan besar sama dengan dokumen yang dimasukkan oleh user tersebut.

6. Dokumentasi Pada tahap ini, penulis menyn laporan terhadap sistem yang telah dibuat.

Skripsi Teknologi Informasi:Pendeteksian Kesamaan Pada Dokumen Teks Menggunakan Kombinasi Algoritma Enhanced Confix Stripping Dan Algoritma Winnowing
Downloads Versi PDF >>>>>>>Klik Disini

	Bab I	Downloads
	Bab II	Downloads
	Bab III - V	Downloads
	Daftar Pustaka	Downloads
	Lampiran	Downloads

Skripsi Teknologi Informasi:Pendeteksian Kesamaan Pada Dokumen Teks Menggunakan Kombinasi Algoritma Enhanced Confix Stripping Dan Algoritma Winnowing

Search

KOLEKSI JUDUL-JUDUL SKRIPSI

Baca deh..Penting sekali buat skripsi kamu.....

like fb

Skripsi Teknologi Informasi:Pendeteksian Kesamaan Pada Dokumen Teks Menggunakan Kombinasi Algoritma Enhanced Confix Stripping Dan Algoritma Winnowing

Share this Article

Subscribe via Email

Related Post

Search

KOLEKSI JUDUL-JUDUL SKRIPSI

Baca deh..Penting sekali buat skripsi kamu.....

like fb