Skripsi Teknologi Informasi:Pendeteksian Kesamaan Pada Dokumen Teks Menggunakan Kombinasi Algoritma Enhanced Confix Stripping Dan Algoritma Winnowing


BAB  PENDAHULUAN
1.1. Latar Belakang Tugas  akhir  merupakan  kewajiban  yang  harus  diselesaikan  setiap  mahasiswa  yang  ingin mendapatkan status kelulusan. Dalam teknik penulisan tugas akhir salah satu ciri  utamanya adalah keasliannya. Setiap karya memiliki kekhasan penulisannya masingmasing  tergantung  karakter  dari  setiap  penulis.  Keaslian  suatu  karya  dapat  ditunjukkan  pula  dengan  adanya  copyright  dari  pemilik  tulisan  itu  sendiri.
(Sonneborn, 2011) Dari  penelitian  yang  dilakukan  oleh  Andrew  Thompsett  dan  Jatinder  Ahluwalia  (2010)  ada  sekitar  89%  mahasiswa  yang  setuju  dan  mengerti  arti  dari  plagiarisme  dalam  dunia  pendidikan,  dan  menyarankan  agar  materi  tentang  hal  itu  dijelaskan pada awal perkuliahan. Tetapi sekitar 65% mengaku bahwa mereka merasa  bingung dengan pengertian plagiat, 59% diantaranya menyatakan bahwa mereka tidak  diberi  tutorial  yang  cukup  untuk  menghindari  tindak  plagiat  dalam  menyelesaikan  tugas mereka.
Kerugian  dari  melakukan  tindak  plagiat  adalah  dapat  mematikan  kreativitas  mahasiswa  dalam  berkarya.  Mereka  juga  akan  dikenakan  sanksi/hukuman  berupa  peringatan dan pemberhentian secara tidak hormat atas status kemahasiswaannya.

Banyak  kendala  yang  perlu  diperhatikan  untuk  melakukan  pendeteksian  kesamaan  yang  mengacu  pada  plagiarisme  dari  sebuah  karya  ilmiah  yang  berupa  dokumen teks, seperti  banyaknya dokumen yang sudah diartikan ke berbagai bahasa  dan  dokumen  asli  bersifat  nonelektronik  (Henrieta  Telepovska  &  Frantisek  Gajdos,  2010).  Namun  tidak  menutup  kemungkinan  dewasa  ini  sudah  banyak  karya  ilmiah  yang diterbitkan dalam bentuk  elektronik sehingga proses pendeteksian lebih mudah  dan akurat.
 Proses  pendeteksian  dapat  dilakukan  dengan  mengurai  isi  dokumen  menjadi  string  yang memiliki nilai dan dilakukan pencocokan dengan dokumen yang tersedia  di dalam  database. Beberapa penelitian sebelumnya, pendeteksian dilakukan dengan  metode  Latent  Semantic  Analysis  (Alfarisi,  2011),  algoritma  Rabin-Karp  (Nugroho,  2011), algoritma  Smith-Waterman  (Novanta, 2009), konsep  Similarity  dan  algoritma  Rabin-Karp (Salmuasih, 2013).
Dalam  awal  pendeteksian  diperlukan  proses  stemming.  Melakukan  proses  stemming  berarti  menghilangkan  akhiran  dari  suatu  kata.  Proses  ini  sudah  sering  dilakukan  dalam  proses  pencarian  teks,  aplikasi  kamus,  pengklasifikasian  subjek  dokumen  perkantoran,  dan  mesin  pencari  (Asian,  2005).  Berbeda  dengan  proses  stemming  peeada bahasa  Inggris, proses  stemming  pada bahasa  Indonesia lebih sulit  dilakukan  karena  bahasa  Indonesia  mengenal  imbuhan  awalan  (prefixes),  sisipan  (infixes), akhiran (suffixes), dan kombinasi awalan dan akhiran (confixes).
Penelitian  proses  stemming  pada  bahasa  Indonesia  telah  dilakukan  sebelumnya.  Ada  beberapa  algoritma  yang  digunakan  untuk  melakukan  stemming pada dokumen teks berbahasa Indonesia, seperti, algoritma Nazief dan Adriani (1996),  algoritma  Ahmad,  Yussof,  dan  Sembok  (1996),  algoritma  Vega  (2001),  algoritma  Ariffin  dan  Setiono  (2002),  algoritma  Confix  Stripping  oleh  Jelita  Asian,  pengembangan  algoritma  Nazief  dan  Adriani  (2007),  algoritma  Enhanced  Confix  Stripping Stemmer (2010).
Dalam penelitian  yang akan dilakukan, algoritma  Enhanced Confix Stripping  Stemmer  dipilih  untuk  proses  penguraian  teks  dari  imbuhannya.  Untuk  menghitung  nilai  kesamaan  teks  dengan  dokumen  dalam  database  digunakan  algoritma  Winnowing  dengan  teknik  rolling  hash.  Algoritma  Winnowing  membuang  seluruh  pemakaian karakter yang tidak relevan, seperti, tanda baca, spasi, angka, dan karakter  lainnya.  Hanya  karakter  berupa  huruf  yang  akan  diproses  ke  tahap  berikutnya  (Purwitasari et al, 2010).
1.2. Rumusan Masalah Maraknya  tindakan  plagiarisme  di  dunia  perkuliahan,  baik  plagiarisme  dalam  hal  penyelesaian  tugas  maupun  penynan  karya  ilmiah  dapat  mengurangi  bahkan  mematikan  kreativitas  seseorang  dalam  berkarya.  Berdasarkan  hal  tersebut,  penulis  dapat  merumuskan  masalahnya,  yaitu  bagaimana  mendeteksi  kesamaan  pada   dokumen  teks  sehingga  didapatkan  perbandingan  antara  jurnal  yang  diuji  user  dan  jurnal yang terdeteksi.
1.3. Batasan Masalah Adapun batasan masalah dalam penelitian ini adalah: 1.  Dokumen  teks  bahasa  Indonesia  yang  digunakan  dengan  format  Portable Document File (.pdf).
2.  Portable Document File  yang terkunci  (secured)  tidak dapat di-parsing  dengan  aplikasi ini.
3.  Sumber „kata dasar dari aplikasi ini diambil dari KBBI online.
4.  Sumber dokumen  karya ilmiah merupakan jurnal mahasiswa  (data akses:  repositori ).
5.  Nilai gram  dan  window  pada perhitungan algoritma  Winnowing  ditentukan oleh  penulis.
1.4. Tujuan Penelitian Tujuan dari penelitian tugas akhir ini adalah mendeteksi kesamaan pada dokumen teks  dengan  mengombinasikan  algoritma  Enhanced  Confix  Stripping  Stemmer  dan  algoritma Winnowing sehingga memperoleh tingkat akurasi yang lebih baik.
1.5. Manfaat Penelitian Manfaat dari penelitian tugas akhir ini, antara lain: 1.  Mengurangi  adanya  tindak  plagiarisme  pada  mahasiswa  dalam  penyelesaian  karya ilmiah.
2.  Memudahkan  dosen  untuk  mengecek  tingkat  plagiarisme  yang  dilakukan  mahasiswa dalam menyelesaikan tugas akhirnya.
1.6. Metodologi Penelitian Metodologi yang digunakan penulis adalah:  1.  Studi Literatur Pada  tahap  ini,  penulis  mencari  metode  yang  berbeda  dari  penelitian  sebelumnya  dan  memahaminya,  serta  mencari  referensi  yang  berkenaan  dengan proses stemming pada dokumen teks, berupa pdf.
2.  Desain Sistem Pada tahap ini, penulis membuat  flowchart system,  use case, dan  arsitektur  umum dari sistem yang akan dibuat.
3.  Pembuatan Sistem Pada  tahap ini, penulis mulai mengodekan  sistem yang akan dibuat dengan  bahasa pemrograman PHP dan database MySQL.
4.  Pengujian Sistem Pada tahap ini, penulis melakukan pengujian dari sistem yang telah dibuat.
Pengujian akan menampilkan  persentase tingkat plagiat dari dokumen yang  di-input  oleh  user  dan  menampilkan  dokumen  yang  kemungkinan  besar  sama dengan dokumen yang dimasukkan oleh user tersebut.
6.  Dokumentasi Pada tahap ini, penulis menyn laporan terhadap sistem yang telah dibuat.


Skripsi Teknologi Informasi:Pendeteksian Kesamaan Pada Dokumen Teks Menggunakan Kombinasi Algoritma Enhanced Confix Stripping Dan Algoritma Winnowing
Downloads  Versi PDF >>>>>>>Klik Disini

Bab I
Downloads
Bab II
 Downloads 
 Bab  III - V
 Downloads 
Daftar Pustaka
 Downloads 
Lampiran
Downloads