Menu Close

Proximity: Jaccard Coefficient

Ukuran kemiriman (similarity) antara dua buah object yang hanya berisi atribut biner disebut sebagai similarity coefficients dan memiliki nilai antara 0 dan 1. Nilai 1 mengindikasikan bahwa dua buah objek benar-benar memiliki kesamaan sedangkan nilai 0 sebaliknya. Banyak alasan mengapa suatu koefisien bisa lebih baik dibandingkan dengan yang lainnya pada suatu contoh tertentu. Kita misalkan dua buah objek x dan y memiliki atribut biner n. Perbandingan dua objek misal dua buah vektor biner memiliki empat buah besaran yaitu:

f00 = atribut x bernilai 0 dan y 0 bernilai 
f01 = atribut x bernilai 0 dan y 1 bernilai 
f10 = atribut x bernilai 1 dan y 0 bernilai 
f11 = atribut x bernilai 1 dan y 1 bernilai 

Koefisien Jaccard disimbolkan dengan huruf J, sering digunakan untuk menangani objek yang memiliki atribut biner asimetri. Contoh:

x = (1, 1, 1, 0, 0, 0, 1, 0, 0, 1)

y = (1, 0, 1, 0, 0, 0, 1, 0, 0, 1)

maka:

J = f11 / f01+f10+f11

J = 4 / 5 = 0.8

dimana:

f11 = jumlah nilai biner 1 pada x dan y

f01 = jumlah nilai biner 0 pada x dan nilai biner 1 pada y

f10 = jumlah nilai biner 1 pada x dan nilai biner 0 pada y

Sehingga, dalam perhitungan Koefisien Jaccard tidak melibatkan nilai yang terdapat pada atribut x dan y bernilai 0 (f00)

Leave a Reply

Your email address will not be published. Required fields are marked *