Ukuran kemiriman (similarity) antara dua buah object yang hanya berisi atribut biner disebut sebagai similarity coefficients dan memiliki nilai antara 0 dan 1. Nilai 1 mengindikasikan bahwa dua buah objek benar-benar memiliki kesamaan sedangkan nilai 0 sebaliknya. Banyak alasan mengapa suatu koefisien bisa lebih baik dibandingkan dengan yang lainnya pada suatu contoh tertentu. Kita misalkan dua buah objek x dan y memiliki atribut biner n. Perbandingan dua objek misal dua buah vektor biner memiliki empat buah besaran yaitu:
f00 = atribut x bernilai 0 dan y 0 bernilai
f01 = atribut x bernilai 0 dan y 1 bernilai
f10 = atribut x bernilai 1 dan y 0 bernilai
f11 = atribut x bernilai 1 dan y 1 bernilai
Koefisien Jaccard disimbolkan dengan huruf J, sering digunakan untuk menangani objek yang memiliki atribut biner asimetri. Contoh:
x = (1, 1, 1, 0, 0, 0, 1, 0, 0, 1)
y = (1, 0, 1, 0, 0, 0, 1, 0, 0, 1)
maka:
J = f11 / f01+f10+f11
J = 4 / 5 = 0.8
dimana:
f11 = jumlah nilai biner 1 pada x dan y
f01 = jumlah nilai biner 0 pada x dan nilai biner 1 pada y
f10 = jumlah nilai biner 1 pada x dan nilai biner 0 pada y
Sehingga, dalam perhitungan Koefisien Jaccard tidak melibatkan nilai yang terdapat pada atribut x dan y bernilai 0 (f00)