Menu Close

Confusion Matrix

Untuk mengevaluasi performa dari suatu model klasifikasi, dikenal suatu cara yang disebut Confusion Matrix. Perhitungan dilakukan pada data tes yang diprediksi benar dan tidak benar oleh model klasifikasi yang telah ditentukan sebelumnya. Confusion Matrix disajikan dalam bentuk tabel dengan masukkan fij dimana i dan j menyatakan jumlah record dari kelas i yang akan memprediksi record pada kelas j. Seperti yang dituliskan pada tabel, nilai f01 menyatakan nilai record dari kelas 0 yang tidak benar diprediksi pada kelas 1 sebagai nilai benar. Sehingga berlaku, nilai benar hasil prediksi total diperoleh dari (f11 + f00) dan nilai tidak benar hasil prediksi total diperoleh dari (f01 + f10).

Predicted Class (j)
Class 1 = 1Class 1 = 0
Actual Class (i)Class 1 = 1f11f10
Class 1 = 0f01f00

Selain itu, untuk menyatakan nilai akurasi dari hasil prediksi model klasifikasi hal tersebut dinyatakan dalam perhitungan sebagai berikut:

Accuracy = (f11 + f00) / (f11 + f10 + f01 + f00) = Jumlah hasil prediksi bernilai benar / Total jumlah prediksi

Kemudian, disamping nilai akurasi terdapat nilai error (Error Rate) yang juga digunakan untuk melihat performa dari model klasifikasi dengan perbitungan sebagai berikut:

Error rate = (f01 + f10) / (f11+ f10 + f01 + f00) = Jumlah hasil predisi bernilai salah / Total jumlah prediksi

Contoh:

Atribut1Atribut2Atribut3Atribut4
YaBesar125Tidak
TidakSedang100Tidak
TidakKecil70Tidak
YaSedang120Tidak
TidakBesar95Ya
TidakSedang60Tidak
YaBesar220Tidak
TidakKecil85Ya
TidakSedang75Tidak
TidakKecil90Ya
Data Training (Model Deskriptif)

Dengan meperhatikan model klasifikasi yang sudah kita buat pada tabel data training, maka didapat model sebagai berikut:

Atribut1Atribut2Atribut3Atribut4
TidakSedang100Tidak
TidakKecil70Tidak
TidakSedang60Tidak
TidakSedang75Tidak
YaBesar125Tidak
YaSedang120Tidak
YaBesar220Tidak
TidakBesar95Ya
TidakKecil85Ya
TidakKecil90Ya
Hasil Pengurutan Data Training

Sekarang, bagaimana kita bisa menentukan klasifikasi untuk Atribut4 pada tabel data testing?

Atribut1Atribut2Atribut3Atribut4
TidakKecil55?
YaSedang80?
YaBesar110?
TidakKecil95?
TidakBesar67?
Data Testing (Model Prediksi)

Kita akan mempertimbangkan nilai-nilai yang ada pada masing-masing atribut dimana hasil data training menunjukkan bahwa Atribut1 dan Atribut3 memiliki kontribusi besar dibandingkan dengan nilai pada Atribut2. Dengan demikian, kita bisa berasumsi bahwa hasil prediksi untuk Atribut4 pada Data Testing yaitu:

Atribut1Atribut2Atribut3Atribut4
TidakKecil55Tidak
YaSedang80Tidak
YaBesar110Tidak
TidakKecil95Ya
TidakBesar67Tidak

Sehingga:

Accuracy = (f11 + f00) / (f11 + f10 + f01 + f00) = (1+4) / (1+4+0+0) = 5/5 = 1 (100%)

Error rate = (f01 + f10) / (f11+ f10 + f01 + f00) = (0+0) / (1+4+0+0) = 0/0 = 0 (0%)

Jika pada baris kedua dan kelima diprediksi dengan hasil Ya. Maka perhitungan akurasi dan error rate-nya jelas berbeda. Misalnya:

Accuracy = (f11 + f00) / (f11 + f10 + f01 + f00) = (1+2) / (1+2+0+2) = 3/5 = 0.6 (60%)

Error rate = (f01 + f10) / (f11+ f10 + f01 + f00) = (2+0) / (1+2+0+2) = 2/5 = 0.4 (40%)

Sumber: Pang Ning Tan, et. al.

Leave a Reply

Your email address will not be published. Required fields are marked *