Menu Close

Teknik Visualisasi Data

A. Stem Plot dan Leaf Plot

Stem dan Leaf plot dapat digunakan untuk memberikan wawasan tentang distribusi data integer atau kontinu satu dimensi. Untuk jenis plot batang dan daun yang paling sederhana, kami membagi menjadi beberapa kelompok, di mana setiap kelompok berisi nilai-nilai yang sama kecuali untuk digit terakhir. Setiap grup berisi nilai-nilai yang digit dari grup adalah daun. Oleh karena itu, jika nilainya adalah dua digit bilangan bulat 35, 36, 42, dan 51, batangnya akan menjadi digit orde tinggi mis. 3, 4, dan 5, sedangkan daun adalah digit orde rendah mis. 1, 2, 5, dan 6. Dengan memplot batang secara vertikal dan daun secara horizontal, kita dapat memberikan representasi visual dari distribusi data.

B. Histogram

Stem dan Leaf plot adalah jenis histogram, plot yang menampilkan distribusi nilai atribut dengan membagi nilai yang mungkin ke dalam bin dan menampilkan objek yang jatuh ke dalam setiap bin. Untuk data kategorikal, setiap nilai adalah bin. Jika ini menghasilkan terlalu banyak nilai, nilai-nilai itu digabungkan dalam beberapa cara. Untuk atribut kontinu, rentang nilai dibagi menjadi bin-biasanya, tetapi tidak harus dengan lebar yang sama-dan nilai di setiap bin dihitung. Setelah jumlah tersedia untuk setiap bin, plot batang dibangun sedemikian rupa sehingga setiap bin diwakili oleh satu batang dan luas setiap batang sebanding dengan jumlah nilai (objek) yang termasuk dalam kisaran yang sesuai. Jika semua interval memiliki lebar yang sama, maka semua batang memiliki lebar yang sama dan tinggi batang sebanding dengan jumlah nilai dalam wadah yang sesuai.

C. Box Plot

Box Plot adalah metode lain untuk menunjukkan distribusi nilai atribut numerik tunggal. Ujung atas bawah kotak masing-masing menunjukkan persentil ke-25 dan ke-75, sedangkan garis di dalam kotak menunjukkan nilai persentil ke-50. Garis atas dan bawah ekor menunjukkan persentil ke-10 dan ke-90. Pencilan ditunjukkan oleh tanda +. Boxplot relatif kompak, sehingga banyak dari mereka dapat ditampilkan pada plot yang sama. Versi sederhana dari plot kotak yang memakan lebih sedikit ruang juga dapat digunakan.

D. Pie Chart

Pie Chart mirip dengan histogram, tetapi biasanya digunakan dengan atribut kategoris yang memiliki jumlah nilai yang relatif kecil. Alih-alih menunjukkan frekuensi relatif dari nilai yang berbeda dengan luas atau tinggi batang, dalam histogram, diagram lingkaran menggunakan luas relatif lingkaran untuk menunjukkan frekuensi relatif. Meskipun diagram lingkaran umum dalam artikel populer, frekuensinya lebih jarang digunakan dalam publikasi teknis karena ukuran area relatif sulit untuk dinilai. Histogram lebih disukai untuk pekerjaan teknis.

E. Percentile Plot

Jenis diagram yang menunjukkan distribusi data secara lebih kuantitatif adalah plot dari fungsi distribusi kumulatif empiris (ECDF). sementara jenis plot ini mungkin terdengar rumit, konsepnya sederhana. untuk setiap nilai dari distribusi statistik, CDF menunjukkan probabilitas bahwa suatu poin lebih kecil dari nilai tersebut, ECDF menunjukkan pecahan poin yang lebih kecil dari nilai ini. karena jumlah titik terbatas, EDCF adalah fungsi langkah (Step Function).

F. Scatter Plot

Scatter plot digunakan untuk menggambarkan korelasi linier yang memplot objek sebagai titik pada bidang menggunakan nilai dua atribut yang berbeda sebagai koordinat x dan y. Diasumsikan bahwa plot pencar dari pasangan atribut dalam format tabel jenis ini dikenal sebagai matriks plot pencar. Ada dua kegunaan utama untuk plot pencar. Pertama, mereka secara grafis menunjukkan hubungan antara dua atribut. Scatter plot juga dapat digunakan untuk mendeteksi hubungan non-linier, baik secara langsung maupun dengan menggunakan scatter plot dari atribut yang ditransformasi. Kedua, ketika label kelas tersedia, mereka dapat digunakan untuk menyelidiki sejauh mana dua atribut memisahkan kelas. Jika memungkinkan untuk menggambar garis (atau kurva yang lebih rumit) yang menurunkan bidang yang ditentukan oleh dua atribut ke dalam wilayah terpisah yang sebagian besar berisi objek dari satu kelas, maka dimungkinkan untuk membangun pengklasifikasi yang akurat berdasarkan pasangan atribut yang ditentukan. Jika tidak maka lebih banyak atribut atau metode yang lebih canggih diperlukan untuk membangun classifier

G. 2D – 3D Plot

2D-3D (Two or Three) Dimentional Plot dapat diperluas untuk mewakili beberapa atribut tambahan. misalnya, sebar plot dapat menampilkan hingga tiga atribut tambahan menggunakan warna atau bayangan, ukuran, dan bentuk, memungkinkan lima atau enam dimensi untuk diwakili

H. Spatio-Temporal Data

Data sering memiliki atribut spasial atau temporal. misalnya, data dapat terdiri dari serangkaian pengamatan pada kisi spasial, seperti pengamatan tekanan di permukaan bumi atau suhu yang dimodelkan pada berbagai titik kisi dalam simulasi objek fisik. Pengamatan ini juga dapat dilakukan pada berbagai titik waktu. Selain itu, data mungkin hanya memiliki komponen temporal, seperti data deret waktu yang menunjukkan harga harian saham.

I. Contour Plot

Untuk beberapa data tiga dimensi, dua atribut menentukan posisi dalam bidang, sedangkan yang ketiga memiliki nilai kontinu, seperti suhu atau ketinggian. Visualisasi yang berguna untuk data tersebut adalah plot kontur, yang memecah bidang menjadi wilayah terpisah di mana nilai atribut ketiga (suhu, ketinggian) kira-kira sama. Contoh umum peta petak kontur yang menunjukkan elevasi lokasi lahan.

J. Surface Plot

Seperti plot kontur, plot permukaan menggunakan dua atribut untuk koordinat x dan y. Atribut ketiga digunakan untuk menunjukkan ketinggian di atas bidang yang ditentukan oleh dua atribut pertama. Sementara grafik tersebut dapat berguna, mereka mengharuskan nilai atribut ketiga didefinisikan untuk semua kombinasi nilai untuk dua atribut pertama, setidaknya pada beberapa rentang. Juga, jika permukaannya terlalu tidak beraturan, maka akan sulit untuk melihat semua informasi, kecuali jika plotnya dilihat secara interaktif. Dengan demikian, plot permukaan sering digunakan untuk menggambarkan fungsi matematika atau permukaan fisik yang bervariasi dalam cara yang relatif halus.

K. Vector Field Plot

Dalam beberapa data, suatu karakteristik mungkin memiliki besaran dan arah yang terkait dengannya. Misalnya, perhatikan aliran suatu zat atau perubahan kerapatan dengan lokasi. Dalam situasi ini, akan berguna untuk memiliki plot yang menampilkan arah dan besaran. Jenis plot ini dikenal sebagai plot vektor.

L. Lower-Dimensional Slice

Pertimbangkan dataset spatio-temoral yang mencatat beberapa kuantitas, seperti suhu atau tekanan, di berbagai lokasi dari waktu ke waktu. Kumpulan data seperti itu, memiliki dimensi dan tidak dapat dengan mudah ditampilkan oleh jenis plot yang telah kami jelaskan sejauh ini. Namun, “irisan” data yang terpisah dapat ditampilkan dengan menunjukkan satu set plot, satu plot untuk setiap bulan. Dengan mengamati perubahan di suatu wilayah tertentu dari satu bulan ke bulan lainnya, dimungkinkan untuk melihat perubahan yang terjadi, termasuk yang mungkin disebabkan oleh faktor musiman.

M. Animation

Pendekatan lain untuk menangani potongan data, apakah ada waktu yang terlibat atau tidak, adalah dengan menggunakan animasi. Idenya adalah untuk menampilkan irisan data tho-dimensi berturut-turut. Sistem visual manusia sangat cocok untuk mendeteksi perubahan visual dan sering kali dapat melihat perubahan yang mungkin sulit dideteksi dengan cara lain.

Leave a Reply

Your email address will not be published. Required fields are marked *