Visualisasi Data Persebaran Perokok di Indonesia menggunakan K-Means dan Tableau
DOI:
10.47709/digitech.v4i2.5263Keywords:
K-Means, Perokok, Usia, Provinsi, TableauDimension Badge Record
Abstract
Melalui penerapan metode K-Means, data persebaran perokok di Indonesia dapat dikelompokkan dan dianalisis secara mendalam, khususnya untuk memahami pola dan tren berdasarkan usia dan provinsi. Metode ini memungkinkan pengelompokan data berdasarkan tingkat kesamaan antar kelompok, sehingga membantu mengidentifikasi pola tersembunyi yang tidak terlihat dalam analisis. Hasil dari pengelompokan tersebut dapat divisualisasikan secara efektif menggunakan Tableau, memberikan gambaran yang lebih jelas dalam memahami persebaran perokok di berbagai wilayah. Oleh karena itu, implementasi metode K-Means yang didukung dengan visualisasi menggunakan Tableau menjadi pilihan yang tepat untuk mengeksplorasi dan menyajikan data persebaran perokok di Indonesia. Tujuan dari penelitian ini adalah untuk memberikan rekomendasi dan menganalisis pola persebaran dan karakteristik perokok di Indonesia berdasarkan usia dan provinsi menggunakan metode K-Means dengan menerapkan EDA serta peran Python dalam eksplorasi data menggunakan Google Colab terhadap visualisasi interaktif pada Tableau. Hasil clustering mengungkapkan bahwa kelompok usia muda (15-24) berada dalam klaster dengan prevalensi merokok rendah pada setiap periode. Kelompok usia 25-34, 35-44, dan 45-54 berada dalam klaster dengan prevalensi merokok tinggi. Kelompok usia yang lebih tua (55-64, 65+) mengalami pergeseran dari prevalensi merokok tinggi ke klaster dengan prevalensi merokok rendah. EDA membantu mengidentifikasi pola tren dan anomali yang signifikan, seperti analisis korelasi. Kombinasi Google Colab, Python, dan Tableau sangat efektif dalam proses analisis data. Penelitian serupa di masa depan dapat menggunakan kombinasi metode clustering lain, seperti DBSCAN atau Hierarchical Clustering, untuk memperkuat hasil analisis.
Abstract viewed = 52 times