sekedar pet crepet

Monday, January 14, 2008

Conditional Probability

Paling gampang, kalau mau ngitung peluang ya tinggal membagi frekuensi kejadian dengan keseluruhan frekuensi. Misalnya saja di sebuah kelas ada 80 orang, dan 20 diantaranya adalah perempuan kemudian kita pilih satu orang secara acak (pakai nomor absen). Ada yang nanya berapa peluang orang yang terpilih itu adalah seorang perempuan. Jawabnya gampang saja, kalau asumsi acak benar-benar terjadi, ya tinggal 20 dibagi 80, atau seperempat.

Apa selalu begitu nilai peluangnya? Tidak juga. Tergantung apakah kita punya informasi tambahan. Andaikan saja sekarang Anda saya berikan tambahan informasi bahwa orang yang terpilih rambutnya sebahu. Menurut Anda, berapa peluang orang yang terpilih tadi adalah seorang perempuan? Apa masih seperempat? Mungkin tidak lagi. Sebagian besar dari Anda mungkin menjawab, sekarang kayaknya peluangnya lebih dari setengah.

Nah, itu dia yang dinamakan conditional probability (di kampus diterjemahkan jadi peluang bersyarat). Nilai peluang bisa berubah jika kita memiliki informasi tertentu. Tentu hanya informasi relevan saja yang bisa melakukan hal itu. Sebut saja kalau informasi yang saya berikan bahwa orang yang terpilih tingginya 160 cm. Barangkali informasi itu tidak akan mengubah (banyak) peluang yang Anda sebutkan sebelumnya.

Apa yang bisa kita dapatkan dari konsep peluang bersyarat ini untuk analisis statistika?

  1. Informasi tambahan dapat mengubah hasil analisis kita, dan tentu saja dengan informasi tambahan tersebut kita dapat memperoleh hasil yang lebih baik.
  2. Tidak semua informasi ada gunanya. Sisihkan informasi yang tidak relevan karena hanya membuang energi Anda tanpa banyak memberikan kontribusi pada analisis yang kita lakukan.

Konsep conditional probability ini menjadi dasardari Kaidah Bayes (Bayes’ Rule) yang selanjutnya dikembangkan untuk berbagai proses pendugaan secara statistika.

Monday, January 07, 2008

Punya KTP Ganda

Ada dua fenomena mengenai pemilikan KTP (kartu tanda penduduk) di Indonesia. Yang pertama adalah tidak semua penduduk dewasa yang memiliki KTP, terutama masyarakat miskin. Gara-gara ini banyak warga miskin tidak bisa menikmati Askeskin dan sebagainya.

Fenomena yang kedua adalah banyaknya warga yang memiliki KTP ganda atau lebih dari satu. Motivasi atau penyebab seseorang punya KTP ganda bisa macam-macam. Ada yang berkilah bahwa salah sendiri kenapa waktu buat KTP, kelurahan/kecamatan gak minta KTP yang lama. Tapi ada juga yang sengaja punya KTP lebih dari satu supaya urusannya lancar di berbagai tempat karena dia tercatat sebagai warga disitu.

Nah ngomong-ngomong motivasi yang terakhir itu, barusan aku lihat iklan pilkada dari salah satu aktor kawakan Indonesia yang dari kecil udah maen film dan hampir semua orang di negara ini tahu. Waktu rame-rame pilkada di DKI dulu, banyak suara yang mengatakan dia mau nyalonin dan dicalonin jadi cawagub, meskipun ternyata tidak jadi. Aku mengasumsikan dia warga DKI kalau gitu, karena gak mungkin kepala daerah dijabat oleh orang luar daerah itu. Tapi kenapa sekarang dia jadi calon kepala daerah di Propinsi Banten? Apa sekarang dia pindah ke Banten? Apa selama ini dia punya KTP ganda dengan alasan punya rumah dimana-mana? Gak ngerti aku rek. Kabar proyek pembuatan nomor identifikasi tunggal gimana nih

Friday, January 04, 2008

Memahami Jalan Pikiran Bayesian

Anda yang pernah belajar statistika dan peluang mestinya pernah mendengar nama Bayes (Thomas Bayes), yang memberikan ide mengenai proses penghitungan peluang berdasarkan sifat-sifat peluang bersyarat. Sekarang kaidah Bayes tersebut telah banyak dipergunakan secara luas dalam pendugaan dan pemodelan statistika, yang kemudian membentuk kelompok metode yang dikenal dengan Bayesian Statistics. Tulisan ini mencoba memberikan penjelasan singkat mengenai proses pendugaan parameter dengan metode Bayesian, dan mudah-mudahan memberikan wawasan yang berguna untuk diskusi mengenai Bayesian selanjutnya.

Metode pendugaan Bayesian melakukan proses pendugaan dengan memanfaatkan dua hal, yaitu data yang sekarang kita miliki dan informasi awal mengenai kasus yang sedang kita bicarakan. Informasi awal itu sangat berguna untuk memberikan masukan terhadap apa yang tidak bisa dengan baik kita duga hanya menggunakan data yang baru saja kita kumpulkan.

Sebagai contoh, sebuah lembaga riset melakukan survei mengenai pendapatan perkapita masyarakat di Kabupaten Sukabumi. Sebanyak 600 rumah tangga mereka datangi, diwawancarai, dan dicatat datanya. Yang ingin diduga adalah berapa rata-rata pendapatan per kapita masyarakat di sana. Jika menggunakan metode non-bayesian, maka yang dilakukan adalah tinggal menghitung rata-rata dari data yang ada. Namun, seberapa yakin Anda jika ternyata penghitungan rata-rata menghasilkan angka 800 ribu rupiah per bulan per orang? Kalau Anda mengenal betul kondisi masyarakat Kabupaten Sukabumi, tentu Anda berpendapat bahwa hasil itu terlalu besar.

Bagaimana ‘penganut’ Bayesian bekerja? Yang harus dilakukan adalah memperoleh informasi awal mengenai variabel pendapatan per kapita masyarakat Sukabumi. Sudah banyak survei bahkan sensus pernah dilakukan terhadap mereka. Informasi dari sana bisa kita jadikan tempat berpijak. Informasi pijakan awal itu dikenal sebagai ‘prior information’. Penggabungan informasi awal dan data baru yang kita kumpulkan itulah yang dilakukan oleh metode Bayesian.

Saya akan berikan ilustrasi kenapa kita tidak boleh sangat yakin hanya dengan data yang kita kumpulkan. Bayangkan bahwa saya memiliki sebuah koin uang pecahan 500 rupiah. Kemudian saya ingin tahu berapa peluang munculnya “sisi angka” kalau uang tersebut saya lempar. Untuk itu saya lempar koin tadi sebanyak 10 kali, dan saya hitung berapa kali angka muncul. Sekarang seandainya dari 10 kali, sisi angka tidak pernah muncul sama sekali. Berapa dugaan peluang muncul sisi angka? Metode non-bayesian akan memperoleh dugaannya sebesar 0, yang berarti sisi angka tidak mungkin muncul. Apa hasil ini dapat digunakan?

Jadi, memasukkan informasi awal terhadap proses pendugaan secara statistika seperti yang dilakukan oleh Bayesian dapat menjadi cara yang tepat untuk memperbaiki kualitas dugaan atau prediksi yang kita lakukan.

Wednesday, January 02, 2008

Mulailah dari tidak buang sampah sembarangan

Pesta tahun baru tkemarin malam berlangsung meriah di banyak tempat. Meskipun di banyak tempat yang lain tidak ada pesta karena sedang memperoleh cobaan bencana banjir dan sebagainya. Berbagi cerita tentang pesta tampaknya tidak cukup menarik karena sama saja dari tahun ke tahun, dan tempat ke tempat. Cerita menarik datang tadi pagi dari salah satu stasiun televisi yang memberitakan tentang banyaknya sampah yang ditinggalkan oleh masyarakat yang berpesta di sekitar Monas.

Sumber dari dinas setempat memberikan data bahwa sampah yang berhasil dikumpulkan dari tempat itu pada pagi selepas pesta tahun baru mencapai 75 meter kubik, meningkat dari tahun sebelumnya yang berjumlah 60 meter kubik. Jadi naik sekitar 25%.

Dalam hati tentu aku bilang luar biasa. Jumlah sampah naik banyak padahal malam tahun baru katanya diguyur hujan lebat.

Ada dua kemungkinan yang aku perkirakan mengenai kenaikan jumlah sampah ini. Pertama, masyarakat yang berpesta di Monas lebih banyak dari tahun kemarin karena sebagian mungkin menghindari Ancol yang tempatnya kurang menguntungkan karena badai laut akhir-akhir ini. Kalau ini yang terjadi, sepertinya kesadaran buang sampah pada tempatnya masih saja kurang.

Tapi, dan ini yang sebenarnya menurutku lebih mungkin terjadi, karena hujan mestinya jumlah orang yang datang lebih sedikit. Berdasarkan obrolan dengan beberapa rekan, sebagian besar malas keluar rumah karena cuaca kurang menguntungkan. Dengan jumlah orang lebih sedikit, jumlah sampah ternyata lebih banyak. Jumlah sampah per kapita semakin besar kalau begitu.

Apapun yang terjadi, perilaku buang sampah masyarakat kita masih mengecewakan. Ya, mengecewakan karena mereka melakukan itu dengan sadar.

Mumpung masih di awal tahun, kenapa kita tidak merenung berapa banyak sampah yang kita hasilkan, berapa banyak yang kita buang sembarangan. Coba juga mari kita renungkan bersama, apa bencana yang dialami oleh orang lain di tempat lain atau mungkin juga kita yang mengalami adalah akibat dari perilaku kita membuang sampah sembarangan. Jadi mulailah dengan tidak membuang sampah sembarangan. (Bogor, 1 Januari 2008)