sekedar pet crepet

Tuesday, November 25, 2008

Pendapatan dan Chi-Square Distribution

Pulang dari kampus, sholat maghrib, makan, sholat isya deh. Sore ini gak mandi. Duingin, tadi siang ujan-ujanan salju. Katrok banget deh... Begitu buka salah satu milis yang aku ikuti, ada teman yang cerita tentang sejarah pekerjaannya. Harapannya bisa diambil hikmahnya oleh para sarjana muda yang baru lulus. Susah ditiru deh, tapi bukan tidak mungkin. Teman ini dulunya aktivis, dan suka pekerjaan-pekerjaan menantang dengan tanggung jawab besar.

Pekerjaan dengan tanggung jawab besar umumnya menawarkan penghasilan atau pendapatan yang besar. Tanggung jawab sering kali juga identik dengan resiko. Biasanya begitu. Kalau ingin dapat yang banyak resiko juga besar. Dalam banyak hal bisa berarti bahwa fluktuasinya lebar. Kalau lagi dapat ya dapat besar... kalau lagi enggak ya enggak saja. Yang mau pendapatan aman dengan besaran tetap setiap bulan, ya umumnya rata-ratanya kecil. Punya usaha/bisnis sendiri lebih menjanjikan memperoleh pendapatan lebih besar. Tapi... resiko juga besar.

Kalau dihubungkan dengan sebaran/distribusi random variable, mirip dengan chi-square. Sebaran ini punya parameter yang disebut degree of freedom. Banyak yang menerjemahkan dengan derajat bebas atau derajat kebebasan. Apa miripnya dengan pendapatan?

Distribusi chi-square dengan derajat bebas sebesar k, memiliki nilai harapan atau rata-rata sebesar k, dan memiliki variance (boleh deh disebut variasi) sebesar 2k.Kalau kita perhatikan, sebaran ini punya rata-rata dan variasi (boleh juga deh disebut fluktuasi) yang berbanding lurus. Kalau rata-ratanya membesar, ya membesar pula variasinya. Mirip kan..

Yang menarik lagi, rata-rata dan variasi ini berbanding lurus pula dengan derajat bebas. Well.... semakin banyak yang bebas, yang sulit dikendalikan, semakin besar rata-ratanya. Ini terkait tanggung jawab tadi. Orang yang ada pada bagian mengendalikan yang sulit-sulit, yang dapat penghasilan besar.

Jadi kira-kira, jangan segan ambil kerjaan yang sulit dengan tanggung jawab besar.... insya Allah deh.... :D

Sunday, October 26, 2008

Banyak Pemilu, Banyak Kecelakaan

There were 3,417 total deaths, including 1,265 on election days. The Election Day average was 158, versus 134 on the other Tuesdays. The crashes involved drivers, passengers and pedestrians. (http://health.yahoo.com/news/ap/med_deadly_voting.html)

Paragrap di atas ini saya kutip dari salah satu artikel di Yahoo!Health. Kreatif juga studinya.

Bagi yang malas baca artikelnya, kira-kira rangkuman ceritanya begini (mudah2an tidak salah memahami). Pemungutan suara di Amerika setiap empat tahun sekali diadakan di hari Selasa. Bukan hari libur. Biasanya hanya sekolah saja yang diliburkan, itupun tidak semua sekolah. Yang menarik dari data yang ditampilkan di atas adalah, rata-rata angka kematian kecelakaan lalulintas di hari pemungutan suara lebih tinggi dibandingkan angka kematian karena kecelakaan pada hari-hari Selasa lainnya.

Nah… jadi ada kemungkinan kecelakaan dan pemungutan suara ada hubungannya. Beberapa alasan yang dapat disebutkan oleh para peneliti (1) orang2 pada ngebut menuju TPS, mereka biasanya pergi sebelum jam kerja atau sesudah jam kerja, (2) biasanya TPS tidak selalu di lingkungan tempat tinggal, makanya mereka gak paham jalan menuju TPS, (3) mereka nyetir sambil mikir enaknya nyoblos siapa ya…

Ada-ada saja… Padahal Amerika kan udah maju, nyoblosnya online aja gitu. Internet based voting.

Untungnya di Indonesia di hari libur ya… dan gak jauh2 dari rumah hehe. Tapi sepertinya korban pemilu di Indonesia tidak pas hari pemungutan suara. Tapi pas kampanye terus berkelahi, sama pas kalah terus ngamuk.

Wednesday, October 15, 2008

Bahagialah wanita indonesia

Berbahagialah...

Selengkapnya di http://bagusco.wordpress.com

Thursday, October 09, 2008

Parallel Group vs Cross Over Design

Parallel Group vs Cross Over Design
Andaikan seorang peneliti bidang medis ingin menguji apakah obat A lebih baik dibandingkan obat B dalam mempertahankan tekanan darah penderita penyakit jantung. Di saat lain perusahaan atau agen riset pasar ingin menentukan rasa blend mana yang lebih disukai konsumen, blend A ataukah blend B. Apa yang bisa dilakukan untuk mendapatkan data sehingga bisa disimpulkan untuk memilih satu dari dua pilihan tersebut?
more... http://bagusco.wordpress.com

Monday, October 06, 2008

Uji Proporsi

Andaikan suatu survei pada bulan Januari terhadap 400 orang mendapatkan hasil 50% responden menyukai SBY menjadi presiden lagi, dan survei bulan Agustus terhadap 600 orang mendapatkan angka 52% yang menyukainya. Pertanyaan yang muncul adalah, apakah dua angka proporsi atau persentase itu berbeda ataukah sama saja secara statistik?

Selangkapnya dapat dilihat pada link berikut ....
http://bagusco.wordpress.com/2008/10/06/uji-proporsi-bagian-1/

Collinearity

Beberapa orang juga menyebutnya multicollinearity. Ini adalah istilah permasalahan yang dihadapi pada saat menduga koefisien model regresi linear. Masalah ini timbul karena dua atau lebih variabel bebas X memiliki hubungan linear yang kuat. Kondisi ideal dalam analisis regresi linear adalah kebebasan/keortogonalan antar X.

Selengkapnya ada link berikut ini...

http://bagusco.wordpress.com/2008/10/02/mendeteksi-collinearity/

Selang Kepercyaan

Bahasa Inggris-nya: confidence interval. Dalam bidang pendugaan secara statistika, istilah ini tentu sangat populer. Sayangnya tidak semua pengguna statistika ingat untuk mencantumkan SK dipublikasinya supaya orang lebih memahami angka hasil dugaannya.

Apa sebenarnya SK? Selengkapnya ada link berikut....

http://bagusco.wordpress.com/2008/09/27/selang-kepercayaan-bagian-1/

Friday, September 19, 2008

Regresi Logistik Menggunakan Solver di Excel

Seorang teman menanyakan bagaimana mendapatkan penduga koefisien regresi logistik, sementara dia tidak punya software statistik. Tulisan berikut mudah-mudahan dapat membantu. Kita dapat menghitung dan menguji koefisien regresi logistik dengan memanfaatkan solver add-ins di MS Excel. Silakan klik link ini.
pdf file juga dapat diperoleh di
Semoga bermanfaat. Situs lain saya kira juga banyak yang menyediakan hal yang sama.

Thursday, September 18, 2008

Ukuran sampel besar tidak selalu lebih baik

Teori mengatakan bahwa dengan ukuran sampel (sampel size), sering dinotasikan n, yang besar maka akurasi dugaan berdasarkan data akan semakin baik karena errornya mengecil. Tidak ada yang salah dengan teori itu, tapi yang harus diingat bahwa teori ini menganggap bahwa proses pengumpulan datanya dilakukan sedemikian rupa sehingga seluruh proses seragam. Prakteknya tidak demikian. Yang ingin dipaparkan ini barangkali sudah banyak ditulis di berbagai buku metodologi survei.

Pendugaan menggunakan data sampel selalu memuat dua jenis error. Pertama disebut sampling error dan yang kedua adalah non-sampling error. Error yang pertama tidak bisa dihindari karena ini adalah kesalahan yang timbul karena kita memang hanya menggunakan sampel, yang artinya hanya sebagian data dari populasi. Sedangkan error yang kedua adalah kesalahan-kesalahan yang diakibatkan oleh proses yang kita lakukan dalam mengumpulkan, merekam, dan mengolah data.

Sampling error ini yang disebutkan dalam teori di paragrap pertama. Benar bahwa n yang semakin besar akan diikuti sampling error yang semakin kecil. Namun perlu diperhatikan bahwa pada umumnya, n yang besar akan menyebabkan non-sampling error semakin besar. Kenapa demikian?

Dengan bertambahnya target jumlah sampel yang harus diperoleh, maka ada beberapa hal yang bisa dilakukan, antara lain adalah: (a) tambah saja jumlah petugas pengumpul data, (2) tidak usah nambah orang, tapi waktunya diperpanjang, atau (3) proses pengumpulannya dipercepat untuk setiap sampel, misal wawancaranya to the point dan sebagainya.

Apapun yang dilakukan, mengandung resiko adanya kesalahan. Memperbanyak orang berarti membuka peluang semakin beragamnya proses pengumpulan data. Besar kemungkinan timbul kesalahan karena perbedaan kemampuan setiap individu petugas pengumpul data. Memperpanjang waktu dapat juga berarti menambah kelelahan dan kejenuhan yang juga dapat berujung kepada timbulnya kesalahan. Wawancara terburu-buru agar target jumlah responden tercapai juga tidak menutup kemungkinan adanya kesalahan, baik kesalahan catat maupun kesalahan responden mengartikan pertanyaan.

Tidak hanya disitu, kesalahan juga dapat timbul pada proses perekaman data. Baik perekaman waktu petugas survei mencatat jawaban, atau perekaman data pada saat entry data di komputer. Semua itu adalah kesalahan-kesalahan yang mungkin terjadi. Dan dengan n yang semakin besar, pada umumnya kesalahan yang demikian semakin mungkin untuk terjadi.

Tentu ini bisa dicegah. Pelatihan kepada orang yang terlibat, pembuatan aplikasi entry data secara hati-hati, perencanaan kerja yang baik, insentif yang memadai, dan lain-lain dapat dilakukan untuk mengurangi non-sampling error.

Sebagai penutup, banyak orang menyarankan untuk mengoptimalkan ukuran sampel. Tidak usah terlalu besar kalau memang itu beresiko menimbulkan non-sampling error yang tinggi. Sayangnya memang, besarnya tingkat kesalahan jenis ini tidak dapat dihitung secara kuantitatif.