Penelitian Yang Baik (Salah Kaprah Terkait Statistik)

“Lho, kok tidak ada statistiknya?”

Tulisan ini tidak bermaksud memberikan penilaian negatif tentang ilmu statistik, namun hanya sedikit meluruskan sedikit kesalahkaprahan yang saya temukan di sekitar saya.

Beberapa waktu yang lalu seorang rekan bercerita, bahwa ketika temannya sedang ujian tesis, yang dibahas hanya statistiknya saja. Padahal penelitiannya biomol. Dari judulnya saja sebenarnya sudah terlihat bahwa datanya sangat lemah dari segi ilmiah dan saya yakin akan di-reject dengan mudah jika di-submit ke jurnal internasional berkualitas. Namun uniknya, kata rekan saya tersebut, ketika ujian pembahasan hanya berhenti di “metode statistik yang digunakan”. Ketika metode statistiknya diterima, data langsung diterima,…padahal secara substansi sangat lemah secara ilmiah. Oh, no…*smile*.

Beberapa waktu yang lalu saya agak geli mendengar komentar dari rekan saya ketika mengomentari suatu paper yang dipublikasikan di suatu jurnal dengan impact factor teramat sangat tinggi. Komentarnya adalah, “sayang sekali tidak ada statistiknya”….hohohoh….

So, penelitian yang baik apakah harus yang berstatistik?

Menurut saya, penelitian yang baik adalah penelitian yang menjelaskan secara langsung sejelas dan se-“final” mungkin apa yang ditelitinya. Makin langsung, makin jelas, makin final, makin baik. Data visualisasi sesuatu dengan mikroskop elektron, misalnya, itu data langsung-jelas (kalau hasilnya jelas)-final dari visualisasi sesuatu, sehingga data dari mikroskop elektron relatif baik. Data ekspresi protein yang ditampilkan dengan sistem reporter – real time PCR – Western Blotting, misalnya, disebut data yang baik bila hasilnya konsisten dan peningkatan / penurunan ekspresi protein tersebut bersifat “absolut”.

Sebentar, mari kita lihat analogi di atas. Untuk contoh data mikroskop elektron mungkin cukup jelas. Tapi untuk contoh data ekspresi protein, kok ada “sistem reporter – real time PCR – Western Blotting – konsisten – absolut”? Ya, karena untuk data ekspresi protein, terutama akibat suatu perlakuan, idealnya didukung tiga data tersebut: data kuantitatif ekspresinya (biasanya dengan sistem reporter, terutama kalau itu protein yang relatif belum ada kit komersial untuk deteksinya) + data kuantitatif dari mRNA gen penyandi protein tersebut + data semikuantitatif ekspresi protein tersebut via Western Blotting (konfirmasi keberadaan & “ukuran” protein & “sesuatu” yang mungkin menyertai karakter protein tersebut). Lalu apa arti “konsisten – absolut”? Ok, jadi kami di Laboratorium, bila melakukan sesuatu, kita biasanya melakukannya dalam beberapa “batch” yang berbeda (minimal 3 batch). Jangan kacaukan “batch” dengan “jumlah sampel”. Misalnya, saya ingin membuat protein X mutan, dan melihat ekspresinya di sel kultur A. Maka, saya siapkan plasmid ekspresor protein X mutan tersebut, juga plasmid ekspresor protein X wild type, dan plasmid back bone (dua plasmid terakhir untuk kontrol), lalu sel kultur A. Sel kultur A ini mungkin saya siapkan dalam 10 dish, untuk masing-masing plasmid, sehingga saya akan membutuhkan 30 dish. Kemudian plasmid2 tersebut saya transfeksikan ke sel kultur A di 30 dish tersebut (10 dish per plasmid). JIKA, semua dish (n=10) yang ditransfeksikan plasmid ekspresor X wild type menghasilkan ekspresi protein X sebanyak 1 ┬ájuta (ini hanya contoh), semua dish (n=10) yang ditransfeksikan plasmid back bone menghasilkan ekspresi protein X sebanyak nol, dan semua dish (n=10) yang ditransfeksikan plasmid ekspresor protein X mutan menghasilkan ekspresi protein X sebanyak nol ATAU >1 trilyun ; DAN data tersebut didukung konsistensi data real time PCR dan Western Blotting, …. maka saya akan mulai happy. Ini artinya, data yang saya dapat bersifat absolut, karena data yang saya dapat via sistem reporter – real time PCR – Western Blotting konsisten dengan angka yang sangat meyakinkan. Tapi, ini baru 1 batch! Saya harus ulang penelitian ini, dari awal, dari proses perbanyakan plasmid dan proses persiapan sel kultur, dengan kondisi yang sama, untuk membuat batch kedua dan ketiga. JIKA, hasil batch kedua dan ketiga sama, barulah saya bisa mengatakan data saya konsisten.┬áData seperti ini butuh statistik? Tentu tidak, buat apa? Hasilnya pasti “signifikan bermakna”…*smile*. Data yang konsisten- absolut dan “tidak butuh statistik” ini relatif kuat dan baik untuk dianalisis.

Namun, saya akan menjadi kurang happy, JIKA: di kelompok plasmid X wild type ekspresi protein X-nya di masing-masing dish berkisar antara 100 ribu sekian – 1 jutaan, di kelompok plasmid X mutan ekspresi protein X-nya di masing-masing dish berkisar antara sekian puluh ribu – sekian ratus ribu, di kelompok plasmid back bone ekspresi protein X-nya di masing-masing dish berkisar antara nol hingga beberapa ribu. Data seperti ini membuat saya “terpaksa” harus menggunakan statistik untuk mengetahui apakah data plasmid X wild type berbeda secara signifikan dengan data plasmid X mutan. Mungkin saya harus menggunakan strategi sebagai berikut untuk analisis statistik: data dari 10 dish di batch 1 saya cari nilai rata-rata-nya, dan dianggap sebagai data sampel no 1. Oleh karena itu, misalkan saya ingin memiliki data dari “8 sampel per plasmid” (ini hanya contoh), maka saya harus membuat 7 batch lagi (= 7 x 10 dish/plasmid x 3 plasmid = 210 dish).

Mulaikah terlihat bedanya?

Yang perlu juga diluruskan, yang namanya “analisis” tidak identik dengan “analisis statistik”.

Lalu, kapan sebenarnya kita menggunakan statistik? Jika ada unsur probabilitas. Sebagai contoh, jika dari 1 juta orang yang merokok semuanya kemudian menjadi kanker paru dan dari 1 juta orang yang tidak merokok semuanya tidak menjadi kanker paru, maka yang seperti ini tidak butuh statistik untuk analisis datanya. Namun, bila dari 1 juta orang yang merokok ada 545.796 orang yang menjadi kanker paru, dan dari 1 juta orang yang tidak merokok ada 275.436 orang yang menjadi kanker paru, maka kita akan membutuhkan statistik untuk menganalisis data ini.

So, mari kita kembalikan statistik ke posisinya yang benar, yaitu sebagai salah satu alat bantu untuk analisis data. Kita akan membutuhkan statistik jika kita meneliti suatu variabel yang dipengaruhi variabel lainnya dan kita tidak mampu mengendalikan variabel lainnya itu, sehingga suka tidak suka ada unsur probabilitas. Untuk “mengurangi” pengaruh variabel yang tidak bisa kita kendalikan itulah kita membutuhkan jumlah sampel yang adekuat, teknik sampling yang baik, dan metode analisis statistik yang tepat, agar hasil analisis nanti dapat menggambarkan keadaan yang mendekati keadaan sebenarnya (Bandingkan dengan data visualisasi sesuatu dengan mikroskop elektron, misalnya, visualisasi ini sudah menggambarkan keadaan yang sebenarnya).

Saya sendiri melakukan studi epidemiologi molekuler (tentang virus). Ketika menganalisis “faktor risiko yang terkait”, “hubungan antara suatu variabel dengan koinfeksi patogen”, “pengaruh usia pada perjalanan penyakit”, dll, saya harus menggunakan statistik. Sedangkan ketika menganalisis “sifat/karakter virus”-nya, yang saya analisis data molekulernya (tidak menggunakan statistik). Dan jika saya ingin menganalisis hubungan antara sifat/karakter virus tertentu dengan perjalanan klinis pasien, saya harus menggunakan statistik karena “perjalanan klinis” merupakan proses yang kompleks yang tidak hanya dipengaruhi sifat/karakter virusnya saja. Oleh karena itu, tulisan ini mohon jangan dipahami sebagai sifat “anti statistik”, karena saya sendiri banyak menggunakan statistik.

Penelitian yang baik adalah penelitian yang didesain dan dilakukan dengan baik, yang mungkin membutuhkan statistik, mungkin tidak.

Just my two cents

Leave a Reply

Your email address will not be published. Required fields are marked *


*

Skip to toolbar