Salah
satu aspek yang paling penting untuk menggambarkan distribusi data adalah nilai
pusat data pengamatan (Central
Tendency). Setiap pengukuran aritmatika yang ditujukan untuk
menggambarkan suatu nilai yang mewakili nilai pusat atau nilai sentral dari
suatu gugus data (himpunan pengamatan) dikenal sebagai ukuran pemusatan data (tendensi sentral).
Terdapat tiga ukuran pemusatan data yang sering digunakan, yaitu:
- Mean (Rata-rata hitung/rata-rata aritmetika)
- Median
- Mode
(1) Mean (arithmetic mean)
Rata-rata hitung atau arithmetic
mean atau sering disebut dengan istilah mean saja merupakan
metode yang paling banyak digunakan untuk menggambarkan ukuran tendensi
sentral. Mean dihitung dengan menjumlahkan semua nilai data pengamatan kemudian
dibagi dengan banyaknya data.
Keterangan:
∑
= lambang penjumlahan semua gugus data pengamatan n = banyaknya sampel data N =
banyaknya data populasi x= nilai rata-rata
sampel μ = nilai rata-rata populasi Mean
dilambangkan dengan x(dibaca
"x-bar") jika kumpulan data ini merupakan contoh (sampel) dari
populasi, sedangkan jika semua data berasal dari populasi, mean dilambangkan
dengan μ
(huruf kecil Yunani mu).
Sampel statistik biasanya
dilambangkan dengan huruf Inggris, x, sementara
parameter-parameter populasi biasanya dilambangkan dengan huruf Yunani,
misalnya μ
a. Rata-rata hitung (Mean) untuk data tunggal
Contoh 1:
Hitunglah
nilai rata-rata dari nilai ujian matematika kelas 3 SMU berikut ini: 2; 4; 5;
6; 6; 7; 7; 7; 8; 9
Jawab:
Nilai
rata-rata dari data yang sudah dikelompokkan bisa dihitung dengan menggunakan
formula berikut:
Keterangan: ∑ = lambang penjumlahan semua gugus data pengamatan fi
= frekuensi data ke-i n = banyaknya sampel data x= nilai rata-rata
sampel
Contoh 2:
Berapa
rata-rata hitung pada tabel frekuensi berikut:
xi
|
fi
|
70
|
5
|
69
|
6
|
45
|
3
|
80
|
1
|
56
|
1
|
Catatan:
Tabel frekuensi pada tabel di atas merupakan tabel frekuensi untuk data
tunggal, bukan tabel frekuensi dari data yang sudah dikelompokkan berdasarkan
selang/kelas tertentu.
Jawab:
xi
|
fi
|
fixi
|
70
|
5
|
350
|
69
|
6
|
414
|
45
|
3
|
135
|
80
|
1
|
80
|
56
|
1
|
56
|
Jumlah
|
16
|
1035
|
b. Mean dari data distribusi Frekuensi atau dari gabungan:
Distribusi Frekuensi: Rata-rata hitung dari data yang
sudah disusun dalam bentuk tabel distribusi frekuensi dapat ditentukan dengan
menggunakan formula yang sama dengan formula untuk menghitung nilai rata-rata
dari data yang sudah dikelompokkan, yaitu:
Keterangan:
∑
= lambang penjumlahan semua gugus data pengamatan fi = frekuensi
data ke-i x= nilai rata-rata
sampel
Contoh 3:
Tabel
berikut ini adalah nilai ujian statistik 80 mahasiswa yang sudah disusun dalam
tabel frekuensi. Berbeda dengan contoh 2, pada contoh ke-3 ini, tabel
distribusi frekuensi dibuat dari data yang sudah dikelompokkan berdasarkan
selang/kelas tertentu (banyak kelas = 7 dan panjang kelas = 10).
Kelas
ke-
|
Nilai
Ujian
|
fi
|
1
|
31
- 40
|
2
|
2
|
41
- 50
|
3
|
3
|
51
- 60
|
5
|
4
|
61
- 70
|
13
|
5
|
71
- 80
|
24
|
6
|
81
- 90
|
21
|
7
|
91
- 100
|
12
|
Jumlah
|
80
|
Jawab:
Buat
daftar tabel berikut, tentukan nilai pewakilnya (xi) dan hitung fixi.
Kelas
ke-
|
Nilai
Ujian
|
fi
|
xi
|
fixi
|
1
|
31
- 40
|
2
|
35.5
|
71.0
|
2
|
41
- 50
|
3
|
45.5
|
136.5
|
3
|
51
- 60
|
5
|
55.5
|
277.5
|
4
|
61
- 70
|
13
|
65.5
|
851.5
|
5
|
71
- 80
|
24
|
75.5
|
1812.0
|
6
|
81
- 90
|
21
|
85.5
|
1795.5
|
7
|
91
- 100
|
12
|
95.5
|
1146.0
|
Jumlah
|
80
|
6090.0
|
Catatan:
Pendekatan perhitungan nilai rata-rata hitung dengan menggunakan distribusi
frekuensi kurang akurat dibandingkan dengan cara perhitungan rata-rata hitung
dengan menggunakan data aktualnya. Pendekatan ini seharusnya hanya digunakan
apabila tidak memungkinkan untuk menghitung nilai rata-rata hitung dari sumber
data aslinya.
Rata-rata Gabungan atau rata-rata terboboti (Weighted Mean)
Rata-rata
gabungan (disebut juga grand
mean, pooled
mean, atau rata-rata
umum) adalah cara yang tepat untuk menggabungkan rata-rata hitung
dari beberapa sampel.
Contoh 4:
Tiga
sub sampel masing-masing berukuran 10, 6, 8 dan rata-ratanya 145, 118, dan 162.
Berapa rata-ratanya?
Jawab:
(2) Median
Median
dari n
pengukuran atau pengamatan x1, x2 ,..., xn
adalah nilai pengamatan yang terletak di tengah gugus data setelah data
tersebut diurutkan. Apabila banyaknya pengamatan (n) ganjil, median terletak tepat ditengah
gugus data, sedangkan bila n
genap, median diperoleh dengan cara interpolasi yaitu rata-rata dari dua data
yang berada di tengah gugus data. Dengan demikian, median membagi himpunan
pengamatan menjadi dua bagian yang sama besar, 50% dari pengamatan terletak di
bawah median dan 50% lagi terletak di atas median. Median sering dilambangkan
dengan (dibaca
"x-tilde") apabila sumber datanya berasal dari sampel (dibaca
"μ-tilde") untuk median populasi. Median tidak dipengaruhi oleh
nilai-nilai aktual dari pengamatan melainkan pada posisi mereka. Prosedur untuk
menentukan nilai median, pertama urutkan data terlebih dahulu, kemudian ikuti
salah satu prosedur berikut ini:
- Banyak data ganjil → mediannya adalah nilai yang berada tepat di tengah gugus data
- Banyak data genap → mediannya adalah rata-rata dari dua nilai data yang berada di tengah gugus data
a. Median data tunggal:
Untuk
menentukan median dari data tunggal, terlebih dulu kita harus mengetahui
letak/posisi median tersebut. Posisi median dapat ditentukan dengan menggunakan
formula berikut:
dimana
n = banyaknya
data pengamatan.
Median apabila n ganjil:
Contoh 5:
Hitunglah
median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6;
7; 7; 2; 9; 10
Jawab:
- data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10
- setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9; 10
- banyaknya data (n) = 11
- posisi Me = ½(11+1) = 6
- jadi Median = 7 (data yang terletak pada urutan ke-6)
Nilai Ujian
|
2
|
4
|
5
|
6
|
6
|
7
|
7
|
7
|
8
|
9
|
10
|
Urutan data ke-
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
↑
|
Median apabila n genap:
Contoh 6:
Hitunglah
median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6;
7; 7; 2; 9
Jawab:
- data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9
- setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9
- banyaknya data (n) = 10
- posisi Me = ½(10+1) = 5.5
- Data tengahnya: 6 dan 7
- jadi Median = ½ (6+7) = 6.5 (rata-rata dari 2 data yang terletak pada urutan ke-5 dan ke-6)
Nilai Ujian
|
2
|
4
|
5
|
6
|
6
|
7
|
7
|
7
|
8
|
9
|
||||||||
Urutan data ke-
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||||||||
↑
|
||||||||||||||||||
b. Median dalam distribusi frekuensi:
Formula
untuk menentukan median dari tabel distribusi frekuensi adalah sebagai berikut:
b
= batas bawah kelas median dari kelas selang yang mengandung unsur atau memuat
nilai median
p
= panjang kelas median
n
= ukuran sampel/banyak data
f
= frekuensi kelas median
F
= Jumlah semua frekuensi dengan tanda kelas lebih kecil dari kelas median (∑fi)
Contoh 7:
Tentukan
nilai median dari tabel distribusi frekuensi pada Contoh 3 di atas!
Jawab:
Kelas ke-
|
Nilai Ujian
|
fi
|
fkum
|
|
1
|
31 - 40
|
2
|
2
|
|
2
|
41 - 50
|
3
|
5
|
|
3
|
51 - 60
|
5
|
10
|
|
4
|
61 - 70
|
13
|
23
|
|
5
|
71 - 80
|
24
|
47
|
←letak kelas median
|
6
|
81 - 90
|
21
|
68
|
|
7
|
91 - 100
|
12
|
80
|
|
8
|
Jumlah
|
80
|
- Letak kelas median: Setengah dari seluruh data = 40, terletak pada kelas ke-5 (nilai ujian 71-80)
- b = 70.5, p = 10
- n = 80, f = 24
- f = 24 (frekuensi kelas median)
- F = 2 + 3 + 5 + 13 = 23
(3) Mode
Mode
adalah data yang paling sering muncul/terjadi. Untuk menentukan modus, pertama
susun data dalam urutan meningkat atau sebaliknya, kemudian hitung
frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah
modus. Modus digunakan baik untuk tipe data numerik atau pun data kategoris. Modus tidak dipengaruhi oleh nilai
ekstrem. Beberapa kemungkinan tentang modus suatu gugus data:
- Apabila pada sekumpulan data terdapat dua mode, maka gugus data tersebut dikatakan bimodal.
- Apabila pada sekumpulan data terdapat lebih dari dua mode, maka gugus data tersebut dikatakan multimodal.
- Apabila pada sekumpulan data tidak terdapat mode, maka gugus data tersebut dikatakan tidak mempunyai modus.
Meskipun
suatu gugus data mungkin saja tidak memiliki modus, namun pada suatu distribusi
data kontinyu, modus dapat ditentukan secara analitis.
- Untuk gugus data yang distribusinya simetris, nilai mean, median dan modus semuanya sama.
- Untuk distribusi miring ke kiri (negatively skewed): mean < median < modus
- untuk distribusi miring ke kanan (positively skewed): terjadi hal yang sebaliknya, yaitu mean > median > modus.
Hubungan
antara ketiga ukuran tendensi sentral untuk data yang tidak berdistribusi
normal, namun hampir simetris dapat didekati dengan menggunakan rumus empiris
berikut:
Mean - Mode = 3 (Mean - Median)
a. Modus Data Tunggal:
Contoh 8:
Berapa
modus dari nilai ujian matematika kelas 3 SMU berikut ini:
- 2, 4, 5, 6, 6, 7, 7, 7, 8, 9
- 2, 4, 6, 6, 6, 7, 7, 7, 8, 9
- 2, 4, 6, 6, 6, 7, 8, 8, 8, 9
- 2, 4, 5, 5, 6, 7, 7, 8, 8, 9
- 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
Jawab:
- 2, 4, 5, 6, 6, 7, 7, 7, 8, 9→ Nilai yang sering muncul adalah angka 7 (frekuensi terbanyak = 3), sehingga Modus (M) = 7
- 2, 4, 6, 6, 6, 7, 7, 7, 8, 9 → Nilai yang sering muncul adalah angka 6 dan 7 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 7. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Karena ke-2 mode tersebut nilainya berurutan, mode sering dihitung dengan menghitung nilai rata-rata keduanya, ½ (6+7) = 6.5.
- 2, 4, 6, 6, 6, 7, 8, 8, 8, 9 → Nilai yang sering muncul adalah angka 6 dan 8 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 8. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Nilai mode tunggal tidak dapat dihitung karena ke-2 mode tersebut tidak berurutan.
- 2, 4, 5, 5, 6, 7, 7, 8, 8, 9 → Nilai yang sering muncul adalah angka 5, 6 dan 7 (masing-masing muncul 2 kali), sehingga Modusnya ada tiga, yaitu 5, 6 dan 7. Gugus data tersebut dikatakan multimodal karena modusnya lebih dari dua.
- 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 → Pada gugus data tersebut, semua frekuensi data sama, masing-masing muncul satu kali, sehingga gugus data tersebut dikatakan tidak mempunyai modusnya
b. Mode dalam Distribusi Frekuensi:
dimana:
Mo
= modal = kelas yang memuat modus
b
= batas bawah kelas modal
p
= panjang kelas modal
bmo
= frekuensi dari kelas yang memuat modus (yang nilainya tertinggi)
b1=
bmo – bmo-1 = frekuensi kelas modal – frekuensi kelas
sebelumnya
b2
= bmo – bmo+1 = frekuensi kelas modal – frekuensi kelas
sesudahnya
Contoh 9:
Tentukan
nilai median dari tabel distribusi frekuensi pada Contoh 3 di atas!
Jawab:
Kelas ke-
|
Nilai Ujian
|
fi
|
|
1
|
31 - 40
|
2
|
|
2
|
41 - 50
|
3
|
|
3
|
51 - 60
|
5
|
|
4
|
61 - 70
|
13
|
|
→ b1 = (24 – 13) =
11
|
|||
5
|
71 - 80
|
24
|
← kelas modal
(frekuensinya paling besar)
|
→ b2 =(24 – 21) =3
|
|||
6
|
81 - 90
|
21
|
|
7
|
91 - 100
|
12
|
|
8
|
Jumlah
|
80
|
- Kelas modul =kelas ke-5
- b = 71-0.5 = 70.5
- b1 = 24 -13 = 11
- b2 = 24 – 21 = 3
- p = 10
Karakteristik penting untuk ukuran tendensi sentral yang baik
Ukuran
nilai pusat/tendensi sentral (average)
merupakan nilai pewakil dari suatu distribusi data, sehingga harus memiliki
sifat-sifat berikut:
- Harus mempertimbangkan semua gugus data
- Tidak boleh terpengaruh oleh nilai-nilai ekstrim.
- Harus stabil dari sampel ke sampel.
- Harus mampu digunakan untuk analisis statistik lebih lanjut.
Dari
beberapa ukuran nilai pusat, Mean hampir memenuhi semua persyaratan tersebut,
kecuali syarat pada point kedua, rata-rata dipengaruhi oleh nilai ekstrem.
Sebagai contoh, jika item adalah 2; 4; 5; 6; 6; 6; 7; 7; 8; 9 maka mean, median
dan modus semua bernilai sama, yaitu 6. Jika nilai terakhir adalah 90 bukan 9,
rata-rata akan menjadi 14.10, sedangkan median dan modus tidak berubah.
Meskipun dalam hal ini median dan modus lebih baik, namun tidak memenuhi
persyaratan lainnya. Oleh karena itu Mean merupakan ukuran nilai pusat yang
terbaik dan sering digunakan dalam analisis statistik.
Kapan kita menggunakan nilai tendensi sentral yang berbeda?
Nilai
ukuran pusat yang tepat untuk digunakan tergantung pada sifat data, sifat
distribusi frekuensi dan tujuan. Jika data bersifat kualitatif, hanya modus
yang dapat digunakan. Sebagai contoh, apabila kita tertarik untuk mengetahui
jenis tanah yang khas di suatu lokasi, atau pola tanam di suatu daerah, kita
hanya dapat menggunakan modus. Di sisi lain, jika data bersifat kuantitatif,
kita dapat menggunakan salah satu dari ukuran nilai pusat tersebut, mean atau
median atau modus. Meskipun pada jenis data kuantitatif kita dapat menggunakan
ketiga ukuran tendensi sentral, namun kita harus mempertimbangkan sifat
distribusi frekuensi dari gugus data tersebut.
- Bila distribusi frekuensi data tidak normal (tidak simetris), median atau modus merupakan ukuran pusat yang tepat.
- Apabila terdapat nilai-nilai ekstrim, baik kecil atau besar, lebih tepat menggunakan median atau modus.
- Apabila distribusi data normal (simetris), semua ukuran nilai pusat, baik mean, median, atau modus dapat digunakan. Namun, mean lebih sering digunakan dibanding yang lainnya karena lebih memenuhi persyaratan untuk ukuran pusat yang baik.
- Ketika kita berhadapan dengan laju, kecepatan dan harga lebih tepat menggunakan rata-rata harmonik.
- Jika kita tertarik pada perubahan relatif, seperti dalam kasus pertumbuhan bakteri, pembelahan sel dan sebagainya, rata-rata geometrik adalah rata-rata yang paling tepat.
DAFTAR
PUSTAKA:
·
http://www.smartstat.info/statistika/statisika-deskriptif/ukuran-pemusatan-data-mean-median-mode.html
·
http://garda-pengetahuan.blogspot.com/2012/04/rumus-matematika-untuk-mean-median-dan.html
·
http://analisisdatastatistikregresianovaspss.blogspot.com/2012/02/konsep-pengertian-modus-mean-median-dan.html
·
http://maulana-samboja.blogspot.com/2012/10/konsep-pengertian-modus-mean-median-dan.html
Tidak ada komentar:
Posting Komentar