• STATISTIKA
• PENGERTIAN
q Statistika
Ø Ilmu tentang pengumpulan data
Ø Klasifikasi Data
Ø Penyajian Data
Ø Pengolahan Data
Ø Penarikan Kesimpulan
Ø Pengambilan keputusan
q Populasi: Himpunan keseluruhan dari objek pengamatan
q Sample: Bagian dari populasi
q Data: Informasi atau fakta yang tertuang dalam angka atau bukan angka
q Deskriptif: Metode untuk mendeskripsikan, menggambarkan, menjabarkan, atau menguraikan data
q Inferensia: Penarikan kesimpulan dari sample untuk menjelaskan isi dari populasi
• JENIS – JENIS DATA
q Data mentah
q Data primer
q Data sekunder
q Data Kuantitatif
Ø Data Diskrit
Ø Data Kontinyu
Ø Data Diskrit:
o Data Nominal
o Daata Ordinal
o Data Dikotomi
o Data Kualitatif
o Parameter: Kualitas Pengukuran sample
• CONTOH – CONTOH
q Deskriptif
“Nilai UAS mahasiswa Teknik Informatika semester 4 untuk mata kuliah Statistika adalah dengan nilai rata – rata 65”
q Populasi dan Sample
“Civitas akademik Universitas Muhammadiyah Sukabumi terdiri dari dosen, mahasiswa dan staff pekerja lainnya yang berjumlah 1200 orang”
q Data Nominal
Jumlah lulusan mahasiswa Universitas Muhammadiyah Sukabumi tahun 2008
l
q Data Ordinal
Kategori hasil nilai akhir Mata Kuliah Statistika
q Data Dikotomi
Ø Murni: Hidup – mati, surga – neraka, laki – laki – wanita, dll.
Ø Buatan: lulus – gagal, hitam – putih, dll.
q Data interval: data yang memiliki rentang atau jarak yang sama
q Data rasio: Data yang dinyatakan dalam perbandingan
• TENDENSI SENTRAL
• Nilai rata – rata (Mean):
Rumus:
q Biasa
q Dengan Frekuensi
q Keterangan:
Ø (jumlah data ke 1 sampai data ke-n )
Ø
(jumlah perkalian frekuensi dengan data)
Ø n = banyaknya data
Ø = jumlah frekuensi
• Modus = Nilai yang paling sering muncul
q Biasa
Mo = nilai yang paling sering muncul
q Data berfrekuensi
q Keterangan:
Ø Mo = modus
Ø Lo = Batas bawah kelas modus
Ø C = lebar kelas
Ø b1 = selisih frekuensi sebelum kelas modus
Ø b2 = selisih frekuensi tepat satu data setelahnya
• Contoh soal data distribusi berfrekuensi
• Misalkan modal (dalam jutaan rupiah) dari 40 perusahaan pada tabel distribusi frekuensi berikut:
• Kata Kunci
Data Distribusi Frekuensi
Data Distribusi Frekuensi
• Kelas = selang/ interval
• Frekuensi = banyaknya nilai yang termasuk ke dalam kelas
• Limit kelas/ tepi kelas: Nilai terkecil dan terbesar pada setiap kelas, terbagi menjadi 2, yaitu limit bawah kelas dan limit atas kelas
• Batas bawah kelas dan batas atas kelas
• Lebar kelas= selisih batas atas kelas dan batas bawah kelas
• Nilai tengah kelas = (batas bawah kelas + batas atas kelas)/ 2
• Dari contoh di atas, maka didapat:
• Kelas = 112 – 120
• Limit kelas/ tepi kelas: pada kelas 112 – 120, Nilai 112 disebut limit bawah kelas dan nilai 120 disebut limit atas kelas
• Pada kelas 112 – 120, nilai 111,5 disebut batas bawah kelas dan nilai 120,5 disebut batas atas kelas
• Lebar kelas= 120,5 – 111,5 = 9 nilai lebar kelas pada masing – masing kelas adalah sama
• Nilai tengah kelas = (111,5 + 120,5)/2 = 116
• Penyelesaian Soal
• Mean/ Rata - rata
• MEDIAN
Untuk mencari median, tentukan dulu pada kelas interval mana mediannya terletak.
Karena frekuensinya bernilai genap, maka median terletak pada nilai ke
Data ke 20,5 terletak pada kelas interval 139 – 147. Maka diperoleh:
Lo = 138,5 f = 12 F = 4 + 5 + 8 = 17
c = 147,5 – 138,5 = 9
• Jadi mediannya adalah
• MODUS
Untuk mencari modus, tentukan dulu kelas interval yang mengandung modus, yaitu kelas interval yang memiliki frekuensi terbesar. Maka dapat diketahui bahwa modus terletak pada kelas interval 139 – 147
• Dengan demikian:
Lo = 138, 5 c = 9 b1 = 12-8=4
b2 = 12-5=7
Jadi modusnya adalah:
= 138,5 + 3,27 = 141,77
• KUARTIL, DESIL, DAN PERSENTIL
• KUARTIL (Perluasan Median)
Kuartil terbagi menjadi 3, yaitu:
q Kuartil pertama/ Kuartil bawah (Q1)
q Kuartil kedua/ Kuartil tengah (Q2)
q Kuartil ketiga/ Kuartil atas (Q3)
Rumus Untuk data tidak berkelompok:
• Untuk data berkelompok
• DESIL
Jika sekelompok data dibagi menjadi 10 bagian yang sama banyak, maka akan terdapat 9 pembagi, masing – masing disebut nilai Desil (D), yaitu D1, D2, …, D9
• Untuk data tidak berkelompok
• Untuk data berkelompok
• PERSENTIL
Jika sekelompok data dibagi menjadi 100 bagian sama banyak, maka akan terdapat 99 pembagi, yang masing – masing disebut persentil (P), yaitu P1,P2,P3,…,P99. Nilai persentil ke-I, yaitu Pi dihitung dengan rumus berikut.
Untuk data tidak berkelompok:
• Untuk data berkelompok
• Contoh soal data tidak berkelompok
• Tentukan kuartil Q1, Q2 dan Q3 dari data gaji bulanan 13 karyawan (dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
• Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100.
Maka:
Q1=nilai ke- nilai ke-
= antara nilai ke 3 dan ke 4
= nilai ke 3 + ½ (nilai ke 4 – nilai ke 3)
= 40 + ½ (45-40)
= 40 + 2,5= 42,5
• Tentukan desil D3 dan D7 dari data gaji bulanan 13 karyawan (dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
• Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100.
Maka:
D3= nilai yang ke-
= nilai ke –
= nilai ke 4 + 1/5 (nilai ke 5 – nilai ke 4)
= 45 + 1/5 (50-45)
= 45 + 1= 46
• Contoh soal data berkelompok
• Misalkan modal (dalam jutaan rupiah) dari 40 perusahaan pada tabel distribusi frekuensi berikut:
• Penyelesaian Soal
• Mencari Q1, Q2, dan Q3
Jawab:
Tentukan dulu kelas interval Q1, Q2, dan Q3
Karena n=40,
q Q1 terletak pada nilai ke
q Nilai ke 10, 25 terletak pada interval kelas 130 – 138
q Q2 terletak pada nilai ke
q Nilai ke 20, 5 terletak pada interval kelas 139 – 147
q Q3 terletak pada nilai ke
q Nilai ke 30,75 terletak pada interval kelas 148 – 156
Setelah diketahui interval kelas dari tiap – tiap kuartil yang dicari, maka nilai kuartil dapat dicari dengan rumus.
Untuk Q1, terletak pada interval kelas 130 – 137, maka:
Lo = 129,5 F = 4+5 = 9 f = 8 c = 9
sehingga:
• Mencari D3 dan D8
Jawab:
Tentukan kelas interval dimana desil berada
Karena n = 40, maka kelas interval D3 dan D8 berada pada:
q D3 terletak pada nilai ke
q Nilai ke 12,3 terletak pada interval kelas 130 – 138
q D8 terletak pada nilai ke
q Nilai ke 32,8 terletak pada interval kelas 139 – 147
q Maka nilai D3 dan D8 adalah:
Untuk D3 terletak pada interval kelas 130 – 138, maka:
Lo = 129,5 F = 4+5= 9 f = 8 c = 9
Sehingga:
• PENGUKURAN DISPERSI, KEMIRINGAN, DAN KERUNCINGAN DATA
• DISPERSI DATA
Dispersi/ variasi/ keragaman data: ukuran penyebaran suatu kelompok data terhadap pusat data.
• Ukuran Dispersi yang akan dipelajari:
q Jangkauan (Range)
q Simpangan rata – rata (mean deviation)
q Variansi (variance)
q Standar Deviasi (Standard Deviation)
q Simpangan Kuartil (quartile deviation)
q Koefisien variasi (coeficient of variation)
• RANGE/ JANGKAUAN DATA (r)
• Range: Selisih nilai maksimum dan nilai minimum
Rumus:
• Range untuk kelompok data dalam bentuk distribusi frekuensi diambil dari selisih antara nilai tengah kelas maksimun – nilai tengah kelas minimum
• Simpangan Rata2/ Mean Deviation (SR)
• Simpangan rata – rata: jumlah nilai mutlak dari selisih semua nilai dengan nilai rata – rata, dibagi banyaknya data.
• Rumus
• Untuk data tidak berkelompok
• VARIANSI/ VARIANCE
• Untuk data berkelompok
• Rumus untuk data tidak berkelompok
• Untuk data berkelompok
• STANDAR DEVIASI/ STANDARD DEVIATION (S)
• Standar deviasi: akar pangkat dua dari variansi
• Rumus:
Untuk data tidak berkelompok
Untuk data berkelompok
• Contoh Soal
• Data tidak berkelompok
Diketahui sebuah data berikut:
20, 50, 30, 70, 80
Tentukanlah:
• Range (r)
• Simpangan Rata – rata (SR)
• Variansi
• Standar Deviasai
• Jawab:
• Range (r) = nilai terbesar – nilai terkecil = 80 – 20 = 60
• Simpangan Rata – rata (SR):
n = 5
• Variansi
• Standar Deviasi (S)
• Contoh Soal
• Data Berkelompok
Diketahui data pada tabel dibawah ini:
• JAWAB
• Range (r)= (nilai tengah tertinggi – nilai tengah terendah)/2
• Simpangan rata – rata
• Variansi
• Standar Deviasi
• Untuk memudahkan mencari jawaban, maka dibuat tabel sesuai dengan keperluan jawaban
• Maka dapat dijawab:
• Range (r) = 170 – 116 = 54
• Simpangan rata – rata
• Variansi
• Standar Deviasi
• JANGKAUAN QUARTIL
DAN JANGKAUAN PERSENTIL 10-90
DAN JANGKAUAN PERSENTIL 10-90
• Jangkauan kuartil disebut juga simpangan kuartil, rentang semi antar kuartil, deviasi kuartil. Jangkauan persentil 10-90 disebut juga rentang persentil 10-90
• Jangkauan kuartil dan jangkauan persentil lebih baik daripada jangkauan (range) yang memakai selisih antara nilai maksimum dan nilai minimun suatu kelompok data
• Rumus:
Jangkauan Kuartil:
• Rumus Jangkauan Persentil
• KOEFISIEN VARIASI/ DISPERSI RELATIF
qUntuk mengatasi dispersi data yang sifatnya mutlak, seperti simpangan baku, variansi, standar deviasi, jangkauan kuartil,dll
qUntuk membandingkan variasi antara nilai – nilai bersar dengan nilai – nilai kecil.
qUntuk mengatasi jangkauan data yang lebih dari 2 kelompok data.
• KOEFISIEN VARIASI KUARTIL
• Alternatif lain untuk dispersi relatif yang bisa digunakan jika suatu kelompok data tidak diketahui nilai rata – rata hitungnya dan nilai standar deviasinya.
• Rumus:
• NILAI BAKU
• Nilai baku atau skor baku adalah hasil transformasi antara nilai rata – rata hitung dengan standar deviasi
• Rumus:
• Contoh Soal untuk Koefisien Variasi dan Simpangan Baku
• Koefisien Variasi
Ada dua jenis bola lampu. Lampu jenis A secara rata – rata mampu menyala selama 1500 jam dengan simpangan baku (standar deviasi) S1 = 275 jam, sedangkan lampu jenis B secara rata – rata dapat menyala selama 1.750 jam dengan simpangan baku S2 = 300 jam. Lampu mana yang kualitasnya paling baik?
Jawab:
Lampu jenis A:
Lampu jenis B:
• Nilai rata – rata ujian akhir semester mata kuliah Statistika dengan 45 mahasiswa adalah 78 dan simpangan baku/standar deviasi (S) = 10. Sedangkan untuk mata kuliah Bahasa Inggris di Kelas itu mempunyai nilai rata – rata 84 dan simpangan bakunya (S) = 18. Bila dikelas itu, Desi mendapat nilai UAS untuk kalkulus adalah 86 dan untuk bahasa Inggris adalah 92, bagaimana posisi/ prestasi Desi di kelas itu?
• Jawab
• Untuk mengetahui posisi/ prestasi Desi, maka harus dicari nilai baku (Z) dari kedua mata kuliah tersebut.
dengan nilai X adalah nilai UAS yang diperoleh Desi
• Untuk Mata Kuliah Statistika
X = 86 S = 10
Maka:
• Untuk Mata Kuliah Bahasa Inggris
X = 92 S = 18
Maka:
Karena nilai baku (Z) untuk mata kuliah Statistika lebih besar dari B. Inggris, maka posisi Desi lebih baik pada mata kuliah Statistika dari pada B. Inggris
• KEMIRINGAN DATA
• Kemiringan: derajat/ ukuran dari ketidaksimetrian (asimetri) suatu distribusi data
• 3 pola kemiringan distribusi data, sbb:
– Distribusi simetri (kemiringan 0)
– Distribusi miring ke kiri (kemiringan negatif)
– Distribusi miring ke kanan (kemiringan positif)
• Beberapa metoda yang bisa dipakai untuk menghitung kemiringan data, yaitu:
– Rumus Pearson
– Rumus Momen
– Rumus Bowley
• Rumus Pearson (α)
• Rumus tersebut dipakai untuk data tidak berkelompok maupun data berkelompok.
– Bila α = 0 atau mendekati nol, maka dikatakan distribusi data simetri.
– Bila α bertanda negatif, maka dikatakan distribusi data miring ke kiri.
– Bila α bertanda positif, maka dikatakan distribusi data miring ke kanan.
– Semakin besar α, maka distribusi data akan semakin miring atau tidak simetri
• RUMUS MOMEN
• Khusus untuk data berkelompok dalam bentuk tabel distribusi frekuensi , derajat kemiringan α3 dapat dihitung dengan cara transformasi sebabai berikut:
– Jika α3 = 0, maka distribusi data simetri
– Jika α3 < 0, maka distribusi data miring ke kiri
– Jika α3 > 0, maka distribusi data miring ke kanan
– Untuk mencari nilai Standar deviasi (S) menggunakan variabel U:
– Variabel U = 0, ±1, ±2, ±3, dst.
• RUMUS BOWLEY
• KERUNCINGAN DISTRIBUSI DATA
• Keruncingan distribusi data adalah derajat atau ukuran tinggi rendahnya puncak suatu distribusi data terhadap distribusi normalnya.
• Keruncingan data disebut juga kurtosis, ada 3 jenis yaitu:
– Leptokurtis
– Mesokurtis
– Platikurtis
• KERUNCINGAN DISTRIBUSI DATA
• Keruncingan distribusi data (α4) dihitung dengan rumus:
• Data tidak berkelompok
• Data Berkelompok
• Khusus untuk transformasi
• Keterangan
– α4 = 3, distribusi data mesokurtis
– α4 > 3, distribusi data leptokurtis
– α4 < 3, distribusi data platikurtis
• Selain cara di atas, untuk mencari keruncingan data, dapat dicari dengan menggunakan rumus:
• Keterangan
– K = 0,263 maka keruncingan distribusi data mesokurtis
– K > 0,263 maka keruncingan distribusi data leptokurtis
– K < 0,263 maka keruncingan distribusi data platikurtis
• REGRESI DAN KORELASI
• Pada bab ini akan membahas dua bagian yang saling berhubungan, khususnya dua kejadian yang dapat diukur secara matematis.
• Dalam hal dua kejadian yang saling berhubungan, ada dua hal yang perlu diukur dan dianalisis, yaitu:
– Bagaimana hubungan fungsional (persamaan matematis) antara dua kejadian tersebut -> analisis regresi
– Bagaimana kekuatan (keeratan) hubungan dua kejadian itu -> analisis korelasi
• REGRESI LINEAR SEDERHANA
• Garis regresi/ regresi: garis lurus/ garis linear yang merupakan garis taksiran atau perkiraan untuk mewakili pola hubungan antara variabel X dan variabel Y.
• Cara untuk mencari persamaan garis regresi:
• Koefisien regresi a dan b dapat dicari dengan rumus:
• Rumus lain untuk menghitung koefisien a dan b adalah:
• Kita dapat membuat garis regresi lebih dari satu dari suatu data. Lalu garis regresi manakah yang paling baik??
• Garis regresi yang paling baik adalah garis regresi yang mempunyai total kuadrat kesalahan/ total kuadrat selisih/ total kuadrat eror yang paling minimum.
• Total kuadrat eror dapat dihitung dengan:
• Selanjutnya bila diambil akarnya, maka diperoleh:
• Nih….. Contoh Soal Regresi……
• Untuk mempermudah mencari nilai – nilai yang diperlukan, maka akan digunakan tabel.
• Masukan nilai X ke dalam persamaan regresi untuk mencari nilai Y regresi
X 1 = 2 ->
X 2 = 3 ->
X 3 = 4 ->
X 4 = 5 ->
X 5 = 6 ->
X 6 = 7 ->
X 7 = 8 ->
• Maka nilai kesalahan baku dari taksiran regresi adalah:
• KOEFISIEN KORELASI
• Perumusan koefisien korelasi dilakukan dengan memakai perbandingan antara variasi yang dijelaskan dengan variasi total.
• Variasi total dari Y terhadap dirumuskan oleh
•
• Perbandingan antara variasi yang dijelaskan dengan variasi total, yaitu:
• Koefisien korelasi (r) adalah akar dari koefisien determinasi
• Keterangan:
• Nilai r = -1 disebut korelasi linear negatif (berlawanan arah); artinya terdapat hubungan negatif yang sempurna antara variabel X dan Y
• Nilai r = 1 disebut korelasi linear positif (searah); artinya terdapat hubungan positif yang sempurna antara variable X dengan variabel Y
• Nilai r = 0 disebut tidak berkorelasi secara linear, artinya tidak ada hubungan antara variabel X dan Y
• Koefisien korelasi dapat juga dicari dengan rumus berikut:
• Dari rumus terakhir, yaitu koefisien korelasi produk momen (product momen formula)
Apabila kita ambil:
Dengan demikian, maka rumus koefisien korelasi dapat juga ditulis:
• Arti dari koefisien korelasi r adalah:
• Bila 0,90 < r < 1,00 atau -1,00 < r < -0,90: artinya hubungan yang sangat kuat
• Bila 0,70 < r < 0,90 atau -0,90 < r < -0,70: artinya hubungan yang kuat
• Bila 0,50 < r < 0,70 atau -0,70 < r < -0,50: artinya hubungan yang moderat
• Bila 0,30 < r < 0,50 atau -0,50 < r < -0,30: artinya hubungan yang lemah
• Bila 0,0 < r < 0,30 atau -0,30 < r < 0,0: artinya hubungan yang sangat lemah
• Contoh soalnya nih….
Biar lebih ngerti…….
Biar lebih ngerti…….
Soalnya sama aja dengan yang regresi ya….
Koefisien korelasi adalah:
• Truz….
• Kesimpulannya….????
Oleh karena, nilai r = 0,49 terletak antara 0,30 dan 0,50 maka terdapat hubungan positif yang lemah antara tinggi badan dan berat badan.
Koefisien determinasi, yaitu
•
TUGAS 2
TUGAS 2
• Data pada suatu pabrik kertas menunjukkan bahwa banyaknya mesin yang rusak ada hubungannya dengan kecepatan beroperasi mesin cetak. Tergambar pada tabel di bawah ini.
• Tentukanlah:
• Persamaan regresi linear
• Berapa perkiraan jumlah kertas yang rusak, jika kecepatan mesin permenit adalah 18?
• Tentukan kesalahan baku yang diberikan oleh persamaan regresi!
• Tentukanlah koefisien korelasi dan koefisien determinasi data tersebut serta berikan artinya masing – masing!
• STATISTIKA SEMESTER 4
QUIZ 3
Selasa, 2 Juni 2009
QUIZ 3
Selasa, 2 Juni 2009
• Data pada suatu pabrik kertas menunjukkan bahwa banyaknya mesin yang rusak ada hubungannya dengan kecepatan beroperasi mesin cetak. Tergambar pada tabel di bawah ini.
• Tentukanlah:
• Persamaan regresi linear
• Berapa perkiraan jumlah kertas yang rusak, jika kecepatan mesin permenit adalah 20?
0 komentar:
Posting Komentar