Berkenalan dengan R

Lompat saja, tidak perlu kenalan bagaimana cara memasang aplikasi R atau Rstudio di komputer ya.
Pertama, di R, kita bertemu dengan prompt yaitu lambang “>” dan kursor yang berkedip, hening. Bagian ini disebut dengan console. Kita bisa menulis perintah apapun di dalam konsol itu, selama R mengerti, dia akan menjalankan perintah tersebut. Kalau tidak, R akan menyatakan “tidak tahu”, namun dengan cara yang bilang “Error: unexpected…”. Kadang saya suka ingin menjawab seperti itu, kalau ada orang yang beri pertanyaan, tapi saya tidak tahu jawabnya. Enak kali ya.

Langsung saja, begini cara memasukkan data ke R. Tanda “<-” bisa saja diganti dengan “=”, tapi saya lebih suka yang pertama. Lebih khas R. Fungsi “c” menyatakan bahwa data berupa vektor. Penjelasan mengenai tipe data dalam R, seperti array, matric, list, data frame, dll, untuk postingan lainnya. Ini postingan pertama, untuk yang selanjutnya, semoga bisa lebih seru.

Memuat Data

hasil<-c(4.5, 5.0,6.5, 5.0, 5.5, 3.8, 8.1, 4.5, 4.8, 5.3, 
3.0, 6.3, 6.1, 5.8, 5.9, 7.5, 7.5, 8.6, 3.0, 4.5)
lokal<-c(4.0, 4.0, 5.5, 6.0, 7.5, 4.8, 6.1, 4.5, 4.5, 5.0,
4.0, 5.3, 5.1, 5.8, 5.9, 6.5, 7.5, 7.6, 4.0, 4.5)

Data di atas di ambil dari modul saya waktu sekolah. Kemarin membongkar gudang dan menemukan itu. Modul pelajaran penggunaan minitab. Materi perkenalan juga, maka itu saya gunakan untuk menulis perkenalan dengan R juga. Untuk melihat data yang sudah dimasukan, panggil saja nama variabelnya. R sudah kenal kok.

Statistik Deskriptif

Mula-mula, deskripsikan dulu data yang dipunya. Umumnya, deskripsi data itu dengan menyatakan banyak amatan (n), rataan (mean), median, keragaman (variance), dan simpangan baku (standard deviation), bilangan lima angka, dan lain-lain. Beberapa package menawarkan macam-macam. Awalnya, kita gunakan R dasar saja (R-Base). Jangan load package dulu.

summary(hasil)
summary(lokal)
sd(hasil)
sd(lokal)
var(hasil)
var(lokal)

hasil yang keluar dari fungsi summary() hanya nilai statistik minimum, kuarter 1, median, rataan, kuarter 3, dan maksimum. untuk mencari simpangan baku dan keragaman, kasih perintah lain, yaitu sd, dan var. Untuk mencari kurtosis dan skewness, sayang harus dengan install package. salah satunya adalah package “moments”. atau, kalau mau, buat sendiri fungsinya.

selanjutnya, histogram.
dan boxplot juga ya.

#histogram with norm curve

h <- hist(hasil, breaks = 10, density = 10,
          col = "blue", xlab = "Hasil", main = "Histogram") 
xfit <- seq(min(hasil), max(hasil), length = 40) 
yfit <- dnorm(xfit, mean = mean(hasil), sd = sd(hasil)) 
yfit <- yfit * diff(h$mids[1:2]) * length(hasil) 
lines(xfit, yfit, col = "red", lwd = 2)

hasilnya…

uji kenormalan, dapat dilakukan dengan uji Shapiro-Wilk. Hasilnya…

Kembali ke modul kuliah dulu. Setelah membuat histogram, dilanjutkan dengan steam and leaf, dan juga dotplot. Kita coba membuat itu juga dengan R.

> fivenum(hasil)
[1] 3.0 4.5 5.4 6.4 8.6
> fivenum(lokal)
[1] 4.00 4.50 5.20 6.05 7.60
> boxplot (hasil, lokal)

Setelah mendapat ringkasan lima angka dengan fivenum lalu dihasilkan

Uji Hipotesis dan Selang Kepercayaan

R base menyediakan uji-t untuk menguji nilai rata-rata dari populasi berdasarkan sampel. Apakah rata-rata (mean) dari populasi hasil adalah 5? yap, t-test.

> t.test(hasil,mu=5)

	One Sample t-test

data:  hasil
t = 1.6101, df = 19, p-value = 0.1239
alternative hypothesis: true mean is not equal to 5
95 percent confidence interval:
 4.832035 6.287965
sample estimates:
mean of x 
     5.56 

sederhana kan? yap. untuk menguji dua populasi, caranya mirip.

> t.test(hasil,lokal)

	Welch Two Sample t-test

data:  hasil and lokal
t = 0.35365, df = 35.604, p-value = 0.7257
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.7342384  1.0442384
sample estimates:
mean of x mean of y 
    5.560     5.405 

Hal menarik dari R adalah, output dari suatu fungsi atau prosedur dapat dilakukan sebagai suatu objek. Seperti hasil uji t yang sebelumnya telah kita coba, dapat kita masukkan ke dalam suatu variabel dan diakses kembali.

> t.test(hasil,lokal)->ttesta
> ttesta

	Welch Two Sample t-test

data:  hasil and lokal
t = 0.35365, df = 35.604, p-value = 0.7257
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.7342384  1.0442384
sample estimates:
mean of x mean of y 
    5.560     5.405 

> names(ttesta)
[1] "statistic"   "parameter"   "p.value"     "conf.int"    "estimate"    "null.value" 
[7] "alternative" "method"      "data.name"  
> ttesta$statistic
        t 
0.3536466 
> ttesta$alternative
[1] "two.sided"
> ttesta$data.name
[1] "hasil and lokal"

Hasil uji t untuk membandingkan rata-rata dari variabel hasil dan lokal ditempatkan pada variabel ttesta. Kita dapat lihat parameter-parameter dari objek baru tersebut dengan fungsi names. Hasilnya, ternyata uji t yang dilakukan memiliki beberapa parameter, yaitu statistic (nilai uji-t), parameter, p.value, dst.

Bagaimana dengan output dari fungsi-fungsi lainnya?

Leave a Reply