library(MASS) data() help(survey) str(survey) #Übersicht über die Datenstruktur summary(survey) #Übersicht über die Daten, Mean, Median,... table(survey$Sex) #Table mit der Anzahle des jeweiligen Geschlecht table(survey$Sex, survey$Smoke) #Kreuztabelle (Wieviele Männer rauchen stark,... attach(survey) #Die einzelnen Spalten sind nun direkt ansprechbar mean(Pulse) #Durchschnitt Puls, nicht möglich da >0 Werte NA mean(Pulse, na.rm=T) #Fehlende weglassen na.omit(Pulse) #streicht alle Fehlenden Weg Pulse[!is.na(Pulse)] #streicht auch alle fehlenden und gibt Vektor zurück hist(Height) #Histogramm boxplot(Height) #Boxplot boxplot(split(Height, Sex)) #Boxplots boxplot(Height[Sex=="Female"],Height[Sex=="Male"]) #Boxplots plot(Wr.Hnd,NW.Hnd) #Scatterplot plot(Sex,Height) #Wieso gibt das ein Boxplot detach(survey) #Spalten sind nicht mehr via Namen ansprechbar plot(survey$Wr.Hnd,survey$NW.Hnd) #Nochmals Schreib gegen nicht Schreibhand Spannweite plot(survey[,2],survey[,3]) #nochmals das selbe plot(survey[1:50,2],survey[1:50,3]) #nur die ersten 50 Werte help(survey) #online hilfe zum datensatz help(plot) #online hilfe zu plot #Aufgabe a summary(survey) #Der Druchschnitt der Schreib ist leicht grösser, ebenso die Max.- und Min-Werte, jedoch sind die Werte sehr ähnlich und die abweichungen könne auch rein zufällig. boxplot(survey$Wr.Hnd, survey$NW.Hnd, main="Aufgabe 1. a)", ylab="Spannweite", names=c("Schreibhand", "Nichtschreibhand")) #H_0 Spannweite: Schreibhand=Nichtschreibhand => ANOVA #Aufgabe b table(survey$Age, survey$Smoke) #Die beiden ältesten rauchen nicht survey[rev(order(survey$Age))[1:2],] #Nur die beiden ältesten survey[rev(order(survey$Age))[1:2],"Smoke"] #Nur Smoke #Aufgabe c pairs(survey) #Geschlecht und evtl. Schreibhand, ist aber etwas weit hergeholt.