15 lisa: funktsioonid

15.1 raamatukogud

install.packages("ggplot2") laadib raamatukogu CRAN-ist alla library(ggplot2) muudab raamatukogu funktsioonid kättesaadavaks

15.1.1 bioconductor

First run biocLite script fron bioconductor.org source("https://bioconductor.org/biocLite.R")
use ‘http’ in url if ‘https’ is unavailable. biocLite("edgeR")

15.1.2 Github

https://github.com following command installs xaringan (presentation ninja) package from GitHub user yihui devtools::install_github("yihui/xaringan")

15.2 failide sisselugemine

readit::readit()kasutab tidyverse, loeb sisse mida iganes
readr::read_delim(file, delim="") saad määrata delimiteri
readr::read_csv2() loeb sisse Exceli csv-d
readr::read_csv() loeb sisse csv-d
Addins/Gotta Read Em All - interaktiivne
readr::write_csv() & base::write.csv()

15.3 matemaatika

sum(x, na.rm = TRUE)
sqrt() võtab ruutjuure
prod() korrutab
log() naturaallogaritm alusel e
exp() anti-logaritm alusele e
log2()
log10()
round(x, 2) ümardab 2le komakohale
^ - astendamine (** töötab ka)
* - korrutamine
/ - jagamine
== - võrdusmärk

15.4 andmeraamid

tibble() andmeraami sisestamine rea vektoritena
tribble() andmeraami sisetamine tabelina
str(df) näitab tabeli struktuuri
nrow() annab tabeli ridade arvu
ncol()
class() annab objekti klassi
as_tibble() & as.data.frame()
add_row()
add_column()
distinct() eemalda duplikaatread
count() loeb üles tabeli rea väärtuste aesinemise arvu
add_count() lisab faktori esinemiste arvu tabelile uue veeruna “n”
table() annab väärtuste aesinemise arvu igal faktorite taseme kombinatsioonil
summary() summeerib tabeli
psych::describe() summeerib tabeli
colnames()
rownames()
rownames_to_column()
remove_rownames()
rowid_to_column() adds a column of ascending nrs starting at 1.
arrange(df, desc(column_name)) sordib read
top_n() annab n suureima/väikseima väärtusega rida
colSums()
rowSums()
rowMeans()
apply()
bind_rows(df1, df2, .id = "id") (base::rbind)
bind_cols() (base::cbind)
full_join(df1, df2)
left_join(df1, df2) ühendab df2 df1-e ridadega nii, et uusi ridu ei teki.
semi_join(df1, df2) filter: 2 tabeli ühisosa
anti_join(df1, df2) filter: 1 tabeli read, mis puuduvad 2. tabelis

15.5 NA-d

VIM::aggr() näitab puuduvad väärtused
sapply(diabetes, function(x) sum(is.na(x))) Mitu NA-d on igas tulbas.
VIM::matrixplot(x) NA-de plot
filter_all(x, any_vars(is.na(.))) annab read, mis sisaldavad NA-sid
na_if(x, y) rekodeerib vektoris x väärtused y NA-deks
coalesce(x, 0L) rekodeerime NA 0-ks
``
``
``
``
``
``
``
``