15 lisa: funktsioonid
15.1 raamatukogud
install.packages("ggplot2")
laadib raamatukogu CRAN-ist alla library(ggplot2)
muudab raamatukogu funktsioonid kättesaadavaks
15.1.1 bioconductor
First run biocLite script fron bioconductor.org source("https://bioconductor.org/biocLite.R")
use ‘http’ in url if ‘https’ is unavailable. biocLite("edgeR")
15.1.2 Github
https://github.com following command installs xaringan (presentation ninja) package from GitHub user yihui devtools::install_github("yihui/xaringan")
15.2 failide sisselugemine
readit::readit()
kasutab tidyverse, loeb sisse mida iganesreadr::read_delim(file, delim="")
saad määrata delimiterireadr::read_csv2()
loeb sisse Exceli csv-dreadr::read_csv()
loeb sisse csv-d- Addins/Gotta Read Em All - interaktiivne
readr::write_csv() & base::write.csv()
15.3 matemaatika
sum(x, na.rm = TRUE)
sqrt()
võtab ruutjuureprod()
korrutablog()
naturaallogaritm alusel eexp()
anti-logaritm alusele elog2()
log10()
round(x, 2)
ümardab 2le komakohale- ^ - astendamine (** töötab ka)
- * - korrutamine
- / - jagamine
- == - võrdusmärk
15.4 andmeraamid
tibble()
andmeraami sisestamine rea vektoritenatribble()
andmeraami sisetamine tabelinastr(df)
näitab tabeli struktuurinrow()
annab tabeli ridade arvuncol()
class()
annab objekti klassias_tibble() & as.data.frame()
add_row()
add_column()
distinct()
eemalda duplikaatreadcount()
loeb üles tabeli rea väärtuste aesinemise arvuadd_count()
lisab faktori esinemiste arvu tabelile uue veeruna “n”table()
annab väärtuste aesinemise arvu igal faktorite taseme kombinatsioonilsummary()
summeerib tabelipsych::describe()
summeerib tabelicolnames()
rownames()
rownames_to_column()
remove_rownames()
rowid_to_column()
adds a column of ascending nrs starting at 1.arrange(df, desc(column_name))
sordib readtop_n()
annab n suureima/väikseima väärtusega ridacolSums()
rowSums()
rowMeans()
apply()
bind_rows(df1, df2, .id = "id")
(base::rbind)bind_cols()
(base::cbind)full_join(df1, df2)
left_join(df1, df2)
ühendab df2 df1-e ridadega nii, et uusi ridu ei teki.semi_join(df1, df2)
filter: 2 tabeli ühisosaanti_join(df1, df2)
filter: 1 tabeli read, mis puuduvad 2. tabelis
15.5 NA-d
VIM::aggr()
näitab puuduvad väärtusedsapply(diabetes, function(x) sum(is.na(x)))
Mitu NA-d on igas tulbas.VIM::matrixplot(x)
NA-de plotfilter_all(x, any_vars(is.na(.)))
annab read, mis sisaldavad NA-sidna_if(x, y)
rekodeerib vektoris x väärtused y NA-dekscoalesce(x, 0L)
rekodeerime NA 0-ks- ``
- ``
- ``
- ``
- ``
- ``
- ``
``