在植物生理生态研究中,统计检验常常是研究结论的根基。本文尝试汇总植物生理生态领域常用的一些检验方法及R命令。需要说明的是这里介绍的R命令为R软件自带的函数,事实上很多R包都能干这些,尤其是plyr 和 dplyr近乎无所不能。
博文以笔记的形式写成,计划每周更新一次(坑一直需要自己挖,一定会掉,至于能不能爬上来再说),直至超出我了解范围。内容局限于植物生理生态的应用和结果解释,与大部分植物学家一样,对统计理论本身不是很上心,心力也很有限。此外,大部分情况下不考虑检验的单、双尾差异。R命令源于其原始函数,使用时建议查看相关案例(着实没有精力放置案例了)
正态性检验Shapiro Test
用途:样本的正态性检验。
零假设(Null hypothesis):待测样本是符合正态分布。
R命令:shapiro.test(x)
分布检验Kolmogorov And Smirnov Test (KS-test)
用途:某个分布是否符合某一理论分布或两个分布是否是同一分布。
零假设:分布符合某个已知的分布或者两个相同。
R命令:
ks.test(x, y, ...,
alternative = c("two.sided", "less", "greater"),
exact = NULL)
方差齐性检验 F-Test
用途:检验两个源于正态分布的样本的变异情况。
零假设:样本的变异一致。
R命令:
var.test(x, y, ratio = 1,
alternative = c("two.sided", "less", "greater"),
conf.level = 0.95, ...)
两个样本的独立性检验Chi squred Test
用途:检验两个样本是否独立。
零假设:两个样本相互独立。(注意,除了考虑p值,通常还需要考虑chi.sq值,大于3.841认为不独立)
R命令:
chisq.test(x, y = NULL, correct = TRUE,
p = rep(1/length(x), length(x)), rescale.p = FALSE,
simulate.p.value = FALSE, B = 2000)
单一样本的t-Test和Wilcoxon Signed Rank Test
用途:检验样本的均值是否可以认为是某个特定值。其中t-test适用于正态分布样本,为参数检验;Wilcoxon Signed Rank Test适用于非正态样本,为非参数检验。
零假设:样本均值等于某个特定的值
R命令:
t.test(x, mu = Mean)
# ------
wilcox.test(x, mu = Mean, conf.int = TRUE)
两个样本的均值比较t-Test和Wilcoxon Signed Rank Test
用途:比较两个样本的均值。其中t-test适用于正态分布样本,为参数检验(当样本是两个时,t-Test就是方差分析);Wilcoxon Signed Rank Test适用于非正态样本,为非参数检验。
零假设:两个样本的均值相等
t.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, var.equal = FALSE,
conf.level = 0.95, …)
#--------
wilcox.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, exact = NULL, correct = TRUE,
conf.int = FALSE, conf.level = 0.95, ...)
单因素方差分析,One-way Anova
用途:两个样本的均值比较,其实质就是两样本的t-Test。
零假设:均值相等
R命令:
aov(formula, data = NULL, projections = FALSE, qr = TRUE,
contrasts = NULL, …)
多因素的比较,是基于两两比较,排序通常用Tukey Honest Significant Differences
R命令:
TukeyHSD(x, which, ordered = FALSE, conf.level = 0.95, …)