植物生理生态数据采集与分析

今天在理发店排队等待的时候,跟凌老师扯了一会QQ。忘了当时是什么原因,让我开了个国际玩笑:“以后我要是有自主权,我以后开设一门课程,系统阐述田间数据采集-统计分析-结果可视化”问题。显然这是个富有“理想特色”的梦想。无论是数据采集、统计分析还是可视化,均是非常复杂的问题,每一个“名词”均可开设一系列的课程,甚至是一个专业。而我本身也就是懂一点皮毛。但是,这个问题确实非常有意思,于是睡觉前还是决定记录下来。

田间数据采集

抛开实验设计这种已经被诸多课程纳入的基础性问题,试验数据采集还有很多被忽略的问题。举个例子:植物生理生态研究的对象往往必须包括环境因素和植物,环境数据测定的探头(尤其是市面上没有的特殊用途的)设计及工作原理、数据采集系统的工作原理等等几乎没有被重视。主要的原因可能是,现在国内科研单位普遍豪气,动不动就是豪华(全套)采集系统直接购入,而研究生导师迫于造文章的压力,不希望研究生花时间去钻研这种可以花钱解决的事情。这样方式是简单高效了,但是研究者所获得也只有冰凉的数据,至于数据是否准确,多数真正使用的研究生是不明白的。其它诸如光合作用、同位素等等更是如此。其实,很多检测均是用一些基础的物理原理在做,比如大多数探头的原理是相同的,即电路中特殊电阻器件因目标环境变化引起的自身电阻变化。如果能有系统的原理和实践教学,让学生有比较宏观的印象或许对于研究的生动性和数据可靠性大有益处。

统计分析

这个问题几乎是所有生理生态研究者的软肋。很多人到毕业都没搞明白方差分析,不论什么数据上来就“点”软件中特定的按钮,我甚至见过死记“点”顺序的毕业生。详细参见统计学的七个‘枕头’ 以及忠于假设和数据

数据的可视化

简单的说,这是统计分析的一个方面。但是我其实更愿意单独拿出来说。数据的可视化,有非常多的技巧和规矩。而大多数研究生直到毕业甚至工作多年了,依然在重复犯一些低级错误。比如非常简单的bar图,就有不少人为了将差异显得更”醒目”而调节坐标刻度范围。再比如三维立体图的滥用。

Davis