费希尔阀门定位器dvc6200 费希尔( 三 )


二、试验设计的三大原则——费希尔的农田
通过以上第一节 , 我们明白了为什么DOE比COST方法更加高效 , 然而如何进行试验设计是一个非常重要的环节 , 这将直接关系到试验的效率和成败 。费希尔在洛桑农业实验站工作的14年中(1919年-1933年) , 通过大量的试验研究总结出了试验设计的普适性的三大原则 , 即:
(1) 重复试验;
(2) 随机化;
(3) 区组化 。
然而有时候 , 一些专业书籍对这三大原则的解读会非常晦涩难懂 , 这里我们通过一个杜撰的故事—— 费希尔的农田  , 尝试从另外一个视角来解读这三大原则 。
如图2 , 故事讲的是 , 费希尔在洛桑农业实验站工作时 , 曾做过两种稻种亩产量的评估试验 , 他经过严密认真的思考 , 最终得出了试验设计的三大原则 , 并一直被学界奉为经典:
① 最初费希尔的想法是 , 在两块稻田中分别种上A稻种和B稻种 , 然后去看哪一种稻种的亩产量更高 , 这样就可以得出评估结论了;
② 可是 , 费希尔是大统计学家 , 所以稍作考虑后 , 认为仅仅从一个点去做判断是不严谨的 , 因此 , 他就把左右两块田各分成4块 , 然后再把A和B种上去 , 这样不仅可以得到A和B两种稻种亩产量的平均值 , 而且还可以获得它们亩产量的标准差 , 这样比较就更加有说服力了;
③ 但是 , 敏锐的费希尔很快又意识到上面的试验方法还是存在缺陷 , 因为根据自己多年在农业实验站工作的经验 , 实验站农田的土壤肥沃很是不均 , 假设左边的农田土壤一般 , 而右边的农田土壤更加肥沃 , 如果最后得出的结论是B稻种的产量更高 , 那么是稻种的原因导致其产量高 , 还是土壤的原因导致其产量高呢?这里就产生了两种因素的混淆 , 所以 , 他经过思考之后 , 又重新设计了试验方法 , 他在左边和右边的农田分别种上A和B , 那么这样A和B稻种在土壤肥沃和普通的农田上都机会均等地种上了 , 所以这样做得出的结果会更加合理;
④ 本来这个试验方案可以直接来进行操作了 , 这时 , 农业实验站临时接到一个新任务 , 要求评价新发明的机械播种机比人工播种是否更有助于提高亩产量 , 为了减少试验次数 , 要求将两种评价合并在一起 , 费希尔不愧是天才 , 他很快就找到了完美的方法来解决这个问题 , 他把左边和右边的农田各一半用人工播种 , 另一半用机械播种 , 这样就在不增加试验次数的情况下 , 非常完美地完成了这个临时接到的任务 。
实际上 , 费希尔在上面的试验逻辑思考②、③、④里面 , 已经非常完整地把重复试验、随机化和区组化这三大试验设计原则创造性地应用到两种稻种亩产量的评价任务中 , 从而 , 保证了试验结果的有效性和合理性 , 为最后得出科学的评价结果提供了有力保障 。
当然 , 对于区组化 , 有一个基本原则 , 即: 『能区组者则分区组 , 不能分区组者则随机化 。』
三、试验设计及分析的工作流程
以上我们已经知晓了试验设计的优越性以及试验设计的三大原则 , 这里我们通过一个全因子完全析因设计来介绍一下试验设计及分析的工作流程 。
如图3 , 这是一个典型的因子设计示意图 , 从图中可以看出 , 试验设计者试图研究A、B、C三个因子对响应变量的影响 , 为此 , 设计者设计了以下试验方案 , 并希望通过以上试验估计以下回归方程的系数:
由以上回归方程可以明显看出一共存在8个系数需要估计 , 因此 , 需要至少次试验 , 类似地 , 如果因子数量为n个 , 那么我们需要做到完全析因 , 则需要至少次试验 。
根据前面所提到的试验设计的三大原则 , 我们还需要进行重复试验 , 但是为了减少试验次数 , 一般选择在中心点进行3-4次重复性试验 。选择在中心点进行重复性试验还有一个好处 , 即它可以发现模型是否存在弯曲现象 , 如果存在弯曲现象 , 则我们需要加上因子的高阶项 , 以构成响应曲面 , 通常而言 , 也就意味着我们基本找寻到了最优值 。当然 , 对于出现弯曲情况 , 还需要增加一些试验点来对模型参数进行估计 , 这将在后面进行讨论 。同时 , 我们还需要对试验顺序进行随机化处理 , 本案例没有区组化的要求 , 因此 , 可以直接根据此试验设计进行试验 , 并获得相应的试验数据 。

秒懂生活扩展阅读