主成分分析法简单例题 主成分分析法

主成分分析法(PCA)3.2.2.1 技术原理
主成分分析方法(PCA)是常用的数据降维方法,应用于多变量大样本的统计分析当中,大量的统计数据能够提供丰富的信息,利于进行规律探索,但同时增加了其他非主要因素的干扰和问题分析的复杂性,增加了工作量,影响分析结果的精确程度,因此利用主成分分析的降维方法,对所收集的资料作全面的分析,减少分析指标的同时,尽量减少原指标包含信息的损失,把多个变量(指标)化为少数几个可以反映原来多个变量的大部分信息的综合指标 。
主成分分析法的建立,假设xi1,xi2,…,xim是i个样品的m个原有变量,是均值为零、标准差为1的标准化变量,概化为p个综合指标F1,F2,…,Fp,则主成分可由原始变量线性表示:
地下水型饮用水水源地保护与管理:以吴忠市金积水源地为例
计算主成分模型中的各个成分载荷 。通过对主成分和成分载荷的数据处理产生主成分分析结论 。
3.2.2.2 方法流程
1)首先对数据进行标准化,消除不同量纲对数据的影响,标准化可采用极值法
及标准差标准化法
,其中s=
(图3.3);
图3.3 方法流程图
2)根据标准化数据求出方差矩阵;
3)求出共变量矩阵的特征根和特征变量,根据特征根,确定主成分;
4)结合专业知识和各主成分所蕴藏的信息给予恰当的解释,并充分运用其来判断样品的特性 。
3.2.2.3 适用范围
主成分分析不能作为一个模型来描述,它只是通常的变量变换,主成分分析中主成分的个数和变量个数p相同,是将主成分表示为原始变量的线性组合,它是将一组具有相关关系的变量变换为一组互不相关的变量 。适用于对具有相关性的多指标进行降维,寻求主要影响因素的统计问题 。
什么是主成分分析方法?主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标.在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术.它是一个线性变换.这个变换把数据变换...

主成分分析法简单例题 主成分分析法

文章插图
主成分分析(PCA)简介 主成分分析实例:一个 平均值 为(1, 3)、标准差在(0.878, 0.478)方向上为3、在其正交方向为1的 高斯分布。这里以黑色显示的两个向量是这个分布的 协方差矩阵 的 特征向量 ,其长度按对应的 特征值 之平方根为比例,并且移动到以原分布的平均值为原点 。
在多元统计分析中, 主成分分析 (英语: Principal components analysis , PCA )是一种分析、简化数据集的技术 。主成分分析经常用于减少数据集的 维数 ,同时保持数据集中的对方差贡献最大的特征 。这是通过保留低阶主成分,忽略高阶主成分做到的 。这样低阶成分往往能够保留住数据的最重要方面 。但是,这也不是一定的,要视具体应用而定 。由于主成分分析依赖所给数据,所以数据的准确性对分析结果影响很大 。
主成分分析由 卡尔·皮尔逊 于1901年发明,用于分析数据及建立数理模型 。其方法主要是通过对 协方差矩阵 进行特征分解,以得出数据的主成分(即 特征向量 )与它们的权值(即 特征值[3]) 。PCA是最简单的以特征量分析多元统计分布的方法 。其结果可以理解为对原数据中的 方差 做出解释:哪一个方向上的数据值对方差的影响最大?换而言之,PCA提供了一种降低数据 维度 的有效办法;如果分析者在原数据中除掉最小的 特征值 所对应的成分,那么所得的低维度数据必定是最优化的(也即,这样降低维度必定是失去讯息最少的方法) 。主成分分析在分析复杂数据时尤为有用,比如 人脸识别。
PCA是最简单的以特征量分析多元统计分布的方法 。通常情况下,这种运算可以被看作是揭露数据的内部结构,从而更好的解释数据的变量的方法 。如果一个多元数据集能够在一个高维数据空间坐标系中被显现出来,那么PCA就能够提供一幅比较低维度的图像,这幅图像即为在讯息最多的点上原对象的一个‘投影’ 。这样就可以利用少量的主成分使得数据的维度降低了 。
PCA跟因子分析密切相关,并且已经有很多混合这两种分析的统计包 。而真实要素分析则是假定底层结构,求得微小差异矩阵的特征向量 。
PCA,Principle Component Analysis,即主成分分析法,是特征降维的最常用手段 。顾名思义,PCA 能从冗余特征中提取主要成分,在不太损失模型质量的情况下,提升了模型训练速度 。

秒懂生活扩展阅读