欢迎来到优发表网,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

购物车(0)

期刊大全 杂志订阅 SCI期刊 期刊投稿 出版社 公文范文 精品范文

多元统计分析论文(合集7篇)

时间:2023-03-16 16:27:42
多元统计分析论文

多元统计分析论文第1篇

主成分分析法,又称主分量分析法是指相关的经济变量间通常存在着起主导作用的决定性因素,通过对原始变量的相关矩阵内部结构进行分析,找出几个不相关的综合指标来线性表示原来的变量,主成分之间既互不相关,又尽可能多的包含了原指标集合。这种方法首先由Hotelling提出,其主要思想是降维。Stone(1947)对美国1929-1938年间的17项国民经济统计指标进行主成分分析,发现完全可以用三个经济指标来概括原来的17项指标,大大简化了数据分析。M.Scott(1961)对英国157个城镇的发展水平进行主成分分析,发现原57个测度指标完全可以由5个综合变量替代,既解决了原指标间的信息重叠问题,又简化了原指标体系的指标结构,主成分分析由此推广。邱东(1990)系统阐述了主成分分析法的定义、基本思想、基本步骤和特点,认为主成分分析法可以消除评价指标间的相关影响,并且伴随数学变换过程生成信息量权数和系统效应权数,保证了客观性。同时也指出了主城分析法在计算综合评价值未充分考虑指标的重要程度等不足,主要适用于被评价对象较多的综合评价。随后,众多学者对此提出了改进:孟生旺(1992)针对原始数据的标准化处理和主成分个数的选择问题,认为标准化不如均值化的无量纲处理方法,提出了非标准化主成分分析法。陈述云等(1995)通过对原始数据作对数—中心化转换,用原始变量的非线性组合表示主成分,同时重点分析样本协方差矩阵而非相关系数矩阵,提出了非线性主成分法。朱泰英等(2004)提出了加权主成分分析法,认为可以将主成分分析法的客观分析和层次分析法的主观分析有机结合。王璐等(2006)在对主成分分析法的权数、降维等问题的研究上,提出了首先要按主成分分析法对指标体系进行分类,得到各方面的评价值后再进行主成分分析,最终得到综合评价值的二重主成分分析法。段力誌等(2009)在传统主成分分析法基础上,首先对原始指标值进行预处理,再借助软件,将原始数据转化为少数几个主成分的线性组合,并进行加权变换,得到改进的主成分综合值。白雪梅等(1995)则分析了“均值化”、“标准化”、“极差正规化”三种方法的选择条件是保证方差损失最小。陈衍泰等(2004)认为主成分分析法具有全面性、可比性和客观合理性等优点,比较适合对评价对象进行分类,但需要大量数据,函数意义不够明显,不能反映客观发展水平。苏为华(2012)提出经典的R型主成分本质是单项指标标准化结果的加权算术平均值,比当量平均法复杂。赵利等(2013)通过主成分分析法对宏观经济中影响城镇劳动就业因素分析时,提出主成分为宏观经济和技术进步,通过VAR模型对主成分进行分析,得出宏观成分中对城镇劳动就业影响最大的是消费、产业结构和城市化水平,而技术进步成分中影响最大的是技术进步的结论。黄利文(2013)针对主成分分析中存在的未考虑负向因子的影响,以及采用线性加权法时确定权重方法不统一,评价结果非唯一等缺陷,提出了逼近理想点的主成分分析法,更好地反映了原始数据信息,并较为客观地给出了综合评价结果。林海明等(2013)认为主成分分析因缺乏应用条件的考虑而导致评价结果不具合理性甚至错误,通过分析因子分析法因子载荷阵的简单结构、加权算术平均数的合理性,得出主成分分析的应用条件是:指标是正向、标准化的;主成分载荷阵达到更好的简单结构时,主成分正向,且主成分与变量显著相关。

二、因子分析

法因子分析法是指从被评对象的观察变量的相关度出发,利用降维的思想,把繁杂的变量尽可能归纳为几个综合因子进行分析的的一种多变量统计分析方法。其基本思想是:将观察变量按相关度的高低或联系的紧密程度进行分类,类别内部变量相关性高,联系紧密,而类别之间的变量则相关度较低,联系稀疏,每一类变量则代表一个公共因子。具体步骤为:

三、逼近理想解的排序法

多元统计分析论文第2篇

1聚类分析在证券投资中的应用

(1)定义:聚类分析是依据研究对象的特征对其进行分类、减少研究对象的数目,也叫分类分析和数值分析,是一种统计分析技术。(2)在证券投资中应用聚类分析,是基于证券投资的各种基本特点而决定的。证券投资中包含着非常多的动态的变化因素,要认真分析证券投资中各种因素的动态变化情况,找出合适的方法对这种动态情况进行把握规范处理,使投资分析更加的准确、精确。1)弥补影响股票价格波动因素的不确定性证券市场受到非常多方面的影响,具有很大的波动性和不稳定性,这种波动性也造成了证券市场极不稳定的发展状态,这些状态的好坏对证券市场投资者和小股民有着非常重要的影响。聚类分析的方法是建立在基础分析之上的,立足基础发展长远,并对股票的基本层面的因素进行量化分析,并认真分析掌握结果再应用于证券投资实践中,从股票的基本特征出发,从深层次挖掘股票的内在价值,并将这些价值发挥到最大的效用。影响证券投资市场波动的因素非常多,通过聚类分析得出的数据更加的全面科学,对于投资者来说这些数据是进行理性投资必不可少的参考依据。2)聚类分析深层次分析了与证券市场相关的行业和公司的成长性聚类分析是一种非常专业的投资分析方法,它善于利用证券投资过程中出现的各种数据来对证券所涉及的各种行业和公司进行具体的行业分析,这些数据所产生额模型是证券投资者进行证券投资必不可少的依据。而所谓成长性是一种是一个行业和一个公司发展的变化趋势,聚类分析通过各种数据总结归纳出某个行业的发展历史和未来发展趋势,并不断的进行自我检测和自我更新。并且,要在实际生活中更好的利用这种分析方法进行分析研究总结,就要有各种准确的数据来和不同成长阶段的不同参数,但是,获取这种参数比较困难,需要在证券市场实际交易和对行业和公司的不断调查研究中才能得出正确的数据。因此,再利用聚类分析法进行行业和公司分析和证券投资分析时要注重选取正确的、关键的指标进行检查,例如主营收入增长率、净利润增长率等指标,这样才有利于正确预测证券市场上股票的发展潜力。3)在实际操作中更加直观实用聚类分析是根据现代证券市场发展水平和特点发展出来的新的分析方法,这种分析方法的出现与现代的基本的投资组合理论形成了比较,突出了聚类分析方法更加贴近实际生活,更加直观、实用的特点,并且由于技术的发展,聚类分析方法在实际应用中所受到的局限较小,而且易操作,因此它的适用范围就比现资理论更加的广泛。

2主成分分析在证券投资中的应用

(1)定义:在统计分析中,主成分分析是一种分析、简化数据集的技术。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。主成分分析由卡尔•皮尔逊于1901年发明,用于分析数据及建立数理模型。其方法主要是通过对协方差矩阵进行特征分解,以得出数据的主成分(即特征矢量)与它们的权值。(2)主成分分析的应用非常广泛,判别分析的分析方法就是通过对各种分类数据的研究,分析出自变量各组间存在的差异,并总结出差异性,判断哪一个自变量对组间差异的贡献是否完全,根据这些数据将自变量的转变方法进行样本归类。1)降低影响证券投资市场变动的因素之间的互相影响在证券市场中有非常多的因素在影响着证券市场的稳定,这些因素之间有着非常多的关系,相互影响、相互关联,但相互之间的影响也存在着非常多的影响。而主成分分析方法就是在对影响证券投资相互关系的因素中进行分析,并对原始数据指标变量进行认真分析,将其中重要的主成分因素概括出来,并进行转换形成相互彼此相互独立的成分,而且经过实践证明在影响证券市场投资分析中的指标间相关程度越高,主成分分析效果越好。2)通过主成分分析减少指标选择的工作量主成分分析的目的就是要通过对各种数据、因素的分析总结出相对各种因素的不同影响程度,总结总体因素中的主要影响成分,并总结出不同层次的影响因素梯度,在分析时采取逐级分析的方法,这样既可以抓住主要矛盾进行分析,也可以节省时间,并且提高分析的准确性,减少分析人员的工作量,因此,主成分分析法指标选择上的优势更加的突出。3)由主成分分析法构造回归模型更加的精确、节省时间在进行证券投资因素分析时,为了能够更加清晰准确的对模型中的相关数据进行分析,都要对各种数据进行模型处理,这样的处理方式可以提高整个证券投资分析的准确性,是模型更加易于做出结构分析、控制和进行证券市场变动的预报。

3因子分析

(1)定义:因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。(2)应用因子分析最主要的作用是确定证券投资组合的模型。因子分析将影响股票价格的各种因素看成是不同的变量,建立股价因子模型,利用各因子不相关性确定股票的分类,再分析股票的发展潜力的基础上确定出合适的证券投资模型。

4总结

多元统计分析论文第3篇

关键词:多元统计分析;教学内容;教学方法

中图分类号:G424.21 文献标识码:A 文章编号:

多元统计分析是统计学中的一个重要分支,是收集、处理和分析多维样本数据的统计方法。特别是随着计算机技术的发展,计算软件的普及,多元统计分析已成为分析多元数据的一个重要工具,在自然科学、管理和社会科学、经济领域等都有广泛的应用。

多元统计分析是我校财经管理类本科生大部分专业的一门必修课程,总学时为45学时,其中理论教学时数36学时,实践教学时数时。该课程涉及到许多数学知识,有大量的理论和公式推导,且计算量比较大。同时,本课程的学生为财经管理类的本科生,大多数学基础不好,且学生基础差异较大,部分学生感觉本门课程学习有困难。本文根据本学科的特点和学生的实际情况,结合自己从事多元统计教学的实践和体会,提出几点思考,以供同行参考,共同探讨。

一、重视统计方法的应用

针对财经管理类本科生数学基础较弱的情况,在教学过程中,理论推导部分不必讲解过多,也不应该过分强调复杂的数学证明和公式推导。对于多元统计分析的每一种统计方法,重点阐述它们的统计思想,结合实例介绍涉及到的背景,在实际应用中需要解决什么问题,如何用这种统计来解决这些问题,用了这种统计方法后可以得到什么结果。以及各种方法应用的前提条件、适用范围和局限性等,教学重点从理论转移到实际应用中。为了加深学生对概念的理解,适当做一些数学推导,可以省略复杂的证明。例如在聚类分析的教学中, 借助“物以类聚,人以群分”的道理给出了“就近原则”, 聚类分析的基本思想就容易被学生接受, 然后再逐步引入为了实现就近原则的度量远近的距离及各种具体聚类方法。学生在短时间内就对统计方法有了理解,效果非常明显。

二、重视各种多元统计方法的联系

各种多元统计分析方法虽各自具有不同的特点,但它们彼此之间均有着紧密的联系。在解决实际的问题中,也需要用多种方法结合起来解决问题,对于这一点一定要讲清楚。在聚类分析和判别分析的介绍中,我们介绍了在度量工具选择上两种方法的共同点。同时,聚类分析与判别分析有以下的不同点:①聚类分析可以对样本进行分类,也可以对指标进行分类;而判别分析只能对样本进行判别归类;②聚类分析事先不知道事物的类别,也不知道应分几类;而判别分析必须事先知道事物的类别;③聚类分析直接对样本进行分类,而判别分析根据训练样本建立判别函数,然后对新的观测对象进行判别归类。在实际问题处理中,针对聚类分析归类,判别分析分类的特点,常常将两种统计方法结合使用。在因子分析的基本思想、数学模型、因子载荷矩阵的估计方法、因子得分等几个环节的学习中, 我们随时将主成分分析的相关内容拿来与之比较分析, 分析了两种方法在模型、参数唯一性、取舍因子等问题上的不同与使用环境等方面的共同之处, 学生不仅对因子分析有了深入理解,而且对主成分分析的内容有所复习,更容易实现对着两种统计方法的掌握。

三、重视统计软件地使用

各种多元统计方法解决的是大量多维数据的分析问题,自然离不开复杂数据的计算,所以在教学中必须重视统计软件的学习,完成大量的计算过程。SPSS软件简单易学,操作方便、功能强大、应用广泛,可以进行大部分多元统计分析方法的操作,基本能满足教学和实践上计算的需要。且在多元统计分析课程之前,学生已学过SPSS课程,对软件的应用也基本掌握。在教学过程中,当介绍每一种统计方法的基本思想、原理后,先对教材上的已有详细步骤和结果的例题进行操作,使学生将统计软件操作结果与其进行比较。进一步要求学生针对某一专题或结合自身专业,对某一实际问题收集数据,整理数据,利用软件进行具体分析操作,得到自己需要的结果。但是在教学过程中,需要让学生知道统计软件只是一种分析工具, 重点还是掌握各种统计分析方法的基本原理和科学选用上。同时,结合自己的一些研究课题,与学生一起探讨、研究,培养学生初步的科研能力。

四、合理制定考试方式和内容, 科学评定学生成绩

针对多元统计分析课程的特点,本门课程考核不仅要注重基本知识点的掌握,也要包括各种统计方法的理解、分析和应用。在考试的方式上,可以采用闭卷考试,开卷考试和课程论文相结合,从而多角度、全方位对学生的学习成绩给予综合评价。通过以上多种方式,考察学生理解能力、跨学科综合能力、解决实际问题的能力及创新能力。在考试的内容上,闭卷考试着重考查学生对各种统计方法和理论知识的掌握程度,并对量不大的数据进行处理;开卷考试以学生上机操作的方式进行,着重考查学生利用统计软件处理多元数据的熟练程度,以及对统计软件输出结果进行分析判断和解释说明的统计素养;课程论文侧重于考查学生运用多元统计方法解决实际问题的能力及创新能力。总成绩则有闭卷考试成绩(占60%)、开卷考试(占20%)和课程论文成绩(占20%)三部分组成,从而科学评价学生对本门课程的掌握情况。

多元统计分析作为多元数据处理的一个重要工具, 必将随着社会的需要而不断的有广泛的应用。多元统计分析教学模式的选择必须根据教学的需要和学生的实际接受水平发生改变。而作为教师,需要不断地总结经验,完善自己的教学,不懈努力,传授给学生正确的统计思想, 实用的统计方法和综合的统计能力。

参考文献:

1何晓群. 多元统计分析[M]. 中国人民大学出版社,2012.

2任雪松,于秀林. 多元统计分析[M]. 中国统计出版社,2011.

3苏金明,傅荣华等. 统计软件SPSS系列应用实战篇[M]. 北京: 电子工业出版社,2002.

4张文彤,邝春伟.SPSS统计分析基础教程[M]. 北京:高等教育出版社,2011.

5吕洁. 多元统计分析课程教学探讨[J].中国成人教育,2007 ( 8): 153- 154.

6陶胜,胡明颖. 多元统计分析课程教学研究与实践[J]. 集美大学学报, 2011( 2): 99- 102.

多元统计分析论文第4篇

关键词:水文统计;教学内容;教学体系

作者简介:宋松柏(1965-),男,陕西永寿人,西北农林科技大学水利与建筑工程学院,教授;康艳(1976-),女,黑龙江佳木斯人,西北农林科技大学水利与建筑工程学院,讲师。(陕西 杨凌 712100)

基金项目:本文系西北农林科技大学2011年度教学改革研究项目(项目编号:JY1102059、JY1102056)的研究成果。

中图分类号:G642.0     文献标识码:A     文章编号:1007-0079(2012)05-0054-02

“水文统计”是应用概率论与数理统计原理研究和揭示水文现象统计规律的一门学科,是水利、交通和电力工程规划设计的核心基础理论。20世纪50年代,我国著名水文学家刘光文教授在河海大学(原华东水利学院)创建了我国第一个水文系,亲自开设了我国第一门结合水文专业特点的“应用数学”,主要介绍水文学中基本的统计理论和方法[1],1980年更名为“水文统计”。半个多世纪以来,随着我国水利、交通和电力发展战略的调整和发展,丛树铮、朱元、宋德敦、丁晶、郭生练、金光炎、吴正平、黄振平、张海伦、刘权授、梁忠民、华家鹏、谢平和陈元芳等学者先后在水文统计领域进行了大量的研究,取得了重要的研究进展,形成了今天“水文统计”课程的理论体系[2-16]。以“水文统计”课程为核心,出现了若干相关的分支课程,如“统计试验方法及应用”、“风险分析与决策”、“随机水文学”和“水文水资源随机分析”等,所有这些推动了我国“水文统计”教学和科学研究的发展[2-16]。20世纪90年代以来,国外在水文统计出现了一些新的理论与方法,这些方法不同程度地引进了许多院校“水文统计”的教学。但是,这些方法仍分散于一些外文文献和研究专著。根据现行“水文统计”课程教学内容和水利、交通和电力工程专业培养方案,鉴于大多数学校在“水文统计”课程开设之前已经讲授过概率论,因此,有必要压缩现行“水文统计”教材中的一些概率论篇幅,突出概率论在水文中的应用,增加一些实用的理论方法和水文统计新的理论与方法,补充和修改现行课程的教学内容。

一、国外“水文统计”课程教学内容

国外“水文统计”教学主要选用的教材有《Statistical Methods in Hydrology》、美国地质调查局培训教材《Statistical Methods in Water Resources》和《Statistical Methods in Hydrology and Meteorology》等[17-19]。

《Statistical Methods in Hydrology》经过第二版修订后,被广泛地用于教学中,是一本很好的教材。主要介绍概率和概率分布的基本概念,随机变量的特性,一些离散型概率分布及其应用,正态分布,连续分布,频率分析,置信区间和假设检验,线性回归分析,多元线性回归分析,相关分析,多变量分析,数据生成,水文时间序列分析,随机水文模型,不确定性、风险可靠性分析的概率方法和地统计分析等[17]。《Statistical Methods in Water Resources》主要介绍数据总结,数据的图形分析,不确定性描述,假设检验,总体的独立性分析,配对检验,几个独立总体比较,相关分析,线性回归分析,回归的交替分析法,多元线性回归分析,趋势分析,检测下限数据分析方法,离散关系,离散响应回归和图形展示等[18]。《Statistical Methods In Hydrology and Meteorology》强调随机变量间的关系,主要介绍概率计算的基本概念,随机事件的相互依赖性,随机变量的概率分布,随机现象的统计估计,统计假设检验和随机变量的相互依赖性等[19]。

上述教材的特点是突出了概率论与数理统计在水文中的应用,除此之外,在教学上,还讲授随机模型,地统计分析,风险分析理论,统计模拟,贝叶斯分析,不确定性分析,水文分布,极值理论与洪水、干旱评估,人工智能,区域分析等。区域分析主要有洪水指数法,频率分布的区域特性和区域洪水水位的描述等内容。

二、国内“水文统计”课程教学内容

自刘光文教授开设“应用数学”课程讲授水文学中的概率与统计理论方法后,金光炎先后编写了《水文统计的原理与方法》、《水文统计计算》和《实用水文统计法》等,结合应用实例,从实用的角度出发,介绍了概率论和数理统计的基本知识和水文频率计算的一般方法。丛树铮(1980)、王俊德(1992)分别编写了《水文学的概率统计基础》和《水文统计》,形成了“水文统计”课程内容体系。金光炎结合多年在水文频率计算的研究成果,先后于1993、2002、2003、2010年出版了《水文水资源随机分析》、《工程数据统计分析》、《水文水资源分析研究》和《水文水资源计算务实》研究专著,除介绍概率论与数理统计原理外,系统地总结作者在常用水文频率线性选择、参数估计和误差分析中的研究成果。2003年,黄振平出版了《水文统计》教材,经过河海大学教学团队的建设与改革,“水文统计”课程于2007年被评为部级精品课程,也被许多高校选用为《水文统计》课程教材[1]。主要介绍事件与概率,随机变量及其分布,多元随机变量及其分布,数字特征与特殊函数,极限定理,抽样分布,估计理论,假设检验,相关分析,回归分析,误差分析和随机过程等。陈元芳(2000)出版了《统计试验方法及应用》,主要介绍水文随机变量、随机向量和随机过程的生成方法。张济世(2006)《统计水文学》汇集了利用数学原理解决水文问题的热点研究方法,扩展了传统统计学在水文统计中的应用,系统地介绍了灰色理论、模糊数学、神经网络、时频分析、小波分析、混沌和分形等新技术新方法在水文统计分析的应用,内容丰富,是拓展学生知识面的学习参考书。秦毅(2006)《水文水资源应用数理统计》强调多元分析在水文中的应用。丛树铮(2010)《水科学技术中的概率统计方法》系统地介绍了概率统计方法和及其在水文统计方面的研究成果。程根伟(2010)《水文风险分析的理论与方法》系统地介绍了水文风险分析原理,并附有实例计算过程。

综上所述,国内《水文统计》教材突出了概率论与数理统计的基本原理及其应用,形成了以河海大学“水文统计”课程为代表的教学内容,讲授事件与概率、随机变量及其分布、多元随机变量及其分布、数字特征与特征函数、极限定理、抽样分布、水文频率计算、假设检验、回归分析和误差分析等。而有些研究专著虽然包含了目前水文统计一些新的理论和方法,是学生学习课程时很好的教学参考书,但是难度较大,不便于讲授使用。

三、“水文统计”课程新的教学内容

根据水利、交通和电力行业的特点,结合国外水文统计教学与理论方法的最新发展,“水文统计”课程按以下原则设置教学内容:突出概率论与数理统计原理在水文中的应用;强调工程规划设计中的实用计算方法;吸收和反映国内外成熟的新理论与方法;内容力求系统、全面。根据上述原则,“水文统计”课程教学内容设置如下:

第1章:绪论。主要包括水文统计方法、应用与发展。第2章:水文事件概率与重现期计算。主要包括水文事件概率与条件概率计算;洪水与干旱特征变量提取;次重现期与年重现期。第3章:水文概率分布。主要包括正态分布类;指数分布类;Wakeby分布类;Pareto分布类;Logistic分布类和截取分布等。第4章:几种偏态分布的特性。主要包括偏态 Normal、t、Laplace、Logistic 分布、Uniform、Exponential Power、Bessel函数、Pearson Type II、Pearson Type Ⅶ、General t 分布等。第5章:常用的多维水文概率分布特性。主要包括二维 gamma分布;Gumbel 混合分布;Gumbel logistic分布;Nagao-Kadoya二维指数分布;多维正态、t 分布和对数正态分布。第6章:抽样分布。主要包括简单随机抽样;样本分布;抽样分布;几种统计量的分布;顺序统计量及其分布。第7章:估计理论。主要包括点估计;区间估计;估计量好坏的评选标准。第8章:假设检验。主要包括常用的参数检验和非参数假设检验。第9章:多元统计分析。主要包括一元线性与多元线性回归;非线性回归;逐步回归;线性递推回归;判别分析;聚类分析;主成分分析;对应分析;因子分析;典型相关分析。第10章:随机模型。主要包括随机过程的基本概念;自回归模型;滑动平均模型;自回归滑动平均模型;水文序列组成与模拟;非平稳随机模型及其应用;多变量随机模型及其应用。第11章:单变量水文序列频率计算。主要包括资料“三审”;水文序列频率分布的参数估计方法(矩法,极大似然法,概率权重矩法,线性矩法,最大熵原理法,交互熵法,贝叶斯法、Box-Cox 变换法,E-M算法,适线法,优化算法,核密度估计法;部分熵,部分交互熵,部分概率权重矩,部分线性矩法,LH矩法和LL矩法);水文序列频率最优线型评定与拟合度检验;单变量序列的经验频率计算。第12章:特殊水文序列频率计算。主要包括含零值水文序列频率计算;加入特大值后洪水序列频率计算;非一致性水文序列频率计算;截取水文序列频率计算(包含超定量洪水频率计算);梯级水库(电站)下游水文频率计算;区域洪水频率计算。第13章:多变量水文序列频率计算。主要包括copula函数的定义与特性;对称、非对称和Archimedean copulas;Meta-elliptical copulas;Plackette copula;Pair- copulas;混合copulas;经验copulas;变量相依性度量;copula函数参数估算和最优copulas函数评定;copulas模拟与拟合度检验;多变量序列经验频率计算;基于copula函数多变量联合概率分布计算。第14章:正交试验。主要包括正交试验方法;水平数不同的全因素试验;正交表的使用。第15章:风险分析。主要包括水文风险分析原理;减小风险的主要途径;水文风险分析举例。第16章:地统计分析。主要包括区域化变量;协方差函数;变异函数;克里格插值;应用实例。

四、结论

根据水利、交通和电力工程专业培养方案,回顾了我国“水文统计”课程教学体系的发展,分析了“水文统计”课程国内外代表性的教材、专著和教学内容,提出了相应的新的教学内容。与现有课程教学内容相比,压缩了概率论原理篇幅,增加了各类水文频率分布、水文频率计算新理论与方法、工程中几种特殊序列的频率计算、正交试验、风险分析、地统计分析等,其目的是增强学生毕业后从事水文分析与水利计算的工作能力,以期完善我国水利、交通和电力高等院校“水文统计”课程的教学体系。

参考文献:

[1]丛树铮.水文学的概率统计基础[M].北京:水利水电出版社,1980.

[2]王俊德.水文统计[M].北京:水利电力出版社,1992.

[3]黄振平.水文统计学[M].南京:河海大学出版社,2003.

[4]丛树铮.水科学技术中的概率统计方法[M].北京:科学出版社,2010.

[5]陈元芳.统计试验方法及应用[M].哈尔滨:黑龙江人民出版社,2000.

[6]秦毅,张德生.水文水资源应用数理统计[M].西安:陕西科学技术出版社,2006.

[7]金光炎.水文统计的原理与方法[M].北京:水利电力出版社,1958.

[8]金光炎.实用水文统计法[M].北京:水利电力出版社,1958.

[9]金光炎.水文统计计算[M].北京:水利电力出版社,1980.

[10]金光炎.水文水资源随机分析[M].北京:中国科学技术出版社,

1993.

[11]金光炎.工程数据统计分析[M].南京:东南大学出版社,2002.

[12]金光炎.水文水资源分析研究[M].南京:东南大学出版社,2003.

[13]金光炎.水文水资源计算务实[M].南京:东南大学出版社,2010.

[14]张济世,刘立昱,程中山,等.统计水文学[M].郑州:黄河水利出版社,2006.

[15]程根伟,黄振平.水文风险分析的理论与方法[M].北京:科学出版社,2010.

[16]Charles Thomas Haan.Statistical Methods in Hydrology(2 nd edition)[M].Iowa:Iowa State Press,2002.

[17]Helsel D.R.,Hirsch R.M.Statistical Methods in Water Resources[R].Techniques of Water-Resources Investigations of the United States Geological Survey,Book 4 Hydrologic Analysis and Interpretation,Chapter A3,2002.water.usgs.gov/pubs/twri/twri4a3/.

多元统计分析论文第5篇

【关键词】多元统计分析;教学研究;实践

多元统计分析是应用统计方法来研究多变量(或多指标)问题的理论和方法.它不仅是统计专业开设的一门重要的专业课程,也是非统计专业本科生、研究生开设的一门重要的基础课程.

如何深化多元统计分析课程教学改革,培养学生的科学思维能力、应用能力和创新能力,改革现有的教学内容和课程体系,具有重要的意义(文献[1]).

一、国内外该课程教学现状对比分析

当今国际上先进国家多元统计分析得到了非常广泛的应用(文献[2]).这与他们的教学模式有很大的关系.美国的统计事业是发展得最好的,各行各业,特别是医药业,统计的应用非常深入,当今很多统计思想和方法都是美国人提出的,这与美国多元统计分析教学特别重视动手能力和创新能力的培养是分不开的.日本目前统计教育改革的动向为多元统计分析教育个性化、活动化和实践化,提倡学生综合学习和选择性学习.近年来,世界各国纷纷将信息技术应用于统计学科中,十分重视计算机辅助教学的研究与实施.英国国家统计课程标准要求给学生提供适当的机会来发展并应用信息技术学习统计的能力.荷兰的统计课程标准提出了跨学科目标的概念,反映了课程综合的基本理念.总之,国外比较先进的国家,对统计教育都非常重视,并各有自己的一套教学模式.

我国传统的多元统计分析课程教学就是“数学知识+例子说明+解题”,这种传统的教学模式虽然使学生在一定程度上掌握了基础知识,提高了学生的计算能力、逻辑推理能力、应用能力,但我们也不难看出,当前多元统计分析在教学以及考核中都存在一些问题.比如,只注重理论上的教学,缺乏主动性和创造性,缺少实践环节等.学生感觉到学到的不能用到实处,学习往往是应付考试,也就难以激发学生的学习兴趣,所以这种传统的教学与国外的教育相比缺乏生动性与普及性,难以与时俱进.

综合国外先进统计教育理念,我们必须“博采天下之长,弥补我之短”,对于多元统计分析课程教学进行改革,以适应时代和社会发展的需要.

多元统计分析课程是在高维空间讨论问题,离不开复杂的计算.如果没有相关软件的支撑,手工计算几乎是不可能.因此,引入软件实验教学,使学生既掌握理论知识,又能合理利用软件进行实践操作,这不仅是社会对人才培养的需要,更是新形势下多元统计分析教学改革的必然趋势.

二、编写《应用多元统计分析》教材的实践

作者结合多年来的教学实践,深感一本内容简练但又实用的《多元统计分析》教材的重要性.随着我国高等教育进一步“大众化”,特别是相关软件的普及,学习“多元统计分析”的人越来越多,人们不再只满足于学习一些理论知识,而且大家学习它更重要的是作为工具借助计算机和相关软件进行数据处理和分析.《应用多元统计分析》教材(文献[3]),在介绍多元统计分析的有关概念、背景的基础上,突出统计思想,着重讲解常用方法,并侧重于应用,对一些严格的数学推导被略去而只列出结论(降低了数学基础的要求),读者学习时关键是理解这些结果,清楚它们的意义和背景.

考虑到作为一款免费软件,R软件具有丰富的资源、良好的扩展性和完备的帮助系统;另外,考虑到MATLAB在工程等领域中应用广泛性、在国内外各高等院校使用的普及性,本书的应用案例采用R软件和MATLAB,并给出了相应的程序.

《应用多元统计分析》教材(文献[3])共分十二章,在介绍多元统计分析的有关概念、背景的基础上,突出统计思想,着重讲解常用方法,主要包括:多元数据的表示、线性回归分析、逐步回归与回归诊断、广义线性模型与非线性模型、方差分析、聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析.注重体现多元统计分析在各个领域的应用,将应用案例贯穿于理论讲解的始终,并给出了R软件、MATLAB的相关程序.

三、教学研究的实践

以下我们通过《应用多元统计分析》教材(文献[3])中的几个例子,来看多元统计分析中如何从图形得到相应结论的.

例1 (服装标准制定中的变量聚类法)在服装标准制定中,对某地成年女子的各部位尺寸进行了统计,通过14个部位 (上体长,手臂长,胸围,颈围,总肩围,总胸宽,后背宽,前腰节高,后腰节高,总体长,身高,下体长,腰围,臀围) 的测量资料,获得各因素之间的相关系数表(见文献[3]155页的表7-4).请根据以上数据,按最长距离法对这14个变量进行聚类,并画聚类图.

请根据以上数据,按最长距离法对这14个变量进行聚类,其画聚类图(有关程序见文献[3]的156页),如图1所示.

图1 聚类图

说明 在图1中,编号1,2,…,14分别表示前面的14个变量(上体长,手臂长,胸围,颈围,总肩围,总胸宽,后背宽,前腰节高,后腰节高,总体长,身高,下体长,腰围,臀围).

从图1可以看出,人体的变量大体可以分为两类:一类反映人高、矮的变量,如上体长、手臂长、前腰节高、后腰节高、总体长、身高、下体长;另一类是反映人体胖瘦的变量,如胸围、颈围、总肩围、总胸宽、后背宽、腰围、臀围.

例2 (蠓虫分类问题)两类蠓虫Af和Apf已由生物学家W.L.Grogon和W.W.Wirth (1981)根据它们的触角长度、翅膀长度加以区分.已经测得9只Af和6只Apf的数据,具体数据见文献[3]205页的表8-7.如何依据以上数据给出一种方法正确区分两类蠓虫?

根据数据已经测得9只Af和6只Apf的数据,散点图和分类直线图(有关程序见文献[3]的207页),如图2所示.

图2 散点图和分类直线图

从图2 可以看出,已经测得9只Af和6只Apf数据可以用判别直线分为两类.

例3 (学生身体四项指标的主成分分析)在某中学随机抽取某年级30名学生,测得身高、体重、胸围、坐高,具体数据见文献[3]222页的表9-4.试对这30名学生身体四项指标数据画出主成分的碎石图,并从碎石图判断主成分的个数.

30名学生身体四项指标数据主成分的碎石图(有关程序见文献[3]的222-224页),如图3所示.

图3 碎石图

从图3 可以看出,取两个主成分比较合适.碎石图(或悬崖碎石图)是一种可以帮助我们确定主成分合适个数的有用的视觉工具,将特征值从大到小排列,选取一个拐点对应的序号,此序号后的特征值全部较小且彼此大小差异不大,这样选出的序号作为主成分的个数.

例4 (文化程度和就业观点的对应分析)利用20世纪90年代初期对某市若干个郊区已婚妇女的调查资料,主要调查她们对“应该男人在外工作,妇女在家操持家务”的态度,依据文化程度和就业观点(分为非常同意、同意、不同意、非常不同意)两个变量进行分类汇总,具体数据见文献[3]267页的表11-1.请根据以上调查数据画出文化程度和就业观点的对应分析图.

根据以上调查数据画文化程度和就业观点的对应分析图(有关程序见文献[3]的267页),如图4所示.

图4 对应分析图

对应分析图可以直观地来展示两个变量各个水平之间的关系.

结果说明: (1) 对于图4,主要看横坐标的两种点(就业观点与文化程度)的距离,纵坐标的距离对于分析贡献意义不大.(2) 从图4可以看出对该观点持赞同态度的是小学以下、小学、初中文化程度的,而大学文化程度的妇女主要持不同意或者非常不同意的观点,高中文化程度的持有非常不赞同或者非常同意两种观点.

四、结束语

多元统计分析既可以是统计专业核心课程,也可以是其他专业的专业课或基础课等.在该课程中培养学生的动手能力,对于该课程具有重要的意义.

多元统计分析是一门应用性很强的课程,要提高教学质量,学以致用,必须充分调动学生学习的主动性和积极性,采用多媒体教学、案例教学和实验教学相结合的多元化教学方法,强化相关软件的应用,改革考核方法,达到培养创新型人才的目的.

本文中给出了几个例子,通过一些图形,可以直观地帮助我们得到所需要的结论.当然画这些图形需要借助有关软件(如R软件和MATLAB等)来实现.

【参考文献】

[1]沈菊红.关于多元统计分析课程教学的几点思考[J].学科教学,2008(9).

多元统计分析论文第6篇

关键词:多元控制理论;分析控制理论;重点剖析分析技术;质量管理工作;聚类分析法

中图分类号:F270 文献标识码:A 文章编号:1009-2374(2011)31-0046-02

多元控制理论的广泛应用给企业带来了很好的收益,比起之前的一元质量控制有很多进步。它不像一元控制理论那样指标单一,多工序多指标的质量控制是多元质量控制的最主要优点,通过多元质量控制理论的实践,很多质量问题得到明显的改善,企业也因此而走上了一条前途光明的道路。

一、多元控制理论的发展历程

多元控制理论最早是在美国发明的,多元控制图的发明预示着多元控制系统的诞生。到20世纪90年代以后,这种方法已经广泛应用于生产实践了。此方法包含多种设计技术和控制技术,针对不同的质量管理起到不同的作用。

张公绪在我国第一个提出选控图系列并提出两种质量诊断理论,这种方法突破了之前的质量控制理论,给统计质量诊断开辟了新方向。此外郑慧英,陈志强等人也对此作出了杰出的贡献。目前多元质量控制理论已经是质量管理学和数学统计的一个独立分支,是理论控制及工程应用的热点。

二、多元控制图的作用和方法

多元控制图是多元控制理论的基础,它可以对多个质量特性进行统一质量管理,是在一元控制图上的延伸和推广,对解决质量控制问题有更深一步的提高和认识。当然,要提醒的是,虽然多元控制图是一个非常好的质量控制工具,但是目前在工程项目质量管理中应用还不是很广泛,要达到项目的具体要求还需要做很多的工作,这点也需要多数工作人员的共同努力来完成。

三、控制理论中的设计技术

在控制理中,设计技术的应用是很广泛的。目前多元控制理论的质量设计是最有效的改进质量的技术,它在产品设计和工艺设计阶段的应用是非常广泛的。通过较好的设计技术可以减小质量波动,保证质量过关率。随着社会竞争力的不断增强,日益难以满足的客户需求成为商场上生出的关键,传统的质量控制特性已经没有办法满足多方位的客户需求,所以,针对不同的客户群体我们在设计中也应该遵循多元控制技术理论来展开。

总的来讲,在设计技术理论中,我们一定要注意到用户多元性的需求同设计之间的关系,要通过多远化控制理论来指导设计技术,最终目的就是让设计出来的产品或项目得到大家的认可。这样企业才能存活。

四、分析技术的应用

针对我国目前多指标切多工序的工业系统来讲,要对其进行质量控制必须采用先进的分析技术。多变量高维数据可以对独立低维空间有投影作用,从而降低分析难度。目前我国多采用哪个多元统计分析方法来进行高维数数据的控制,这样可以使得高维数数据简化而且维数降低,综合性增强,从而更好的将复杂系统的质量特性体现出来,从而改善整个质量控制系统的工作效率。具体来讲,多元控制理论的分析技术和特点有以下几种:

(一)投影寻踪法

这种方法的原理主要是将高维数据投影到低维,并寻找出能反映原高位数据结构或特征的投影,在低维空间上对数据结构进行详细分析,最终达到研究和分析高维数据的目的。

这种方法的典型优点是克服了维数祸根带来的困难,它可以有效排除与数据结构和特种无关的或关系比较小的变量干扰。与其他非参数方法一样可以用来解决非线性问题。

(二)主成分分析法

这种方法的主要原理是将相关度的多为变量转变为互不相关的主成分,将数量众多的指标转化为较少的互不相关的综合指标,且能提供原有指标的绝大部分信息。

这种方法的优点在于能将高维空间的问题转化到低维空间去处理,将问题变得相对简单而且直观,并且不易于丢失数据信息,同时还简化了系统的统计数字特征。

(三)聚类分析法

聚类分析法的主要原理指的是某种特定标准,一般为距离准则逐级归并好聚类,形成一个亲属关系谱系图,同族之间相似性尽可能大,不同族之间差异性尽可能大,这样在进行质量控制的时候就比较好入手。

这种方法的优点主要体现在数据挖掘上,可以作为独立的数据分析工具来获得数据分布情况,也可以作为其他数据分析算法的预处理步骤。

总的来讲,聚类分析是数据挖掘的重点方法之一,可以作为独立的数据分析工具来获得数据分布情况,也可以作为其他数据分析算法的预处理步骤。

(四)因子分析法

因子分析法的主要内容是指将多个变量综合为少数几个独立因子,根据先惯性把变量分组,使得同组内的变量之间相关性较高,不同组类之间的相关性较低。

这种方法的主要优点在于各综合因子的权重不是主观赋值,分局方差贡献率来确定,避免了认为确定权重的随意性,使得评价结果唯一,而且较为客观综合。

总的来讲,多元质量控制是全面质量管理的重要组成部分,是多指标、多工序复杂制造过程质量保证的重要工具。综述多元质量控制的发展历程、控制图以及设计技术的研究现状,从原理、优缺点等方面对比分析多元质量控制的常用分析技术。统计质量控制可分为一元质量控制和多元质量控制。一元质量控制主要研究单一指标的质量控制问题,但从生产实际来看,单一指标的质量控制是比较少见的,多工序、多指标的质量控制是普遍存在的多元质量控制,是以多元统计分析为基础的实用技术,随着计算机技术的进步与普及,在机械、电子、化工冶金等行业中都已崭露头角,发挥着越来越重要的作用。为了普及多元质量控制理论,提高广大工程技术人员对多元质量控制的认识,作者将多元质量控制理论与技术领域的研究成果进行简要概述。

五、结语

综合全文,多元控制技术现在已经广泛应用于质量控制管理工作中。作为先进控制理论的一部分,此控制技术有着很大的优势,它通过一系列的指标和方法使得本来复杂的质量控制管理变得井井有条,让本来繁重的工作变得非常简单,不管是对工作人员还是对质量管理人员,或者是对消费者,如果能将这些先进控制理论应用的生产实践中,无疑是一个多赢的局面。所以,作为质量管理或者相关的工作人员,要做的就是尽量掌握好这些先进的控制技术,采用多元控制理论来指导自己的工作,只有这样工作才能做好,也只有这样企业才能发展,客户或者消费者才能满意,最终质量管理控制工作的价值才能得到最完美的体现。

参考文献

[1] 苗占东.先进控制为企业节能增效[J].中国石化,2011,(6).

[2] 许锋,罗雄麟.“先进控制理论与技术”课程的教学实践[J].电气电子教学学报,2011,(3).

[3] 高红亮.先进控制技术方法及其应用[J].可编程控制器与工厂自动化(PLC FA),2010,(8).

多元统计分析论文第7篇

关键词:地质统计学 微量元素化学分析 应用研究

中图分类号:P628.2 文献标识码:A 文章编号:1672-3791(2013)07(c)-0098-01

微量元素地球化学是半个世纪以来迅速发展和广泛应用的地球化学分支。由于同位素稀释质谱法、中子活化分析、Ber thelot-Nernst分配定律等方法的成功应用,在多种地质过程中微量元素分配演化的定量模型得以实现,也使得微量元素化学分析被系统地应用于解决各类地质问题,成为指示岩石成因的典型标志。20世纪70年代以后,微量元素地球化学的讨论从定性认识上升成为定量分析,发展方向也变成微观、宏观同时发展,经常需要对地球化学中的主量元素、稀土配分、微量元素等进行定量化学研究和数据分析,此时,一些相关的地质统计方法就变得非常重要和实用。在微量元素化学分析中,地质统计学的各类统计方法作为对地质客观现象相关数据进行定量分析的重要工具,提供了诸多有效的数据分析途径。应用地质统计学对微量元素化学分析进行处理,能为研究工作取得客观成果提供科学的定量依据。

1 地质统计学与微量元素化学分析相关理论知识简述

1.1 地质统计学

地质统计学是20世纪60年代兴起的一门数学地质学科分支,它的出现始于解决矿产普查勘探、矿山开发设计以及矿山开采整个过程中各种储量计算和生产误差估计问题。后来,地质统计学逐渐在油气勘探开发、采矿、水文以及环境科学领域中得到广泛应用。近年来,地质统计学作为一门新兴的科学,在地质领域的发展非常迅速,其应用前景的广泛性和模型计算的实用性受到地质学家的高度重视。

1.2 微量元素化学分析

微量元素化学分析是地球化学的分支学科,主要研究自然物质和自然体系中微量元素的分布规律、存在形式、活动特点、控制因素及其地球化学意义。一般意义上讲,微量元素是指除了O、Si、Al、Fe、Ca、Na、K、Mg、Ti这九种组成99%的地壳和地幔质量之外的80余种元素。当然,这里所指的微量元素是相对而言的,在一个体系中它可能是微量元素,但在另一个体系中却可能是常量元素。

1.3 地质统计学在地球化学领域的应用现状

近几十年年来,地质统计学对地球化学的相关研究中起到了极大的辅助和推进作用。应用地质统计学相关统计方法能够将大规模原始地球化学数据群体中隐藏的重要信息提炼和挖掘出来,进行分类和解释,继而被广泛地应用在地质找矿、科学研究等各个领域。在地球化学中主量元素、微量元素、稀土配分化学分析等领域的研究中,丰富的地质统计学方法对圈定和评价地球化学异常、提取地球化学找矿信息常常起到决定性的作用。本文则主要研究地质统计学在微量元素化学分析中的应用研究。

2 地质统计学在微量元素化学分析中的应用研究

2.1 方法讨论

聚类分析是通过某种距离的测算将数据对象的集合分为类似的对象组所形成的若干个类,其中运用到了降维思想,在对样品和指标进行分类,采用物以类聚的原理进行的一种多元统计分析方法。在地质找矿领域,聚类分析是研究元素在成矿活动中地球化学行为相似程度的一种有效方法,一般从数字分类角度进行分析。对于这种方法的运用,我们可以借鉴现有的成果和理论进行分析和应用。R型聚类分析是聚类分析方法的一种,原理是以变量之间的相似程度为基础,将变量分成不同级别的类。R型聚类分析是研究成矿活动中地球化学微量元素行为相似度的一种有效方法。通过对某些矿石或岩样的微量元素数据进行R型聚类分析,可以得出元素组合特征并将其分类,对元素之间的亲疏关系进行判定,进一步为划分矿化阶段、成矿元素迁移和富集的判断以及矿床成因等问题的研究提供判断依据。

2.2 案例研究

通过对高松山矿区内岩矿石样品的微量元素数据进行R型聚类分析后,可以得到图1中显示的分类的结果,即,在相似水平的相关系数等于15时,可以把微量元素分成7个类别,分别是:(1)W、Cu;(2)Sn;(3)Au、Ag、As、Sb、Pb、Mo;(4)Bi;(5)Hg;(6)Co、Ni、Mn;(7)Zn。这7个类别之间没有显著的相关性,说明矿床成矿具有多期次性和复杂性。从图中还可以看出,Au不仅和Ag有着强相关关系,而且还和As、Sb、Pb相关。而Au元素与Ag之间有非常密切的关系,当γ=2.5时它们聚成了一类,相关性比较强,同时Sb、As、Pb和它们之间都存在相关性,说明Au、Ag、As、Sb、Pb、Mo之间具有亲缘关系,预示着伴随着多金属硫化物的形成Au 成矿并且富集。因此,我们可以以Sb、Pb、Ag、As作为矿区找金的近程指示元素。

3 结论

本文采用地质统计学中一类常用方法,R型聚类方法对高松山矿区的铜多金属矿进行了微量元素组合上的分析研究。统计分析结果使我们对高松山金矿床岩矿石微量元素的数据结构的特点有了清楚的认识。各元素组合具有叠加出现的特征,表明矿床成矿具有多期多阶段或成矿物质多来源的特征。分析结果表明Au与Ag、As、Sb、Pb等中低温元素相关非常大,但是和W、Co、Sn、Mn、Ni、Zn等中高温元素之间的相关性较差。

地质统计学在地球化学其它领域,比如常量元素分析、稀土元素分析中也有广泛的应用,笔者认为,采用类似的统计方法对不同类数据的分析是进一步拓展地质统计学在地质科学中应用性的前进方向。

参考文献

[1]赵伦山,张本仁.地球化学[M].地质出版社,1988,6.