搜档网
当前位置:搜档网 › 2012年全国数学建模竞赛A题全国优秀论文

2012年全国数学建模竞赛A题全国优秀论文

2012年全国数学建模竞赛A题全国优秀论文
2012年全国数学建模竞赛A题全国优秀论文

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A

我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):

参赛队员(打印并签名) :1.

2.

3.

指导教师或指导教师组负责人(打印并签名):

日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页

赛区评阅编号(由赛区组委会评阅前进行编号):

赛区评阅记录(可供赛区评阅时使用):

全国统一编号(由赛区组委会送交全国前编号):

全国评阅编号(由全国组委会评阅前进行编号):

A 题 葡萄酒的评价

摘要

随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。

针对问题一,本文拟采用离散点检验、F 检验、τ检验建立综合检验模型,首先利用残差绝对值法剔除原始评分中的异常数据,得出各葡萄酒样品的两组平均得分,然后对两组数据进行F 检验知F 值大于F 分布临界值,确定两组评价结果间存在显著性差异,最后进行τ检验知两组数据间系统误差相当,综合F 检验和τ检验知两组评价结果间系统误差相当精密度不同,且第一组标准差大于第二组,因此确定第二组评价结果更可信。

针对问题二,对酿酒葡萄进行分级,采用主成分分析法建立主成分分析模型,首先降多个理化指标为累计贡献率达%537.73的六个互不相关的主成分,对主成分累计贡献率进行归一化处理得各主成分权重,进而确定葡萄样品的主成分理化指标加权综合评分,由matlab 数据拟合知理化指标与葡萄酒的质量互不相关,因此根据表2-4准则把酿酒葡萄分为三个等级。

针对问题三,分析酿酒葡萄与葡萄酒的理化指标间的联系,本文拟建立典型相关性分析模型,利用spss 软件求出各指标间的相关系数,由第一、二典型相关系数皆大于各组内部理化指标间任一相关系数,因此典型相关分析模型能更好反映出酿酒葡萄与葡萄酒的理化指标间的联系。

针对问题四,建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss 软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键字:理化指标 综合检验模型 主成分分析 线性回归 spss

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题:

1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信;

2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级;

3、分析酿酒葡萄与葡萄酒的理化指标之间的联系;

4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

二、问题分析

葡萄酒起源于埃及,并在欧洲得到得到了长足的发展,是人们最喜爱的酒品之一。近年来,我国的葡萄酒业得到了快速的发展,同时也产生了诸如因质量检测体系不完善带来的市场紊乱等问题,如今人们也越来越关注葡萄酒的质量问题,因此,研究葡萄酒的质量评价问题对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。

2.1 对问题一的分析

问题要求对两组评酒员的评价结果有无显著性差异进行检验,在葡萄酒的感官评价中,由于品酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同品酒员对同一酒样的评价存在差异,两组评酒员的评价结果的精确度不同,因此有必要对评价结果进行统计分析,判定出哪一组评酒员的评价结果更能真实的反映出葡萄酒样品的质量。首先应进行离群值检验,主要目的是剔除异常数据,这种异常数据不是系统误差,也不是随机误差,而是由过失误差引起的,这种数据应一律舍去。然后进行F检验和 检验可以判断出两组判定结果有无显著性差异。

2.2 对问题二的分析

问题要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级;主成分分析法是一种通过降维技术把多个变量化为少数几个主成分(即综合变量)的统计分析方法,其中每个主成分都是原始变量的线性组合,各主成分之间互不相关,采用这种方法可以克服单一的理化指标不能真实反映酿酒葡萄的全面特征,引进多方面的理化指标,但又将复杂因素归结为几个主成分,使得复杂问题得以简化,同时得到更为科学、准确的酿酒葡萄的信息。对酿酒葡萄进行分级,可以通过将由主成分分析法得到的主成分贡献率进行归一化处理,得到各主成分之间的相对重要性,进而确定各葡萄样品的加权综合评分。由以上根据酿酒葡萄的理化指标得到的优劣取值,再加以问题一中得到的葡萄酒的质量取值,设定分级标准,对这些酿酒葡萄进行分级。

2.3 对问题三的分析

要求分析酿酒葡萄与葡萄酒的理化指标间的联系,首先根据模型假设可以舍去二级指标,由问题二可以确定酿酒葡萄与葡萄酒的理化指标的主成分,对此可以建立典型相

关分析模型,典型相关分析是研究两组变量之间相关关系的一种多元计方法。它能够揭示出两组变量之间的内在联系,也是一种运用于多元统计中的降维技术。其目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析,利用spss 软件求出各指标间的相关系数,进而确定各指标间关联度的大小。 2.4对问题四的分析

问题要求分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。由问题二、三得知酿酒葡萄和葡萄酒的理化指标是存在关联的,因此可以建立多元线性回归模型,求出回归方程,然后对回归方程的显著性进行检验,若回归方程显著则能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,否则,不能。

三、模型假设

1、本文所涉及的置信度均取05.0 a ;

2、两组品酒员的评分服从正态分布;

3、对葡萄样品设置的分级标准客观合理;

4、附录中所给数据真实有效,品酒员评分不受其他客观因素的影响;

5、理化指标中二级指标对酿酒葡萄和葡萄酒质量影响较小,可以忽略不计;

四、符号定义与说明

符号

定义与说明

i v 残差 i y 残差绝对值 s 试验标准差 df 自由度 1M 加权综合评分 ij r i x 和j x 的相关系数 i z 主成分

这里只给出主要符号的意义,其他符号将在文中给出,在此不再一一赘述。

五、模型的建立与求解

5.1 判定两组评酒员的评价结果有无显著性差异,并确定哪一组结果更可信

葡萄酒的感官评价中,由于品酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同品酒员对同一酒样的评价存在差异,两组评酒员的评价结果的精确度不同,因此有必要对评价结果进行统计分析,判定出哪一组评酒员的评价结果更能真实的反映出葡萄酒样品的质量。本文拟建立离散点检验、F 检验、τ检验相结合的综合检验模型对两组评酒员的评价结果进行检验。离散点检验、F 检验、τ检验三者是比对试验数据处理中最基本的方法,三者缺一不可,顺序不能颠倒;离散点检验剔除离散值,保证了数据统计结果的有效、准确,是F 检验、τ检验的基础;F 检验的目的在于比较两组数据精密度即随机误差是否存在显著性差异;τ检验的目的在于说明两组数据平均值的准确度,是一切试验根本目的所在;因此采用综合检测模型能更好的对评价结果进行检验。

5.1.1 数据的基本统计处理

对两组评价员对白葡萄酒的各指标评分进行基本的统计计算,用excel 求出每个评酒员对样品酒的综合评分结果(见附录9.1); 5.1.2 检验评价结果 1、离散值的检验

残差绝对值法[1]是离散值检验的一种,主要目的是剔除异常数据,这种异常数据不 是系统误差,也不是随机误差,而是由过失误差引起的,这种数据应一律舍去。对任何一组数据进行处理,首先要检验其是否存在由过失误差带来的异常数据,即进行离散值检验。因此,有必要对于十个品酒员对每个葡萄酒样品的评分进行离群值检验,本文拟采用残差绝对值法对数据进行离散值检验。

设品酒员对每个白葡萄酒样品的综合得分为:)(102,1i },{x x 1021 ==x x 它的算术平方值x 及残差i v 分别为:

x x x

i i i

-==

∑v 10

x 10

1

残差与试验标准差之比为实验残差,即:

s

v y i

i =

式中:s 为试验标准差,其值为:

9

s 10

1

2

∑==

i i

v

试验残差的绝对值与试验标准差之比为残差的绝对值:

s

v i

i max y =

确定置信概率a 值(本文取05.0=a ),查蒙特卡罗法得出的残差绝对值法剔除离散点的

临界值)(y 1i a -见表1,当)(y(i )1i y a ->时i v max 对应的i x 为离散点,应予以剔除,否则该组数据不含离散点,若剔除一个离散点,对剩余的数据重复使用该准则进行判断,直到检测不出离散点为止。由蒙特卡罗法得出的残差绝对值法剔除离散点的临界值见表1-1:

表1-1 残差绝对值临界值

n

)(y 05.01i -

)(y 01.01i - 3 1.154 1.155 4 1.481 1.496 5 1.715 1.764 6 1.886 1.973 7 2.025 2.152 8 2.132 2.280 9 2.218 2.390 10

2.290

2.485

采用上述方法对每组品酒员给出的综合得分进行离散点检测,并采用均值法得出每个白葡萄酒样品的平均得分见表1-2:

表1-2 两组品酒员给出白葡萄酒的平均得分

2、F 检验—随机误差的检验

一组数据的标准偏差可以反映出该组数据的精密度 ,精密度决定于随机误差,不同的数据有不同的精密度,两组数据的精密度之间有无显著性差异即两组数据的随机误差是否一致,这就需要进行F 检验,F 检验的基本思想是:检验2

22

1σσ与是否相等。

酒样1 酒样2 酒样3 酒样4 酒样5 酒样6 酒样7 酒样8 酒样9 第一组 82 74.2 78.3 79.4 71 68.4 77.5 71.4 72.9 第二组 77.9 75.8 75.6 76.9 81.5 75.5 74.2 72.3 80.4 酒样10 酒样11 酒样12 酒样13 酒样14 酒样15 酒样16 酒样17 酒样18 第一组 74.3 72.3 63.3 65.9 72 72.4 74 78.8 73.1 第二组 79.8 71.4 72.4 73.9 77.1 78.4 67.3 80.3 76.7 酒样19 酒样20 酒样21 酒样22 酒样23 酒样24 酒样25 酒样26 酒样27 第一组 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 第二组

76.4

76.6

79.2

79.4

77.4

76.1

79.5

74.3

77

假设0H :

2221σσ=

式中:

1σ为第一组的方差,2σ为第二组的方差; i σ的无偏估计量:

21

2

)(11s ∑=--=n

i i i i c c n 统计量F :

2

2

2

1

s s F =(假设2221s s ≥)

查F 分布表(见附录9.2)()112

--n n F α,若()11212

--≤n n F F α则说明二者的精密度

之间存在显著性差异,反之存在显著性差异。

对两组原始试验数据进行基本的统计计算,求出最大值、最小值、平均值、观测值、极差、标准偏差等,见表1-3:

表1-3 基本统计结果

平均 偏方差 df 最大值 最小值 极差

第一组 73.741 63.11 26 82 63.3 18.7 第二组 76.419 29.08 26 81.5 67.3 14.2

08.29,11.63s 2

221

==s 代入式2

2

2

1

s

s F =中得17.2=F ,查F 分布表得

()=>26262

05.0F F 1.90,因此二者存在显著性差异。第一组的标准偏差大于第二组的标

准偏差,说明第一组的评价精度低于第二组,可以认为第一组的随机误差大于第二组的随机误差。

3、τ检验—系统误差的检验

通过F 检验,可以判定两组数据随机误差即精密度有无显著性差异,但两组数据的平均

值之间是否存在显著性差异即是否有系统误差,这就必须进行平均值检验即τ检验;

τ检验的目的就是比较两组数据的平均值之间是否存在显著性差异。 对两组独立的酒样品评价得分进行τ检验,将相关数据代入式:

2

2

2

1

2

1

2

1n n c c σστ+

-=

式中:21,

c c 分别为两组数据的平均数,2

22

1σσ,分别为两组数据的方差;

得422.1=τ根据自由度26=df 查τ分布表(见附录9.3)0.05(26) 2.05553τ=,所以

()05.026ττ<,因此两组综合评分的平均值间不存在显著性差异,即不存在系统误差。

综合F 检验和τ检验,两组品酒员对27个白葡萄酒样品的综合评分间存在显著性差异。两组间不存在系统误差,但存在随机误差,第一组的标准偏差大于第二组的标准偏差,说明第二组的评价精度高于第一组,可以认为第二组品酒员的评价结果更可信。

4、由于数据量大计算繁杂,本文仅给出了白葡萄酒评价结果的检测,红葡萄酒评价结果的检测方法如上,本文在此不一一给出。

5.2 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级

主成分分析法[2]是一种通过降维技术把多个变量化为少数几个主成分(即综合变量)的统计分析方法。其中每个主成分都是原始变量的线性组合,各主成分之间互不相关,从而这些主成分能够反映原始变量的绝大部分信息,且所含的信息互不重叠。

采用这种方法可以克服单一的理化指标不能真实反映酿酒葡萄的全面特征的缺点,引进多方面的理化指标,但又将复杂因素归结为几个主成分,使得复杂问题得以简化,同时得到更为科学、准确的酿酒葡萄的信息。

对酿酒葡萄进行分级,可以通过将由主成分分析法得到的主成分贡献率进行归一化处理[3],得到各主成分之间的相对重要性,进而确定各葡萄样品的综合评定的加权分析模型为:

n n 22111P W P W P W M ?++?+?=

由以上根据酿酒葡萄的理化指标得到的优劣取值,结合问题一中得到的葡萄酒的质

量取值,设定合理的分级标准,对这些酿酒葡萄进行分级。 5.2.1 主成分分析模型的建立

设有n 个样本,每个样本有p 个变量,构成一个p n ?阶的数据矩阵:

??

?

???

?

????

???=np n n p p x x x x x x x x x X 21

22221

11211 记原变量指标为p x x x ,,,21 , 1、计算相关系数矩阵:

??????

????????=pp p p p p r r r r r r r r r R 212222111211 ()p j i r ij ,,2,1 =,为原变量i x 和j x 的相关系数,其中ji ij r r =,计算公式为

()()()()

∑∑∑===----=

n

k n

k j

kj i

ki n

k j

kj i ki

ij x x

x x

x x x x

r 1

1

2

21

2、计算特征值和特征向量:

解特征方程0=-R I λ,用雅克比法求出特征值,使其按大小顺序排列,即:

021≥≥≥≥p λλλ

分别求出对应于特征值i λ的特征向量),,2,1(p i e i =,要求1=i e ,即:

11

2=∑=p

j ij

e

其中ij e 表示向量j e 的第j 个分量; 3、计算主成分贡献率及累计贡献率:

贡献率:

()p i p

k k

i

,,2,11

=∑=λ

λ 累计贡献率:

()p i p

k k

i

k k

,,2,111 =∑∑==λ

λ

取累计贡献率达到%70的特征值m λλλ,,

, 2,1所对应的第()p m m ≤,,2,1 个主成分; 4、计算主成分载荷:

设它们降维处理后的综合指标,即新变量为)(,,,21p m z z z m ≤ ,

??

????

?+++=+++=+++=p

mp m m m p

p p

p x l x l x l z x l x l x l z x l x l x l z 21112222121212121111 其中()

()p j i e x z p l ij i j i ij ,,2,1,, ===λ

5.2.2 红葡萄样品分级

因为葡萄的理化指标较多,二级指标不是很重要,所以只选取一级指标,舍弃二级指标,同时对一个项目多次测试的数据取平均值,由题目附件2,得到葡萄的一级理化指标(见附录9.4);

依上述步骤,对附录9.4中红葡萄的一级理化指标首先采用spss 软件(源代码及结果见附录9.5)进行处理去除相关性较大的几个指标,对剩下的指标继续进行处理得到相关系数矩阵,由相关系数矩阵计算特征值,得到各主成分的贡献率及累计贡献率,如表2-1:

表2-1 特征值及主成分贡献率

主成分 特征值 贡献率/% 累计贡献率/% 主成分 特征值 贡献率/% 累计贡献率/% 1z 5.723 22.894 22.894 7z 1.238 4.953 78.491 2z

3.417 13.668 36.562 8z 1.079

4.316 82.807 3z

3.233 12.893 49.455 9z 0.797 3.188 85.994 4z

2.552 10.209 59.664 10z

0.651 2.604 88.598 5z 1.927

7.710

67.374

11z 0.573

2.290 90.889 6z

1.541 6.163 73.537 12z

0.486

1.944

92.83

注:本表只给出部分特征值及主成分贡献率,详见附录9.5。

由表2-1知主成分61~z z 的累计贡献率已经达到%70%573.73>,所以选取主成分61~z z 为主要理化指标,主成分61~z z 的特征值对应的特征向量2521,,,e e e ,再用上述步骤4中的公式计算各变量在主成分61~z z 上的载荷, 可以得出:

第一主成分1z 与4x 呈现出较强的正相关,与24x 呈现出较强的负相关; 第二主成分2z 与23x 呈现出较强的正相关,与17x 呈现出较强的负相关; 第三主成分3z 与20x 呈现出较强的正相关,与14x 呈现出较强的负相关; 第四主成分4z 与19x 呈现出较强的正相关,与6x 呈现出较强的负相关; 第五主成分5z 与21x 呈现出较强的正相关,与3x 呈现出较强的负相关; 第六主成分6z 与15x 呈现出较强的正相关,与26x 呈现出较强的负相关; 对主成分61~z z 的贡献率进行归一化处理:

()6,,2,16

1

==

∑=i z

z W i i

i

i

得到主成分61~z z 之间的相对重要性,即各主成分占的权重,如表2-2:

表2-2 主成分权重

主成分

权重 主成分

权重

1z

0.31 4z

0.14 2z

0.19 5z 0.10 3z

0.18

6z

0.08

由各主成分对应的具有较强相关性的理化指标及各主成分占的权重,可得到只考虑理化指标时红葡萄样品的优劣情况,如表2-3:

表2-3 只考虑理化指标时红葡萄样品排名

葡萄样品 总分 葡萄样品 总分 葡萄样品 总分

26 295.295 14 196.799 27 162.022 24 276.353 25 189.913 6 160.451 5 262.597 19 177.012 7 153.228 1 260.973 18 175.975 21 153.209 17 251.603 3 175.125 15 151.671 23 231.837 2 174.910 13 151.328 8 230.959 10 171.180 11 136.301 20 223.927 12 165.709 22 135.197 9 207.440 4 162.604 16 125.062

由问题一知道第二组评酒员的可信度较高,为综合考虑酿酒葡萄的理化指标和葡萄酒的质量进行分级,首先运用Matlab 软件(源代码见附录9.6)[4]进行数据拟合,求取两个指标分别占有的权重; 拟合结果如图2-1:

60

62646668

707274767880

120140160180200220240260280300评分

红葡萄样品总得分

图2-1 红葡萄的理化指标与葡萄酒质量的关系

由图2-1可以看出,红葡萄的理化指标与葡萄酒的质量不相关;

根据红葡萄理化指标总得分和第二组评酒员平均评分的密集程度设定分级标准:

设红葡萄理化指标的总得分为1m ,葡萄酒质量评分为2m ;则:

表2-4 红葡萄样品分级标准

一级红葡萄 二级红葡萄

三级红葡萄

1m 2001≥m 2001501<

702≥m

70652<

652≤m

则根据以上分级标准,可得到红葡萄样品分级结果如表2-5:

表2-5 红葡萄样品分级结果

一级红葡萄 二级红葡萄 三级红葡萄 葡萄样品 5,9,17,20,23,24,26 1,2,3,4,6,7,8,10,12,13,14,15,1

8,19,21,25,27

11,16,22

5.2.3 白葡萄样品分级

与对红葡萄的处理相同,对附录9.4中白葡萄的一级理化指标用spss 软件进行处理得到相关系数矩阵,由相关系数矩阵计算特征值,得到各主成分的贡献率及累计贡献率,如表2-6:

表2-6 特征值及主成分贡献率 主成分 特征值 贡献率/% 累计贡献率/% 主成分 特征值 贡献率/% 累计贡

献率/%

1z 4.397 17.590 17.590 7z 1.416 5.663 69.547 2z

3.624 1

4.497 32.087 8z 1.161 4.646 74.193 3z

2.704 10.818 42.905 9z 1.133 4.531 78.724 4z

2.000 8.001 50.906 10z

0.961 3.846 82.570 5z 1.742

6.967

57.872

11z

0.897 3.586 86.157 6z

1.503 6.012 63.884

12z

0.817

3.268

89.425

注:本表只给出部分特征值及主成分贡献率。

从表2-6中可以看出,主成分81~z z 的累计贡献率已经达到70%%193.74>,计算主成分81~z z 的特征值对应的特征向量2521,,,e e e ,再用上述步骤4中的公式计算各变量在主成分81~z z 上的载荷,

可以得出:

第一主成分1z 与12x 呈现出较强的正相关,与8x 呈现出较强的负相关; 第二主成分2z 与23x 呈现出较强的正相关,与5x 呈现出较强的负相关; 第三主成分3z 与29x 呈现出较强的正相关,与3x 呈现出较强的负相关; 第四主成分4z 与6x 呈现出较强的正相关,与9x 呈现出较强的负相关; 第五主成分5z 与15x 呈现出较强的正相关,与16x 呈现出较强的负相关; 第六主成分6z 与7x 呈现出较强的正相关,与14x 呈现出较强的负相关; 第七主成分7z 与17x 呈现出较强的负相关; 第八主成分8z 与19x 呈现出较强的负相关; 对主成分81~z z 的贡献率进行归一化处理:

()8,,2,18

1

==

∑=i z

z W i i

i

i

得到主成分71~z z 之间的相对重要性,即各主成分占的权重,如表2-7:

表2-7 主成分权重 主成分

权重 主成分 权重 1z

0.24 5z 0.09 2z

0.20 6z 0.08 3z

0.15 7z

0.07

4z

0.11

8z

0.06

由各主成分对应的具有较强相关性的理化指标及各主成分占的权重,可得到只考虑理化指标时白葡萄样品的优劣情况,如表2-8:

表2-8 只考虑理化指标时白葡萄样品排名

葡萄样品 总分 葡萄样品 总分 葡萄样品 总分

21 189.608 6 114.576 5 80.994 27 175.866 18 111.957 19 80.675 23 174.175 20 105.383 9 78.518

15 146.232 13 104.639 17 75.795 14 130.281 25 101.865 4 68.760 11 126.749 24 93.985 26 68.589 8 122.962 10 93.967 2 67.615 1 118.303 7 93.930 22 67.063

12 116.619 3 87.459 16 114.785 28 81.452

由问题一知道第二组评酒员的可信度较高,为综合考虑酿酒葡萄的理化指标和葡萄酒的质量进行分级,首先运用matlab 软件(源代码见附录9.7)进行数据拟合,求取两个指标分别占有的权重; 如图2-2:

66

687072

7476788082

6080

100

120

140

160

180

200

评分

白葡萄样品总得分

图2-2 白葡萄的理化指标与葡萄酒质量的关系

由图2-2可以看出,白葡萄的理化指标与葡萄酒的质量不相关;

根据白葡萄理化指标总得分和第二组评酒员平均评分的密集程度设定分级标准:设白葡萄理化指标的总得分为3m ,葡萄酒质量评分为4m ;则:

表2-9 白葡萄分级标准

一级白葡萄 二级白葡萄

三级白葡萄

3m

1203≥m 120803<

4m 754≥m

75704<

则根据以上分级标准,可得到红葡萄分级结果如表2-10:

表2-10 白葡萄分级结果

一级白葡萄 二级白葡萄 三级白葡萄

葡萄样品

14,15,21,23,27

1,3,5,6,7,8,10,11,12,13,18,19,20,24,25,28

2,4,9,16,17,22,26

5.3 分析酿酒葡萄与葡萄酒的理化指标之间的联系

典型相关分析[5]是研究两组变量之间相关关系的一种多元计方法。它能够揭示出两组变量之间的内在联系。也是一种运用于多元统计中的降维技术。其目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析。

多元统计分析就是运用典型相关分析研究变量p X X X ,,,21 与q Y Y Y ,,,21 之间的线性关系,将每一组变量作为一个整体进行分析。

通常,多元统计分析有两种方法,方法一是讨论第一组每个变量和第二组每个变量的相互关系,得到pq 个相关系数,再用这些相关系数反应两组变量的关系,但是这种方法只是孤立考虑单个X 与单个Y 间的相关,没有考虑Y X ,变量组内部各变量间的相关,而且在两组变量较多时,使问题显得复杂,难以从整体描述;方法二是在每组变量中选择若干个有代表性的综合指标,这些指标是原始变量的线性组合,代表了原始变量的大部分信息,且两组综合指标的相关程度最大,新产生的综合指标成为典型相关变量,通过少数的几个综合变量来反应两组变量的相关性质,这种方法则更为简洁,得到的结果也更可靠。因此本文采用第二种方法进行分析。 5.3.1 典型相关分析模型的建立 设要求的两组变量分别为:

()T

p X X X X ,21 ,=

()T

q Y Y Y Y ,21 ,,=

其中q p ≤,

设q p +维随机向量???? ??=Y X Z 的协方差阵∑∑

∑∑

∑???

?

??=22

21

1211, 其中∑11是X 的协方差阵,∑22是Y 的协方差阵,∑∑=1221T

是Y X ,的协方差阵; 典型相关分析用X 和Y 的线性组合

Y b V X a U T T ==,

之间的关系来研究X 和Y 之间的相关性,其目的就是希望找到向量a 和b ,使得()V U ,ρ最大,从而找到替代原始变量的典型变量U 和V ; 其中典型相关系数的数学定义为:

()()()()∑∑∑=

=221112,,b b a a b a V Var U Var V U Cov V U T T T ρ

由于随机变量乘以常数不改变其相关系数,为防止不必要的结果重复出现,加上如下的

约束条件:

()111==∑a a U Var T ()122==∑b b V Var T

记:

∑∑∑--=12

1

1121

1

11A ∑

∑∑∑--=12

1

11

21

1

22

B

则存在b Bb a Aa 22,λλ==;

其中2λ既是A 又是B 的特征根,a 和b 就是对应于A 和B 的特征向量。

5.3.2 红葡萄与红葡萄酒的理化指标之间的联系

1、由问题二可以得到红葡萄的几个主成分,经过分析又得到这些主成分对应的理化指标,选取主成分61~z z 的特征值对应的特征向量绝对值的最大值所在的理化指标作为有代表性的理化指标,

即红葡萄的有代表性的理化指标可以概括为171514,643,,,,x x x x x x ;

同样运用问题二中主成分分析的方法,对葡萄酒进行处理,得到葡萄酒有代表性的理化指标。

因为葡萄酒的理化指标较多,二级指标不是很重要,所以只选取一级指标,舍弃二级指标,对一个项目多次测试的数据取平均值,由题目附件2,得到葡萄酒的第一理化指标(见附录9.8);

对附录9.8中红葡萄酒的一级理化指标运用spss 软件进行处理得到相关系数矩阵,由相关系数矩阵计算特征值,得到各主成分的贡献率及累计贡献率,如表3-1:

表3-1 特征值及主成分贡献率 主成分 特征值 贡献率/% 累计贡献率/% 主成分 特征值 贡献率/% 累计贡

献率/%

1z 5.3255 59.1722 59.1722 6z 0.1441 1.6011 98.8966 2z

1.6621 18.4677 77.6400 7z 0.0393 0.4366 99.2400 3z

0.7598 8.4422 86.0822 8z 0.0309 0.3433 99.6767 4z

0.7052

7.8355 93.9177

9z

0.0291

0.3233

100

5z

0.3040 3.3777 97.2955

从表3-1中可以看出,主成分31~z z 的累计贡献率已经达到%80%0822.86 ,计算主成分31~z z 的特征值对应的特征向量921,,,e e e ,再根据问题二步骤4中的公式计算各变量在主成分31~z z 上的载荷, 可以得到:

第一主成分1z 与7x 呈现出较强的正相关,与3x 呈现出较强的负相关; 第二主成分2z 与98,x x 呈现出较强的正相关;

第三主成分3z 与9x 呈现出较强的正相关;与8x 呈现出较强的负相关; 因此红葡萄酒的有代表性的理化指标可以概括为9873,,,x x x x ;

对得到的红葡萄以及红葡萄酒的有代表性的理化指标按上述步骤运用s pss 软件(源代码及结果见附录9.9)进行处理,得到简单相关系数矩阵,如表3-2:

表3-2 简单相关系数矩阵

3x 4x 6x 14x 15x 17x 3y 7y 8y 9y

3x

1.0000 -0.1097 -0.1350 0.2700 -0.0148 -0.3833 -0.1287 0.1224 0.1073 -0.3680 4x -0.1097 1.0000 0.6327 -0.0601 0.3524 -0.0126 0.7735 -0.8342 -0.3486 -0.2401 6x -0.1

350 0.6327 1.0000 0.1098 0.0558 0.1671 0.3532 -0.3462 -0.5588 -0.3102 14x 0.27

00 -0.0601 0.1098 1.0000 0.1829 -0.1316 0.0761 0.1261 -0.4494 -0.1101 15x -0.0

148 0.3524 0.0558 0.1829 1.0000 0.1511 0.4053 -0.5237 -0.0490 0.2234 17x -0.3

833 -0.0126 0.1671 -0.1316 0.1511 1.00000 -0.0066 0.0165 -0.2002 0.5673 3y -0.1

287 0.7735 0.3532 0.0761 0.4053 -0.0066 1.0000 -0.8024 -0.3048 0.0155 7y 0.12

24 -0.8342 -0.3462 0.1261 -0.5237 0.0165 -0.8024 1.0000 -0.0423 -0.1201 8y 0.10

73 -0.3486 -0.5588 -0.4494 -0.0490 -0.2002 -0.3048 -0.0423 1.0000 0.3113 9y -0.3

680

-0.2401 -0.3102 -0.1101 0.2234

0.5673 0.0155 -0.1201 0.3113 1.0000

2、由表3-2可以看出,4x (花色苷鲜重)与3y (红葡萄酒总酚)之间的关联程度最大(7735.0=R ),17x (还原糖)和9y (色泽b*(D65))之间的关联程度次之(5673.0=R ),其他红葡萄理化指标与红葡萄酒理化指标的直接关联程度不大,更多的可能是综合影响。

3、由运算结果可以得到第一典型相关系数为0.965,第二典型相关系数为0.811,他们均比红葡萄理化指标与葡萄酒理化指标两组间的任一个相关系数大,这说明综合的典型相关分析效果要好于简单相关分析。

5.3.3 白葡萄与白葡萄酒的理化指标之间的联系

由问题二可以得到白葡萄的几个主成分,经过分析又得到这些主成分对应的理化指标,选取主成分61~z z 的特征值对应的特征向量绝对值的最大值所在的理化指标作为有代表性的理化指标,

即白葡萄的有代表性的理化指标可以概括为2923151486,,,,,x x x x x x ;

与对红葡萄酒的处理相同,对白葡萄酒的一级理化指标(见附录9.10)进行处理得到相关系数矩阵,由相关系数矩阵计算特征值,得到各主成分的贡献率及累计贡献率,如表3-3:

表3-3 特征值及主成分贡献率 主成分 特征值 贡献率/% 累计贡献率/% 主成分 特征值 贡献率/% 累计贡

献率/%

1z 2.9938 37.4225 37.4225 5z 0.3784 4.7300 94.9275

2z

2.3674 29.5925 67.0150 6z 0.2815

3.51875 98.4462 3z

1.0750 13.4375 80.4525 7z 0.1025 1.2812 99.7275 4z

0.7796

9.7450 90.1975

8z

0.0218

0.2725

100

从表3-3中可以看出,主成分31~z z 的累计贡献率已经达到80%%4525.80>,计算主成分31~z z 的特征值对应的特征向量821,,,e e e ,再根据问题二步骤4中的公式计算各变量在主成分31~z z 上的载荷, 可以得到:

第一主成分1z 与2x 呈现出较强的正相关;

第二主成分2z 与8x 呈现出较强的正相关,与6x 呈现出较强的负相关;

第三主成分3z 与4x 呈现出较强的负相关;

因此白葡萄酒的有代表性的理化指标可以概括为8642,,,x x x x ;

对得到的白葡萄以及白葡萄酒的有代表性的理化指标运用s pss 软件(源代码及结果见附录9.11)按上述步骤进行处理,得到简单相关系数矩阵,如表3-4:

表3-4 简单相关系数矩阵

6x 8x 14x 15x 23x 29x 2y 4y 6y 8y

6x

1.0000 -0.2361 0.1364 0.1284 0.0941 -0.1424 0.1217 -0.2488 0.0987 -0.2708 8x

-0.2361 1.0000 -0.3676 -0.1644 -0.0219 0.2039 -0.4032 0.1562 0.0062 -0.0457 14x

0.1364 -0.3676 1.0000 0.1547 0.2347 0.2334 0.0373 -0.2128 -0.3114 0.2176 15x

0.1284 -0.1644 0.1547 1.0000 0.0484 0.1371 0.3859 -0.0948 -0.1982 0.2387 23x 0.0941 -0.0219 0.2347 0.0484 1.0000 -0.0036 0.0610 -0.0520 0.4567 -0.5360 29x

-0.1424 0.2039 0.2334 0.13711 -0.0036 1.0000 -0.0023 0.1684 -0.1303 0.1440 2y 0.1217 -0.4032 0.0373 0.3859 0.0610 -0.0023 1.0000 -0.1381 -0.1881 0.1426 4y

-0.2488 0.1562 -0.2128 -0.0948 -0.0520 0.1684 -0.1381 1.0000 0.1416 0.0170 6y 0.0987 0.0062 -0.3114 -0.1982 0.4567 -0.1303 -0.1881 0.1416 1.0000 -0.9081 8y

-0.2708 -0.0457 0.2176 0.2387 -0.5360 0.1440 0.1426 0.0170 -0.9081 1.0000

1、由表3-4可以看出,23x (果穗质量)与6y (白葡萄酒色泽L*(D65))之间的关联程度最大(4567.0 R ),而其他白葡萄理化指标与白葡萄酒理化指标的直接关联程度不大,更多的可能是综合影响。

2、由运算结果可以得到第一典型相关系数为0.756,第二典型相关系数为0.664,他们均比白葡萄理化指标与白葡萄酒理化指标两组间的任一个相关系数大,这说明综合的综合的典型相关分析效果要好于简单相关分析。

5.4 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元线性回归;

全国数学建模竞赛一等奖论文

交巡警服务平台的设置与调度 摘要 由于警务资源有限,需要根据城市的实际情况与需求建立数学模型来合理地确定交巡警服务平台数目与位置、分配各平台的管辖范围、调度警务资源。设置平台的基本原则是尽量使平台出警次数均衡,缩短出警时间。用出警次数标准差衡量其均衡性,平台与节点的最短路衡量出警时间。 对问题一,首先以出警时间最短和出警次数尽量均衡为约束条件,利用无向图上任意两点最短路径模型得到平台管辖范围,并运用上下界网络流模型优化解,得到A区平台管辖范围分配方案。发现有6个路口不能在3分钟内被任意平台到达,最长出警时间为5.7分钟。 其次,利用二分图的完美匹配模型得出20个平台封锁13个路口的最佳调度方案,要完全封锁13个路口最快需要8.0分钟。 最后,以平台出警次数均衡和出警时间长短为指标对方案优劣进行评价。建立基于不同权重的平台调整评价模型,以对出警次数均衡的权重u和对最远出警距离的权重v 为参数,得到最优的增加平台方案。此模型可根据实际需求任意设定权重参数和平台增数,由此得到增加的平台位置,权重参数可反映不同的实际情况和需求。如确定增加4个平台,令u=0.6,v=0.4,则增加的平台位置位于21、27、46、64号节点处。 对问题二,首先利用各区平台出警次数的标准差和各区节点的超距比例分析评价六区现有方案的合理性,利用模糊加权分析模型以城区的面积、人口、总发案次数为因素来确定平台增加或改变数目。得出B、C区各需改变2个平台的位置,新方案与现状比较,表明新方案比现状更合理。D、E、F区分别需新增4、2、2个平台。利用问题一的基于不同权重的平台调整评价模型确定改变或新增平台的位置。 其次,先利用二分图的完美匹配模型给出80个平台对17个出入口的最优围堵方案,最长出警时间12.7分钟。在保证能够成功围堵的前提下,若考虑节省警力资源,分析全市六区交通网络与平台设置的特点,我们给出了分阶段围堵方案,方案由三阶段构成。最多需调动三组警力,前后总共需要29.2分钟可将全市路口完全封锁。此方案在保证成功围堵嫌疑人的前提下,若在前面阶段堵到罪犯,则可以减少警力资源调度,节省资源。 【关键字】:不同权重的平台调整评价模糊加权分析最短路二分图匹配

12年全国数学建模大赛A题获奖作品

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题. 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出. 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性.如有违反竞赛规则的行为,我们将受到严肃处理. 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等). 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期: 年月日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号):

基于统计分析的葡萄酒评价模型 摘 要 本文针对葡萄酒评价问题, 指出了两组评酒员评价结果差异, 给出了更可信的小组,根据酿酒葡萄的理化指标和葡萄酒的质量确定了酿酒葡萄的分级, 然后建立了酿酒葡萄与葡萄酒理化指标之间的回归方程组, 得出了酿酒葡萄和葡萄酒理化指标对葡萄酒质量影响的方程, 最后论证了葡萄酒质量不能完全用这两种理化指标评价. 问题一:首先对两组评酒员打分数据进行预处理,采用了两个独立样本的非参数统计方法进行Mann-Whitney U 检验,证明了两组评酒员评价结果存在显著差异,并通过比较两组打分样本的方差,异常值点等离散型度量,认为第二组的评价结果更加合理. 问题二:首先选取能代表所有葡萄理化指标的变量,利用聚类分析法验证了所选变量具有代表性,然后通过主成分分析得出每种葡萄的理化指标综合得分,依据综合得分将酿酒红葡萄分为3类、白葡萄分为5类,并根据每一类中葡萄所酿造的酒的质量确定该类葡萄的等级. 问题三:应用SPSS 软件,利用回归分析方法建立了酿酒葡萄和葡萄酒理化指标之间的回归方程组. 问题四:首先利用Matlab 软件对酿酒葡萄和葡萄酒理化指标运用功效系数法进行无量纲量的转换,综合考虑这两方面因素,得到一个关于量化指标的综合指数,最后将葡萄酒质量作为因变量,量化综合指数作为自变量,利用回归分析方法建立两者的联系,得到回归方程为121317105.001.010*302.9171.10N N N M +-+=-,证明了葡萄酒质量不能完全用这两种理化指标评价. 关键词: Mann-Whitney U 检验 聚类分析 主成分分析 回归分析 功效系数法

2013全国数学建模大赛a题优秀论文

车道被占用对城市道路通行能力的影响 摘要 随着城市化进程加快,城市车辆数的增加,致使道路的占用现象日益严重,同时也导致了更多交通事故的发生。而交通事故发生过程中,路边停车、占道施工、交通流密增大等因素直接导致车道被占用,进而影响了城市道路的通行能力。本文在视频提供的背景下通过数据采集,利用数据插值拟合、差异对比、车流波动理论等对这一影响进行了分析,具体如下: 针对问题一,首先根据视频1中交通事故前后道路通行情况的变化过程运用物理观察测量类比法、数学控制变量法提取描述变量(如事故横断面处的车流量、车流速度以及车流密度)的数据,从而通过研究各变量的变化,来分析其对通行能力的影响。而视频1中有一些时间断层,我们可根据现有的数据先用统计回归对各变量数据插值后再进行拟合,拟合过程中利用残差计算值的大小来选择较好的模型来反应各变量与事故持续时间的关系,进而更好地说明事故发生至撤离期间,事故所处横断面实际通行能力的变化过程。 针对问题二:沿用问题一中的方法,对视频2中影响通行能力的各个变量进行数据采集,同样使用matlab对时间断层处进行插值拟合处理,再将所得到的的变化图像与题一中各变量的变化趋势进行对比分析,其中考虑到两视频的时间段与两视频的事故时长不同,从而采用多种对比方式(如以事故发生前、中、后三时段比较差值、以事故相同持续时间进行对比、以整个事故时间段按比例分配时间进行对比)来更好地说明这一差异。由于小区口的位置不同、时间段是否处于车流高峰期以及1、2、3道车流比例不同等因素的影响,采用不同的数据采集方式使采集的变量数据的实用性更强,从而最后得到视频1中的道路被占用影响程度高于视频2中的影响程度,再者从差异图像的变化波动中得到验证,使其合理性更强。 针对问题三:运用问题1、2中三个变量与持续时间的关系作为纽带,再根据附件5中的信号相位确定出车流量的测量周期为一分钟,测量出上游车流量随时间的变化情况,而事故横断面实际通行能力与持续时间的关系已在1、2问中由拟合得到,所以再根据波动理论预测道路异常下车辆长度模型的结论,结合采集数据得到的函数关系建立数学模型,最后得出事故发生后,车辆排队长度与事故横断面实际通行能力、事故持续时间以及路段上游车流量这三者之间的关系式。 针对问题四:在问题3建立的模型下,利用问题4中提供的变量数据推导出其它相关变量值,然后代入模型,估算出时间长度,以此检验模型的操作性及可靠性。 关键词:通行能力车流波动理论车流量车流速度车流密度

数学建模期末考试A试的题目与答案

华南农业大学期末考试试卷(A 卷) 2012-2013学年第 二 学期 考试科目:数学建模 考试类型:(闭卷)考试 考试时间: 120 分钟 学号 姓名 年级专业 一篮白菜从河岸一边带到河岸对面,由于船的限制,一次只能带 一样东西过河,绝不能在无人看守的情况下将狼和羊放在一起;羊和白菜放在一起,怎样才能将它们安全的带到河对岸去? 建立多步决策模型,将人、狼、羊、白菜分别记为i = 1,2,3,4,当i 在此岸时记x i = 1,否则为0;此岸的状态下用s =(x 1,x 2,x 3,x 4)表示。该问题中决策为乘船方案,记为d = (u 1, u 2, u 3, u 4),当i 在船上时记u i = 1,否则记u i = 0。 (1) 写出该问题的所有允许状态集合;(3分) (2) 写出该问题的所有允许决策集合;(3分) (3) 写出该问题的状态转移率。(3分) (4) 利用图解法给出渡河方案. (3分) 解:(1) S={(1,1,1,1), (1,1,1,0), (1,1,0,1), (1,0,1,1), (1,0,1,0)} 及他们的5个反状(3分) (2) D = {(1,1,0,0), (1,0,1,0), (1,0,0,1), (1,0,0,0)} (6分) (3) s k+1 = s k + (-1) k d k (9分) (4)方法:人先带羊,然后回来,带狼过河,然后把羊带回来,放下羊,带白菜过去,然后再回来把羊带过去。 ?或: 人先带羊过河,然后自己回来,带白菜过去,放下白菜,带着羊回来,然后放下羊,把狼带过去,最后再回转来,带羊过去。 (12分) 1、 二、(满分12分) 在举重比赛中,运动员在高度和体重方面差别很大,请就下面两种假设,建立一个举重能力和体重之间关系的模型: (1) 假设肌肉的强度和其横截面的面积成比例。6分 (2) 假定体重中有一部分是与成年人的尺寸无关,请给出一个改进模型。6分 解:设体重w (千克)与举重成绩y (千克) (1) 由于肌肉强度(I)与其横截面积(S)成比例,所以 y ?I ?S 设h 为个人身高,又横截面积正比于身高的平方,则S ? h 2 再体重正比于身高的三次方,则w ? h 3 (6分) ( 12分) 14分) 某学校规定,运筹学专业的学生毕业时必须至少学

数学建模国家一等奖优秀论文

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写):B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3.

指导教师或指导教师组负责人(打印并签名): ?(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 2014 年 9 月15日 赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

2012年数学建模A题优秀论文

2012高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话):S55001 所属学校(请填写完整的全名):郑州科技学院 参赛队员(打印并签名) :1. 刘超 2. 赵芬芳 3. 尹峰 指导教师或指导教师组负责人(打印并签名):闫天增 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

2012高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号):

葡萄酒的评价 摘要 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。本文通过对27种红葡萄酒和28种白葡萄的理化指标数据进行分析,采用显著性差异分析法、可靠度分析、因子分析法、相关系数分析、主成分分析法以及聚类分析法,借助统计软件SPSS和数学软件MATLAB,分析了两组评酒员的评价结果有无显著性差异和可信度,给出了酿酒葡萄与葡萄酒的理化指标之间的联系,建立了基于酿酒葡萄理化指标和葡萄酒质量的聚类分析模型确定了葡萄酒质量的影响因素,最后通过补充相关信息,建立基于分析模型确定了葡萄酒质量的影响因素。 针对问题一,首先对所有样品的10位评酒员打分的加权平均值进行显著性差异检验,显著性水平取为0.05,通过两组评酒员分别对红葡萄酒和白葡萄酒的显著性检验得出两组评酒员的评价结果有明显差异,最后运用可靠性分析,得到两组评酒员的评价结果的可靠度,结果表明第二组评酒员的评价结果更加可信。 针对问题二,以第二组评酒员的评价结果作为相应葡萄酒样品的质量指标,根据酿酒葡萄理化指标对比葡萄酒的质量利用SPSS软件进行聚类分析,得到酿酒葡萄的聚类树状图,从而将酿酒葡萄分成5个等级。 针对问题三,对葡萄酒的理化指标进行主成分分析,得到葡萄酒的主要成分,然后将每一个主成分与酿酒葡萄的理化指标进行多元回归分析,根据SPSS软件运行结果得出主成分与酿酒葡萄的理化指标的相关性。 针对问题四,利用因子分析分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响因素,将附件3中4个表格里的每张样品中所含各种芳香物质求和作为样品中的芳香指标与葡萄酒的理化指标一并进行因子分析,比较前后两者结果中由样品中的芳香指标导致的影响差异来确定不能只用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,还需要结合感官指标,感官指标是评价葡萄酒质量的最终及最有效的指标。 关键词:理化指标主成分分析法可信度分析显著差异聚类分析芳香物质

2012年美国国际大学生数学建模竞赛(MCM ICM)题目 翻译

IMPORTANT CHANGE TO CONTEST RULES FOR MCM/ICM 2012: Teams (Student or Advisor) are now required to submit an electronic copy (summary sheet and solution) of their solution paper by email to solutions@https://www.sodocs.net/doc/f011060124.html,. Your email MUST be received at COMAP by the submission deadline of 8:00 PM EST, February 13, 2012. Teams are free to choose between MCM Problem A, MCM Problem B or ICM Problem C. COMAP Mirror Site: For more in: https://www.sodocs.net/doc/f011060124.html,/undergraduate/contests/mcm/ MCM: The Mathematical Contest in Modeling ICM: The Interdisciplinary Contest in Modeling 2012 Contest Problems MCM PROBLEMS PROBLEM A: The Leaves of a Tree "How much do the leaves on a tree weigh?" How might one estimate the actual weight of the leaves (or for that matter any other parts of the tree)? How might one classify leaves? Build a mathematical model to describe and classify leaves. Consider and answer the following: ? Why do leaves have the various shapes that they have? ? Do the shapes “minimize” overlapping individual shadows that are cast, so as to maximize exposure? Does the distribution of leaves within the “volume” of the tree and its branches effect the shape? ? Speaking of profiles, is leaf shape (general characteristics) related to tree profile/branching structure?

2012年数学建模A题范文

2013高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):

2013高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

美国大学生数学建模竞赛优秀论文翻译

优化和评价的收费亭的数量 景区简介 由於公路出来的第一千九百三十,至今发展十分迅速在全世界逐渐成为骨架的运输系统,以其高速度,承载能力大,运输成本低,具有吸引力的旅游方便,减少交通堵塞。以下的快速传播的公路,相应的管理收费站设置支付和公路条件的改善公路和收费广场。 然而,随着越来越多的人口密度和产业基地,公路如花园州公园大道的经验严重交通挤塞收费广场在高峰时间。事实上,这是共同经历长时间的延误甚至在非赶这两小时收费广场。 在进入收费广场的车流量,球迷的较大的收费亭的数量,而当离开收费广场,川流不息的车辆需挤缩到的车道数的数量相等的车道收费广场前。因此,当交通繁忙时,拥堵现象发生在从收费广场。当交通非常拥挤,阻塞也会在进入收费广场因为所需要的时间为每个车辆付通行费。 因此,这是可取的,以尽量减少车辆烦恼限制数额收费广场引起的交通混乱。良好的设计,这些系统可以产生重大影响的有效利用的基础设施,并有助于提高居民的生活水平。通常,一个更大的收费亭的数量提供的数量比进入收费广场的道路。 事实上,高速公路收费广场和停车场出入口广场构成了一个独特的类型的运输系统,需要具体分析时,试图了解他们的工作和他们之间的互动与其他巷道组成部分。一方面,这些设施是一个最有效的手段收集用户收费或者停车服务或对道路,桥梁,隧道。另一方面,收费广场产生不利影响的吞吐量或设施的服务能力。收费广场的不利影响是特别明显时,通常是重交通。 其目标模式是保证收费广场可以处理交通流没有任何问题。车辆安全通行费广场也是一个重要的问题,如无障碍的收费广场。封锁交通流应尽量避免。 模型的目标是确定最优的收费亭的数量的基础上进行合理的优化准则。 主要原因是拥挤的

2012年数学建模大赛A题解题思路

首先纠正一下对于数学建模的看法,数学建模重要的是一种数学思想,即使是没有牢固的数学根底,一样可以在建模的赛场上大放异彩。 下面先把试题读一下,个人认为的重点词汇已经标出出来。(不要盲目听从任何人所谓的专家建议) A题葡萄酒的评价 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒 员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡 萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒 葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某 一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的 和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 附件1:葡萄酒品尝评分表(含4个表格) 附件2:葡萄和葡萄酒的理化指标(含2个表格) 附件3:葡萄和葡萄酒的芳香物质(含4个表格) 解题思路: 1、众所周知,对于同一事物的评价,如果大家的意见越一致,那么评 价的可信度就越高。所以对于问题1的解题思路也就清晰明了了。

我们可以通过离散度(所谓离散程度,即观测变量各个取值之间的 差异程度。它是用以衡量风险大小的指标。)这一概念来对每一组评 酒员作出的评估作出风险分析。显而易见的是若风险评估的值越高,这组评酒员的评价就存在问题了。若风险评估值大小相当,这说明 这两组评酒员是没有明显差异的。 2、题目中要求对葡萄作出评级。看起来似乎没有思路,那么我们可以 动一下我们的小脑筋。既然对于评级我们没有参考标准,那么我们 可以参考评酒员的评价。即使用逆向思维,从评酒员的评分发出, 那么大体上葡萄的分级基本上就能确定下来,根据确定先来的葡萄 分级进行逆推,就可以得出结论。 3、对于这个问题,最直观也是最基本的思路就是看两者之间的趋势。 (作出两者的趋势图)。通过对趋势图的直接观察,两者之间的大体 关系即可确定,然后根据曲线拟合的方法可得出两者间的函数关系。 4、对于问题4的这中学术中称之为白痴型问题,大家肯定一眼就能得 出结论,那就是肯定能用理化指标来评价葡萄酒的质量。但这里有 个前提,就是先分析葡萄和葡萄酒理化指标之间的关系,显然这是 解题的关键。对于这种大量数据的问题,只要通过计算机实现,基 本上不要考虑认为分析,因为在浪费大量时间的前提下基本上不会 得出结论。言归正传,谈一下解题的关键点或者是捷径,可以通过 附件一种的数据来作出评价。至于具体的方法,因为只是初步的讲 解还未作出具体判断。估计会在后续的评论中作出判断。 谢谢大家,小马过河预祝大家考出理想成绩。

2014年数学建模国家一等奖优秀论文设计

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参 赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括、电子、网上咨询等) 与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或 其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文 引用处和参考文献中明确列出。 我们重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违 反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3.

指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 2014 年 9 月 15日赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

数学建模A题

2012年暑期培训数学建模第二次模拟 承诺书 我们仔细阅读了数学建模联赛的竞赛规则。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与本队以外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其它公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们愿意承担由此引起的一切后果。 我们的参赛报名号为: 参赛队员(签名) : 队员1: 队员2: 队员3:

2012年暑期培训数学建模第二次模拟 编号专用页 参赛队伍的参赛号码:(请各个参赛队提前填写好): 竞赛统一编号(由竞赛组委会送至评委团前编号): 竞赛评阅编号(由竞赛评委团评阅前进行编号): 数学课程的成绩分析 摘要 本文针对大学甲、乙两个专业数学成绩分析问题,进行建模分析,主要用到统计分析的知识和 excel以及matlab软件,建立了方差分析、相关分析的相关模型,研究了影响学生成绩的相关因素, 以及大学生如何进行数学课程的学习。 问题一针对每门课程分析两个专业的数学成绩可以通过excel工具得出各门功课的平均值、方差

进行比较分析。 问题二针对专业分析两个专业的数学成绩的数学水平有无明显差异,可以运用平均数、方差进行 比较。并对两专业的数学成绩进行T检验,进一步分析其有无显著性差异。 问题三针对各班高数成绩和线代、概率论成绩进行散点图描述建立一元回归线性模型,然后对模 型进行求解,对模型进行改进。包括分析置信区间,残差等。 关键词:平均值方差 T检验一元回归线性模型置信区间 残差 excel matlab 一、问题重述 附件是甲专业和乙专业的高等数学上册、高等数学下册、线性代数、概率论与数理统计等三门数学课程的成绩数据,请根据数据分析并回答以下问题: (1)针对每门课程分析,两个专业的分数是否有明显差异? (2)针对专业分析,两个专业学生的数学水平有无明显差异? (3)高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况? (4)根据你所作出的以上分析,面向本科生同学阐述你对于大学数学课程学习方面的看法。 二、模型假设 1.假设附件中所给的数据为学生真实考试成绩(由于数据的来源要符合真实可靠的原则); 2.每位学生的成绩之间是相互独立的; 3.同一个专业不同班之间学生的成绩是相互独立的; 4.假设显著性水平是a=0.05; 三、符号约定 X:甲专业高数平均成绩 Y:乙专业高数平均成绩 :回归系数 :回归系数 四、问题分析 问题一分析:比较两个专业成绩是否有明显差异可以通过分别求出各自的成绩平均值以及方差等方法,并画出柱状图来形象表示。 问题二分析:比较两个专业数学水平可以在平均值与方差的基础上进行T检验,从而得出结论。 问题三分析:根据处理后的数据分析高数成绩对其他两科的影响,首先根据数据画出散点图进行模型建立,再用matlab进行回归分析,求出回归系数并分析模型的残差,对模型进行改进直至得到较为满意的模型;并根据模型对问题进行分析得出结论。

2012年数学建模A题资料

(一)葡萄酒观察方法 1 酒液总体观察 1.1 澄清度观察 衡量葡萄酒澄清程度的指标有透明度、浑浊度等,与之相关的指标还有是否光亮、有无沉淀等。优良的葡萄酒必须澄清、透明(色深的红葡萄酒例外)、光亮。 a.澄清:是衡量葡萄酒外观质量的重要指标。澄清表示的是葡萄酒明净清澈、不含悬浮物。通常情况下,澄清的葡萄酒也具有光泽。 b.透明度:表示的是葡萄酒允许可见光透过的程度。 红葡萄酒如果颜色很深,则澄清的葡萄酒也不一定透明。 c.浑浊度:表示的是葡萄酒的浑浊程度,浑浊的葡萄酒含有悬浮物。葡萄酒的浑浊往往是由微生物病害、酶破败或金属破败引起的。浑浊的葡萄酒其口感质量也差。 d.沉淀:指的是从葡萄酒中析出的固体物质。沉淀是由于在陈酿过程中,葡萄酒构成成份的溶解度变小引起的,一般不会影响葡萄酒的质量。 1.2 颜色观察 葡萄酒的颜色受酒龄影响,新红葡萄酒由于源于果皮花色素苷的作用,通常颜色鲜艳,为紫红色和宝石红色,带紫色色调;在葡萄酒的成熟过程中,丹宁逐渐与游离花色素苷等结合而使成年葡萄酒带有黄色色调。瓦红或砖红色为成年红葡萄酒的常有的颜色,而棕红色则为在瓶内陈酿10年以上的红葡萄酒的颜色。因此,可根据颜色,判断葡萄酒的成熟状况。 葡萄酒的颜色和口感的变化存在着平行性,颜色和口感之间必须相互协调平衡。颜色的深浅反应葡萄酒的结构、丰满度以及尾味和余味。如在红葡萄酒中,颜色的深浅与丹宁的含量往往正相关。如果红葡萄酒颜色深而浓,几乎处于半透明状态,多数情况下它必然醇厚、丰满、丹宁感强。相反,色浅的葡萄酒,则味淡、味短。当然,如果较柔和,具醇香,仍不失为好酒。例如瓦红色的红葡萄酒,必须与浓郁的醇香和柔顺的口感同时存在,否则表明该酒是人工催熟条件下陈酿而未能表现出最佳感官质量。 带紫色的新葡萄酒往往口味平淡、瘦弱、尖酸、粗糙;褐色过重的成年葡萄酒,氧化过重、老化。 1.3 浑浊度观察 观察葡萄酒有无下列情况:略失光,失光,欠透明,微混浊,极浑浊,雾状混浊,乳状混浊; 1.4 沉淀观察 观察葡萄酒有无下列情况:有无沉淀,沉淀类型:纤维状沉淀,颗粒状沉淀,絮状沉淀,酒石结晶,片状沉淀,块状沉淀。 2 酒液表面观察 2.1 流动性观察 如果葡萄酒不正常,则其流动性差;如倒时无声,无气泡,呈油状。 --灰腐病危害的葡萄酿的酒; --酒发生了由乳酸菌引起的油脂病。 2.2观察液面方法 方法A:用食指和姆指捏着酒杯的杯脚,将酒杯置于腰高,低头垂直观察葡萄酒的液面。或者将酒杯置于品尝桌上,站立弯腰垂直观察。 方法B:如果葡萄酒透明度良好,也可从酒杯的下方向上观察液面。 正常葡萄酒的液面标准 a. 葡萄酒的液面呈圆盘状; b. 葡萄酒的液面洁净、光亮、完整; c. 透过圆盘状的液面,可观察到"珍珠",即杯体与杯柱的联接处。表明葡萄酒具有良好的透明性。

2012年数学建模C题全国一等奖作品

脑卒中发病环境因素分析及干预 摘要 环境因素已被证实与脑卒中的诱发密切相关,本文从定量角度给出了脑卒中的发病率与环境因素之间的关系,并提出发病预警和干预的建议方案。 问题一要求对发病人群进行统计描述,我们首先对原始数据进行再加工整理,得到不同性别、不同职业及不同年龄段的发病率数据,通过计算发病人群分布的众数、四分位差、偏度、峰度等统计指标,得到了发病人群分布的特征:如发病人群的年龄呈左偏、平峰分布等。 针对问题二,为全面分析发病率与环境因素的关系,我们增加考虑温度差、和湿度差因素,通过建立统计回归模型,得到了脑卒中发病率与气压、温度、湿度、温度差和湿度差之间的量化关系,结果分析显示拟合优度和显著性检验都令人满意。 最后,根据问题一和问题二得到的结果,我们对不同的年龄层次、职业人群,气候条件等提出了相应的预警干预方案。 关键词:众数、四分位数、偏度、峰度、统计回归

问题的重述 脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。这种疾病的诱发已经被证实与环境因素,包括气温和湿度之间存在密切的关系。对脑卒中的发病环境因素进行分析,其目的是为了进行疾病的风险评估,对脑卒中高危人群能够及时采取干预措施,也让尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程度,进行自我保护。同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。 数据来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料。根据题目提供的数据,回答以下问题: 1.根据病人基本信息,对发病人群进行统计描述。 2.建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。 3.查阅和搜集文献中有关脑卒中高危人群的重要特征和关键指标,结合1,2中所得结论,对高危人群提出预警和干预的建议方案。 问题假设 1.脑卒中发病因素只考虑气压、温度、湿度、温度差、湿度差,不考虑其它非环境因素; 2.在07至10年的相应时间段上,当环境因素稳定时,脑卒中人群的发病率服从正态分布; 3.忽略数据统计过程中的微小误差。 符号的假设 M——脑卒中发病人群年龄分布的众数 M——脑卒中发病人群年龄分布的中位数 e Q——脑卒中发病人群年龄分布的上四分位数 L Q——脑卒中发病人群年龄分布的下四分位数 U V——脑卒中发病人群年龄分布的异众比率 r X——脑卒中发病人群年龄分布的均值 Q——脑卒中发病人群年龄分布的四分位数差 D ——脑卒中发病人群年龄分布的偏态系数 3

2011年全国数学建模大赛A题获奖论文

城市表层土壤重金属污染分析 摘要 本文旨在对城市土壤地质环境的重金属污染状况进行分析,建立模型对金属污染物的分布特点、污染程度、传播特征以及污染源的确定进行有效的描述、评价和定位。 对于重金属空间分布问题,首先基于克里金插值法,应用Surfer 8软件对各数据点的分布情况进行模拟,得到了直观的重金属污染空间分布图形;随后,分别用内梅罗综合污染指数以及模糊评价标准和模型对城区内不同区域重金属的污染程度进行了评判。 对于金属污染的主要原因分析问题,基于因子分析法、问题一的结果和对各个金属污染物的来源分析等因素,判断出金属污染的主要原因有:工业生产、汽车尾气排放、石油加工并推测该区域是镍矿富集区。随后讨论了污染源之间的相互关系和不同金属的污染贡献率。 针对污染源位置确定问题,我们建立了两个模型:模型一以流程图的形式出现,基于污染传播的一般规律建立模型,求取污染源范围,模型作用更倾向于确定污染源的位置;模型二基于最小二乘法原理,建立了拟合二次曲面方程,在有效确定污染源的同时也反映了其传播特征,模型更加清楚,理论性也更强。 在研究城市地质环境的演变模式问题中,我们对针对污染源位置确定问题所建模型的优缺点进行了评价,同时建立了考虑了时间,地域环境和传播媒介的污染物传播模型,从而反映了地质的演变。 综上所述,本文模型的特点是从简单的模型建立起,强更准确的数学模型发展,逐步达到目标期望。 关键词:重金属污染,克里金插值最小二乘法因子分析流程图

一、问题重述 1.1问题背景 随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。评价和研究城市土壤重金属污染程度,讨论土壤中重金属的空间分布,研究城市土壤重金属污染特征、污染来源以及在环境中迁移、转化机理,并对城市环境污染治理和城市进一步的发展规划提出科学建议,不仅有利于城市生态环境良性发展,有利于人类与自然和谐,也有利于人类社会 健康和城市可持续发展[1] 。按照功能划分,城区一般可分为生活区、工业区、山区、主干道路区及公园绿地区等,不同的区域环境受人类活动影响的程度不同。 现对某城市城区土壤地质环境进行调查。为此,将所考察的城区划分为间距1公里左右的网格子区域,按照每平方公里1个采样点对表层土(0~10 厘米深度)进行取样、编号,并用GPS 记录采样点的位置。应用专门仪器测试分析,获得了每个样本所含的多种化学元素的浓度数据。另一方面,按照2公里的间距在那些远离人群及工业活动的自然区取样,将其作为该城区表层土壤中元素的背景值。 1.2 目标任务 (1) 给出8种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金属的污染程度。 (2) 通过数据分析,说明重金属污染的主要原因。 (3) 分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。 (4) 分析所建立模型的优缺点,为更好地研究城市地质环境的演变模式,分析还应收集的信息,并进一步探索怎样利用收集的信息建立模型及解决问题。 二、 模型假设 1)忽略地下矿源对污染物浓度的影响; 2)认为海拔对污染物的分布较小,故只在少数模型中讨论其作用; 3)认为题目中的采样方式是科学的,能够客观反映污染源的分布。 三、 符号说明 3.1第一问中的符号说明 i p ——污染物i 的环境污染指数 i C ——污染物i 的实测值 i S ——污染物i 的背景值 m ax (/)i i C S ——土壤污染指数的最大值 (/)i i avg C S ——土壤污染指数的平均值

2012数学建模A题葡萄酒答案

图一的两组红葡萄酒的平均值、和标准差 第二组红葡萄酒 标准差平均值标准差酒样品1 9.638465 酒样品1 68.1 9.048634 酒样品2 80.3 6.307843 酒样品2 74 4.027682 酒样品3 80.4 6.769211 酒样品3 74.6 5.541761 酒样品4 68.6 10.39444 酒样品4 71.2 6.425643 酒样品5 73.3 7.874713 酒样品5 72.1 3.695342 酒样品6 72.2 7.728734 酒样品6 66.3 4.595892 酒样品7 71.5 10.17895 酒样品7 65.3 7.91693 酒样品8 72.3 6.634087 酒样品8 66 8.069146 酒样品9 81.5 5.739725 酒样品9 78.2 5.072803 酒样品10 74.2 5.51362 酒样品10 68.8 6.014797 酒样品11 61.7 7.91693 酒样品11 61.6 6.168018 酒样品12 53.9 8.924996 酒样品12 68.3 5.012207 酒样品13 74.6 6.703233 酒样品13 68.8 3.910101 酒样品14 73 6 酒样品14 72.6 4.812022 酒样品15 58.7 9.250225 酒样品15 65.7 6.429965 酒样品16 74.9 4.254409 酒样品16 69.9 4.483302 酒样品17 79.3 9.381424 酒样品17 74.5 3.02765 酒样品18 59.9 6.871034 酒样品18 65.4 7.089899 酒样品19 69.4 6.25744 酒样品19 72.6 7.426679 酒样品20 78.6 5.103376 酒样品20 75.8 6.250333 酒样品21 77.1 10.77497 酒样品21 72.2 5.95912 酒样品22 77.2 7.11493 酒样品22 71.6 4.926121 酒样品23 85.6 5.699903 酒样品23 77.1 4.976612 酒样品24 78 8.653837 酒样品24 71.5 3.27448 酒样品25 69.2 8.038795 酒样品25 68.2 6.613118 酒样品26 73.8 5.593647 酒样品26 72 6.44636 酒样品27 73 7.055337 酒样品27 71.5 4.527693 图二两组白葡萄酒的平均值、和标准差 第一组白葡萄酒第二组白葡萄酒 干白品种平均值标准差干白品种平均值标准差 酒样品1 82 9.60324 酒样品1 77.9 5.087021 酒样品2 74.2 14.1798 酒样品2 75.8 7.00476 酒样品3 85.3 19.10817 酒样品3 75.6 11.93687 酒样品4 79.4 6.686637 酒样品4 76.9 6.488451 酒样品5 71 11.24475 酒样品5 26.1 5.126185 酒样品6 68.4 12.75583 酒样品6 75.5 4.766783 酒样品7 77.5 6.258328 酒样品7 74.2 1.212265 酒样品8 71.4 13.54991 酒样品8 72.3 5.578729 酒样品9 72.9 9.631545 酒样品9 80.4 10.30857 酒样品10 74.3 14.58348 酒样品10 79.8 8.390471

全国数学建模竞赛b题优秀论文

基于最小二乘法的碎纸片拼接复原数学模型 摘要 首先对图片进行灰度化处理,然后转化为0-1二值矩阵,利用矩阵行(列)偏差函数,建立了基于最小二乘法的碎纸片拼接数学模型,并利用模型对图片进行拼接复原。 针对问题一,当两个数字矩阵列向量的偏差函数最小时,对应两张图片可以左右拼接。经计算,得到附件1的拼接结果为: 08,14,12,15,03,10,02,16,01,04,05,09,13,18,11,07,17,00,06。 附件2的拼接结果为: 03,06,02,07,15,18,11,00,05,01,09,13,10,08,12,14,17,16,04。 针对问题二,首先根据每张纸片内容的不同特性,对图片进行聚类分析,将209张图片分为11类;对于每一类图片,按照问题一的模型与算法,即列偏差函数最小则进行左右拼接,对于没有拼接到组合里的碎纸片进行人工干预,我们得到了11组碎纸片拼接而成的图片;对于拼接好的11张图片,按照问题一的模型与算法,即行偏差函数最小则进行上下拼接,对于没有拼接到组合里的碎纸片进行人工干预。我们最终经计算,附件3的拼接结果见表9,附件4的拼接结果见表10。 针对问题三,由于图片区分正反两面,在问题二的基础上,增加图片从下到上的裁截距信息,然后进行两次聚类,从而将所有图片进行分类,利用计算机自动拼接与人工干预相结合,对所有图片进行拼接复原。经计算,附件5的拼接结果见表14和表15 该模型的优点是将图片分为具体的几类,大大的减少了工作量,缺点是针对英文文章的误差比较大。 关键字:灰度处理,图像二值化,最小二乘法,聚类分析,碎纸片拼接 一、问题重述 碎纸片的拼接复原技术在司法鉴定、历史文献修复与研究、军事情报获取以及故障分析等领域都有着广泛的应用。近年来,随着德国“斯塔西”文件的恢复工程的公布,碎纸文件复原技术的研究引起了人们的广泛关注。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。对于一页印刷文档,针对不同的破碎方法,讨论下列三个问题: (1)将给定的一页印刷文字文件纵切,建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。 (2)对于碎纸机既纵切又横切的情形,设计碎纸片拼接复原模型和算法,并针对附

相关主题