红方窑

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 281|回复: 19

2022国赛C题完整思路古代玻璃制品分析

[复制链接]

2

主题

3

帖子

6

积分

新手上路

Rank: 1

积分
6
发表于 2022-9-22 21:51:30 | 显示全部楼层 |阅读模式
C 题古代玻璃制品的成分分析与鉴别

今年C题真的太简单了,完全就是小白级别,我用SPSSPRO完整解题了
解题总结
问题1:对这些玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析(对应分析);结合玻璃的类型,分析文物样品表面有无风化化学成分含量的统计规律(独立样本t检验),并根据风化点检测数据,预测其风化前的化学成分含量(简单计算)。

问题2:对这些玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析;结合玻
璃的类型,分析文物样品表面有无风化化学成分含量的统计规律,并根据风化点检测数据,预
测其风化前的化学成分含量。(建立机器学习分类模型并对模型进行评价)

问题3:对这些玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析;结合玻
璃的类型,分析文物样品表面有无风化化学成分含量的统计规律,并根据风化点检测数据,预
测其风化前的化学成分含量。(将问题2中的训练的模型进行应用,同样用到的是机器学习分类模型)

问题4:针对不同类别的玻璃文物样品,分析其化学成分之间的关联关系,并比较不同类
别之间的化学成分关联关系的差异性。(因子分析或相关性分析)

问题1

该题其实可以分成三部分:


一、对这些玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析,可以用到对应分析,来研究不同分类变量之间的关系。



结论:铅钡容易风化,高钾不易风化。




结论:纹饰B容易风化,AC不易风化。





结论:黑色比较能却确认为风化,浅绿、深蓝比较能确定为无风化,其它颜色不大能分清是否风化。


二、题目要求分析文物样品表面有无风化化学成分含量的统计规律,我们可以用到独立性t检验,以分析有无风化各成分含量是否具有差异性,以及有无风化各成分的均值是什么。但是前提是需要对数据进行预处理,该预处理后的数据在之后的问题中同样适用。

数据预处理:
2.1
根据表单1的与表单2的文物编码,以它为主键,将“类型”和“表面风化”两个变量汇总到表单2中,但表单2中的文物采样点可能取得是并无风化点,还需在表单2进行细微修改。




2.2
题目中提到成分空白处表示未检测到该成分,我们可以在数据处理模块的“缺失值处理”,将所有成分变量存在的缺失值处理为0。




2.3

题目中要求将成分比例累加和介于 85%~105%之间的数据视为有效数据。我们可以在数据处理模块的“生成变量”,检验所有成分加和是否在85%-105%区间。



表格中就会生成多一列的数据:




紧接着做一次“异常值处理”,将85%~105%之外的设置为空值




再进行”个按处理”,将异常值剔除


最终剔除了两个样本




2.4

数据分析模块:我们使用独立样本t检验





由输出结果5,我们可以看出是否以分析有无风化各成分含量是否具有差异性,P值小于0.05的,说明有无风化该成分含量具有差异性。输出结果4的条形图可以有无风化各成分的均值是什么。比如:








三、
预测其风化前的化学成分含量:根据风化前各成分含量与风化后各成分含量,建立预测关系。

解题思路:可以根据(2)中独立样本t检验中,计算各成分有风化均值和无风化均值之间的比值,利用这个比值可以求出风化前的化学成分含量。


问题2



依据附件数据分析高钾玻璃、铅钡玻璃的分类规律;对于每个类别选择合适的化
学成分对其进行亚类划分,给出具体的划分方法及划分结果,并对分类结果的合理性和敏感性
进行分析。

解题思路:建立机器学习分类模型,因变量为高钾玻璃、铅钡玻璃,自变量为各个成分变量,我这里举例选择随机森林来建立模型,并通过分类模型评价结果来对其合理性与敏感性进行分析。






由特征重要性得到,可以发现氧化铅的重要性是最大的。






由混淆矩阵得到,训练集与测试集都被完美预测,效果极好。






问题3



对附件表单 3 中未知类别玻璃文物的化学成分进行分析,鉴别其所属类型,并对
分类结果的敏感性进行分析。

解题思路:此题是在问题二建立的模型基础上进行应用。首先对表单3的空值进行0填补后,直接在问题二的输出报告中,最后一个输出结果6,上传表单3,可以得到这8个样本的所属类别的预测结果。






问题4



针对不同类别的玻璃文物样品,分析其化学成分之间的关联关系,并比较不同类
别之间的化学成分关联关系的差异性。

解题思路:简而言之,首先是分别对两种类型成分间的关联关系进行分析,其次是比较二者成分的关联性是否具有差异。可先将刚才问题二预处理得到的数据进行导出,然后根据类型的不同,分成两个不同的数据再分别上传,大家可以用相关性分析或者是因子分析来解答此题。









一、
高钾下相关性分析--部分成分之间的相关性较高





高钾下因子分析--某些变量可以由归结为一个因子,说明变量关联性大。




二、
铅钡相关性分析结果--各成分之间的相关性都较低




铅钡因子分析结果--各成分之间较为独立,说明变量关联性低。

以上操作均使用免费工具SPSSPRO,完整解题。
回复

使用道具 举报

0

主题

1

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-9-22 21:52:20 | 显示全部楼层
查重只查文字啊 论文自己写就没问题
回复

使用道具 举报

0

主题

1

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-9-22 21:53:12 | 显示全部楼层
可以求个b吗?感激不尽!
回复

使用道具 举报

0

主题

2

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-9-22 21:53:45 | 显示全部楼层
看一下我的博客
回复

使用道具 举报

1

主题

2

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2022-9-22 21:54:21 | 显示全部楼层
好的!
回复

使用道具 举报

2

主题

3

帖子

7

积分

新手上路

Rank: 1

积分
7
发表于 2022-9-22 21:55:16 | 显示全部楼层
bc都比以往简单,a没仔细看不知道[捂脸]
回复

使用道具 举报

0

主题

2

帖子

3

积分

新手上路

Rank: 1

积分
3
发表于 2022-9-22 21:55:42 | 显示全部楼层
你家混淆矩阵能达到P R都为1这不是胡扯蛋吗
回复

使用道具 举报

1

主题

2

帖子

3

积分

新手上路

Rank: 1

积分
3
发表于 2022-9-22 21:55:50 | 显示全部楼层
对应分析你用的SPSS是哪个?
回复

使用道具 举报

0

主题

2

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-9-22 21:56:27 | 显示全部楼层
[赞][赞]对小白够友好
回复

使用道具 举报

1

主题

3

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2022-9-22 21:57:13 | 显示全部楼层
大佬 求excel权限[可怜][可怜]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|红方窑

GMT+8, 2025-4-18 23:48 , Processed in 0.166523 second(s), 23 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc. Templated By 【未来科技 www.veikei.com】设计

快速回复 返回顶部 返回列表