学校实验室统计表

2024-07-12

学校实验室统计表(精选7篇)

1.学校实验室统计表 篇一

计算机实验室里面有大量用电设备, 需要在没人的状态断水断电, 才能确保安全。但是在现有的计算机实验室管理中, 通常是通过人工巡查的方法。这样既浪费人力, 又不能及时发现实验室的无人状态。为了能自动发现实验室的无人状态, 本文使用自动人数统计的方法。自动统计进实验室和出实验室的人数, 当两者人数一致时, 向实验室管理员报警, 说明实验室处于无人状态。

目前已有较多研究者对人数统计展开研究。徐超将人数统计用于公交乘车统计, 使用HOG特征提取人头特征, 并使用支持向量机分类[1]。李振宇通过检测人头加肩膀的特征, 然后判断这个目标是否通过一定的区域, 实现双向人流量统计[2]。高陈强使用运动目标检测的方法获得人数统计结果[3]。但是这些方法并不能直接用于实验室的人数统计。因为在实验室环境下, 可以通过更加合理地布置摄像头位置, 提高人数统计的效果。所以, 本文将综合利用人脸检测、运动目标检测、人头特征检测三大技术进行人数统计。

2 系统的设计

计算机实验室人数统计系统流程图如图1所示:从图1可以看到, 实验室人数统计系统包含5个步骤。

(1) 倾斜人头部检测。在天花板上, 正对门口45°角的地方布置一个摄像头, 实现倾斜人头检测。

(2) 倾斜人数统计。使用目标追踪的方法, 判断检测到的人头是否越过指定区域, 只有越过指定区域才统计人数。

(3) 垂直人头部检测。在天花板上, 在出门或者进门必经的区域正上方布置一个垂直向下的摄像头, 实现垂直人头检测。

(4) 垂直人数统计。与倾斜人头统计的步骤相同。

(5) 人数确定。检查倾斜人头数量与垂直人头数量是否相同。如果不相同, 再进一步判断画面上到底有多少个人。

3 人头部检测

人数检测包含倾斜头部检测和垂直头部检测。两者均使用Adaboost完成任务, 为了加快执行速度, 两者均仅在有运动目标的区域执行Adaboost算法。

倾斜头部检测。本文正面和背面倾斜人头部检测时分别分成0°、15°、30°三个角度, 总共需要训练6个Adaboost分类器。

垂直头部检测。垂直人头在正面或者侧面时, 特征并不会发生非常大的变化。另外因为人的发型的因素, 也没办法对垂直人头定义合适的角度。所以针对垂直人头检测, 本文只训练一个分类器。

因为在摄像头位置固定时, 指定区域的人头大小有一定范围, 所以在检测到人头后去掉大小不在一定范围内的目标, 以降低噪声的影响。

4 人数统计

因为实验室有进出两个方向, 并且使用Adaboost进行头部检测可能检测到非头部区域。所以使用目标追踪的方法确定人是进入实验室还是走出实验室来去掉检测到的非头部区域。

因为学生进出实验室可能几个人一起, 造成运动区域连接在一起, 所以, 为了避免因为学生并排在一起而造成人头的漏检, 本文并不使用Camshift等运动目标追踪算法。而是首先一直使用人头检测的方法检测人头, 获得每次检测到的窗口的中心点, 然后使用卡尔曼滤波算法预测目标的下一个位置, 当且仅当两者误差在一定范围内时才能判断为目标的下一个位置。

5 人的数量确定

在理想情况下, 倾斜人头部统计获得的人数与垂直人头部统计获得的人数应一致。但是因为学生进出实验室时姿势可能多种多样, 或者高个的学生对矮个的学生产生遮挡, 这时可能会出现两者统计的数目不一致的情况。此时, 需要重新确认画面, 以获得更为准确的人数统计结果。本文采用如图2所示的方法完成该目标。

从图2可以看到人头数量确定包含两大块:倾斜人数统计和垂直人数统计。两者均包含以下几步。

(1) 滑动窗口。为了从画面中获得人的数量, 必须要判断所有候选区域是否是头部。对于计算机, 没办法一眼判断画面上是否有人, 只能每个区域均判断一次。这些区域采用滑动窗口的方法生成。窗口大小与摄像头与头部检测区域的距离相关, 窗口偏移量与分类器的判断能力相关。

(2) 窗口特征提取。在第2小节人头检测时, 每个窗口的特征使用Haar小波提取, 该特征运算速度较快, 但是提取的信息量不足。所以本小节使用局部二值纹理 (Local Binary Pattern, LBP) 和梯度方向直方图 (Histogram of Oriented Gradient, HOG) 提取特征。为了使窗口特征长度一致, 本文将窗口大小缩放到128×128大小, HOG的参数分为两组:第一组设为16×16大小的区域, 区域之间不重叠;第二组设为8×8大小的区域, 区域之间不重叠。直方图的容器大小设为16。上述两个特征提取到了之后, 对所有样本, 将每个特征的均值归一化成0, 方差归一化为1。然后将两特征连接在一起, 组成窗口的特征。

(3) 维数约简。特征提取之后, 获得的维度太高, 本文拟使用维数约简算法解决该问题。该方法拟使用文献[4]中采用的方法。

(4) 分类。第2节使用的Adaboost是一个集成分类器, 每个分类器都是使用一个Haar特征训练的一个弱分类器, 分类能力并不是很强, 为了解决这个问题, 本文考虑使用支持向量机训练强分类器。核函数使用多项式核。为了避免两个相连的人头被判断为一个人头, 本文将两个相连的人头区域作为负面样本。

(5) 人头数量统计。经过分类之后, 画面上人头区域的值为1, 非人头区域为0。因为使用的是强分类器, 所以几乎不会出现将两个人头区域连在一起的情况, 所以使用区域统计的方法统计连通区域的个数, 将大于5×5的连通区域作为一个人的头部区域。

(6) 人的数量。人头部数量统计结果中较大的作为最终人的数量。

6 实验

实验将在实验室真实的环境下进行。实验条件是, 上机人数为50~70人, 查看100节课的人数统计报警结果。一般来说, 人数统计会产生一定误差, 所以并不仅仅测试实验室剩余人数为零的实验结果, 而是测试实验室分别剩余0、2、4、6人时的报警概率。实验结果如表1所示:

从表1可以看到, 实验室还剩余0人时才报警的报警概率是53%。而设置成剩余6人时报警的报警概率是100%。这说明人数统计技术还不成熟, 但是一般情况下整个计算机实验室还剩余少数几个人时也应属于一种不安全的状态, 此时也应提醒管理员。所以一般实验室在用本系统时, 应将人数设置为6人左右开始报警, 此时才能确保实验室基本没人时, 系统予以提示。

7 结语

本文提出一种新的基于人数统计的实验室管理方法。该方法利用两个摄像头, 当两个摄像头的人数统计结果不一致时, 使用复杂度更高的算法对人数统计进行确认, 能在一定程度上提高人数统计的准确性。但是目前人数统计技术还受到非常多因素的影响, 所以本文还针对实验室剩余不同人数时的报警率进行测试, 为实验室管理提供了一个安全可行的方案。

参考文献

[1]徐超, 高梦珠, 査宇锋, 等.基于HOG和SVM的公交乘客人流量统计算法[J].仪器仪表学报, 2015:446-452.

[2]朱秀娟, 卢琳, 钟洪发.基于运动目标分类的双向人流量统计算法[J].激光杂志, 2016:90-93, .

[3]黎海清.视频图像中基于特征匹配的人流量统计[Z].2016.

2.学校实验室统计表 篇二

[关键词]高等院校 实验室信息 数据统计

[作者简介]赵亚红(1964- ),女,新疆石河子人,石河子大学教务处科员,实验师,主要从事实验室管理和研究工作。(新疆 石河子 832003)

[中图分类号]G482[文献标识码]A[文章编号]1004-3985(2008)18-0150-02

高等院校实验室数据统计工作的职能是对所获资料加以整理、统计、归纳、分析,从中认识事物的规律和本质,为教育部和学校管理部门提供有价值的信息资料和数据分析,对实验室的未来发展规划、整改具有重要的现实意义。随着信息技术,尤其是网络技术在高校的普及,使用计算机网络来进行实验室管理成为必然。利用计算机进一步规范化、流程化和信息化管理,减轻实验室管理人员的工作负担,提高实验室的教学质量、管理水平和服务水平,为实验室评估提供翔实数据,为实验室开放提供有力保障。以计算机为工具的信息统计工作也在不断改进与完善。每年通过“实验项目及人员管理系统”和“高等院校仪器设备管理系统”,形成“高等院校实验室信息统计数据”,上报教育部。为了能客观、准确、全面地反映高校在教学经费投入、办学条件、教学改革发展、人才培养质量及实验室建设、教学科研仪器设备、实验教学和实验队伍等方面的信息,认真做好“高等院校实验室信息统计数据”的统计和上报工作势在必行,是今后高等院校实验室发展与评估的依据和保障,同时也是教育部和学校宏观把握实验室的设备、人员结构、实验教学任务的重要依据,意义广泛而深远。

一、提高认识、统一思想是关键

根据《教育部办公厅关于报送高等学校实验室信息统计数据的通知》精神,自2006年起,各高等院校均采用网上传送方式给教育部上报有关实验室数据。为完善相关指标体系,教育部组织人员对原“高等学校实验室和仪器设备统计”进行了全面修订,制定了新的“高等学校实验室信息统计”指标体系和规定。为了落实教育部文件精神,我校组织相关人员进行学习、培训,各学院之间相互观摩、取经,对做得好的学院和单位学校给予一定程度的奖励和表彰。为了取长补短,做得更好,我校还组织相关实验室信息管理人员去兄弟院校学习先进经验,并结合我校实验室具体情况,制定了一整套适合我校目前实验室现状的信息采集、统计、录入和上报格式及要求,大大提高了信息数据的准确率和工作效率。

高等院校实验室信息统计工作是衡量一个学校办学水平、管理水平、实践教学水平及实验教学手段的重要指标,是高等院校实践教学管理部门每年必须完成的一项重要任务。我校十分重视实验室信息统计数据管理工作,多次召开有关会议落实部署这项工作,成立了实验室信息专项工作领导小组,重新规范了实验室名称,并制定修订了相关实验室教学管理工作的规章制度,实行主管实验室院领导负责制。指定实验室信息管理员统计实验室基本信息,如实验房间数、房间面积、仪器设备台套数、仪器设备总值、开出实验项目数、实验室专(兼)职人员、大型精密仪器设备使用情况等。及时维护和更新实验室基本信息,明确岗位职责,规范管理过程,确保数据统计质量。同时,将实验室仪器设备,账、物、卡管理水平作为各学院本科教学工作水平评估和基础课教学实验室评估的重要指标,提高了实验室仪器设备账、物、卡的相符率,为学校上级主管部门全面掌握实验室工作提供了一手资料和数据。

二、完善管理,确保数据真实、准确、完整

信息统计管理软件具有两大功能。一是可以实现各级管理用户的建立,网络数据安全设置,网上数据输入、统计、审核、查询、打印等功能。二是可以提供实验项目及人员管理的相关统计报表,能全面反映学校每学年实验项目、实验人员的基本情况、实验室面积、实验室类别、实验室仪器设备、实验教学手段、实验室建设、实验室经费等基本情况,为学校教辅人员定编、实验设备经费筹措、实验教学材料费的划拨及专业实验室评估、学校实践教学评估等提供强有力的依据。

为适应新形势下高等院校实验室管理工作的需要,更好地完成我校实验室信息统计管理工作,我校采用了教育部指定的新版“实验项目及人员管理系统”和“高等院校仪器设备管理系统”,其中能客观反映高等院校实验室基本情况的基础报表有7个,反映高等院校实验室情况的综合报表有2个。数据汇总阶段,可以对全校各学院实验室上报数据的完整性和准确性进行核查、修改,确保数据准确、完整、真实、可靠。数据生成阶段,经过“高等院校实验室信息统计检测系统”进行检测,完成上报数据的查错,提高网络数据上报的准确率,形成完整数据。目前,中国教育统计网已经建立了“高等院校实验室信息统计”专项统计栏目,各高校、省市教育行政主管部门、教育主管部门可以登录该站点,完成“高等院校实验室信息统计”指标体系要求的数据上报、数据验证、数据审核查询、报表打印等工作。

此外,学院实验室信息管理人员及时对网上数据进行了更新与维护,保证统计数据的准确性和及时性。主管部门及领导可随时上网查询实验人员、实验项目、仪器设备等信息,实现了实验室的宏观、动态管理。为了严格和规范管理,我们印制了《实验室信息统计使用表格与说明》《高等学校实验室管理信息系统常用代码汇编》《实验室信息上报统计表》等数据统计表格,并汇编成册,使我校数据统计上报工作得以顺利进行。

三、思考与建议

1.充分认识信息统计工作的重要意义。高等院校实验室信息统计数据反映了实验室基础工作的最新动态,为主管部门查询、浏览、统计、打印提供了信息资料。因此,必须及时做好实验室基本信息的更新与维护。正如仪器设备信息管理,它是一个动态的管理过程,新购仪器设备一经验收合格,就要及时录入,在网上更新数据,才能体现信息的及时性、准确性,也才能客观、真实地反映实验室的基本情况和最新动态。

2.加快实验室网络信息化建设的步伐。随着科学技术和信息化管理的发展,高等院校实验室信息统计工作的完成必须建立与之相适应、规范、科学、便捷实用的日常管理软件平台。因此,各高等院校必须加快实验室网络信息化建设步伐,并与校园网络连通,以便实现网络环境下的信息资源共享。在实验室基本信息建立过程中,要注重信息的有效利用,要求管理人员在实践中多摸索、多实践、多总结,不断改进与完善,最大限度地发挥和利用现有信息资源,真正体现出资源的利用价值。

3.最大限度地发挥信息统计功能。学校在完成高等院校实验室信息统计、数据上报的基础上,要及时进行实验室基本信息的传递,使各级部门动态了解实验室仪器设备增减变动及损耗情况、实验室教学任务完成情况、实验室材料的耗费情况、实验室人员的培训、晋升、变动情况、学生实验的开支等情况,为学校全面了解现有实验室基本资源情况,动态把握和管理,开展实验室仪器设备使用效益评价等提供可靠的依据和保障。

4.重视信息统计的日常管理工作。加强实验室信息资料的日常管理,提高高等院校实验室信息统计工作质量,规范实验室实验教学管理。实验室基本信息的规范化、科学化、现代化管理是一项需要常抓不懈、不断实践、不断完善、不断更新、不断改进的系统性工程。要真正实现这一目标,我们还需要在今后的工作中付出更多更艰辛的劳动,不断探索与实践,不断学习与完善,不断改进和提高各层次的管理水平,更好地为教学科研服务。

5.稳定队伍,提高实验室信息管理员的素质和地位。实验室信息统计工作是实验室的基础工作,需要一支稳定的、经验丰富的队伍。因此必须改变高校实验人员的岗位定位,适当提高待遇。通过各种方式对信息管理员进行培训,提高他们的基本信息收集、整理、录入和计算机管理水平。

高等院校实验室信息统计工作在各高校的共同努力下,顺利完成了各项信息数据的统计汇总,为上级主管部门制定实验室发展规划及相关政策提供了重要的依据。随着实验室管理系统的进一步推广与运用,将对实现高校教育教学资源的共享和管理工作的高效运行发挥积极的推动和促进作用。通过我们广大实验室管理人员的不懈努力,实验室信息统计数据上报系统会更加完善。

[参考文献]

3.学校实验室统计表 篇三

普通高等学校辅导员队伍状况统计表

(截至2011年4月1日)

注:1.此表由高校统计填写。设区市委教育工委(教育局)不用统

计填写本表,但要收集各市属高校的《统计表》并报省委教育工委宣传部;

2.严格按照附件3界定的专职辅导员、一线专职辅导员、兼职

辅导员、班主任的范围进行统计;

3.辅导员同时带本专科生、研究生的,如重复统计时,请在备注栏内说明;

4.“2+2”、“2+3”类型辅导员在列入专职或兼职辅导员统计的同时,需再单独统计该类型辅导员数; 5.班主任只需统计数量; 6.如有需要,可另附表说明。

附件2:

关于界定专职辅导员、一线专职辅导员、兼职辅导员、班主任范围的说明

为做好普通高等学校辅导员队伍状况统计工作,现将专职辅导员、一线专职辅导员、兼职辅导员、班主任的界定范围做说明如下:

专职辅导员是指在一线从事大学生日常思想政治教育工作的人员,包括院系团总支书记、党总支副书记等副处级以下从事学生工作的人员。

一线专职辅导员是专职辅导员的一部分,是指专职在一线从事大学生日常思想政治教育工作的辅导员,不含院系团总支书记、党总支副书记等。

兼职辅导员是指兼职从事辅导员工作的人员,包括带班的学生工作部门、研究生工作部门、校团委等相关职能部门工作人员及研究生等。

班主任是指从专业课教师中选聘的带班教师。

4.统计学实验报告 篇四

武汉工大学

管理学院

应用统计学 课程实验(上机)报告专业班级:2010级工商管理01班 学 号: 指导老师:夏剑锋

实验(上机)地点:活动中心 学期:2012—2013第二学期

第 1 页;共 23页

应用统计学实验报告

实验(上机)日期:2013年4月25日

第1 次 实验(上机)主题:统计软件的运用 实验(上机)类别):验证性 完成方式:独立

实验(上机)目的与要求:

1、掌握启动和退出统计软件

2、掌握数据库的建立

3、搜集一些数据并建立数据库

4、进行一些统计计算(函数、描述性统计)

5、制作统计图

6、计算各种统计指标

实验(上机)内容及方法

一、基本操作

1.在EXCEL图标双击,打开工作表。

2.在“文件”菜单下,选择“新建”,在右边“新建工作簿”选择“空白工作簿”。

3.单击页面右上角红色关闭按钮,关闭工作表,并退出软件。如提醒“是否保存”则选择保存,或者选择取消在查看后在退出。

二、描述性统计

1.在数据表窗口输入数据如下:

59 78 86 94

81 76 69

表1-1某学科成绩表 78 94 49 76 89 95 83 58 76 66 81 68

78 76 93

68 63 69 78 2.单击保存,在文件名称中输入“成绩文件”

第 2 页;共 23页

应用统计学实验报告

3.加载数据分析工具:在“工具”下拉菜单下找到“加载宏”,单击,选择“数据分析工具”点击确认。

图1-1 加载分析工具库

4.再在工具下拉菜单下找到“数据分析”选项。

图1-2 打开数据分析

第 3 页;共 23页

应用统计学实验报告

5.单击“数据分析”,选择“描述性统计”

图1-3开始描述性统计

6.数据复选框如下,单击确定,图1-4描述性统计选项卡

7.显示结果如下:

平均 标准误差 中位数 众数 标准差 方差 峰度 偏度

表1-2 描述性指标显示结果 77.91667 区域 1.972982 最小值 78 最大值 76 求和 11.83789 观测数 140.1357 最大(1)-0.24247 最小(1)-0.19707 置信度(95.0%)

第 4 页;共 23页

2805 36 98 49

4.005367

应用统计学实验报告

三、函数计算:

1、简单函数运算:

1)将鼠标定位在单元格,进入编写模式,输入函数:“=A1*A1”,点击回车键,在哦单元格内出现运算结果。把鼠标移到单元个右下角,直到出现“十字”按住鼠标右键往下拉,则将运算复制。显示结果如下:

图1-4 函数输入

2)插入函数:(用函数求和)

3)单击输入框中的函数输入符号,点击确定(如下图),计算书刚刚输入成绩的总和为:2805

图1-5 插入函数选项卡

按照同样的方法可以选择其他函数形式进行统计统计运算。

第 5 页;共 23页

应用统计学实验报告

2、制作统计图:

1)直方图:

 在表格上输入分组方式:

表1-3 分组方式

99

 在工具菜单下找到数据分析,单击,并在对话框中选择“直方图”,单击“确定”

图1-6 直方图操作选项

图1-7 直方图复选框

第 6 页;共 23页

应用统计学实验报告

 统计结果如下:

表1-4 频率分析表 分数

99

其他

频率 8 11 7 7 0

直方图***989分数99其他

图1-8 成绩分析直方图

频率频率 如果在复选框中选择“柏拉图”和“表格输出”,显示结果如下:

直方图***99959其他接收

图1-9 带累计频率的直方图

150.00%100.00%50.00%0.00%频率累积 %2)饼形图:

在“插入”菜单下,选择“图表”,在对话框中选择“饼形图” 频率第 7 页;共 23页

应用统计学实验报告

图1-10 饼形图选择框

根据向导输入数据,分别选择。最终统计图表如下:

成绩分析饼形图90-9919%其他0-590%8%60-6922%80-8919%70-7932%0-5960-6970-7980-8990-99其他

图1-11 成绩分析饼形图

第 8 页;共 23页

应用统计学实验报告

上机总结:

1、通过本次上机,巩固了excel的基本操作,让操作更加流畅。

2、进一步了解了函数的使用,能够熟练的掌握基本的统计量的运算。

3、通过实验的学习和比较,进一步加深了对统计量意义的学习。

实验(上机)成绩:第 9 页;共 23页

评阅老师: 评阅时间:

应用统计学实验报告

实验(上机)日期: 2013年5月9日 第 2 次 实验(上机)主题:假设检验与方差分析 实验(上机)类别):验证性 完成方式:独立

实验(上机)目的与要求:

1、建数据库:(1)假设检验(双样本数据)(2)方差分析:单因素方差分析和双因素方差分析

2、掌握假设检验的计算与分析

3、掌握方差分析的计算与分析

4、输出计算结果并进行分析

5、进行检验和决策

实验上机内容及方法

一、单因素分析

1.检验数据:

表2-1 三种训练方法下工人的日产量

方法1 方法2 方法3 22 18 18 27 24

人均日产量 18 16 21 22 11 17 15

2.将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认”

图2-1 分析工具选择

第 10 页;共 23页

应用统计学实验报告

3.在数据复选框内选择数据如下;

图2-2 单因素分析复选框

结果输出:

表2-2 单因素分析结果

组 行 1 行 2 行 3 方差分析 差异源 组间 组内 总计 观测数 5 5 5 SS 40 192 232

求和 85 105 95 df 2 12 14

平均 17 21 19 MS 20 16

方差 17.5 15.5 15 F 1.25

P-value 0.321277

F crit 3.885294

分析:F crit=3.885294;F=1.25 因为F=1.25<F crit=3.885294,所以拒绝训练方法对日产量有显著影响,即三种训练方法对日产量没有显著影响。

二、双因素分析(无交互作用)实验数据

表2-3 4个工人和3台机器配合的日产量

A1 A2 A3 B1 50 63 52 B2 47 54 42

第 11 页;共 23页

B3 47 57 41 B4 53 58 48

应用统计学实验报告

将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认”

图2-3 无交互作用双因素分析选项

在数据复选框内选择数据如下;

图2-4 无交互作用双因素分析复选框

分析结果输出:

表2-4方差分析:无重复双因素分析

SUMMARY 行 1 行 2 行 3 列 1 列 2 列 3 列 4 方差分析 观测数 4 4 3 3 3

求和 197 232 183 165 143 145 159

平均 49.25 58 45.75 55 47.66667 48.33333

方差

8.25 14 26.91667

36.33333 65.33333

显著性水平:1%

第 12 页;共 23页

应用统计学实验报告

差异源 行 列 误差

总计 SS 318.5 114.6667 32.83333

df 2 3 6

MS F P-value F crit

159.25 29.10152 0.000816 10.92477 38.22222 6.984772 0.022015 9.779538 5.472222

466 11

MS

F

P-value

F crit 方差分析:无重复双因素分析

方差分析 显著性水平:5% 差异源 行 列 误差

总计 SS 318.5 114.6667 32.83333

df 2 3 6

159.25 29.10152 0.000816 5.143253 38.22222 6.984772 0.022015 4.757063 5.472222

466 11

分析:

行因素:在显著性水平为1%的时候,F crit=10.92477,在显著性水平为5%时,F crit=5.143253,都远小于F =29.10152。即不同牌号机器上的日产量有高度显著性差别。

列因素:在显著性水平为1%的时候,F crit=9.779538,在显著性水平为5%时,F crit=4.757063,F=6.984772。因为4.757063<6.984772<9.779538。则不同工人的日产量只有显著的差别。

三、双因素分析(有交互作用)实验数据

表2-5 灯泡寿命数据

因 子 B

B1 B2 B3

A1

13.2 15 16.1 17.3 18 17

因子A A2 A3

14.4 14 15.6 13.6 13.7 16.3 14.3 17.1 14.5 17.1 15.7 16.1

第 13 页;共 23页

应用统计学实验报告

将数据输入软件,并在“工具”菜单下选择“数据分析”,选择如图,单击“确认”

图2-5 有交互作用双因素分析

在数据复选框内选择数据如下;

图2-6 有交互作用双因素分析复选框

分析结果输出:

表2-5方差分析:可重复双因素分析

观测数 求和平均 方差

28.2 14.1 1.62

15 0.72

27.6 13.8 0.08

85.8 14.3 0.796

第 14 页;共 23页

应用统计学实验报告

观测数 求和平均 方差

观测数 求和平均 方差

总计

观测数 求和平均 方差

方差分析

差异源 样本 列 交互 内部 总计 2 33.4 28 16.7 14 0.72 0.18 2 35 30.2 17.5 15.1 0.5 0.72 96.6 16.1 3.096 88.2 14.7 0.62 33.4 16.7 0.32 33.2 16.6 0.5 94.2 15.7 2.348 94.8 15.8 2.188

98.4 16.4 1.52

P-value

F crit

显著性水平为5% SS 14.04 6.24 10.92 5.36 36.56

df

MS

F 7.02 11.78731 0.003063 4.256495 2 3.12 5.238806 0.030987 4.256495 4 2.73 4.583955 0.027093 3.633089 9 0.595556

方差分析

差异源 样本 列 交互 内部 总计

显著性水平为:1% SS df MS 14.04 2 7.02 6.24 2 3.12 10.92 4 2.73 5.36 9 0.595556 36.56 17

F

11.78731 5.238806 4.583955

P-value 0.003063 0.030987 0.027093

F crit 8.021517 8.021517 6.422085

分析:

1、因子A(工艺方法)分析:在显著性水平为1%的时候,F crit=8.021517,在显著性水平为5%时,F crit=4.256495,F =6.24,因为4.256495<6.24<8.021517,则工艺方法对灯泡寿命的影响是显著的。

2、因子B(灯丝配方)分析:在显著性水平为1%的时候,F crit=8.021517,在显著性水平为5%时,F crit=4.256495,F =11.78731,因为8.021517<11.78731,则灯丝配方对灯泡的寿命影响是高度显著的。

第 15 页;共 23页

应用统计学实验报告

3、交互作用分析:在显著性水平为1%的时候,F crit=6.422085,在显著性水平为5%时,F crit=3.633089,F =4.583955,因为3.633089<4.583955<6.422085。则工艺和菲方之间存在交互作用。

实验上机总结:

1、学会如何让运用软件进行方差计算和分析;

2、通过提出假设,了解如何通过计算数据进行显著性判断和检验;

3、根据假设和检验结果,明白如何进行判断。

实验上机成绩:

评阅老师:

评阅时间:

第 16 页;共 23页

应用统计学实验报告

实验(上机)日期:2013年5月16 第 3 次 实验(上机)主题:回归分析 实验(上机)类别):验证性 完成方式:独立

实验(上机)目的与要求:

1、搜集数据并建数据库

2、掌握一元线性回归的计算与分析

3、掌握多元线性回归的计算与分析

4、输出计算结果并进行分析

5、进行检验和预测

实验上机的内容及方法 一,一元线性回归 数据显示如下:

(表3-1十个企业的生产费用与产量数据)

企业编号 1 2 3 4 5 6 7 8 9 10 产量X(千克)40 42 48 55 65 79 88 100 120 140 生产费用Y(千元)150 140 160 170 150 162 185 165 190 185 将数据输入工作表,在“工具”菜单下选择“数据分析”,然后选择“回归”胆机确定。在复选框中选择如下:

(图3-1一元回归分析复选框)

第 17 页;共 23页

应用统计学实验报告

则显示相关数据处理结果如下:

表3-2 回归统计表

Multiple R R Square Adjusted R quare 标准误差 观测值

表3-3 方差分析表

0.807766 0.652486 0.609047 10.5332

回归分析 残差 总计 df

SS MS F Significance F 1666.514 1666.514 15.02064 0.004704 8 887.586 110.9483 2554.1

表3-4 回归分析表

Intercept X Variable 1 Coefficients 标准误差 t Stat

Lower Upper

95% 95% 134.7893 8.643234 15.59477 2.85E-07 114.8579 154.7206 0.397821 0.102646 3.875647 0.004704 0.161118 0.634525

P-value 得到散点图和拟合分析图如下:

Normal Probability Plot20010000204060Sample Percentile图3-2 散点图 Y80100

X Variable 1 Line Fit Plot***0X Variable 1图3-3 拟合分析图

Y预测 Y150Y

第 18 页;共 23页

应用统计学实验报告

相关分析:

1、回归方程

由散点图得知回归方程为一元线性方程。得到回归方程如下: Y=134.7893+0.397821X

2、显著性分析

得到Multiple R=0.807766>0.765(在检验数为0.01时相关系数检验数)表示回归方程显著。

t Stat=3.875647>2.306(α=0.05,自由度=8时t值)则统计检验结果显著。其存在良好的线性关系。

F=15.02064>5.32(在α=0.05,n1=1,n2=8时F值),表示回归结显著。

3、相关预测

在产量为80千件时,平均生产费用的置信区间(α=0.05)生产费用预测Y0=134.7893+0.397821 *80=166.615 下界=Y0-2.306*10.5332*0.317=166.614-7.707=158.844 下界=166.614+7.707=174.321 即总体均值得95%置信区间为(158.844,174.321)

在产量为80千件时,生产费用的置信区间(α=0.05)生产费用预测Y0=134.7893+0.397821 *80=166.615 下界=Y0-2.306*10.5332*1.049=166.614-25.503=140.637 下界=166.614+25.503=191.643 即总体得95%置信区间为(140.637,191.643)

二,多元回归 试验数据:

表3-5 某企业10个月的月管理费用与工人劳动日数和机器开工台数的资料

管理费用Y 工人劳动日数X1 29 45 24 42 27 44 25 45 26 43 28 46 30 44 28 45 28 44 27 43

第 19 页;共 23页

应用统计学实验报告

机器开工台数X2 14 15 13 13 14 16 16 15 15 将数据输入工作表,在“工具”菜单下选择“数据分析”,然后选择“回归”胆机确定。在复选框中选择如下:

图3-4 多元回归复选框

则显示相关数据处理结果如下:

表3-5 回归统计表

回归统计

Multiple R 0.85377 R Square 0.728923 Adjusted R

0.651473

Square 标准误差 1.070639 观测值 10

表3-6 方差分析表

回归分析 残差 总计 df SS MS F Significance F 2 21.57613 10.78806 9.411471 0.010371 7 8.023873 1.146268 29.6

表3-7 回归分析表

Coefficients 标准误差 t Stat

第 20 页;共 23页

P-value 下限 上限

应用统计学实验报告

Intercept X Variable 1 X Variable 2

95.0% 95.0%

-13.8196 13.3233-1.03725 0.334115-45.3242 17.68497 0.56366 0.303274 1.858586 0.10543-0.15347 1.280789 1.099469 0.313139 3.511123 0.009844 0.359013 1.839926 得到散点图和拟合分析图如下:

Normal Probability Plot402000204060Sample Percentile图3-5 散点图 Y80100

X Variable 1 Line Fit Plot***X Variable 1图3-6 拟合分析图

Y预测 Y4647Y

相关分析:

1、回归方程

由散点图得知回归方程为二元线性方程。得到回归方程如下: Y=-13.8196+ 0.56366X1+ 1.099469X2

2、回归方程检验

R Square= 0.728923>0.6516

第 21 页;共 23页

应用统计学实验报告

F= 9.411471>4.74(α=0.05,自由度=2,7时,F值)即:回归方程的拟合程度很好。

3、回归系数:

t 1= 1.858586<2.365(α=0.05,自由度=7时,t值)t2= 3.511123>2.365(α=0.05,自由度=7时,t值)

所以β1不显著,β2显著。即工人劳动日数对管理费用的影响并不是显著;机器开工台数对管理费用影响显著。

4、相关系数分析:

表3-8相关系数分析表

Y X1 X2

Y X1 X2

0.501517 1 0.771462 0.184094 则得到Y与X1之间的相关系数为0.501517;Y与X2之间的相关系数为0.771462,X1与X2之间的相关系数为0.184094 计算相应的偏回归系数Y与X1之间的偏相关系数为0.5748;Y与X2之间的相关系数为0.7987。

又t1= 0.5748*√7/√(1-0.5748*0.5748)=1.86<2.356(α=0.05,自由度=7时,t值)

T2=0.7987*√7/√(1-0.7987*0.7987)=3.51>2.356(α=0.05,自由度=7时,t值)

即:工人劳动日数与管理费用之间的偏相关系数不显著;机器开工台数与管理费用之间的偏相关系数是显著的。

第 22 页;共 23页

应用统计学实验报告

实验上机总结:

1、学会如何让运用软件进行一元与二元方程回归分析的计算;

2、通过提出假设,了解如何通过计算数据进行系数显著性判断和检验;并对方程的拟合优度和相关性进行判断

3、根据回归结果很好的预测,并在给出置信度的情况下对总体均值和个体值进行预测。

实验上机成绩:

评阅老师:

评阅时间:

5.学校统计工作计划 篇五

在2017教育统计工作完成的基础上,为充分发挥学校基础教育统计的服务职能,尽职尽责地落实好学校基础统计工作,推进我校统计工作制度化、规范化,特制定2018工作计划。

一、统一领导,分级负责,层层落实责任制。

按照“统一领导,分级负责,层层落实责任制”的组织原则,我校建立统计工作领导小组,由校长担任领导小组组长,全权负责统计工作的组织和实施,严格进行数据审核和对统计工作各个环节进行抽查。

为了保证学校统计工作的顺利进行,由副校长担任副组长,保证统计工作的有序开展,负责工作和人员、技术支持方面的协调。

组员包括各个业务分管负责人:负责教育教学工作的教务主任、负责安全工作的政教主任、学校固定资产管理员、负责学校财务的总务处主任。明确领导小组各成员在此次统计工作中的职责分工,各司其职,通力协作,高质量完成各个所承担的原始数据上报任务。在组长统一领导下,严格按照教委关于统计工作的要求,明确责任,通力协作,密切配合,把每一步工作做好、做扎实。

二、具体工作计划

1.制定学统计工作方案、修订和补充相关制度。2.采集学生学籍数据与入学新生户籍分布情况;制作与学籍管理系统信息相符的学生花名册,完成相关报表。

3.收集教职员工信息变化与参加培训情况;建立培训情况记录档案,完成相关报表统计。

4.负责审核教学设备和图书购置与使用情况,完成相关报表统计。

5.核对校园占地面积、建筑面积、固定资产等变化情况,完成相关报表统计。

6.审核学校各部门上报数据是否达标。

7.收集全校各部门数据、进行输机、完成汇总数据和逻辑校验,以对本次统计工作进行全面总结。

8.对本校各项上报数据最后把关审核、签字确认。汇总数据必须由校长完成全部文本及电子数据审核,并签字确认方能上报。

9.完成基础教育统计的电子数据导出、全国平台的数据导入,文本文件报送,确保学校基础教育统计、准确、及时完成上报。

10.完成本次统计工作中各类电子数据的存档、文本资料的存档,存档过程严格遵守学校学籍信息安全管理相关制度,做好保密工作。

三、学校学籍管理、基础教育统计收尾工作。

做好学校学籍管理、教育统计等全部工作的电子、文本数据的档案留存和收尾工作,完善学校统计工作台账、学籍与统计工作档案。

XXX

2018年10月

2017王集镇徐楼小学

学校统计工作总结

负责人:_______

制定人:_______

6.统计实验教学考核评价方法研究 篇六

一、统计实验教学目的

传统的统计教学以理论灌输为主, 强调让学生掌握基本的统计知识以及其理论推导过程, 这固然能让学生深刻理解统计方法及其思想, 然而却容易造成理论与实际应用的脱节, 很难让学生掌握利用所学统计方法解决实际问题的能力, 同时也无法通过实际应用中遇到的新问题来促进理论知识的学习。

统计实验作为统计学学习的辅助性课程, 通过案例讲解的方式, 利用SPSS等统计工具进行分析展示, 让学生对统计方法有一个直观的认识, 有助于学生对统计原理和数理统计基础知识的理解和正确应用。通过实验教学应达到以下目标:一是让学生掌握基本实验技能和方法, 掌握SPSS等统计工具的操作与应用, 强化学生基本技能;二是通过实验学习操作巩固基础理论知识, 培养实践能力;三是通过案例学习锻炼学生主观能动性和创造性, 培养学生动手能力和综合素质;四是通过开放式的实验教学形式和综合性的实验设计, 培养学生探索和研究问题的能力。

二、统计实验教学方法

统计实验教学应结合市场经济背景, 以实际案例分析讲解为牵引, 以学生动手操作为重心, 以参与社会实践为补充, 激发学生学习兴趣, 全面培养学生解决实际问题的能力。

(一) 做好统计软件的教学, 让学生熟练掌握基本的统计分析工具。

统计实验教学应对基础理论教学起到辅助和进一步深化的作用, 而以统计软件为工具, 可以大大减少计算量、简化中间计算过程, 快速展示数据分析结果, 通过图形、图像、图表等把抽象的理论直观表现出来, 使学生进一步理解概率的理论和统计的思想及应用, 提高学生对理论学习的兴趣[2]。

统计软件教学过程中除了教会学生基本的操作方法之外, 更重要的是让学生通过各个模块的操作回顾每种统计方法的思想、公式和关键变量, 学会对统计结果的分析解读, 从而使学生熟练掌握各种基本的统计方法及其统计思想[3]。

(二) 加强案例教学, 培养学生数据分析能力。

统计就其性质而言是一种认识活动, 它是通过采集、整理、描述和分析数据的过程来对客观事物的总体数量现象进行观察和探索的过程。毫无疑问, 学生数据分析解读能力成为了这一过程成功与否的关键因素, 而实践证明, 案例教学是培养数据分析解读能力的行之有效的方法。因此, 在统计实验教学中, 应大量使用案例教学, 培养学生数据分析解读能力。

在教学的过程中, 我们利用来自于实践的经典案例, 一方面让学生对社会经济背景知识有一个直观的了解, 另外一方面通过案例分析强化数据建模的基本思想方法和步骤, 培养学生数据分析能力, 锻炼学生主动掌握一手数据资料, 通过对数据的分析挖掘数据后面潜藏的信息, 从而逐步提高对数据信息的理性认识。

(三) 开展社会实践活动, 锻炼学生创造性和主观能动性, 培养学生发现问题和解决问题的能力。

统计实验不是封闭的课程, 应采用形式多样的教学方法, 包括课内与课外相结合, 探究式和开放式并行的实验教学方式。除了课内教学外, 还应组织、发动学生参与社会实践活动, 使学生按照自己的兴趣和想法深入实际、调查研究, 收集实验数据的素材, 通过简单的调查数据建立相应的概率统计模型来解决一般性问题, 从而完成一些创新工作。

开展社会实践活动过程中, 教师应做好组织安排及跟踪指导工作, 活动应以小组的方式开展, 教师应指导学生仔细设计实验方案, 明确职责分工, 落实工作方案, 推动活动有序开展。通过开展社会实践活动, 不仅可以使学生发挥自己的特长, 学会解决统计问题的方法, 也能够培养学生团队协作精神, 增加学生的自信心, 对学生的健康发展起到良好的促进作用, 进一步提高学生的综合素质。

三、统计实验教学考评原则及特点

为了检查统计实验的教学效果, 检验学生对统计思想、统计方法、实验技能学习掌握程度, 引导督促学生通过统计实验课程的学习提高主观能动性和综合素质, 设计合理的考核评价体系对统计实验课程的学习至关重要。通过系统考评可以分析学生的知识掌握程度和能力缺陷, 为改进和完善教学目标和策略提供依据, 同时合理的考评可以让学生建立自信心、增强主动性和积极性。

(一) 统计实验教学评价基本原则。

统计实验评价除了应遵循教育评价的方向性、科学性、可行性、时效性、激励性等基本原则外, 还应以全面实现学校人才培养目标、促进学生综合素质提高为基本导向, 遵循方式多样、全程监控、突出重点、评改结合等原则。

(二) 统计实验教学评价特点及要点。

统计实验教学评价是以事实判断为基础, 基于学生表现和过程的评价, 用于评价学生知识运用掌握能力, 评价标准应由教师根据学生知识结构、课程教育目标以及过往经验制定。统计实验教学评价不仅要考察学生对统计思想、统计方法、统计工具等掌握情况, 更要考察学生的动手能力、对知识主动获取能力、信息加工整理能力、主观能动性和创造性。统计实验教学评价是主客体互动、评价与指导相统一的过程。在评价过程中应以教师为主, 包括学生、同学、社会等主体共同参与进行评价, 同时应突出主客体之间的互动, 以评促改, 通过在评价过程中发现问题, 并指导学生解决问题。统计实验教学评价是连续且系统的过程, 统计实验教学应按照全方位、多形式、全过程评价, 包括课内与课外表现、知识掌握与熟练运用能力、学习态度与团队协作能力等, 过程评价与终结性评价相结合, 全面评价学生的综合能力。

四、统计实验教学评价方法

传统的统计实验课程学习评价主要以教师的个别评价和终结性评价相结合而得出一个学生的最终评价, 重在量化评价。这种评价方式有很大的局限性, 评价内容片面, 方法简单, 它只就学生的学习结果进行评价, 而忽视了学生的学习过程以及综合能力, 不能全面评价一个学生;并且评价主体单一, 缺乏学生、社会的参与, 不利于培养学生的主观能动性和创造性。统计实验作为注重培养学生动手能力和实践活动的学科, 应对学生学习过程中不同阶段、不同活动进行全面评价, 制定和运用切实可行的、符合教学目的的评价体系和评价标准, 一方面应以知识、能力和素质提高为目标并体现三者统一, 另一方面应根据教学特点分基本技能及基础实验、知识综合运用能力及综合实验、社会实践活动开展及创新能力三个层次建立综合评价指标, 通过考评促进提升学生综合素质。

统计实验教学评价方法包括相对评价与绝对评价, 进行性评价与终结性评价, 定性评价与定量评价, 教师评价、小组评价与学生互评多维评价等, 结合不同的教学内容采用不同的评价方法, 通过综合运用各种评价方法发现存在的不足, 找出改进的方法, 促进学生综合能力的提高。

(一) 基本技能及基础实验评价。

根据统计实验教学大纲基本要求, 学生应熟练操作SPSS等基本统计分析工具, 掌握基本的统计分析方法, 能对简单的数据进行加工整理并建立统计分析模型, 养成良好的统计思维模式并能有效表达。对于学生的评定应从以下几个方面综合评定:

1. 基本操作考核。

主要考核学生的基本技能掌握情况, 教师可以根据实际情况采用课内随堂考核、让学生记录操作过程进行课后评定、实验小组组长评定等方法。

2. 实验过程及报告考核。

主要考查统计方法选择是否正确、实验报告是否条理清晰、图表表达是否准确完整、实验结果是否符合预期、学生是否具备初步的数据分析处理能力等。

3. 实验表现考核。

主要考查学生课前预习情况、出勤情况、实验态度、责任心、团队合作情况等。教师可以根据实际情况对以上几个方面设定权重进行评价, 如可以采取30%:50%:20%的权重分布, 对每次实验课程都进行评价, 并以各次基础实验课的平均值作为学生在该项的评定结果。

(二) 知识综合运用能力及综合实验评价。

学生除了要掌握基本的统计实验知识之外, 还应该对各种统计方法融会贯通, 掌握统计方法的综合运用能力, 自行收集统计数据及统计信息, 对信息加工整理并建模分析, 主要对学生的知识运用能力和统计实验素养进行评价。

1. 数据收集整理能力考核。

主要考查数据收集途径及收集方法是否正确, 对数据来源是否有规范记录, 对数据的准确性和有效性是否进行分析判断。

2. 建模能力及实验报告考核。

主要考查学生分析思路是否正确, 分析是否全面, 统计方法是否合理, 报告内容是否详实, 实验结果是否符合逻辑等。

教师可以根据实际情况对以上两个方面设定权重进行评价, 如可以采取40%:60%的权重分布, 考核形式上可以采用指定或自拟题目, 学生详细记录实验过程, 提交实验报告。

(三) 社会实践活动开展及创新能力评价。

统计实验课程还应注重引导培养学生的动手能力, 主观能动性和创造性, 通过社会实践活动的开展有利于学生综合素质的提高, 有利于让学生尽早实现知识与实践活动的衔接。

1. 社会实践活动能力考核。

主要考核学生的动手能力, 沟通能力, 发现处理问题的能力, 吃苦耐劳精神, 团队协作精神等。

2. 创新能力考核。

主要考核学生社会实践活动中的新思路、新想法, 是否对问题会进行深入思考反思并提出合理化建议等。

教师应安排学生以小组为单位开展社会实践活动, 小组成员可以采取随机分组或自行组建等模式, 每组推举一名组长, 由组长组织小组成员制定社会实践方案, 责任分工等, 活动结束后提交详实的实验报告, 同时小组长对小组成员评价, 组内成员互相评价, 教师对小组评价, 三者综合作为学生在该项的评价结果。

(四) 终结性测评。

教师可以根据实际情况在学期结束时安排一次终结性测试, 测评方式以检验学生统计实验综合运用能力为主, 教师给定测评内容, 学生上机操作, 结束后提交综合报告, 作为学生终结性评价依据。

(五) 综合考评。

我们通过上述研究从四个不同方向、不同角度提出了对学生的评价方法, 将以上评价结果为基础, 教师根据学生培养目标、课程大纲、学生实际情况等灵活设置不同的权重, 通过加权计算作为学生统计实验课程综合考评结果, 权重设置时通过不同侧重引导学生加强薄弱环节学习, 促进学生综合素质的提高。

五、结语

作为具有很强应用背景及应用领域的统计学科, 只有通过科学安排实验内容, 合理设计评价体系, 才能促进理论知识与实际背景有机结合, 将理论应用于实践活动, 通过实践活动促进理论研究的发展, 形成良性互动, 最终培养出知识面宽广、应用能力强、理论功底扎实的高素质人才。

我们应积极改革和探索实验教学体系, 紧紧围绕实现统计知识高效学习、提高学生综合素质来合理设计统计实验教学评价方法, 综合灵活运用多种评价手段, 发挥评价的引导功能和正向激励功能, 查漏补缺, 以评促改, 提高学生的创造能力、独立分析和解决问题的能力、团队协作能力, 把学生培养成为符合现代化建设需要的合格人才。

摘要:为发挥考核评价对统计实验课程学习的引导功能和正向激励功能, 促进学生创造能力、独立分析和解决问题能力等综合素质的提高, 本文基于多年金融统计实验课程教学实践, 从统计实验课程教学目标出发, 研究提出了为达成教学目标所采取的教学方法, 系统分析了该课程的教学考评原则及特点, 详细阐述了该课程的评价体系和考核方法, 提出了从基础知识到综合知识、从基本技能到综合技能、从课内到课外的全方位评价体系, 理论联系实际, 通过考核权重的灵活设置促使学生综合能力的全方位提高。

关键词:统计实验,教学方法,考核评价

参考文献

[1] .贾俊平, 何晓群, 金勇进.统计学[M].北京:中国人民大学出版社, 2010, 4

[2] .顾光同, 张香云, 徐光辉.统计实验寓于概率统计教学的探索与实践[J].统计与决策, 2007, 21 (249) :165~167

7.校情统计分析平台助力学校发展 篇七

关键词:数字校园;智慧校园;校情;统计分析;BIEE;ROLAP

中图分类号:TP315 文献标志码:A 文章编号:1673-8454(2016)03-0079-04

一、前言

随着高校数字化校园建设的广泛推广,学校各类信息系统都积累了一定规模的业务数据,涉及教学、科研、管理、后勤等各个方面。在系统集成技术、数据挖掘技术、大数据处理技术日趋成熟的背景下,建设数据仓库系统,对高校各类业务数据进行统计分析挖掘,有助于提高教学质量、提升管理水平、促进管理决策科学化。在《大数据视角下高校综合信息分析平台的构建》[1]一文中作者提出了基于大数据环境高校综合信息分析平台建设的框架,但并未对所提框架的结构和功能进行详细论述。在《大数据时代的高校信息化框架》[2]一文中,作者较为详细地描述了大数据时代高校信息化建设框架,但并未提出可行的实施方案。本文以智慧校园建设为出发点,利用数据挖掘、大数据处理等技术,对学校的教学、管理、科研、后勤等信息系统进行整合,不仅提出校情统计分析平台的框架及建设思路,并给出了模型设计和实施方案。平台于2013年开始调研,2014年8月开始建设,截至目前已完成第一期建设。

二、校情平台建设思路

智慧校园以数字校园为基础,追求资源与应用的高度整合,强调为用户提供个性化的服务,更多地体现服务的智能化和人性化。[3]校情平台正好符合了智慧校园的理念。它可以利用充分融合好的数据进行统计分析,为教职工和学生提供个性化统计报表,为教学提供动态的质量监督信息,为管理和决策提供支撑。

1.校情平台的功能

根据统计学的信息、咨询、监督三种社会功能,可以制定 “信息综合查询”、“数据咨询”、“业务监督”三种职能作为校情平台的建设目标。而根据学校实际应用水平,可以分阶段实现以上目标。

图 1是根据总体发展要求设想的校情平台系统原型。功能方面以教务、科研、学工、财务、人事、设备、后勤等业务归口部门的年度报告和日常统计工作需求为基础,向用户提供在线报表、在线查询统计两种方式的功能。用户角色考虑三个层次,分别是学校层面、院系层面和师生个人层面。

2.校情平台规模控制与技术标准

由于在数字校园建设过程中,已经将各种管理系统数据存储于各自的业务数据库中,仅需考虑结构化数据对象,因此普通企业级关系型数据库或集群即可满足一期工程的存储和检索需求。但是,各种管理系统源自于不同的厂商,不同系统中数据差异较大,需在统一的数据标准基础上开展集成。同时,考虑到校情平台服务于不同管理阶层和管理目标,数据统计分析需求具有不确定性的因素。

因此,在数据抽取、清洗工具上需要考虑可灵活部署、数据格式兼容性强、数据转换能力强大的企业级工具;在联机分析方面,需要以OLAP技术为主,向用户提供所见即所得的在线工具,并对Excel、SPSS、SAS、STAT、R等统计分析软件提供数据接口服务。

根据学校应用系统建设标准,整个方案还需兼容JSR168标准[4]和Open SSO单点身份认证标准[5],使用户可通过学校门户系统访问到所需的查询、统计功能。

三、基于OLAP数据服务的二次开发

校情平台中所选用的BIEE系统是整个数据服务的核心提供者,也是二次开发的重点内容。

如图2所示,BIEE系统是一个典型的三层架构,包括由各种外部数据源组成的Sources层、存储OLAP逻辑信息的资料库层(Repository,可通过OBI Admin工具访问)、以及数据发布服务层(Presentation Services)。其中资料库层和数据发布服务层均包含在BIEE系统内。

1.BIEE环境下ROLAP的实现

数据库联机事务OLTP(Online Transaction Process)是在数据库环境下处理应用业务事务(Transaction)所执行的一系列数据库操作。OLAP(Online Analytical Processing,联机分析处理)是在基于数据仓库多维模型的基础上实现的面向分析的各类操作的集合。OLAP与OLTP的主要差别见表1。

OLAP分为MOLAP、ROLAP、HOLAP等类型,其中ROLAP是一种将OLAP操作转换为数据库关系模型操作的OLAP实现技术,具有成本较低、性能较好的优点,因此选用BIEE-ROLAP方案。

OLAP操作包括钻取(Drill-down)、上卷(Roll-up)、切片(Slice)、切块(Dice)以及旋转(Pivot),建立在多维模型的理论基础上。

关系模型操作包括数据创建(Create)、获取(Retrieve)、更新(Update)、删除(Deletion),建立在关系理论的基础上。OLAP操作均是读取操作,被映射到关系模型获取操作的集合、投影、选择、聚合等操作上。

两个领域操作原语的转义由BIEE完成。Oracle BIEE将转义信息存储在Repository中,分别包括数据资源的物理结构(Physical)、面向多维分析的数据立方体信息以及面向业务的发布信息。

物理层(Physical Layer)包括待分析数据的数据库位置、访问方式、各数据库中表结构及其关联关系,使BIEE能够根据需要正确执行相关关系操作。

在业务逻辑层(Business Layer)中,记录了面向多维分析的数据立方体信息,包含多维模型的事实(Facts)、维度(Dimensions)信息与物理层各种数据表之间的映射关系。这些信息使BIEE能够将OLAP操作正确地映射为关系操作。

在表现层(Presentation)中,存储了开发人员在表现层建立的视图模型(View Model)。按业务和用户角色划分数据立方体的访问范围,视图模型是访问者访问数据立方体的“窗口”,通过视图模型所访问到的是一个受限数据立方体的子集范围,也称为“主题”。

在BIEE环境下OLAP查询结果以图、表和叙事板的形式给出,并可组织成丰富的图文展现形式。开发人员可将OLAP查询操作以Answers的形式保存在服务端,并提供更为通俗易懂的名称,如“教职工职称系列分布”,最终用户只需直接访问这些Answers就可得到相应的结果。

BIEE还提供和数据仪表盘(Dashboard)功能,访问者可在一个WEB页面中得到多个Answers的数据,获得更多的信息量。但因Dashboard组织在BIEE自有门户系统中,无法直接集成到学校数字化校园门户系统,因此不能使用BIEE的Dashboard功能。

2.校情平台与学校门户系统的集成

金致公司提供BIEE Answers的JSR168封装插件,利用该插件以http代理的方式将Answers封装成一个Portlet。通过该插件,可在学校门户中实现校情门户站点,在该站点中,将各种预先制作好的Answers以Portlet的形式集成在站点页面中,形成图形化的菜单,具有更好的访问效果。图3是门户系统的集成效果。

四、校情平台的设计与实现

1.方案设计

基于上述建设思路,校情平台架构采用分层架构进行设计,共分为四层,分别是数据层、集成层、模型层、应用层,如图4所示。

数据层由各种管理信息系统的数据库或结构化数据文件构成。

集成层以数据抽取清洗工具为主,按照我国现行的行业标准,对不同业务系统中的公共信息进行统一编码、转义,统一存储在标准数据库中,并在元数据库中提供标准数据的数据结构说明。[6]集成后的数据按ROLAP模型组织成事实、维度、指标存储在关系数据库中。同时,校情平台对数据抽取集成的过程都进行了监控和日记记录,以备数据审计的需要。

在模型层,考虑到联机分析引擎和报表引擎均需要提供相应的模型数据才能正确运行,因此关于主题数据库中的雪花模型和关系模型都详实、规范地录入到引擎中了。在Oracle BIEE中这些信息登记在Physical Model、Business Model和View Model中;在SAP BO中,这些信息登记在Universe。这些数据虽然来源于业务系统中的事务数据,但组织形式和使用目的已经发生了变化,因此统一归纳在模型层之中。

应用层构建在模型层之上,主要是根据用户的需要,通过各种工具软件进行统计分析,并以图表的方式呈现给用户。分为三类情况:一是向用户提供报表功能,满足非IT人员直接获取报表和分析结果的需求。二是通过在线OLAP系统,向业务专家提供查询结果、交叉表和图形等形式的自定义分析功能。三是专业数据分析人员可以通过Excel、SPSS等工具直接通过ODBC、JDBC接口访问主题数据库中的各类数据,进行更深层次的数据挖掘和分析工作。

2.软硬件架构实现

校情平台软件方面:①选用甲骨文公司所提供的解决方案构造整个服务平台,采用Oracle作为数据库引擎,采用BIEE作为OLAP引擎,采用ODI负责数据转换和清洗。②选用金智公司针对BIEE开发的JSR168插件,实现统一身份认证、单点登录和门户集成。

通过金智公司的插件可将BIEE中的Answers 封装成学校门户中的Portlet,再利用门户的站点(Site)、门户(Portal)、页面(Page)和Portlet配置功能,可建立不同功能的数据服务站点,如图5所示。

校情平台硬件方面:使用三台物理服务器组成ORACLE RAC集群,形成高可用高性能的中心数据库。从学校现有的FC SAN存储中心划分6T存储空间,向中心数据库提供2x8Gbps数据带宽。使用四个虚拟服务器作为应用服务器,其中两台运行ODI,一台运行BIEE,另外一台作为开发工作站,如图6所示。

3.系统的扩展

考虑未来的发展需求,在校情平台设计之初,已经考虑到了未来在存储、查询和计算性能方面的扩展途径。

(1)存储和查询性能的扩展

校情平台的中心库作为所有分析数据的存储和SQL查询提供者,存在潜在的容量和性能瓶颈。当容量不能满足需要时,可在存储系统中划分新的存储空间,并以表空间的方式提供给数据库。当性能不能满足需要时,可增加RAC节点数量,从而得到更大的处理性能和吞吐率。

(2)计算性能的扩展

由于校情平台采用ROLAP方案,导致BIEE应用服务器在运行时会在内存中进行交叉、汇总计算。因此,在应用服务器端有潜在的性能瓶颈。前期应用规模不大时,瓶颈问题不明显,使用一台虚拟服务器运行BIEE服务即可;应用增长到一定范围时,只需增加服务器节点,即可解决瓶颈问题。这是由于JSR168封装插件可令服务器间的访问差异性被屏蔽,使整个系统仍然表现为一个整体。

五、建设成果与展望

学校于2014年8月开始建设校情平台,到目前为止的建设成果为:按照方案设计完成了软硬件系统的部署,并完成了数据集成、系统进程工作;完成了科研、教务、学生、设备、宿舍、一卡通、研究生等主要业务系统的数据集成,向学校各级管理层提供了10个方面的98个查询服务。

校情平台建设成果已经初步显现。通过学生招生、培养、就业数据的联合分析,学校进行了2015年招生计划调整,将原有报考率高、就业形势明显更好的四个专业调整为一本专业招生,对不好的一些专业进行了缩减、停招等调整;通过学生宿舍分配情况的统计分析,向学校提供下一学年各校区、宿舍区的新生容纳能力,为学校招生安排、后勤保障提供支撑;学校在校情平台的数据统计基础上开展学科点建设管理,对各学科的学科点建设情况进行动态跟踪,对各种指标进行横向对比、团队内对比,全面监督各学科点建设任务推进情况。类似的工作还应用在就业工作领域,通过就业数据的实时分析,全面对比学校各专业的就业工作进展,促进各二级院系扎扎实实推进毕业生就业工作。通过一期校情平台的建设,学校各级管理部门已经初步感受到了,在充分数据共享环境下,信息化对管理、决策带来的强力支撑。目前学校正在开展全员工作量考核管理系统建设,其中工作量核算、分析、调整等功能将在校情分析平台上实现。

如何能够有效地关联相关数据,找出数据之间内在的联系和知识是进一步发挥数据价值的主要途径。随着校情平台的数据量增长,可以进一步利用数据挖掘技术对该平台的结果进行关联分析、序列模式分析、分类分析和聚类分析,将隐藏在教育数据集之中的知识,通过数据挖掘技术榨取出。[7]这样就不仅仅能够提供各项统计数据,还能把影响数据指标的隐含因素挖掘出来,供决策者参考。

师生用户始终是校园信息化服务的核心,围绕“人”来建立数据收集和应用机制,不仅能抓住重点有的放矢,又能简单易行清晰完善。在下一步工作计划中,我们将以师生为中心,进一步丰富主题模型,适应更多的查询统计需求;还将结合学校管理需求和统计事件,开发更多的查询服务,开展挖掘分析工作。更重要的是通过这些服务工作让职能部门感受到信息化所带来的好处,促进各职能部门自觉、自主地开展信息化应用,使信息化在高校发展、人才培养上起到更大的促进作用。

参考文献:

[1]管廷昭,夏艳东.大数据视角下高校综合信息分析平台的构建[J].数字技术与应用, 2014(8).

[2]罗军锋,徐菲.大数据时代的高校信息化框架[J].中国教育信息化(高教职教),2014(3).

[3]宓詠,赵泽宇.大数据创新智慧校园服务[J].中国教育信息化(基础教育),2013(24).

[4]JCP.JSR-000168 portlet specification 1.0[EB/OL]. https://www.jcp.org/en/jsr/detail?id=168,2003.

[5]The Open Group.Scope of the Single Sign-On Standard[EB/OL]. http://www.opengroup.org/security/sso/.

[6]教育部关于发布《教育管理信息教育管理基础代码》等七个教育信息化行业标准的通知[EB/OL].http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/s5972/201203/133140.html.

[7]Shyamala K, Rajagopalan S P.Data Mining Model for a Better Higher Educational System[J].Information Technology Journal,2006,5(3).

上一篇:人生感悟散文:活得潇洒更幸福下一篇:重症医学科总住院医师职责