序列的造句

2024-08-08

序列的造句(通用9篇)

1.序列的造句 篇一

庭院设计:园林的空间序列属于上面所说的最后一种手法。有人把古典园林比作山水画的长卷,这可能是处于它的连续性,不过画所呈现的毕竟是平面而园林庭院是用空间来构筑这种连续性的,空间随着人的活动呈现出连续性,则比山水画更有变化和深度。现代建筑由于功能的复杂,无论规模大小,也多采用这种自由灵活的布局和迂回循环的空间。坐落在苏州古城城中的苏州博物馆以“不高不大不突出”为构思时的原则,毗邻拙政园和忠王府,为了与这些古典园林和古民居建筑相协调,建筑的高度、形态与色调都得到很好的控制

庭院设计:建筑主体的檐口尺度限定在六米以内,由于毗邻的是忠王府和拙政园,建筑高度控制在16米。同时也绝对不是一个传统园林的复制品,建筑非常尊重古城的街区肌理,正门使用了与古城民居水巷协调的尺度感。并以大小各异的庭院群组串联其建筑,沿纵轴层层递进,围合中心庭院的墙体不但没有阻隔新旧建筑的,博物馆更像是古典园林的延续。很好的把新的建筑融合到了自然环境和历史环境中。

协调好新建筑、自然、历史之间的关系成为设计的创新点。新建建筑与历史传统的建筑之间相得益彰。博物馆以中心水庭院为核心空间,进行空间组织,相对整个空间来说较开阔的水庭院很好的拉开了从入口开始的纵轴线的景深。由三面不同的建筑围合而成的主庭院,北面是著名的古典园林拙政园。这条由入口大厅开始的纵轴线将视线一直延伸到水庭院与拙政园相隔的北墙。与之相交的横轴线上

庭院设计:串联起功能不同的大小庭院。纵横相交的轴线控制这建筑空间的序列与节奏,疏密有致的建筑分布,形成不同的庭院空间围合,以 博物馆以层层院落式组合进行空间的递进,符合周边的合院式民居的肌理。中国传统建筑讲究的是群体的组合,群落之美和群体的组合正是靠层层递进的庭院组织而成,并不强调单体建筑。而苏博正是由众多的庭院空间将单体建筑联系起来,通过庭院空间来控制节奏,步换景移,产生空间和时间的流动。

而时间和空间这两个维度流动变化的叠加,让空间成为了具有中国式的庭院空间的韵味。庭院也起到各个单体之间的联系和功能空间的转换。所谓意境都是靠群体组合的序列来完成的,传统建筑之美是孤立的单体建筑不能完整表达的。

庭院设计:几何造型,融合进了粉墙黛瓦的屋顶造型,相比多年前的香山饭店的平面化的传统元素,立体了很多。青瓦片被换成了菱形的黑色花岗石片,花岗宕棱形的瓦,依旧保留了白墙相配的“中国黑”的色调和苏州城的江南味道。(2)坡顶天花的新结构,在大部分的展厅、廊都可以看到仿木色的铝合金格栅和用银色钢管代替的传统建筑的椽子结构,这些格栅除了使光线变得柔和外,也产生了奇妙的光影效果,并让人联想到,传统书斋里的的竹帘,增添静谧之感。(如图5.3所示)(3)抽象的造景,园冶中:“以壁为纸,以石为绘。”

庭院设计:HTTP:///

2.序列的造句 篇二

关键词:装配序列,规划,配合节点序列,代价函数,模拟退火算法

0引言

随着我国航天事业的深入开展,航天器结构与机构产品正朝着更大、更重、更精密、更复杂的方向演变。目前, 业内对其装配方案的探寻主要依赖于多阶段实物验证试验并迭代改进,而鲜有从理论上进行规划、分析的案例。

相对其他行业特别是各高校在装配序列规划领域开展了大量的工作,其研究成果多集中于以下两个方面:

1) 装配模型构建方法: 主要有基于装配序列优先图( 或优先关系矩阵)[1,2,3]、基于子装配体( 或装配模块)[4,5,6]和基于基础件[7]的模型构建法。

2) 装配序列优化引擎: 主要有专家系统[8]、知识论[9]、启发式算法( 粒子群算法[1]、蚁群算法[2]、遗传算法[10]等) 和人工神经网络[11]。

从以上文献可知,构建装配模型是实施序列规划的必要条件,该模型的有效性直接影响序列规划的效率和精度。一个优良的装配模型不仅要求能够巧妙的表达参与装配的各零件及其约束信息,更能有利于使用高效的序列优化引擎。通观引文所涉及的3种模型构建方法,虽然侧重点各不相同,但无一不是针对装配主体( 零件、部件、子装配体等) 来展开研究。基于装配主体的模型构建方案具有表达自然、建模灵活的优点,众多研究成果表明,该方案已趋于成熟,并能有效的应用于各领域。

针对以上现状,通过深入发掘装配信息,识别其他有效建模元素,提出不同于“主体建模法”的“配合节点建模法”,研究了基于配合节点序列的航天产品装配序列规划方法,为装配序列规范方案探寻另一种可能。

1配合节点模型

机械产品的装配过程是参与装配的零件互相连接的过程。为了便于开展研究,现将某零件与其他零件的连接部位及其对应的连接操作抽象为配合节点,并形式化定义如下:

式中: P = {p1,p2},为与该配合节点直接相关的两个零件; et,ec,ef分别为完成该连接操作的搬运能耗、配合能耗和紧固能耗; st,sc,sf分别为完成该连接操作的搬运遮蔽度、 配合遮蔽度和紧固遮蔽度。

表1对以上参数进行了详细的说明。

注: 为了统一度量,“赋值策略”中有量纲的参数均按标准单位取值。

2遮蔽度评价

由于零件间的干扰量与其外形、尺寸、位置等非结构化因素密切相关,对配合节点遮蔽度进行自动评价面临建模困难和计算量大的问题,而人工评价则可“一目了然”。

2. 1制定评价表

定义2: 设零件pa与零件p1或p2有连接关系且不属于p1或p2,则称pa为p1或p2的一级关联零件; 设零件pb与pa有连接关系且不属于p1、p2或pa,则称pb为p1或p2的二级关联零件; 依此类推。一般情况下,二级及以后的关联零件对遮蔽度的影响已非常小,仅考虑一级关联零件,简称关联零件。

对于给定的配合节点,其遮蔽度由零件p1、p2及其关联零件决定。通过制定遮蔽度评价表可便于罗列所有配合节点的遮蔽度信息,如图1所示。

2. 2填写评价表

采用“人工评价”的方式,按表1赋值策略对遮蔽度评价表的主表和关联零件表进行逐项赋值,具体步骤如下:

1) 主表赋值

在三维装配图环境下,通过隐藏除p1,p2外的其他零件模型来考察指定配合节点的遮蔽度并填写主表对应项目。

2) 关联零件表赋值

在三维装配图环境下,通过隐藏除p1,p2及其对应的关联零件外的其他零件模型来考察指定配合节点的遮蔽度并填写关联零件表对应项目。

3装配序列规划

3. 1装配序列模型

文中以配合节点序列来表征装配序列,即:

定义3: AS = [nc1,nc2,. . . ,ncm]为带有m个配合节点的装配对象的一个装配序列。式中nck表示第k步装配所涉及的配合节点。

3. 2装配序列评价

以按指定装配序列AS完成目标装配所付出的代价作为装配序列评价的唯一依据,用代价函数C( AS)表示。

式( 1) 中f( nck) 是完成配合节点nck相关操作的代价函数,如式( 2) 所示。

由表1可知,et= M × h,ec= ξ × τ × M,而M和h均受上游配合节点的影响; 同时,根据上游配合节点的不同, st,sc,sf将在遮蔽度评价表中取不同的值。因此,不同的节点序列中f( nck) 取值各不相同,则C( AS)相应不同。文中序列规划的目标即寻找一组序列AS,使得C( AS)最小。

3. 3模拟退火算法

对于在复杂解空间中进行寻优,启发式算法是行之有效的方法。文献[12]通过获取目标城市序列来解决旅行商问题,文中的研究模式与之类似,可借鉴其采用模拟退火算法进行配合节点序列寻优,算法流程如图2所示。

4应用实例

4. 1规划对象

某型号电源分系统结构、机构部分由5大部件组成, 各部件在上游环节完成部装后统一交付,由总装车间完成其在舱体上的安装,装配完成后的构型如图3所示。

4. 2数据准备

由于参与装配的部件与舱体均已完成交付,总装期间不允许对其进行拆解,则以上6部分均可视为零件,可按表1和图1构建装配体配合节点及其遮蔽度评价表,如表2、表3所示。

根据型号工艺要求,零件1( 舱体) 只能处于静止状态,其他所有零件可自由组合,因此M和h按以下原则取值:

1) 如果本节点不直接或间接涉及零件1,则属于地面装配,h = 0,M按质量最小的零件组合取值;

2) 如果本节点直接或间接涉及零件1,则属于舱上装配,h按表2取值,M取参与装配( 除零件1) 的零件组合的质量;

3) 特别是,由于本例的特点,最后一个节点已处于半装配状态且不需要搬运,则M取p1或p2中质量最小的值, h = 0。

节点遮蔽度选取原则:

1) 如果本次装配只涉及零件p1和p2,遮蔽度在主表中取对应值;

2) 如果本次装配涉及关联零件,遮蔽度在关联零件表中取p1和p2对应值之和。

4. 3执行结果

按图2流程,取初始序列AS = [1,2,3,4,5,6],初始温度T = 6 500,a = 0. 98,在VC + + 6环境下编写程序迭代计算500次。

结果显示,从第216次迭代开始,代价函数处于最小且不再变化,此时AS = [6,1,2,3,5,4],C( AS)= 7 191,即为目标序列,如图4所示。验证试验表明,该配合节点序列所对应的装配序列合理可行。

5结语

3.关于学习进展序列的研究 篇三

学习进展序列提供一个有序列的、有联系的步骤,描述了学生为掌握一个大概念或核心概念时,理解程度和思维技巧从简单到复杂的过程中所需要的典型技能和知识。学习进展序列需要以科学研究为基础,并体现一定的灵活性,给出时间分段和对应的特定内容。

下面以学生学习沉浮现象,建立物体密度概念为例:

了解小学科学教育的教师都知道,孩子很喜欢水。不管是玩水,还是自己学游泳,孩子从小就会接触到沉浮现象。但是教师也都知道,建立密度的概念是小学阶段科学教育中的难点,也一直是科学教育研究的热点课题。皮亚杰认为:建立为什么物体会沉浮的解释,孩子需要经历4个主要的阶段。第一阶段(4-5岁)孩子解释沉浮的原因是道德上的,如“这块石头聪明”。第二阶段(5-6岁)认为重的物体会沉,因为物体重,表示强大,用的是拟人力量的解释,而非客观的原因。第三阶段(6-8岁)开始找客观的原因。第四阶段(9岁以后)开始把重量和容积联系起来,才可能逐步建立密度的概念。这就是皮亚杰提出的儿童获得密度概念的进展序列。皮亚杰理论的问题在于把这种进展序列看成是儿童天生具有的过程,不受到文化和社会背景的影响。他的这个观点被实践和脑科学证明是错误的。儿童,甚至于是没有接受过良好科学教育的成年人,都会对沉浮现象有许多错误的前概念。这些错误的前概念,不经过精心设计的科学教育,是很难改变的。而有了好的教育方法,儿童才能够较早地建立正确的概念。

威尔逊(Wilson)等用渐进的变量来描绘学生对沉浮概念掌握的进展过程,一共分为9个等级,如表1所示。作为一个例子,它说明不同的科学概念可以分解成随着时间进展而发展的详细过程。在给出的学习进展序列中并没有像皮亚杰那样给出年龄的阶段。因为,根据社会建构理论和脑科学的研究,已经证明学生的学习进展的进度各不相同,既与先天的条件有关,更会受到后天文化和社会条件的影响,语言和教育就是一个重要的学习背景。

有的学者还主张,学生的学习进展序列不一定是楼梯式的,可能会出现拼图式和螺旋式的进展过程。莎奈娜(Salina)把拼图式称为风景照式。迄今为止,我们还没有见到螺旋进展式的实际案例。

我们在图1中给出了阶梯式和拼图式的示意图。

本文摘自韦钰院士的论文《小学科学课要以探究式学习为主要的学习方式》,有删改。学教育的原则和大概念,科学普及出版社2011年7月

[1] Ivan Salina. Learning Progression in Science Education: Two Approaches For Development. Paper presented at the Learning Progressions in Science (LeaPS) Conference, June 2009, Iowa City

[2] Esther Dabagyan,What Makes Things Float? Density and Buoyancy Misconceptions,California State University Northridge www. csun.edu/~eed39911/.../Density/ Misconceptions/Paper.pdf

[3] Cathleen A. Kennedy & Mark Wilson. Using Progress Variables to Interpret Student Achievement and Progress. (BEAR Technical Report No. 2006-12-01). Berkeley Evaluation & Assessment Research (BEAR) Center

表1 学生学习密度概念的学习进展过程

图1 阶梯式和拼图式的学习进展

4.(ρ) 混合序列的强大数定律 篇四

(ρ) 混合序列的强大数定律

讨论了(ρ) 混合序列的.Kolmogorov强大数定律,并推广到了在一类广泛的条件下的不同分布的情形.

作 者:谭成良 吴群英 贾贞 孟凡宇 TAN Cheng-liang WU Qun-ying JIA Zhen MENG Fan-yu  作者单位:桂林工学院,数理系,广西,桂林,541004 刊 名:桂林工学院学报  ISTIC PKU英文刊名:JOURNAL OF GUILIN UNIVERSITY OF TECHNOLOGY 年,卷(期):2008 28(2) 分类号:O211.4 关键词:强大数定律   (ρ) 混合序列  

5.序列的造句 篇五

针对多边形切割中由于切割点坐标值的取舍导致的点位偏移,从而可能出现拓扑错误的情况,提出一种基于节点序列搜索的`多边形分割算法.该算法在生成多边形相交的切割线的基础上,对产生的切割点进行坐标值取舍,将进行坐标值取舍后的坐标点与被切割多边形的坐标点按照节点序列生成被切割多边形,同时切割点内插到相关多边形,从而保证多边形的拓扑关系不变.该算法能解决带岛多边形切割.该算法已经在大规模数据生产中得到应用.

作 者:曾广鸿 王晓明 徐宜勤 邬伦 ZENG Guang-hong WANG Xiao-ming XU Yi-qin WU Lun  作者单位:曾广鸿,ZENG Guang-hong(北京大学,地球与空间科学学院,北京,100871;广州市国土资源和房屋管理局,广东,广州,510031)

王晓明,徐宜勤,邬伦,WANG Xiao-ming,XU Yi-qin,WU Lun(北京大学,地球与空间科学学院,北京,100871)

刊 名:测绘通报  ISTIC PKU英文刊名:BULLETIN OF SURVEYING AND MAPPING 年,卷(期): “”(8) 分类号:P208 关键词:多边形分割   节点序列   拓扑关系   算法  

6.具随机误差迭代序列的强收敛定理 篇六

具随机误差迭代序列的强收敛定理

介绍和研究了一类具随机误差的迭代序列, 并在 Banach 空间中证明了此迭代序列的.强收敛性,改进和推广了以往文献的相关结果.

作 者: 作者单位: 刊 名:重庆工学院学报(自然科学版)  ISTIC英文刊名:JOURNAL OF CHONGQING INSTITUTE OF TECHNOLOGY 年,卷(期): 23(9) 分类号:O177 关键词:L-Lipschitz   映像   具随机误差的迭代序列   强收敛定理  

7.语文课程的序列错位及矫正 篇七

从教学角度看, 作为课程的语文也是围绕“语言、文字、文章、文学、文化”等几个要素来展开的。但人们似乎忽略一个前提:什么是课程?《现代汉语规范词典》这样解释课程:教学的科目和进程。其中核心词语有两个:“科目”和“进程”。“科目”强调学科的范围和特性, “进程”强调学科的内在逻辑体系。自然学科的教学由表及里, 由浅入深, 环环相连, 知识体系、认识体系、能力体系有条不紊。但语文学科教学在课程的序列安排上常常是不尽如人意, 甚至是混乱无章的。

一、寅吃卯粮, 学段职责不明

各学段的语文教学中都有“抢先”现象, 将不适合本学段的教学内容强行提供给学生, 结果是“种了人家的地, 荒了自己的苗”。例如, 小学阶段语文教学本该注重语言文字基本功的训练, 将汉字写端正, 将笔画写正确, 将字音读准确, 将句子读流畅, 能写出合乎现代汉语规范的语句, 为学生终身语文学习奠定基础。但事实上, 小学语文教学“自加压力”的现象令人惊讶。

【镜头扫描一】

某小学四年级试卷上的一道原题:

勇敢的孩子

一辆大客车载着19个6至11岁的小学生去参加活动。途中, 驾驶员因病昏迷, 汽车失控, 在美国第40号公路上急驶乱窜。一些孩子吓得哭泣起来:“我们快要死了。”突然, 汽车又开始横冲直撞, 孩子们都摔倒了, 有的还撞在车窗上。这时, 车上10岁的五年级学生拉里的头脑异常清醒, 在这千钧一发之际, 他勇敢地从座位上一跃而起, 一把抓住方向盘, 并用力踩住刹车踏板, 使汽车猛然刹住。拉里随后招呼三位同学一起把司机拖起来。这时, 恰巧有辆汽车路过, 他们立即报警。几辆救护车闻讯赶到, 将受伤的五位同学送到医院, 其余的换乘另一辆大客车返回学校。在车上, 孩子们个个泪流满面, 滔滔不绝地倾诉对拉里的感激之情……

事后, 拉里平静地对表扬他的校长说:“这算不了什么, 只是我常跟爷爷一起摆弄一辆货车的缘故。要知道我爸爸才是一位真正的英雄, 他生前总是想方设法做好事, 帮助过许多人, 我想, 我爸爸一定会为我高兴的。”

1、根据意思从文中摘录成语

⑴比喻极其危急。 ()

⑵形容话多, 连续不断。 ()

⑶形容毫无顾及地乱冲乱撞。 ()

2、缩写句子

⑴失控的汽车在40号公路上急驶乱窜。_________

⑵泪流满面的孩子们滔滔不绝地倾诉对拉里的感激之情。_________

3、第一节末的省略号省略了孩子们的话语, 请展开想象, 补写孩子们说的感激的话。

同学们有的说:_________, 有的说:_________。

4、简要回答问题:十岁的拉里为什么能成功救出一车小学生?______________________

笔者对前三道题毫无异议, 但第四题显然要小学生在理解文章内容的基础上作情理和伦理分析, 这不应该是小学语文教学的任务。“十岁的拉里为什么能成功救出一车小学生”, 这个问题让高中生或者老师回答都很有“嚼头”:首先是拉里为什么能“头脑异常清醒”;其次, 10岁的拉里怎么能“从座位上一跃而起, 一把抓住方向盘, 并用力踩住刹车踏板, 使汽车猛然刹住”;再次, 拉里为什么要拯救一车的孩子?“ (爸爸) 生前总是想方设法做好事, 帮助过许多人, 我想, 我爸爸一定会为我高兴的。”它涉及到了教育和道德伦理问题, 是一个深刻的社会文化话题, 远不是四年级的孩子们所能回答得了的;甚而至于, 它不完全是一道语文试题。

当然, 这道题仅是个例, 但其中反映出人们对语文课程内容及序列性特点的漠视。试题命制者虽并不要求小学生从如此深刻的层面回答这道题, 但试问, 老师这么命题的依据何在?语文学科的命题和教学有度可言吗?可供掌握的标准究竟在哪里?

【矫正策略】

面对语文课程中存在着的各种形式的“超级” (也超范围) 现象, 人们的认识必须清醒:必须到什么山唱什么歌。有些问题, 学生是非得到了一定年龄阶段, 获得一定的社会阅历和知识储备后才能有所领悟的。阶段性语文教学根本没有必要去人为地设置高度和难度。从语文课程自身特点理解, “语言+文字、语言+文章、语言+文学、语言+文化”这四者循序渐进, 合乎人们认知和掌握语文的一般规律。“文字”、“文章”、“文学”、“文化”之间有着千丝万缕的联系, 很难用绝对的先后、深浅、难易来衡量它们, 但笔者认为, 从实际教学的需要和特点来看, 小学阶段的主要精力要落实到“语言+文字”上, 中学阶段的主要精力要落实到“语言+文章”、“语言+文学”上, “语言+文化”理应贯穿人一生的语文学习。小学语文教学的成效不是看能将教学内容挖多深多广, 而应该看能将基础打得多牢多实, 能将学生语文学习习惯和对民族语言的感情培养得多好。而这些都得围绕“语言+文字”这一阶段教学核心展开。初中语文教学要注重引领学生读文章, 了解文学的一般特点, 掌握文学作品的阅读方法, 通过对优秀文学作品的分析理解进一步了解社会和历史, 学会思考和分析社会现实, 确立正确的情感态度价值观, 学会用恰当的方式表露自己的观点和情感。高中语文教学中提升了的文学教育, 重在通过文学教育培养学生的理性思维能力和情感体验能力, 积极培养学生运用语文, 形成健康向上的审美能力和深入浅出的探究能力, 形成良好的思想道德素质和科学文化素质, 为终身学习和有个性的发展奠定基础。

二、囫囵吞枣, 教材编排混乱

维果茨基的“最近发展区理论”告诉我们, 学生学业进步是在已有发展水平的基础上追求可能达到的发展水平。因此, 了解学生的学习基础和发展可能尤为重要。各学段学生语文学习的现有水平、发展需求、发展潜能、存在困惑等都是研究关注的重点。但从教材编写、教学内容确定等方面看, 我们的学情掌控工作浅尝辄止, 分析实施更任重道远。人大附中调查高中语文教材中学生最喜欢和最不喜欢的篇目, 在最不喜欢的十篇文章中鲁迅先生的作品《拿来主义》、《纪念刘和珍君》、《祝福》就占三席。鲁迅先生的文学创作代表了中国现代文学发展的最高水平, 他的文章针砭时弊, 涤荡灵魂, 砥砺情志, 兼备文学性和艺术性, 深受专家和一线教师的喜爱, 但学生为什么偏偏不喜欢呢?个中情由耐人寻味。倘若不作此调查, 教学时教师还蛮以为学生和自己一起沉浸在鲁迅的世界里呢。学情掌握不准, 教学必然是盲人瞎象。

【镜头扫描二】

李白的《早发白帝城》是小学低年级学生耳熟能详的诗篇, 柳宗元的《江雪》早就出现在小学语文课本里了。类似形式简单但内蕴丰富的作品学生读得懂吗?能大概地观其表难察其意。笔者曾在高三学生中作过调查:《江雪》末句为什么不是“独钓寒江鱼”而是“独钓寒江雪”?两个班百余名学生都是一脸茫然。

高中生不理解小学课本上的古诗词, 这好像是咄咄怪事。反思这一现象, 问题并不在学生身上。理解文学作品必须知人论世, 学生在学这两首诗歌时老师会作详细的作者介绍和创作背景提示吗?即便介绍提示了, 年幼的学生也不太可能弄懂。不知柳宗元的人生经历和《江雪》的创作背景, 不知道柳宗元此时貌似旷达的心境, 如何去理解“钓雪”呢?同样, 《早发白帝城》中“轻舟”何以“已过万重山”?学生不知李白在流放夜郎途中突然遇赦的惊喜, 根本想不到这句诗是写作者内心激动情绪的。但“知人论世”的要求对于小学生来说显然是太高。这样囫囵吞枣的结果是学生要对一些作品作终身的误读。

【镜头扫描三】

王勃的《滕王阁序 (并诗) 》是千古名篇, 但诘屈聱牙, 文义跳跃晦涩。尽管如此, 此文是各种版本的高中语文教材的必须篇目, 苏教版高中语文教材将其安排在必修四上, 供高一学生学习。但这样的篇目高中生是不可能读通读懂的。试以第4段文字为例:

无路请缨, 等终军之弱冠;有怀投笔, 慕宗悫之长风。舍簪笏于百龄, 奉晨昏于万里。非谢家之宝树, 接孟氏之芳邻。他日趋庭, 叨陪鲤对;今晨捧袂, 喜托龙门。杨意不逢, 抚凌云而自惜;钟期即遇, 奏流水以何惭?

一段96字的文段, 除生僻的字词外, 几乎一句一用典, 学生读起来摸不着头脑, 教师教起来捉襟见肘。骈文在现今已失去其现实意义了, 就是鲁迅先生的《拿来主义》里所说的“烟灯和烟枪”, 教材即便要选用也可将其放在配套阅读教材中备选, 或干脆放到大学语文教材上去。否则, 不顾实际的求深、求难、求全, 只会让教学适得其反。

【矫正策略】

不同学段的语文课程里都有一些“不可回避”的难题, 只能等时间这味真火来锻炼。中学阶段语文教学要围绕“语言+文章”、“语言+文学”, 培养学生良好的阅读习惯。文学从本质上说要表现人物的心理世界和社会生活, 是人类精神生活的物质体现, 以文学教育为主体的中学语文教学必须正视这一特点。具有教学内容选择指导意义的语文教材在选编课文时要充分考虑学生的认知程度, 包括显性和隐形两方面。像《早发白帝城》一类的作品要上调到中学初始年级, 老师在可能的情况下引导学生“跳一跳”, 由作品看作者, 由作者看社会, 由昨天看今天, 由今天看明天。若能再作一些浅显的课外探究和讨论, 就既能解决实际问题, 又能激发学生的求知欲望。

三、重三叠四, 教学体系模糊

一个最常见但匪夷所思的现象, 高三的语文综合试卷高一、高二学生都能做, 很可能做得比高三学生还好;初中学生也能做, 情况也不见得多糟糕;若让小学生来做呢?结果不敢想象。反之, 从低到高做, 情况倒不见得一定多好。这说明不同学段不同年级的语文试卷的层次性并不鲜明。

【镜头扫描四】

2008年江苏高考作文试题《好奇心》, 某报曾约请包括小学生、初中生、高中生、本科生、研究生在内的5位学生进行同题写作, 邀请有多年高考阅卷经验的语文教师为之打分。让人颇感意外的是, 小学生的得分竟然最高, 并且学历越高得分越低!排除媒体炒作因素, 这中间确有让人深思的东西!

从教学角度看, 写作教学存在严重的序列问题。例如小学、初中、高中都要求写作记叙文, 小学阶段“能写简单的纪实作文和想象作文”, 初中阶段“写记叙文, 做到内容具体”, 高中阶段“写作较为复杂的记叙文”。“简单”、“具体”、“复杂”等笼统的要求表面看似乎确立了训练的序列, 实际上全凭师生主观掌握, 连训练的对象、训练的目标、训练的方法、训练的要求等都是模糊的。这的确没法保证写作训练的效果。

【矫正策略】

笔者尝试在高中阶段进行了写作序列训练。高一年级上学期重点是端正文风, 培养学生写真事、抒真情、说真理、表真趣的写作习惯, 训练时不设文长要求, 有话则长, 无话则短;下学期重点训练文体写作规范, 要求将记叙文、议论文写得中规中矩, 具有鲜明的文体特征;高二年级一学年进行分点训练, 将写作中常见的问题设计成九组关系:生活与创作、规范与创新、审题与立意、章法与构思、放笔与收题、情节与细节、论证与抒情、举例与运用、知识与鉴赏, 有计划地分别训练;高三年级进行综合训练, 重点提高学生对问题的分析能力和思辨能力, 提高学生的临场“作战”能力。这样的写作训练至少在本学段形成体系性, 训练的目标和要求力争明确, 效果有保障。

【镜头扫描五】

再以中学散文阅读教学为例, 不同年级的散文阅读只有选材篇幅长短、结构繁简之别, 却没有教学侧重点和训练角度序列。六年的散文教学都从文本内容、主旨情感、表现手法等方面切入, 从《背影》到《纪念刘和珍君》, 从《济南的冬天》到《听听那冷雨》, 从《愚公移山》到《报任安书》, 一以贯之, 这怎能不让学生厌倦?阅读训练中比喻修辞的作用在初一习题中有, 在高考试题中还有。倘若高考数学试卷上出现纯粹的初中教学内容如因式分解等, 肯定会遭人指责, 但语文试卷就偏偏有此等怪现象。

【矫正策略】

8.人生是时间序列的模型 篇八

参加今天的毕业典礼,意味着人生模型的结构转变,从学业向事业的转移。毕业后的10年,无论是创业、做学问、去机关,都是最艰难的爬坡,基本上没有喘息机会。你面临着处理各种不确定性的问题,但是最重要的判断就是“优化还是博弈”。所谓优化,就是你本人没有主动权,只是被动地适应环境,只能优化成功的路径。根据我的经验,优化问题的最优解就是:碰到一个好领导,就踏踏实实地干活;碰到一个不好的领导,你就认认真真地继续学习。如果在一个对局中,你掌握了至少30%以上的筹码,有了自己的主动权,可以参与对局了,这就是博弈问题。参与博弈,既需要实力,也需要策略。

一、只有潜能发挥到极限,才有可能成功

假如成功意味着抢夺稀缺资源,获得稀缺资源需要经过激烈的竞争,这就是一个丛林法则决定的环境。或早或晚,人生只有经历过一两场惊心动魄的激烈竞争,才能让你的潜能发展到极限,才有可能看到更高层次的风景,没有人能够轻松地获得成功。轻松获得的成功,层次肯定高不了。这样的环境一般是零和博弈,一件事情想清楚了70%就要去做,并投入100%的努力!

二、不要赢得了战役,输掉了战争

经过一场大战固然重要,但人生是一场漫长的马拉松,不能以一时的成功与失败论英雄的,这是一个多次博弈或重复博弈的过程。在多次博弈的情况下,不能赢得了战役,输掉了战争。当年的楚汉相争中,项羽赢得了很多次战役的胜利,但是刘邦赢得了最后的战争。1984密歇根大学的政治科学家阿克谢罗德,以“囚徒困境”为基本博弈单元,选择了150种策略,使用计算机模拟数百次博弈,被称为“阿克谢罗德竞赛”。最终获胜的策略有如下特征:

(1)“善良的”: 策略为首先合作,不会首先选择背叛。

(2)“可激怒的”:当发现对方不合作,能识别并采取不合作来报复对方,不会让背叛者逍遥法外。

(3)“宽容的”:不会长时间怀恨在心,如果对方改过自新,可以恢复合作。

(4)“清晰的”:即能让对方在三五步对局内辨识出来自己特征,不玩深沉。很快就让对手发现了规律,从而不得不采取“合作”的态度。

(5)“不嫉妒”:不耍小聪明,不占对方便宜,不在任何双边关系中争强好胜。

这个在重复博弈中制胜的策略被称为“针锋相对”,在每一次博弈中,得分都是中等,但是相加的总分是最高的,赢得了最后的胜利。

三、学业结束了,学习并没有结束

博弈的技巧从哪里来?从学习中来。前一段在地铁中看到一个广告“学习是一种信仰”,深以为然。我能告诫各位的是:学业结束了,学习并没有结束。学习可以擦拭自己的心灵,可以荡去污染的尘埃。如果你忘记了学习,你的心灵很有可能已经饥渴,但是感觉不到饥渴的程度,时间一久,肯定会出问题。有个非正式的统计,现在的很多“老虎”都是不爱学习的人。

在毕业以后,很多人抱怨,生活太辛苦,能够应付眼前的工作就不错了,哪来的时间学习看书。可不是嘛,到了工作单位,那可真是“前有强敌,后有追兵”,有的工作已经到了deadline了还没出手,新的工作又排山倒海般压了过来。不但今天的人这样,古人也有这种烦恼。

明朝的心学大师王阳明有这样一位下属,有一天这位下属这样问王大师:“先生,你讲的学问真好,但是我平常有很多的文件、案件需要处理,哪有时间学啊?”王大师听了反问这位下属兼弟子:“我什么时候让你不处理公文、案件,而去空空地做学问了?”

王大师开导这位不开化的属官,你既然有案件要处理,那你就从案件、官司上学习好了:你在审理案件时,不能因为对方的无礼而恼怒;不能因为对方措辞婉转周密而高兴;不能厌恶对方的委托说情而心存整治;不能因为对方的哀求而屈意宽容;不能因为自己的事务繁忙而随意草率结案;不能因为别人的诋毁诽谤而随别人的意愿去处理。以上讲的情况都是私心杂念,只有你自己知道,必须仔细反省体察克治,唯恐心中有丝毫偏离而错判了是非,这就是学习,这就是做学问。处理文件与审理案件,无不是实实在在的学问。如果抛开了具体事物去做学问,反而会不着边际。平常工作繁忙,恰恰给你学习提供了极好的机会。

当然除了结合本职工作的学习以外,现在社会是一个知识爆炸的社会,新观点、新知识、新的学习工具层出不穷,我有两点体会:对于新知识,你可以不超前,但一定不掉队,比如,现在就需要知道什么是产业互联网,什么是工业4.0;对于新工具,一定要超前使用, 但不做狂热粉丝。狂热容易玩物丧志。

四、良知是确定人生成功与否的系数

如果说博弈和学习是人生成功的两个要素,在这两个要素前面还有一个系数,那就是良知。良知是倍数,可以把你的成功快速放大,也可以快速地缩小。曾国藩达到了博弈的最高境界,对手“不忍欺”,背后是什么?背后是人心聚合,是对手心理上折服,当然是良知在起作用。王阳明大师一贯学术立场就是“格物致知”,致知是“致良知”,在工作实践中不是学习书本知识,而是发现自己的良知、不断确认自己的良知、实践自己的良知。实现这一切的途径就是“格物”,这也就是大学所说的“致知在格物”。按照现在的技术条件,“格物”就是收集大数据,凝练信息。

所谓良知,就是生来自由的心灵的澄明,就是孟子所讲的恻隐之心、羞恶之心、恭敬之心、是非之心。这个良知,从具体可感的层面说,体现为人之所以为人的道德、良心。

如果没有良知,心灵被灰尘蒙蔽:人的占有欲、执著心,过分的物质需求、功利之心、世俗的偏见、社会的陋俗等等,都会毁掉你的一生。“致良知”,与自己的心灵对话,用良知之光、心灵之光照耀自己的日常生活、一言一行,不以物喜、不以己悲,不戚戚于贫贱、不汲汲于富贵,内心世界不为宠辱得失而左右,变成一个内心强大的人。

9.序列的造句 篇九

文献综述报告

基于股票时间序列数据的关联规则挖掘研究

Study on Mining Association Rules from Stock Time Series Data

别: 计算机科学与技术系 专

业: 计算机应用技术 研究方向: 人工智能 研 究 生: 汪廷华 导

师: 程从从(教授)

2005年03月

一.引言

随着计算机信息系统的日益普及,大容量存储技术的发展以及条形码等数据获取技术的广泛应用,人们在日常事务处理和科学研究中积累了大量的各种类型的数据。在这些数据中,有很大一部分是呈现时间序列(time series)类型的数据。所谓时间序列数据就是按时间先后顺序排列各个观测记录的数据集[1],如金融证券市场中每天的股票价格变化;商业零售行业中,某项商品每天的销售额;气象预报研究中,某一地区的每天气温与气压的读数;以及在生物医学中,某一症状病人在每个时刻的心跳变化等等。然而,我们应该注意到:时间序列数据不仅仅是历史事件的记录,更重要的是蕴藏这些数据其中不显现的、有趣的模式。随着时间推移和时间序列数据的大规模增长,如何对这些海量数据进行分析处理,挖掘其背后蕴藏的价值信息,对于我们揭示事物发展规律变化的内部规律,发现不同事物之间的相互关系,为人们正确认识事物和科学决策提供依据具有重要的实际意义。

时间序列数据分析按照不同的任务有各种不同的方法,一般包括趋势分析、相似性搜索、与时间有关数据的序列模式挖掘、周期模式挖掘等[2]。本综述是针对证券业中股票时间序列分析的,试图通过列举、分析有关证券业中股票时间序列数据分析的原理、方法与技术,着重探讨数据挖掘中基于股票时间序列数据的关联规则挖掘的概念、原理技术、实施过程及存在的障碍和问题,以期能有新的发现和领悟。

二.股票时间序列传统研究方法概述

随着我国市场经济建设的发展,人们的金融意识和投资意识日益增强。股票市场作为市场经济的重要组成部分,正越来越多地受到投资者的关注。目前股票投资已经是众多个人理财中的一种重要方式。不言而喻,如果投资者能正确预测股票价格、选准买卖时机,无疑会给投资者带来丰厚的收益。于是,在股票的预测和分析方面出现了大量的决策分析方法和工具,以期能有效地指导投资者的投资决策。目前,我国股市用得较多的方法概括起来有两类[3]:一类是基本分析和技术分析,另一类是经济统计分析。1.基本分析和技术分析

在股票市场上,当投资者考虑是否投资于股票或购买什么股票时,一般可以运用基本分析的方法对股市和股票进行分析;而在买卖股票的时机把握上,一般可以运用技术分析的方法[4]。

基本分析指的是通过对影响股票市场供求关系的基本因素(如宏观政治经济形势、金融政策、行业变动、公司运营财务状况等)进行分析,来确定股票的真正价值,判断未来股市走势,是长期投资者不可或缺的有效分析手段。

技术分析是完全根据股市行情变化而加以分析的方法,它通过对历史资料(成交价和成交量)进行分析,来判断大盘和个股价格的未来变化趋势,探讨股市里投资行为的可能转折,从而给投资者买卖股票的信号,适合于投资者作短期投资。目前技术分析常用的工具是各种各样的走势图(K线图、分时图)和技术指标(MA、RSI、OBV等)。2.经济统计学分析

主要针对时间序列数据进行数学建模和分析。传统的时间序列数据分析已经是一个发展得相当成熟的学科,有着一整套分析理论和工具,是目前时间序列数据分析的主要方法,它主要用经济统计学的理论和方法对经济变量进行描述、分析和推算。传统时间序列数据分析的研究目的在于[5]:

●分析特定的数据集合,建立数学模型,进行模式结构分析和实证研究; ●预测时间序列的未来发展情况。

传统的时间序列数据分析最基本的理论是40年代分别由Norbor Wiener和Andrei Kolmogomor提出的。20世纪70年代,G.P.Box和G.M.Jenkins发表专著《时间序列分析:预测和控制》,对平稳时间序列数据提出了自回归滑动平均模型(ARMA),以及一整套的建模、估计、检验和控制方法,使得时序数据分析得以广泛运用于各种工程领域。其基本思想是根据各随机变量间的依存关系或自相关性,从而由时间序列的过去值及现在值来预测出未来的值。该模型以证券市场为非有效市场为前提,当期的股票价格变化不仅受当期随机因素的冲击,而且受前期影响。换句话说,就是历史信息会对当前的股票价格产生一定程度的影响。采用的方 1 法一般是在连续的时间流中截取一个时间窗口(一个时间段),窗口内的数据作为一个数据单元,然后让这个时间窗口在时间流上滑动,以获得建立模型所需要的训练集[6]。

[7]基于股票时间序列是一种混沌时间序列的认知,提出一种新颖的非线性时间序列预测模型,即滑动窗口二次自回归(MWDAR)模型,该模型使用部分的历史数据及其二次项构造自回归模型,模型参数用最小二乘法估计。其基本理论基础是:一个线性模型不能描述混沌时间序列的全局性特征,但在一个小的时间间隔内,系统的行为却可以用某种线性模型近似。[8]则提出了一种基于嵌入理论和确定集上的预测误差的混沌时间序列预测方法,并探讨了在股票价格预测上的应用。

可以看出,经济统计学为问题的探索解决方案提供了有用而实际的框架;模型是经济统计学的核心,模型的选择和计算往往被认为是次要的,是建立模型的枝节。经济统计学本质上是从事“确定性”分析的,可以说统计方法是“目标驱动”的。但是,在大量数据集中往往存在一些未被人们预期到但又具有价值的信息,人们为发现大量数据中隐藏的规律和模式,就需要新的具有“探索性”的分析工具。显然,数据挖掘就是这样的一门工具。

三.数据挖掘技术应用于股票时间序列分析的研究现状

数据挖掘(DM,Data Mining),也称为数据库中的知识发现(KDD,Knowledge Discovery in Database)是数据库技术和机器学习等人工智能技术相结合的产物,是一门新兴的数据智能分析技术[9]。20世纪80年代末,随着数据库、互联网技术的迅速发展以及管理信息系统(MIS)和网络数据中心(IDC)的推广应用,数据的存取、查询、描述统计等技术已日臻完善,但高层次的决策分析、知识发现等实用技术还很不成熟,导致了“信息爆炸”但“知识贫乏”的现象。到了90年代,人们提出在数据库基础上建立数据仓库,应用机器学习和统计分析相结合的方法处理数据,这两者的结合促成了数据挖掘技术的诞生。

所谓数据挖掘,简单地说,就是从大量数据中提取或挖掘知识[2];详细一点可以描述为主要利用某些特定的知识发现算法,在一定的运算效率的限制下,从大量的数据中抽取出潜在的、有价值的知识(模型、规则和趋势)的过程。挖掘算法的好坏直接影响到知识发现的质量和效率,因此目前大多数研究都集中于数据挖掘算法及其应用上。1.相关技术介绍(1)关联规则挖掘

关联规则是美国IBM Almaden Research Center的 Rakesh Agrawal等人于1993年首先提出来的KDD研究的一个重要课题[10]。关联规则挖掘本质是从大量的数据中或对象间抽取关联性,它可以揭示数据间的依赖关系,根据这种关联性就可以从某一数据对象的信息来推断另一对象的信息。它可以做如下形式化定义:

设I = {i1,i2,...,im}是一组项的集合(例如一个商场的物品),D是一组事务集(称之为事务数据库)。D中的每个事务T是项的集合,且满足TI。称事务T支持物品集X,如果XT。关联规则是如下形式的一种蕴含式:X→Y,其中XI,YI,且X∩Y= 。

(1)称关联规则X→Y在事务数据库D中具有大小为s的支持度,如果物品集X∪Y的支持度为s%,即support(X→Y)=P(X U Y)。

(2)称规则X→Y在事务数据库D中具有大小为c的可信度,如果D中支持物品集X的事务中有c%的事务同时也支持物品集Y,即confidence(X→Y)=P(Y|X)。

从语义的角度来分析,规则的可信度表示这条规则的正确程度;支持度表示用这条规则可以推出百分之几的目标,即这一规则对于整体数据的重要程度。用户可以定义二个阈值,要求数据挖掘系统所生成的规则的支持度和可信度都不小于给定的阈值。这样,就用蕴含式、支持度和可信度唯一标识了每一个挖掘出来的关联规则。

已知事物数据库D,关联规则的挖掘问题就是产生支持度与置信度分别大于用户给定的最小阈值的所有关联规则。该问题分两步来求解:第一步是找出事务数据库D中所有满足条件的具有用户指定最小支持度的项目集。具有最小支持度的项目集称为频繁项集。第二步是从频繁项集中构造可信度不低于用户要求的规则。形式地,对于每一个频繁项目集A,找出A的所有非空子集a,如果比率support(A)/support(a)≥min_conf 2(可信度),就生成关联规则a→(A-a)。

识别或发现所有的频繁项集是关联规则挖掘算法的核心,也是计算量最大的部分。目前已有不少挖掘频繁项集的方法,其中最著名的是R.Agrawal和R.Srikant提出的Apriori算法[11],其核心是利用这样一个性质:频繁项集的所有非空子集都是频繁的。基于这样的先验知识,Apriori使用一种“逐层搜索“的迭代方法,k-项集用于探索(k+1)项集。首先找出频繁1-项集,记作L1;用L1找频繁2-项集L2;而L2用于找L3,如此下去,直到不能找到频繁k-项集。

虽然Apriori算法能最终挖掘出所有的关联规则,但由于处理的数据量非常大,因而算法的效率显得十分重要。后来的一些研究人员对算法的连接和剪枝过程进行各种优化。

如[12]提出了称为AprioriTid的改进算法,该算法提出了在每一步(第一步除外)计算候选频繁项集的支持度时不需要浏览整个事务数据库。它认为不包含任何k-项集的事务不可能包含任何k+1项集,这样,这种事务在其后的考虑时,可以加上标记或删除,因为为产生j-项集(j>k),扫描数据库时不再需要它们。该算法的本质是压缩进一步迭代扫描的事务数。

而[13]提出的AprioriPro算法,其基本思想与AprioriTid是一致的,也是减少对数据集的扫描,不同的是AprioriPro算法是通过在原有的数据集上增加一个属性,通过这个属性的取值来减少对某些事务的扫描。

[14]是结合Apriori和AprioriTid两种算法,提出了一种混合挖掘算法AprioriHybrid,其基本思想是在扫描的早期使用Apriori算法,当候选模式集中记录条数小到可以放进内存时就转向AprioriTid算法。

这些改进算法虽然比Apriori算法在挖掘效率上有一些提高,但本质上没有什么区别,都要在挖掘过程中生成大量的候选模式集。

“有没有这样的算法,挖掘全部的频繁项集而不产生候选?” 1999年Han等人提出FP-Growth算法[15],以及 Agrawal等人提出的树-投影(Tree Project)[16]关联规则挖掘算法就是这样的算法,它们在性能上均获得了突破,与Apriori算法相比,挖掘效率有了数量级的提高。利用FP-Tree 可以压缩事务数据集,压缩有的达到100多倍;而树-投影方法从原理上讲是适应任何数据集的,无论其据量多大该算法都能有效运行,从而使得关联规则挖掘可以应用于海量数据的挖掘和稠密数据集的挖掘。

除了上述关联规则挖掘的经典算法之外,人们着重在以下几个方面对关联规则进行了研究。

(1)继续通过各种手段提高挖掘效率。这方面包括对原有算法的进一步改进[17,18];提出一些并行挖掘算法[19,20]、增量算法[21]以及带约束的关联规则挖掘策略(元规则制导关联规则挖掘)[22,23]。

(2)不同形式关联规则的研究。关联规则最早是由购物篮分析开始的,但是随着研究的扩展和深入,关联规则的应用范围不断扩大,因此出现了多种形式关联规则的研究。由最简单的单维、单层、布尔关联规则逐渐向复杂形式扩展。在基本关联规则的基础上提出了布尔型加权关联规则和广义模糊型加权关联规则算法[24],由单层的关联规则扩展为多层次关联规则的研究[25]等等。关联规则形式的多样化,反映了人们从不同角度认识同一事物的不同视点,加深了对关联规则的认识与研究。

(3)结合其它理论(如软计算理论)对关联规则进行研究。引入粗糙集概念,使关联规则发现的模式具有较高的解释能力和精确度[26];通过引入神经网络的概念,提出用相互激活与竞争网络来进行数据库中的关联规则的发现[27];还有基于遗传算法的多维关联规则挖掘[28]等。可以看出通过引入其他领域的先进理论,丰富了关联规则研究的内容,提高了算法的有效性。

(4)关联规则的价值评判标准研究。如[29]分别讨论了关联规则的客观评价指标(支持度、可信度和相关强度)和主观评价指标(新颖性、用户感兴趣性和简洁性),在此基础上给出了一种关联规则的综合自动评价方法。

(5)关联规则的应用研究。理论从实践中来,但最终是为了指导实践。关联规则自提出以来,经过无数学者的研究努力,广泛应用于社会生产和科研的各个方面,产生了巨大的效益[30,31,32,33]。(2)序列模式挖掘

序列模式(Sequential Pattern)挖掘最早也是由R.Agrawal首先提出来的[34]。设有一个交易数据库D,每个顾客可在不同时间购买不同物品,每次购买活动称为交易(Transaction)。这里,顾客、交易时间和 3 所购物品分别以Customer_ID、Transaction_Time和Itemset标识。如果以Customer_ID为第一关键字,Transaction_Time为第二关键字对数据库D排序,那么,对每一顾客而言,他进行的所有交易是以交易时间的升序排列的,从而构成一个序列,称这种序列为顾客序列CS(Customer Sequence)。一般地,令某顾客的各次交易时间为t1,t2,t3,„,tn,该顾客在交易时间ti购买的物品集记为itemset(i),于是该顾客的CS序列为itemset(t1), itemset(t2), itemset(t3),„, itemset(tn)。相应地,可以认为上述交易数据库D已转换为顾客序列数据库。如果某序列s包含在某顾客的CS序列中,那么称该顾客支持(Support)该序列s。某序列的支持度为支持该序列的顾客数与顾客序列数据库中顾客总数之比。序列模式就是在上述顾客序列数据库中满足用户指定最小支持度的最长序列。

序列模式的问题定义与关联规则很相似,它们之间的区别可以用下列例子描述,关联规则描述的是在一次购物中所购买物品之间的关联关系,而序贯模式则是描述同一顾客在不同次购物所购物品之间可能存在的某种关联关系。换句话说,关联规则仅仅发现事务内部(intra-transaction)的模式,而序列模式则是发现事务之间(inter-transaction)的模式。

序列模式的发现方法与关联规则的发现方法大致相同,R.Agrawal在Apriori算法的基础上提出了三个 序列模式的挖掘算法AprioriAll、AprioriSome和DynamicSome[34]。AprioriAll算法采用哈希树储存候选序列,将所有的候选序列均储存在哈希树的叶子节点中;将候选序列的记数划分为向前及向后两阶段:向前阶段跳跃性地产生所有特定长度的频繁序列,而向后阶段找出在向前阶段未考虑的频繁序列。

在[35][36]中提出了挖掘具有概念分层、滑动时间窗口及最大和最小时间约束的 GSP(Generalized Sequential Patterns)算法。该算法也采用哈希树存储候选序列,仍将候选序列的记数分为向前及向后阶段,但此法划分向前阶段与向后阶段的目的与实现均与 AprioriAll 算法不同。

PSP(Perfectly Sequential Patterns)算法在[37]中提出,该算法采用了前缀树结构(而非哈希树)存储候选序列,从而导致该算法的候选序列集的产生和记数均不同与GSP算法; 同时,由于前缀树的每个节点只 存储事务中的一项,故与哈希树结构相比较大的节省了内存空间。(3)软计算方法

软计算(Soft Computing)是方法论的集合,这些方法集互相协作,并以一种形式或其它某种形式为现实中的模糊情况提供灵活信息处理功能[38]。它的目的是为了获得易处理的、粗糙的、低成本的解决方法而对不确定的数据进行处理。遵从的原则是以追求近似解决模糊/精确问题,并低成本地设计解决方案。软计算方法主要包括模糊逻辑、Rough集、遗传算法、神经网络等。模糊逻辑是处理不确定性概念及其推理机制的过程,Rough集和神经网络常被用来分类和规则抽取,遗传算法包括最优解和搜索过程,像问题最优解和样本选择。针对时间序列挖掘,软计算方法的应用研究简要介绍如下:

模糊逻辑是最早、应用最广泛的软计算方法,模糊逻辑的发展导致了软计算方法的出现。[39]在挖掘时间序列数据时使用了模糊语言概化;[40]针对商业销售的智能分析需求,提出了一种基于模糊集合的数据挖掘时间序列模式算法。

神经网络是一个黑箱问题,它先前被认为不适合应用于数据挖掘,且在符号格式中,它并不能获得有用信息,但却适合进行解释。近年来,挖掘训练过的网络中的嵌入知识,已广泛地应用于数据挖掘中。它对属性或逐个或合并地进行判别,这对于决策或分类是非常重要的。它对数据挖掘的贡献是在规则提取和自组织性上。

遗传算法是可调节的、鲁棒的、有效率的搜索方法,它适应于搜索大空间集。它相对数据挖掘的标准来优化功能,并达到搜索最优解的目的。[41]提出了一个基于小生境遗传算法和模式缓存的时间序列中频繁结构模式的发现算法,该算法具有轻便、灵活、可扩展性好的特点,可根据实际情况合理配置计算时间和所占用的内存资源,可实现挖掘结果的实时动态更新输出,并通过在在实际时间序列数据上的实验证明了该算法的有效性。

Rough集理论由波兰逻辑学家Pawlak教授在20世纪80年代提出,是一种处理含糊和不确定问题的新型数学工具,其出发点是根据目前已有的对给定问题的知识将问题的论域进行划分,然后对划分的每一部分确定其对某一概念的支持程度:即肯定支持此概念,肯定不支持此概念和可能支持此概念,并分别用三个近似 4 集合来表示为正域、负域和边界。它能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识和潜在的规律。同时,Rough集理论在处理大数据量,消除冗余信息等方面有着良好的效果,因此广泛应用于数据挖掘的数据预处理(数据约简)、规则生成等方面[42,43]。2股票时间序列挖掘

股票市场高风险和高收益并存,因此对于股票数据知识发现的研究一直受到人们的关注。目前对股票时间序列的数据挖掘方法大致集中在以下三个方面。(1)相似性的研究。

该方法是在时间序列数据库中找出与给定查询序列最接近的数据序列,它包含了全序列匹配和子序列匹配两种问题。子序列匹配就是找出与给定模式序列相似的所有子序列,而全序列匹配就是找出彼此间相似的序列。具体的操作时将时间窗口在时间序列上滑动,通过距离计算从一个时间序列和多个时间序列中寻找相似的时间序列模式进行聚类形成相似组群,当有一个新的时间序列需要分析时,可以从相似组群中寻找与它最相似的类来匹配。一般有两个研究方向,一种是将时间序列从时间域(time domain)到频率域(frequency domain)后在进行相似性匹配。至于为什么要进行这种数据变换,主要是基于许多信号分析技术(如离散傅立叶变换DFT和离散小波变换DWT)需要数据来自频率域[2]。另一种则是直接在时间域上研究。主要应用是从股票数据中识别具有相似变化趋势的模式,以预测新数据在未来的发展行为。在时间序列相似性方面的研究文献有[44,45,46,47]。(2)趋势分析与值预测研究。

趋势分析研究时间序列的变化趋势,其理论基础是将时间序列视为一个动力系统,认为在其过去的波动中蕴涵有可用于预测未来的信息。给定一组值(Y1,Y2,Y3,„),确定数据趋势的方法通常有两种[2]:一种是N阶的移动平均值,即(i1Yi)/n,(i2Yi)/n,(i3Yi)/n,„。移动平均可以降低数据集中的变化

d,其中偏差或误差di是指点(xi,yi)i1in2nn1n2总量,用移动平均替代时序,可以减少不希望出现的波动,故它也称为时序的平滑。另一种是最小二乘法,即以最好的拟合曲线C作为最小二乘曲线,即曲线具有最小的的值yi与对应曲线C的值之间的差值。

趋势分析可以用来值预测,除此之外,用得较多的是神经网络[48,49]。这种预测方法由于是基于时间序列的具体数值,而这些数据往往含有许多干扰数据,因此该值预测方法的抗干扰能力较弱。(3)时间序列中关联规则的抽取。

Gautam Das等对从时间序列中发现关联规则进行了研究[50],这里规则是对时间序列中不同模式间关系的一种描述,[50]的主要贡献在于给出了一个将原始时间序列转换成有各个模式表示符组成的符号序列的一般方案,该方案由三部分组成,即分割,聚类和符号替换。然后采用序列模式发现算法实现了符号序列中规则的发现。

针对股票时间序列的特殊性,许多学者在经典关联规则挖掘算法的基础上,又提出了许多新的算法。1996年R.Strikant给出了关系数据库中数量关联规则的挖掘算法[51];1998年H.Lu对股票变动的预测以及内联相关性分析进行了研究[52];1999年M.Garofalakis提出了具有约束限制的时序数据挖掘[53];2002年 Y.Chen对时序数据库的多维回归分析进行了研究[54]。国内学者在这方面也做了相当的研究,[55]对股票时间序列的挖掘,分别探讨了一维和二维关联规则的发现;[56]通过一个具体的实例描述了从股票时间序列中挖掘一维关联规则的方法;[57]提出了延迟关联规则的概念,并在股票时间序列上实现挖掘该规则的算法;[58]在时间序列中引入多重时间粒度,以模糊规则的形式给出数据挖掘的结果。

Rough集理论在数据挖掘领域的应用主要体现在数据约简和关联规则的抽取上,这方面的研究已经有了少量的文献。[59]提出的一种基于Rough集的时间序列数据挖掘策略,显然适用于股票时间序列的挖掘;[60]则提出将正则化神经网络与Rough集理论相结合应用于股票时间序列数据库的挖掘。该方法融合了正则神经网络优良的泛化性能和Rough集理论的规则生成能力,充分展示了软计算方法应用于时间序列数据分析的新颖性。

四.总结与展望

从大的方面来说,时间序列数据的挖掘技术可分为统计分析法和数据挖掘。众所周知,统计学是数据挖掘的三大支柱之一(另两种是数据库和人工智能);同时,数据挖掘在统计学的基础上另有扩充和发展,这使得数据挖掘技术成为一种更具优势性的研究方法。统计学为问题的探索解决方案提供了有用而实际的框架;模型是现代统计学的核心,模型的选择和计算往往被认为是次要的,是建立模型的枝节。统计学本质上是从事“确定性”分析的,可以说统计方法是“目标驱动”的。但数据挖掘却不同,它的核心是算法,当然也考虑模型和可解释性问题,但算法及可实现性是第一位的。它所强调的首先是发现,其次才是解释。数据挖掘,作为很多学科交叉的结果,继承了机器学习的“冒险”态度,比统计学更强调实践性、探索性和灵活性。

证券市场是国民经济的晴雨表,是政府主管部门、券商和广大投资者的兴趣中心。长期以来各券商的交易系统一直走在IT技术应用革新的前沿,同时也积累了大量的数据;挖掘、开发和利用这些数据一方面可以有效指导证券投资者的投资,另一方面可以使证券公司进行最适合的定位,从而使企业长期的积累得以充分发挥,树立竞争优势。作为数据挖掘的主要组成部分之一,关联规则挖掘获得了广泛的研究,但从关联规则的角度进行股票时间序列分析,从学术上来说具有一定的新颖性,其终极目标是以极大的概率预测股价的未来走势。股票的涨跌不是各自互不影响的,传统意义上的“板块联动”就是极好的证明。考察股票价格之间的涨跌关系,如能在传统分析方法的基础上,采用先进的数据挖掘技术,挖掘出股票之间的价格联动关联规则,显然具有十分重要的意义。

Rough集理论是一种处理含糊和不精确性问题的新型数学工具,是采用精确的数学方法分析不精确系统的一种理想方法。大量文献已经说明Rough集理论是从数据集中提取关联规则的有效方法,其中主要的原因应归功于Rough集理论强大的数据约简能力。应用Rough集理论对股票时间序列数据进行建模、约简、规则抽取,显然又是一个极具新颖和创新的研究领域。

参考文献

[1] 安鸿志,陈兆国,杜金观,潘一民.时间序列的分析与应用.科学出版社 1983.[2] Jiawei Han,Micheline Kamber.数据挖掘: 概念与技术.北京:机械工业出版社2001.3~6、278~285.[3] 贝政新,陈瑛.证券投资通论.上海:复旦大学出版社,1998.[4] 安妮.股票投资技术方法与应用.深圳:海天出版社,1995.[5] 王耀动,张德远,张海雄.经济时间序列分析.上海财经大学出版社 1996.[6] 李民,邵建中,李俊平等.用ARMA模型预测深沪股市.长沙铁道学院学报,2002,18(1):78~84.[7] 李爱国,覃征.滑动窗口二次自回归模型预测非线性时间序列.计算机学报,第27卷,第7期2004年7月.[8] 孙宏义,朱梅.混沌时间序列预测及在股票市场中的应用.安徽工程科技学院学报,第18卷,第4期2003年12月.[9] 李菁菁,邵培基,黄亦潇.数据挖掘在中国的现状和发展研究.管理工程学报 2004年第3期.[10] R.Agrawal, T.Imielinski, A.Swami.Mining Association Rules Between Sets of Items in Large Databases[C].Proceedings of ACM SIGMOD Int’1 Conf.Management of Data, Washington D.C., 1993.207~216.[11] R.Agrawal, R.Srikant.Fast Algorithms for Mining Association Rules[J].VLDB94, Santiago, Chile,1994:478~499.[12] Mannila H, Toivonen, Inkeri Verkamo A.Efficient algorithms for discovery association rules.In Proceedings of AAAI Workshop on Knowledge Discovery in database.July 1994.181~192.[13] Hannu Toivonen, Mika Klemettinen, Pirjo Ronkaine etal.Pruning and grouping discovered association rules.In Mlnet workshop on Statistics, Maching Learning and Discovery in Database.Heraklion, Rete.April 1995.[14] Agrawal R, Srikant R.Fast Discovery of Association Rules.In Fayyad.Ⅱ 1996.[15] J.Han, J.Pei.Mining Frequent Patterns Without Candidate Generation.In Proc.2000 ACM-SIGMOD Intl.Conf.on Management of Data(SIGMOD’2000)Dallas TX 2000,1~12.[16] R.Agarwal, C.Aggarwal, V.Prasad.A Tree Projection Algorithm for Generation of Frequent Itemsets.Journal of Parallel and Distributed Computing Special Issue on High Performance Data Mining 2001,350-371.[17] 倪旻,徐晓飞,邓胜春,赵政.基于频繁项目对支持矩阵的Apriori优化算法.小型微型计算机系统.Vol.25 No.5, May 2004.[18] 邓砚谷,王丽珍.对FP-Tree头表节点数据结构的改进.计算机工程与应用.2004,25.[19] R.Agrawal, J.Shafer.Parallel Mining of Association Rules.IEEE Trans.On Knowledge and Data Engineer 1996,962~969.[20] 张兆功,李建中,张艳秋.海量数据上挖掘关联规则的并行算法.哈尔滨工业大学学报,2004年05期.[21] 朱红蕾,李明.一种高效维护关联规则的增量算法.计算机应用研究,2004年09期.[22] M.Kamber, J.Han, J.Y.Chiang.Metarule-Guided Mining of Multi-Demensional Association Rules Using Data Cubes In Proc.1997 Intl.Conf.Knowledge Discovery and Data Minin KDD’1997

Newport Beach CA.1997,207-210.[23] 程继华,郭建生,施鹏飞.元规则指导的知识发现方法研究.计算机工程与应用,1999年第10期.[24] 陆建江.数据库中布尔型及广义模糊型加权关联规则的挖掘[J].系统工程理论与实践,2002,2:28~32.[25] 程继华,施鹏飞.多层次关联规则的有效挖掘算法[J].软件学报,1998,9(12):937~941.[26] 程 岩,黄梯云.粗糙集中定量关联规则的发现及其规则约简的方法研究[J].管理工程学报,2001,15(3):73~77.[27] 倪志伟,蔡庆生,方瑾.用神经网络来挖掘数据库中的关联规则[J].系统仿真学报,2000,12(6):685~687.[28] 高坚.基于免疫遗传算法的多维关联规则挖掘.计算机工程与应用.2003年32期.[29] 苏占东,游福成,杨炳儒.关联规则的综合评价方法研究与实例验证计算机应用.2004年10期.[30] 李虹,蔡之华.关联规则在医疗数据分析中的应用.微机发展.2003年06期.[31] 胥桂仙,高旭,于绍娜.关联规则算法在中文文本挖掘中的应用研究.中央民族大学学报(自然科学版).2004年04期.[32] 姜南,唐晓青.应用关联规则构建质量活动链模型.北京航空航天大学学报,2004年05期.[33] 普杰信,薛冰冰.加权关联规则在网络入侵检测系统中的应用.信息技术.2004年04期.[34] Agrawal R, Srikant R.Mining Sequential Patterns.In Proc.95 Int’1 Conf Data Engineering, Taibei,Taiwan.March,5,1995.[35] Tamakrishnan Srikant, Rakesh Agrawal.Mining Sequential Patterns: Generalizations and 7

上一篇:思品教学反思案例下一篇:涉农收费文件