外文文献翻译软件测试

2024-08-13

外文文献翻译软件测试(共5篇)

1.外文文献翻译软件测试 篇一

三连杆铰接式机器手臂的设计控制和实施

毕业论文 提交

阿克伦大学研究生学院

申请学位 理学硕士

Donald R.Dentler II

2008.8月

摘要

在自动进行的最重复的和最复杂的任务范围和生产环境中,机器人已成为司空见惯的了。随着技术的进步,机器人技术的发展,需要更精确和实用。本研究的目的是通过使用三杆铰接式机器手臂来研究机器人系统的行为。在深入介绍各种包括执行器,控制器和驱动程序后。机械手臂设计将遵循物理定理满足静态和动态需求。设计过程包括两个检查结构的要求和控件实现。组件选择必须优化性能和物理性能设计。通过使用机器人手臂和模拟运动的程序,协调解决出现的关于前进后退的(动力)传输问题。

第一章

简介

机器人已经成为平常在生产环境中,使得从重复性最高的任务到最复杂的实现自动化。随着科技的发展,机器人需要发展成更精确和实用。这项研究的目的有两个。第一,此文本应作为机器人和用于控制的机器人系统的力学的概述。第二,本文介绍的机器人技术原则和一般在设计中所涉及的工程知识应用和操作的机器人手臂类似。第二章概述的机器人系统的元素。详细地介绍了执行器、控制器和驱动电路,以及计算机接口。更详细的是联系这些组件于一体的物理准则。

第二章

机器人系统概述

通常,机器人用于执行困难、危险或对人类来说单调的作业。他们举起重物、油漆、焊接、处理化学品,其长时间执行工作而不会疲劳。机器人由各自的运动性质所决定。本节介绍机器人有以下的分类: • 笛卡尔

• 圆柱

• 极地

• 铰接式

笛卡儿机器人

笛卡尔或龙门机器人由三棱柱形接头(图 1)受限制的运动来定义。由矩形造成的重合的轴定义工作区 圆柱机器人:

如果直角坐标机器人的棱柱形接头之一交换的关节型,形成了一个圆柱的机器人。圆柱机器人的运动是由圆柱的坐标系定义的。图 2 说明了带壳圆柱工作区

旋转接头球机器人:

两棱柱形节点形式球形机器人。球形、或极性,机器人是其轴构成极坐标系统的设备。这个机器人手臂工程工作在带壳球区中,图 3 所示。

铰接式机器人:

代以关节型最终棱柱形接头变成机械臂的手臂。任何其手臂已至少三个旋转接头的机器人被认为是一种铰接式的机器人(图 4)。工作区是一套复杂的交叉领域。

在机器人领域的最常用作动器的电动马达,其分为步进或伺服的类型。步进电机开环系统中的最佳表现和伺服电动机非常适合封闭的环的应用程序。将随开放和封闭环路系统详细讨论这些两个具体的执行机构。

步进电机步:

步进电机是简单的机械,相比其他电机在内部没有复杂设计。电枢转动是通过按顺序切换磁场中实现的。步进电机的类型,基于永久磁铁和/或铁转子的使用与叠层钢定子的不同可以分为三个类别:

• 永磁

• 变磁阻

• 混合。电机绕组:

混合步进电机定子,可以以两种方式,unifilar 和双线绕组。线圈影响当前电流如何流经电机,和马达又如何执行。

Unifilar绕组:

Unifilar 有只有一个定子磁极线圈。图10阐释了典型的 unifilar 电机的接线原理图: 双线绕组:

双线绕组电动机有两个一模一样的绕组对每个定子极点来说。图 11 演示了这两个 6 和 8 铅配线图。

步进电机可能会加强取决于如何以及何时定子电压式三种方式之一。步进模式有:

• 全步模式

• 半步模式

• 斯达微步模式

驱动程序功能确定哪些步进模式是用户可用的。完整步进:

标准混合步进电动机有 200 转子牙齿或 200 每电机轴的革命的全部步骤。200 的步骤分为 360 度旋转,等于 1.8º 全步的角度。通常情况下,完整步骤模式被通过交替倒车当前时断电两个线圈。本质上,从驱动程序的一个数字输入是等效的一步。半步进:

进半步只是意味着一电机的 200 牙齿旋转在革命每 400 步骤。在此模式中,一个线圈通电,然后两个线圈激发交替,导致在半的距离或 0.9º 旋转转子。半步进是更实际的解决办法不过,在工业应用中。尽管它提供了稍差一些的扭矩(约 70%的电机额定的控股扭矩),半步模式增加全步模式的决议,并增加位置精度。扭矩减少可以通过相应地调整大小马达来抵销该应用程序。

微步:

细分是相对较新的步进电机技术,用于控制当前在电机绕组进一步细分的两极之间的职位数目的程度。目前,斯达微步驱动程序都可以旋转,1/256 的一步(每步)或超过 50,000 每革命的步骤。这提供电机手术非常顺利,为减少机械噪声和系统共振。这种增强的性能与权衡下跌电机扭矩。图 12 海图的扭矩减少单步是划分。每步电机 256 步骤只生产 0.61%的全部持有扭矩。在某些情况下,这不可能甚至是足够的扭矩,旋转的轴,这将影响电机的准确性。

伺服电动机:

“伺服电机”一词没有指向一个单一种电动机。相反,它是指任何类型的命令信号接收从控制器的电机。在这同一方面,任何闭环系统可以被称为伺服系统。图 13 关系图一种典型的伺服系统的运作。

这种灵活性允许的几种适合类型的电动马达在伺服系统中使用。这些电动马达包括:

• 永磁直流电动机

• 无刷直流电机

• 异步交流电机

电磁电机运行基于原则上带电导体在磁场中的磁场力是垂直于该字段。这是由定义:

F =qv *B

(1)

其中:

• F 是描述磁力

• q 的向量是电荷

• v 的严重程度是带电粒子速度

• B 的矢量幅度是描述磁场的矢量

不过,电动马达的情况下,可作为标量量化力:

F = I * L * B

(2)其中:

• F 是线圈的磁力

• i是线圈中的电流 • L是线圈的长度 • B是磁场强度

永磁直流电动机: 直流永磁电机基于永磁步进电机,一个类似的概念,但它是机械逆。PM 步进依赖固定线圈和附加到转子动产的磁铁,直流永磁电机却平稳的电磁铁。线圈缠在转子和换向器,这可以切换当前的方向,并导致电机顺时针旋转或逆时针方向通过电刷耦合(图 14)。因为当电流在时,电机轴将可以自由旋转,编码器必须用于向控制器提供反馈。直流永磁电机较为常见,但是很多的马达问题与相关的电刷和通勤之间的接口,可以是成本效益。这两个组件之间的接触导致摩擦,并可以打乱了较高的速度。无刷直流电机解决了这些问题。

无刷直流电动机 [17] : 一个无刷直流电机换向器替换电子控制器的电刷。此控制器保持固定线圈中适当的电流。图 15 显示基本图的无刷直流电机。

应当指出的是无刷直流电机的内部布局看上去非常类似于永磁步进,然而依赖反馈装置如霍尔效应来跟踪的转子位置传感器直流无刷电机。这提供了精确的速度控制。无刷直流电机有更高得初始成本比传统的直流电机,但这些费用通常由提高了性能和消除的替换电刷所需的维修费用。

电机驱动电路:

通常诱使电机旋转的必要扭矩产生的控制电路的电流不足够高。为此,受雇驱动电路。他们管理由电动机电流较高和数字控制信号从控制器转换由电动机的运动。驱动程序还管理的电流产生顺时针或逆时针旋转运动的方向。步进电机驱动程序的类型

一般,有三种基本类型的步进驱动程序技术,它们是:

• 单极

• 电阻/有限驱动器电阻

• 双极斩波

所有驱动程序利用“翻译”的步骤和方向的信号从索引器转换到电动机的电脉冲。“交换机设置”或瘳电机绕组的电路的驱动程序选项的本质区别。图 21 显示从控制器步进电机的信息的流动。

单极驱动器 :

一个单极驱动器由与中心抽头绕组的或两个单独的绕组每相,这限制了当前指向一个方向流动。将反向,从一个移动当前使用每个相位,两个交换机,如图 22 所示的另一半绕组的一半。因此,单极的交换机集是驱动器的简单又便宜。然而,单极驱动器利用只有一半可用导电线上的卷清。因此,单极的驱动程序的输出扭矩被减少了将近40%相比其他技术。单极的驱动程序的速度相对较低的一步操作的应用程序中有用。

电阻/有限驱动器电阻:

有限(R/L)驱动程序简单又便宜。驱动程序限制供电电压和绕组的电阻电流。通过增加供电电压的高速性能得到改进。此增加的供应电压 R/L 驱动器中必须附有额外的电阻器的限制(图 23)上一级电流线圈系列。此称为滴的电阻器的电阻被添加到保持有用的速度在增加。这种方法的缺点是滴电阻器的功率损失。此过程还会产生过多的热量,必须依靠其当前的源的直流电源。双极斩波两极斩波器:

到目前为止,双极斩波两极斩波器驱动程序用于工业应用最广泛使用的驱动程序。虽然他们通常设计更昂贵,但他们提供高性能和高效率。此驱动程序采用了两种不同的原则,来控制在电机绕组的当前流: 双极开关集和截流。本节解释了这两个。双极性的驱动,顾名思义,切换当前方向上单绕组转移跨终端的电压极性。极性开关来实现使用四个交换机配置如图 24 所示。此配置称为 H 桥。

斩波器驱动程序背后的方法是马达的使用是马达的导致显著增加,在当前的标称电压比高出数倍的供电电压。通过控制工作周期的菜刀,创建了平均电压和平均当前平等名义电机电压和电流。此恒流控制的优势是,具有较大的扭矩,无论电源供电电压变动的管理。它还提供了最短可能当前集结和逆转的时间。

此外,这些驱动程序使用与循环二极管和维护反馈电压成正比电机当前的感应电阻器的 H 桥的四个晶体管。电机绕组,使用双极斩波器驱动程序,都要充分供应水平受到打开开关晶体管的一套。感应电阻发展线性上升,直至达到所需的级别比较器由监察的电流与电压。此时的顶尖的开关打开并通过底部的开关和二极管维护电机线圈中的电流。电流衰减发生直到达到预设的位置并重新开始这一进程。这种“劈”效果是供应的什么维护正确的当前电压电机在所有时间(图 25)。

图 26 所示 H 桥配置为恒定电流斩波。取决于如何在关闭期间切换 H 桥,当前要么通过一个晶体管和一个二极管(路径 2)重新分发,给当前的慢衰减,或通过电源(路径 3)重新分发。

伺服电动机[6]:

使用电子脉冲控制伺服驱动程序。通常情况下,使用规管脉冲晶体管。有三个基本的晶体管电路用于伺服电机控制 ;线性脉冲,脉冲宽度调制和脉冲调制频率。线性驱动程序:

线性驱动程序运行使用晶体管,但在规管的供电量始终处于活动状态。晶体管作为一个阀,基于输入电压,它从连接的电压源绘制的当前。以这种方式,控制器作为一个水龙头。例如,如果晶体管收到全系列输入电压的一半,然后电机运行在半电源。线性驱动器提供一个稳定的电机转速和控制。脉冲宽度调制驱动程序:

脉宽调制驱动程序通过调整不同的时间周期,它适用于电机调节电源。这种方式,平均功率控制通过脉冲的工作周期。如果脉冲宽(亦即,电源周期)发送到的平均功率电机是高导致其转得更快,等等。图 27 所示脉冲宽度是如何确定的平均电压。这种方法的优点是因为全额功率消耗的晶体管它始终是处于完全在低电压下或短路状态。需要更少的电力意味着晶体管可以小一些,导致可使用较小包装的驱动程序。脉冲频率调制驱动程序:

能控制的不是同脉冲的工作周期,而不是本身的脉冲宽度。这种技术被称为脉冲频率调制。PFM 驱动程序运行在给定的时间段生成高的平均电压和许多生成低的平均电压脉冲应用到几个脉冲。图 28 演示脉冲频率调制的概念。随着 PWM,晶体管要么是完全打开或关闭。由于对调制脉冲频率所需的系统比较复杂,脉冲频率调制的驱动程序并不常用。

计算机接口: 通常情况下,设机器人控制器的计算机。计算机可以翻译数据脉冲马达驱动程序所处理的程序的命令。本节概述了其中一个最常见的接口、并行端口和如何跨它传输数据的详细信息。

并行端口 [7] [8]:

当 PC 将数据发送到打印机或其他使用并行端口的设备时,它可以同时发送数据(1 字节)的 8 位。这些 8 位在相互平行被传输,相对于同一八位正在传输顺序进行,一次通过串行端口 1 位。标准的并行端口是能够发送的数据,每秒 50 到 100 kb 为单位。图 29 显示的常见的配置并行端口,有 25 针的 DB25 的布局。以下是针脚的说明: • 针 1 — — 维护 2.8 和 5 伏特,称为闪光信号之间的电压。数据发送到打印机时,电压低于 0.5 伏计算机发送一个字节的数据。

• 针脚 2 — —9 通过使用 PC 和接收实体之间交换数据。一种简单方法,用于指示是否有点的值为 1 或 0。每次电平5 伏通过发送特定的针的位值为 1。电平指示值为 0。• 针 10 — — 在针 1 相似的方式运行。电压降指示到确认收到数据的计算机。这被称为确认信号。·

• 11 — — 通常用作打印机忙的信号时被控销。在打印机准备好接收更多的数据时,电压低于 0.5 伏。

• 针 12 — — 一个被控在打印机缺纸时的 5 伏信号。

• 针 13 — — 打印机联机信号。不断的反应,表明打印机是积极和准备好接收信息。• 针 14 — — 自动喂给移动通过系统纸打印机的信号。

• 针 15 — — 错误信号,让计算机知道是否有任何问题。它表示错误使用低于 0.5 伏,类似于其他的针脚,电压降。

• 针 16 — — 低于 0.5 伏的电压降初始化打印机.• 针 17 — — 正在充电会使打印机脱机。直到宜使打印机联机.• 针脚 18-25 — — 这些都是要用作低(低于 0.5 伏)电平的参考信号的地面针脚。十六进制转换:

当从一个端口写入或读取,整个字节(8 位)的状态将定义一次。当更新的状态时,二进制数是写入(或从读取)的端口 1 或 0 的每一位。例如,如果要将移动到逻辑状态 1 2 和 7 针的二进制的输入应 0,0,1,0,0,0,0,1。为加快编程,以其十进制等效,33 输入此号码(表 2 显示公约)将转换为二进制与十进制数字十六进制。虽然表在这里被截断,点票可以轻松地继续达 255(最多可以写入一个字节)使用此方法。例如,十进制的规模 16 对应于 10000 的二进制的规模。此外,应该指出的是添加前导零为二进制数不会增加其十进制值。换句话说,如果逻辑状态设置为 1针上 2 和其他的针脚上 0 二进制输入将 00000001,但它仍会输入 1 作为十进制格式。

第三章

机器人臂的设计

本节讨论具体的假设和有关为这项研究的目的建造的机械臂设计参数。

速度:

一个三角形速度配置文件被假定为这项研究。加速和减速都被假定为 5 秒。峰值 ω 和峰值 α 分别为峰值角速度和加速,并定义:

peak ω= 0.3142 peak ω rad/s α= 0.0628 peak α rad/s2 peak 运动学设计:

机器人由3个 完全旋转接头构成。其自由度是3。控制:

使用此设计的控制器三轴,开放环阻力有限(R/L)型控制器。

执行器:

步进电机被选为这个机器人手臂的驱动器。

材料:

6061 T6 铝用于这个机器人手臂和加工性能组件的大多数。321 不锈钢建造底座部分。

机械手臂设计:

专为这篇论文使用在南汽软件建模设计的 3 连杆链接的机器人手臂的装配图。图 37 显示装配图,而图 38 给组件的分解视图。

机器人工作区:

工作区是通过图41和39 定义的。深度是 4.5 英寸、高度是 15.0 英寸和总共(链接 0)旋转角度是 90 °,由 [0,90] 的范围定义(图 40)。链接 1 允许具有一系列变化范围 [-40,70](图 41(a)),共有 110 ° 和链接的旋转 2 允许的范围 [-80,90](图 41(b)),总的 170 ° 旋转。

翻译:王雷

班级:机自0804

时间:2012/3/20

*以上即为对此文献对应的翻译,其中图片只在原文(英文)文献中标出。

2.外文文献翻译软件测试 篇二

关键词:知识组织体系 叙词表 本体

中图分类号: G254.0 文献标识码: A 文章编号: 1003-6938(2013)01-0002-06

1 导论

信息过载是网络时代面临的一个重要问题。近些年来西方发达国家、组织、企业(如欧盟、美国医学图书馆、联合国粮农组织等)纷纷开展信息组织开放应用的研发项目,来推动信息建设基础平台的创新性实践和技术改善,如美国医学图书馆建设的统一医学语言系统(Unified Medical Language System,UMLS),谷歌收购了语义搜索公司Metaweb,采用其主打产品Freebase——大规模的开放结构化信息数据库,来推出知识地图服务。我国在“十一五”期间,在国家层面推进了1.7万台大型科学仪器设备(单台套原值50万元以上)、105个野外科学观测研究台站,135万份自然资源实物、970万号标本、4000余种标准物质,22万种科技图书、6万种科技期刊、138万余条标准和技术法规、41万项科技成果信息,以及160TB的科学数据等大量科技资源的整合、开放与共享[1]。

面对海量的信息,如何从传统图书馆基于文献知识组织方法,向适应计算机海量信息处理基于概念单元或知识单元方向发展,如何从资源链接的整合,向提供深入知识内容的整合,成为了我国在“十二五”期间信息资源建设的一项重要任务。因此由国家科技文献信息中心牵头,组织实施了国家科技支撑计划“面向外文科技文献信息的知识组织体系建设和示范应用”项目,来构建我国面向外文科技文献的知识组织体系,以支持信息揭示、组织和发现。本文通过知识组织建设模式的现状分析,论述面向外文科技文献信息的知识组织体系建设的目标和主要内容,并对信息组织基础设施建设中存在的难点进行探讨。

2 知识组织建设模式分析

通过大量的跟踪调研和凝练,可以把西方发达国家或组织推进知识组织实践应用归纳为四种模式:基于传统知识组织体系关联的语义网络模式、基于传统知识组织体系整合抽取的本体仓库模式、基于语义网的参考网络模式和本体网络模式。

2.1 基于传统知识组织体系关联扩展的语义网络模式

UMLS (Unified Medical Language System)是美国国家医学图书馆建立的关于生物医学和健康的知识组织体系,是基于传统知识组织体系关联扩展建设语义网络模式的典型代表。UMLS共有三个知识源数据库,它们是Metathesaurus、语义网络(Semantic Network)和专家词典(SPECIALIST lexicon)。Metathesaurus是集成了各种叙词表、分类表、编码集、用于病人护理的可控词汇表、健康服务表、公共健康统计、生物医学文献目录和索引等基础医学、临床医学和健康服务的知识组织体系。Metathesaurus通过概念来组织,其目的是将同一概念的不同名称和形式连接在一起,标识不同概念之间的关系。每个概念都分配了至少一个语义网络的语义类型,这样保证了Metathesaurus中的所有概念在语义网络中相对一致的分类。语义网络的目的是提供Metathesaurus中所有概念的统一分类和一系列概念之间的关系。语义网络由两部分组成:①一组较为宽泛的主题类目,也称语义类型;②一组语义类型之间的关系,或称语义关系。专家词典是NLM建立的三个知识源数据库之一,是UMLS项目的组成部分。专家词典的作用是为自然语言处理系统提供词汇信息。专家词典的词汇包括通用英语词汇和生物医学专业词汇。UMLS试图强大多语言词汇库,用于多种类型的信息系统,如病例、科学文献、指引和公共健康数据,从而在读者查询请求和资源之间建立概念上的关联,在具有相同知识内容的资源之间建立关联。

2.2 基于传统知识组织体系整合抽取的本体仓库模式

该模式的典型代表是联合国联农组织发起的FOS项目,旨在通过创建、整合和利用本体,来加强渔业信息系统的信息整合和语义互操作能力。FOS项目整合的资源包括:①OneFish:一个渔业项目的门户,采用等级主题树方式对信息进行组织,大约有超过1800个主题,主题含有简短的摘要、标识符、相关联的材料,如文件、网站、元数据。②AGROVOC叙词表:包含大约2000个渔业的叙词和16000相关的扩展词。③ASFA叙词表:超过6000个叙词。④FIGIS:一个整合渔业信息的全球化网络,其采用参考表来组织资源,主要包括水生物种、地理对象、水生资源、海洋渔业、渔业技术,大约有300个顶级概念,向下分成4级,共含有30000个资源对象,并能支持多语种互操作。FOS希望设计出一个全面的本体参考模型,以满足:是(部分是)以领域为基础本体,能分享规范的KOS;足够的灵活性,能在同一背景下包括不同的观点或者视角;聚焦在渔业领域的核心推理框架[2]。FOS建立一个多层级的本体仓库来整合资源,主要包括三层内容:

顶层本体或称为基础本体,用来表示通用一般性的概念。FOS采用了WonderWeb European项目建立DOCLCE本体模型作为基础,DOCLCE分为三个基本的大类,即:持久性和临时性;品质和品质属性及抽象概念。并采用了乘法的方式来扩展下位类。

核心本体是在顶层本体的基础上,结合本体描述与情景的原理(根据情景的作用、任务、参数、状态来具体化说明)来构建了核心本体。将FOS需要整合的资源按照ODP的本体描述模型转化成术语数据库,提取术语数据库顶层概念,保留TDB框架,专家精简以及采用其他本体设计模型[3]。最终,在ASFA的1600个顶级类、AGROVOC的83个顶级类和FIGIS的约400个顶级类中选取了10%作为核心本体。

nlc202309010048

领域本体,是在核心本体设计和检验后,将术语数据库中遗留的数据转化为本体数据模型,被称为“原形本体”。将COF(核心本体)与OntoWordNet和“原形本体”进行映射、模块化、合并,形成领域本体。

2.3 基于语义网的参考网络模式

该模式的核心是通过元数据的RDF模型和用SKOS格式描述的网络参考模型实现对分散异构资源进行分布式语义检索,其典型代表是STERNA(Semantic Web-based Thematic European Reference Network Application)。该项目在2008年6年到2010年11月获得eContentplus项目的1500万欧元支持下,与12个欧洲自然史和生物多样性机构合作,以鸟类和各种鸟类相关的信息为核心,将各种关于鸟、鸟类物种和他们习惯的多媒体资源,包括科学数据、文章、图片、视频和声频文件,汇集和显示在同一个信息空间,以支持欧洲数字图书馆,整合在自然科学、生物多样性及保护领域带有语义的丰富数字资源。

STERNA基础架构是通过元数据的RDF模型和用SKOS格式描述的网络参考模型对成员网站的内容进行分布式语义检索。整个系统分为三部分:最基础是语义检索,用于实现对不同成员网站的分散异构数据库的检索;网络工具集,用于内容拥有的机构整合和丰富现有的内容和元数据,并链接到用SKOS的参考模型;API层,用于每个成员网站实现STERNA系统的检索功能。

元数据是整个知识组织中的基础组成部分,项目制订了元数据生成和受控词表示的规范。元数据采用RDF元数据模型,RDF的三元组结构易于链接,使一个物体即可以作为主语,也可以作为宾语;也易于机器处理,利用URI来链接相关资源。

受控词表示在STERNA系统中被称为“参考结构”,采用SKOS进行描述。参考结构中包含各种的不同组织描述资源的方式,即有低结构化,如词表和术语,也有高结构化能揭示词和词间关系,如叙词表、本体、知识组织系统。为了在语义网络环境下充分利用现有的知识组织系统,使其能被机器处理和整合到发现层,STERNA项目采用了SKOS方式对ITIS(Integrated Taxonomic Information System)、ISO3166国别名称和代码、自建的标准化列表,如机构结构、人员结构进行描述。

RNA(Reference Network Architecture)参考网络架构,在系统中内容条目使用了多个参考模型,它们通过等级结构将内容相连接,同时内容条目又通过各自间的元数据相连,从而形成了参考网络架构。参考网络架构中内容条目之间的关系最基本是通过参考模型形成的等级结构,同时还存在虚拟的等级关系,RDF的三元组则形成了属性链接的关系,而在RNA之外,内容条目可以通过超链与系统外的文本、网页链接。RNA被用于创建一个发现层,来检索不同语言的各种数字资源,同时被用来帮助创建和维护发现层及产生结构化文本内容。

2.4 本体网络模式

该模式的核心思想是网络化本体,通过发展一套整合的方法来进化网络化的本体和相关元数据,通过场景与模式构建实现现有本体的重构、映射、模块化、本体化,并将非本体资源进行整合。NeOn项目是该模式的典型代表,其由欧盟第六框架计划资助,14个欧盟研究机构参与,旨在通过本体网络进行大规模语义应用,通过发展工具和相应方法,产生经济有效方式处理方式解决整个过程应用问题,尽可能促进新一代语义应用。

作为NeOn实践案例,联合国粮农组织(FAO)采用NeOn技术方法搭建了以本体驱动的鱼产品消耗评估系统(Fish Stock Depletion Assessment System,FSDAS)。联合国粮农组织的渔业和水产部管理和维护着多个渔业和水产信息和知识组织系统,尽管他们含有的数据多是结构化数据,却难以互操作。在NeOn项目的帮助下,FAO基于联合国的资源创建了一个渔业本体化网络,包括了FIGIS的渔业时间序列参考表、AGROVOC、ASFA、渔业和水产的分面表、FAO地理本体。FSDAS采用本体网络化的方法以集成来自FAO不同信息系统的数据。根据渔业本体生命周期管理的要求,分别从本体工程师和本体编辑人员两个角度,归纳出FSDAS的一般性要求。根据来自FIGIS的数据创建本体,即形成了6个本体模型:地域、渔业区域、生物物种、渔业商品、船只类型和载重、工具类型。通过对渔业领域范畴的分析,将对同一实体的多重知识组织方式进行分析,来扩展和修订本体模型;参考表作为本体化的网络的基础,由于已建立的单个本体在覆盖范围上不存在重复,采用数据连接的方式,即以连接数据到参考表,链接数据到半结构化文件、链接数据是从数据或本体中被推理获取,形成本体化网络[4]。

上述四种模式各有特色,但同时具有一些典型的共性:充分借用已有各类知识组织体系;无论是语义网、本体仓库、参考网络还是网络本体,均是以实现网络环境下计算机语义处理和知识组织为目标。

需要综合运用上述四种模式确定本支撑计划项目的可操作的解决方案:

(1)充分借用目前可获得的各类知识组织体系素材和元数据素材,作为遴选规范概念名称的来源;

(2)借鉴“基于语义网的参考网络”模式构建本项目的超级科技词表体系,包括:在利用现有分类范畴的基础上构建超级科技词表的等级结构,以支持面向外文科技文献的结构化呈现与知识导航;选用合适的专业领域知识组织体系作为领域内的参考结构,并实现范畴(等级结构)与各专门知识组织体系(参考结构)的关联映射;

(3)借鉴“基于知识组织体系关联扩展的语义网”模式构建各知识组织体系(参考结构)间的关联网络,通过规范概念名称与各知识组织体系的关联实现各知识组织体系的关联整合,构建多元化的面向外文科技文献的超级科技词表网络。

nlc202309010048

(4)结合中国科技工作的具体环境与需求,探索实现基于英文超级科技词表网络的中英文混合检索的技术路线,包括在医学领域建设英文规范概念名称汉译名和工程技汉表与英文超级科技词表网络映射关键技术两种方式。

(5)借鉴“本体网络”模式构建本项目的本体层,包括:本体转化、重构、模块化、本体化等的机制、方法和工具模型及4~5个领域本体构建的应用示范。

3 STKOS知识组织体系的建设目标

构建“面向外文科技文献的知识组织体系”,开展应用示范的总目标是:采用国际上先进的知识组织技术和方法,借鉴国内外已有的知识组织系统建设成果与应用经验,在“十二五”期间基本建成面向计算机应用的,以面向外文科技文献信息组织为主要应用目标的科技知识组织体系,为我国海量外文科技文献信息的组织和利用提供支撑,实现国家科技文献信息战略资源的有效组织、深度揭示和知识关联,提供知识检索服务,推进基于国家科技文献信息战略资源的知识发现、知识挖掘和知识计算应用示范,整体提升我国科技文献信息机构的知识服务能力。

面向外文科技文献的知识组织体系建设,由知识组织体系内容建设,加工协作平台建设,开放服务平台,自动处理、智能检索的应用,知识服务的应用示范和关键技术研究等六个部分组成(见图1)。具体目标是:

(1)构建外文科技知识组织体系。建设具有我国自主知识产权的、有效服务于科技文献组织的科技知识组织体系,重点建成具有一定规模的统一的超级科技词表。超级科技词表预计收集科技词汇素材约1000万条,收录科技术语不少于500万条,科技概念规范名称80万条,其中理学领域科技概念规范名称20万条,工学领域20万条,医学领域30万条,农学领域10万条。

在此基础上,在各学科领域分别选择两个学科方向初步建成领域本体。完成科研本体的总体框架设计、标准规范制定,并开展应用示范。

(2)建立国家科技知识组织体系的可持续发展机制。通过建立STKOS协同工作系统、 STKOS的评价体系,以及参建单位、领域专家、知识组织专家的长期稳定的协同工作机制,支持STKOS的持续维护更新,对STKOS的测评和修正,保证STKOS可持续发展。

(3)推进科技知识组织体系的开放服务。支持面向国家科技图书文献中心海量科技文献的规模应用,支持面向全国科技信息服务机构的开放应用服务,支持面向科学研究机构的深层次的科学研究服务,使科技知识组织体系成为支撑国内各类信息机构和科研机构开展知识服务的信息基础设施。

(4)实现海量文献信息的自动处理和智能检索。开发基于科技知识组织体系的海量文献信息自动处理和智能检索系统,实现科技文献信息资源的结构化深度整序,提升我国科技信息资源整体的知识化组织程度,使国家科技文献信息资源得到充分揭示和利用,有效推动国家科技文献战略资源的知识化服务。

(5)开展基于科技知识组织体系的应用示范。有效提高我国科技信息机构在知识发现、科技信息监测、知识结构和知识演化分析、领域学术关系研究、领域态势分析、战略情报研究、决策支持等方面的知识服务能力和水平。

4 知识组织体系的建设内容

面向外文科技文献的知识组织体系建设的核心是知识组织体系内容建设,它主要由两个主要部分组成:超级科技词表和本体。超级科技词表是一个融合词表、术语表、叙词表等各种知识组织素材,以科技术语为基本单元,以概念为核心,以来源词表的原有关系为依托,通过概念与来源词表术语进行语义关系的词网络。本体是以STKOS超级词表收集的概念为基础,发展一套根据情景来设计和构建网络本体的方法和工具,将超级科技词表及其他知识组织体系进行本体化表达,形成轻量型本体,建设4~5个面向领域应用的本体网络和1个科研本体知识库,为知识组织体系的语义应用奠定基础。

4.1 超级词表建设

超级词表由基础词库、规范概念集和范畴体系三个层次构成,三部分相互依托,构成一个有机的整体。

基础词库是将两部分的内容,一是来自各种词表、术语表,二是来自作者关键词和用户检索的关键词等,经过对比分析、评价、遴选,作为建立超级词表的来源素材。随后,来源素材经过去重形成基础术语,基础术语再经过词形规范形成规范术语,最后规范术语经词义规范形成基础概念。基础词库处理的关键是:需要将相同含义的不同形式的术语合并成同一概念,同时也要将相同形式不同含义的术语进行区分。因而需要借助词形规范化工具和专家词典,将不同来源的术语进行原型化处理,将完全相同归并在一起。同时需要进行词义鉴别,建立同形异义词典,一个术语经常存在多个词义,基础词库从不同来源获得的术语,同形词可能具有不同的词义,需要按词义进行聚类,将同义词结果分为几个集合,集合内属于同一词义,集合之间属于不同词义,从每个术语的多个词义中,选择其中一个属于自己领域的语义,只保留该语义对应的术语集合。

规范概念集是将基础词库处理后的所有术语,通过学科之间的术语冲突检测,遴选出概念的优选术语,从而形成以概念为基本单元,保留不同来源术语的定义,继承不同来源术语的各种关系的集合。

范畴体系是构建在规范概念集的基础上,通过建立分类框架,对概念进行聚类、分类、浏览,以辅助检索。

4.2 本体建设

STKOS本体建设是根据本体建设的目标场景和本体的生命周期,确定本体建设需要路径和活动,来构建相应的工具集以支持本体网络的建设,从而实现创建4个领域本体和1个科研本体及知识库。

NeOn项目设计了9个本体构建场景:从头开始创建;重用和重建非本体资源;重用本体资源;重用和重构本体资源;重用和整合本体资源;重用、整合、重构本体资源;重用本体设计模型;重组本体资源[5]。STKOS本体构建主要涉及其中的前3个场景:从零开始创建本体、重建和重构非本体资源、本体资源的重用(见图2)。

nlc202309010048

本体生命周期模型是表明本体建设者在本体网络实施过程中需要开展的活动和遵循顺序,主要有两种:瀑布模型和迭代模型。瀑布模型主要应用于建设周期短、需求具体、小而理解充分的领域,它必须按照阶段依次开展相应活动;迭代模型主要应用于需求不完全明确,大型复杂本体的构建过程,它是采用瀑布模型构建单个本体的一组迭代。

由于本体构建的场景不同,所需要的构建阶段也有所不同:从头创建本体需要4个阶段,初始阶段、设计阶段、实施阶段和维护阶段;本体资源的重用分为5个阶段,在初始阶段之后增加了重用阶段;非本体资源的重用和重构,分成了6个阶段,在初始阶段之后增加了重用和重构阶段。本体构建的不同阶段——初始、设计、实施、维护、重用、重构,对应着不同的本体构建活动。

根据STKOS本体构建的场景和生命周期活动,整个本体工具和平台分为3个层次:

(1)本体存储与管理层:存储领域本体、科研本体,并建立本体索引。通过API调用对本体进行访问,并可进行用户管理、多本体管理。

(2)本体工具层:搭建插件运行环境,可加载本体创建、本体查询、本体裁切、非本体资源转换、本体语义丰富、本体合并、本体浏览、本体评估、本体推理等本体工具。

(3)用户界面:根据用户不同的本体构建需求,来组合本体活动和相应的工具,从而实现新建本体、非本体资源转换、现有本体资源复用等。

5 STKOS知识组织体系建设中的难点

作为我国外文科技文献知识组织的基础设施,STKOS知识组织体系涉及学科众多、内容庞杂,在构建超级词表和本体建设的过程中,遇到了各种各样的问题,其中主要的难点为:

(1)对概念的规范整理、凝练、范畴归类:要将多来源的词汇,以概念为核心,形成继承来源属性关系的词网络,需要保证以概念汇集的术语规范整理、聚类归类的准确性和一致性,其关系到构建后的超级科技词表对知识资源组织的准确性、可用性,因而如何对来源术语进行规范整理,实现术语的聚类归类、概念关系继承,成为了超级词表构建中的一个难点,需要在现有叙词表标准的基础上设计规范整理规则和数据格式,对术语的相似度计算方法和模型、设计概念同义归并和归类以及概念同形异义区分的方法和算法,从而实现计算机辅助人工处理。

(2)本体构建与应用的结合:随着本体研究的完善,单纯构建一个本体并不困难,但如何将本体构建与应用场景、应用模式相结合,形成可复用的本体资源,能面向应用形成本体,需要深入地探讨。因而将本体构建通过动态建模的方法,以情境分析为基础采取合作方式,来实现本体的重用、重构、映射、关联和模块化,实现非本体的知识组织体系向本体转换构建本体网络,成为了本体构建的难点。

参考文献:

[1]国家科技基础条件平台中心.“十一五”国家科技基础条件平台建设总结(简版)[EB/OL].[2012-11-20].http://www.nstic.gov.cn/l-side/115.jsp.

[2]Aldo gangemi, Frehiwot Fisseha,Ian Pattman, Johannes Keizer. Building an integrated formal ontology for semantic interoperability in the fishery domain[EB/OL].[2010-03-13].ftp://ftp.fao.org/docrep/fao/008/af242e/af2

42e00.pdf.

[3]Aldo Gangemi. Reusing semi-structured terminologies for ontology building[EB/OL].[2010-3-13].http://wonderweb.semanticweb.org/deliverables/documents/D16.pdf.

[4]CaterinaCaracciolo. Second Network of Fisheries Ontologies[EB/OL].[2010-03-13].http://www.neon-project.

org/nw/images/7/75/NeOn_2010_D724.pdf.

[5]Mari Carmen Suarez-Figueroa, Asuncion Gomez-Perez. Scenarios for building ontology networks[EB/OL].[2012-12-20].http://www.neon-project.org/web-content/media/book-chapters/Chapter-03-1.pdf.

作者简介:孙坦(1970-),男,中科院国家科学图书馆研究馆员,博士生导师;刘峥(1979-),女,中科院国家科学图书馆副研究馆员。

3.内部控制外文文献翻译 篇三

文献出处: Lakis V, Giriūnas L. THE CONCEPT OF INTERNAL CONTROL SYSTEM: THEORETICAL ASPECT[J]. Ekonomika/Economics, 2012, 91(2).

原文

THE CONCEPT OF INTERNALCONTROLSYSTEM:

THEORETICALASPECT

Vaclovas Lakis, Lukas Giriūnas*

Vilnius University, Lithuania

Introduction

One of the basic instruments of enterprise control, whose implementation in modern economic conditions provide conditions for achieving a competitive advantage over other enterprises is the creation of an effective internal control system. In the industry sector, the market is constantly changing, and this requires changing the attitude to internal control from treating it only in the financial aspect to the management of the control process. Internal control as such becomes an instrument and means of risk control, which helps the enterprise to achieve its goals and to perform its tasks. Only an effective internal control in the enterprise is able to help objectively assessing the potential development and tendencies of enterprise performance and thus to detect and eliminate the threats and risks in due time as well as to maintain a particular fixed level of risk and to provide for its reasonable

security .

The increasing variety of concepts of internal control systems requires their detailed analysis. A detailed analysis of the conceptions might help find the main reasons for their increasing number. It may also help to elaborate a structural scheme of the generalized concept of internal control. Consequently, it may help decrease the number of mistakes and frauds in enterprises and to offer the precautionary means that might help to avoid mistakes and build an effective internal control system.

The purpose of the study: to compile the definition of the concept of internal control system and to elaborate the structural scheme of the generalized conception for Lithuanian industrial enterprises.

The object of the research: internal control.

To achieve the aim, the following tasks were carried out:

to examine the definitions of internal control;?

to design a flowchart for the existing definitions of internal control;?

to formulate a new internal control system definition;?

to identify the place of the internal control system in a company’s objectives and ? its management activities.

Study methods: for the analysis of the conceptions of control, internal control, the concept of internal control system, systematic and comparative means of scietific methods of analysis were used.

1. Research of control conception

According to J. Walsh, J. Seward (1990), H. K. Chung, H. Lee Chong, H. K.

Jung (1997), control may be divided into two types C internal and external controls those might help to equalize authority or concerned party‘s attitudes to some certain organization control. Internal control involves the supreme enterprise control apparatus and enterprise shareholders, whereas external control might be defined as the power in the market or branch, competitive environment or state business regulation. Such analytical division is essential when analysing industrial or other enterprises, because this attitude to control makes it more specific and properly defined.

The identification of an appropriate primary theoretical base is an important task in forming the structure of knowledge about the study subject. Appropriately selected conceptions enable to elucidate the essence of the processes, to characterize them and to realize their interplays and interaction principles. Conceptions may be defined as a summation of empirical cognition which transforms practically achieved results into conceptions. The above ideas might be taken as abstractions and lead to an ungrounded conclusion, and through conceptions the reality might be lost. Operating with more than one conceptions allows to form a universal opinion about the reality. Noteworthy, when operating with conceptions an optimal agreement might be found between theory and practice: using the common point of contact C conceptions C a theorist and a practician will always find the way and understand one another.

The main problem of internal control is related to the definition of control conception and the identification of the place of internal control in an organization. Constant changes of the extent, functions and roles of internal control enable to form a

common definition of internal control and to identify its place in an organization.

Analysis of the concept of internal control and its interpretation are essential for assessing the internal control system, because the conception of control is widely used not only in scientific research, but also in the daily activities of an enterprise; therefore the same conception might have a lot of various meanings and interpretations. Analysis of the concept provides conditions for the further research, because it is impossible to form a model of internal control assessment if the research object is unknown. A lot of definitions and variations of control can be found in the publications by Lithuanian and foreign scientists and in public information sources. For example, in the Dictionary of International Words (2002), control is defined as:

supervision, inspection of something; comparison of actual and required ? conditions;

an enterprise or a group of people that control the work and responsibility of other ? enterprises or groups of people;

maintenance of something.?

On the other hand, in the specialized Dictionary of Economic Terms (2005), control is defined as a performance with a definite influence on the management of an enterprise, as rights based on laws and contracts that involve proprietary rights to the whole property or its part, or any other rights that enable to exert a significant influence on the management and performance of an enterprise, or state supervision. Even in common information sources the definitions of control are formulated differently, although the common meaning is quite similar. Analysis and practical

studies of Lithuanian scientists’ works enable to state that there is no one solid concept, definition or description of control. For example, E. Bu?kevi?iūt? (2008) says that when control is more particularly defined, its rules and requirements are described in more detail, it becomes more effective, more specific, more psychologically suggestive, it gives more freedom limits of choice for supervisors and less possibilities of lawlessness for people under control when. Identifying the object of the research, it should be noted that different definitions of control are given in scientific studies by Sakalas, 2000; Navickas, 2011; Katkus, 1997; Bu?kevi?iūt?, 2008; Drury, 2012; Bi?iulaitis, 2001; Lee Summers, 1991; Patrick, Fardo, 2009; Spencer, Pickett, 2010; Gupta, 2010 and other Lithuanian and foreign scientists (see Fig. 1).

The different conceptions and their interpretations indicate that there is no solid opinion about how to define control, and even scientists and practicians themselves do not agree upon a unified definition or description of control or the conception of internal control and its interpretations. In scientific literature, different interpretations of control conceptions are usually related to different aspects of this conception, and their meaning in different situations may be defined in different ways depending on the situation and other external factors. According to A. Katkus (1997), C. Drury (2009), R. Bi?iulaitis (2001), D. R. Patrick, S. W. Fardo (2009), K. H. S. Pickett (2010), during a long-term period control is usually related to achieving the already settled goals, their improvement and insurance. In other information sources (Dictionary of International Words, 2002; Sakalas, 2000; Bu?kevi?iūt?, 2008; Lee Summers, 1991) control is emphasized as a certain means of inspection which

provides a possibility to regulate the planned and actual states and their performance. Despite these different opinions, control might be reasoned and revealed as a traditional function of any object of control, emphasized as one of the main self-defence means from the possible threats in the daily performance of an org第一文库网anization. There is also a more modern approach. For example, V. Navickas (2011) and P. Gupta (2010), presenting the concept of control, name it not only as one of the main factors that influence the organization’s performance and influences its management, but also as one of the assessment means of the taken decisions and achieved values. Such interpretation of the conception of control shows the main role of control. For example, R. Kanapickien? (2008) has analysed a big number of control definitions and says that only an effective and useful control should exist in an enterprise because each enterprise tries to implement its purposes and avoid the possible losses, i.e. mistakes and frauds. According to J.A. Pfister (2009), there are several types of control, and they can be grouped into strategic, management, and internal control. Thus, different researchers give different definitions of control, their descriptions have different goals, but different control definitions lead to numerous variations in the analysis of the conception of control. Thus, to create an effective control, the presence of its unified concept becomes a necessity and the basis for ensuring an effective control of the organization’s performance. The existence of different conceptions of control also indicates that there might be different types or kinds of control.

2. The conception of internal control

Historical development of internal control as individual enterprise system is not as broad as other management spheres in science directions. The definition of internal control was presented for the first time in 1949 by the American Institute of Certificated Accountants (AICPA). It defined internal control as a plan and other coordinated means and ways by the enterprise to keep safe its assets, check the covertness and reliability of data, to increase its effectiveness and to ensure the settled management politics. However, the presented definition of control concept has been constantly improved, and nowadays there is quite an extensive set of conceptions that indicates the system of internal control as one of the means of leadership to ensure safety of enterprise assets and its regular development. In 1992, the COSOmodel appeared; its analysis distinguished the concepts of risk and internal control. Nnow, the concept of internal control involved not only accounting mistakes and implementing means of their prevention, but also a modern attitude that might identify the spheres of control management and processes, and also a motivated development of their detailed analysis. The Worldwide known collapses of such companies as Enron, Worldcom, Ahold, Parmalat and others determined to issue in 2002 the Law of SarbanesCOxley in the USA, in which attention is focused on the effectiveness of the enterprise internal control system and its assessment. Such a significant law as that of SarbanesCOxley has dearly show that not only the internal control system must be concretized and clearly defined, but also the means of implementing the internal control system and assessing their effectiveness must be covered. The concept of internal control was further improved by such Lithuanian and foreign scientists as A.

Сонин (2000), D. Robertson (1993), M.R. Simmons (1995), I. Toliatien? (2002), V. Lakis (2007), R. Bi?iulaitis (2001), J. Mackevi?ius (2001) and the international scientific organizations COSO, INTOSAI, CICA, IT Governance Institute.

A comparative analysis of the introduced concepts of internal control shows that the usage of the concept of internal control is quite broad as it is supposed to involve the performance not only of the state, but also of the private sector. Although the conception of internal control is defined in different ways emphasizing its different aspects, the essential term still remains the same in all authors’ definitions: internal control is the inspection, observation, maintenance and regulation of the enterprise’s work (see Fig. 3.).

It should be also be mentioned that the system of internal control may be defined in different ways every time. For example, R. T. Yeh and S. H. Yeh (2007) pay attention to the fact that usually such values as honesty, trust, respect, openness, skills, courage, economy, initiative, etc. are not pointed out, although they definitely can influence not only the understanding of the concept of internal control, but also its definition, because in different periods of time and in different situations it can obtain slightly different shades of meaning. Control and people, and values produced by people or their performance are tightly connected; consequently, internal control must be also oriented to the enterprise’s values, mission and vision; it does not matter how differently authors define the conception assessment limits: significant attention must be paid not to internal control itself, but to the identification of its functions and evaluation. Mostly internal control is concerned with authority management tools that help to control processes and achieve enterprise goals (COSO, 1992; Сонин, 2000; INTOSAI, 2004; CobiT, 2007; Toliatien?, 2002; Coco, 1995).

C.J. Buck, J.B. Breuker (2008) declare internal control as a mistake detecting and correcting

system; although J. Mackevi?ius (2001) and R. Bi?iulaitis (2001a) state that internal control is defined as a summation of certain rules, norms and means, actually such definitions are identical, but internal control must be related to safety, the rational use of property and the reliability of financial accounting.

Results of a comprehensive analysis of internal control enable to state that, although different authors give different definitions of internal control, there are still some general purposes of the system of internal control, aimed, to ensure reliable and comprehensive information, to protect the property and documents, to enssure an effective economic performance, observation of accounting principles and presentation of reliable financial records, obeying laws and executive acts, enterprise rules and the effective control of risk. Analysis of concept of internal control, presented in both foreign and Lithuanian literature enables to formulate its generalized definition: the system of internal control is part of enterprise management system, which ensures the implementation of its goals, effective economic and commercial performance, observance of accounting principles and an effective control of risks, which enables to minimize the number of intentional and unintentional mistakes and to avoid frauds in the process of enterprise performance, made by its authority or employees.

The internal control system in a company must cover and help to properly organize and control the entire activity of the company; thus, according to majority of authors, internal control is all-inclusive activity in financial and management accounting, as well as in the strategic management of projects, operations, personnel

and the total quality management. However, the most important thing is that internal control should not only cover the entire activity of the company, but also take into account its objectives, goals and tasks in order to make its economic-commercial activity as effective as possible. Analysis of scientific literature in the field shows that it is important not only to predict the particular areas of internal control and interrelate them, but also to stress that the most important objective of internal control is the effective management of risk by identifying and eliminating errors and frauds inside the company. Therefore, the concept of internal control offered by the authors covers a company’s areas of activities, its tasks and objectives; also, it provides for the main goal C an effective risk management.

Despite the quantitative indicators used for goal assessment, each enterprise and especially extractive industry enterprises where attention should be focused on avoiding mistakes and fraud should elaborate and introduce a really effective and optimal system of internal control and accounting so as to strengthen its position in the market and optimize profitability.

Conclusions

The analysis of control definitions has shown that rather wide variations of definitions and their interpretations prove control to be a wide concept, mainly due to the fact that control has quite many different aspects and its meaning in different situations may be also defined differently.

Nevertheless, there are still some general aspects of the system of internal control, which include ensuring reliable and comprehensive information, protecting the

property and documents, to ensure an effective economic performance, keeping to the principles of accounting and presenting reliable financial records, obeying laws and executive acts, enterprise rules and ensuring an effective control of risk.

As a result of the study, the authors present an inclusive and generalizing definition of internal control: the system of internal control is part of the enterprise management system that ensures the implementation of the enterprise’s goals, its effective economic-commercial performance, observance of accounting principles and an effective control of work risks, which enables to minimize the number of intentional and unintentional mistakes, and to avoid frauds in the process of enterprise performance, made by its authority or employees.

译文

内部控制制度:理论研究

拉基斯,卢卡斯

维尔纽斯大学,立陶宛

引言

企业控制的基本工具之一,建立一个有效的内部控制制度,为现代经济条件下企业获得竞争优势提供了条件。在工业领域,市场是不断变化的,这就要求改变的对内部控制的态度,要认识到它不仅仅是财政的一方面,而是对整个控制过

程的管理。内部控制成为风险控制的手段和方法,帮助企业实现其目标和执行其任务。在企业中,进行有效的内部控制能够帮助他客观地评估企业业绩的潜在的发展和趋势,从而及时检测和消除威胁和风险,保持某一特定的风险级别,以确保企业安全。

与日俱增的各种关于内部控制制度的概念需要他们的详细分析。对其概念的详细分析可以帮助找到他们主要原因。同时也能为内部控制的广义概念提供结构方案。因此,它可以帮助企业减少内部错误和欺诈行为,这些预警措施能避免错误出现以及建立一个有效的内部控制制度。

这项研究的目的:著述内部控制制度概念的内涵,并阐述立陶宛工业企业内部控制一般性观念的结构方案。

研究的对象:内部控制。

为了达到目标,应进行如下工作:

审查内部控制的定义,

为现有的内部控制概念设计流程图,

设想一个新的内部控制制度定义,

确定公司内部控制制度的目标及其管理活动。

研究方法:分析控制的概念,内部控制的概念,内部控制制度的概念,使用系统和比较这两个科学的分析方法。

1.对控制概念的研究

沃尔什,苏华德(1990),控制可以分为两种类型――内部和外部控制可能有助于平衡权力或关注相关方对某些特定组织控制的态度。内部控制涉及到最高的企业控制设备和企业股东,而外部控制可能被定义为市场或分公司的力量,竞

争环境或国家业务监管部门。当分析工业或其他企业时,这样的划分与分析是必要的,因为它能使控制概念更加具体和恰当。

形成关于研究主题的知识结构,确定一个适当的理论基础是一项重要的任务。适当选择的概念可以解释过程的本质,进一步的刻画他们并实现他们的相互影响和交互原则。概念可以定义为经验认知的总和,将实际取得的结果转换成概念。以上想法可能会被视为抽象或者导致一个无根据的结论,并且可能导致事实的丢失。多个概念将形成一个普遍的对现实的看法。值得注意的是,当理论和实践之间的最优协议达成后:运用联系的关键点――概念――理论家和有经验的人总会找到和理解彼此的方式。

内部控制的主要问题是控制概念的定义和识别组织中内部控制的地位。不断变化的程度,内部控制的职能和角色可以形成一个共同的内部控制的定义并确定它在一个组织中的地位。

分析内部控制的概念对评估内部控制系统是必不可少的,因为控制的概念不仅被广泛应用于科学研究中,而且也广泛应用于企业的日常活动中,因此同样的概念可能会有很多不同的含义和解释。分析概念为进一步研究提供了条件,因为如果研究对象是未知的,就不可能形成一个内部控制评估的模型。关于控制的很多定义和变化可以在立陶宛和外国科学家的出版物中找到。例如,在国际字典(2002),控制被定义为:

监督,视察某物;比较实际和必须的?条件;

一个企业或一群人,控制其他的工作和责任?企业或团体的人;

维护某物。

另一方面,在经济术语的专业词典(2005),控制被定义为一个对企业管理具

有确切影响的行为,根据法律和合同的权限,涉及整个或其部分财产所有权,或任何其他权利,能对企业绩效与管理或者国家监督产生重要影响。即使在公共信息资源下,控制的定义也有一定的差异,尽管公共信息资源非常相似。立陶宛科学家的分析和实际研究表明,对于控制定义的阐述,目前还没有一个固定的概念。例如,Bu?kevi?iūt?(2008)认为,当控制被赋予特别的定义时,就要更详细的描述它的规则和要求,它也会变得更有效、更具体、更具有心理暗示,它给予监督者更多的自由选择限制,处于控制之下的人们违法的可能性也大大降低。确定研究的对象,应该注意的是,关于控制的不同定义,Sakalas,2000;Navickas,2011;Katkus,1997;Bu?kevi?iūt?,2008;Drury,2012; Bi?iulaitis,2001;Lee Summers ,1991;Patrick, Fardo,2009;Spencer, Pickett,2010;Gupta ,2010以及立陶宛和外国其他科学家作出了不同的描述(见图1)。

不同的.观念以及他们的解释表明,对于控制的定义没有一个固定的观点,甚至科学家与专家对于控制的概念、内部控制的概念解释没有达成统一意见。在科学文献中,对于控制概念的不同解释通常与这个概念的不同方面相关,根据现状与其他外部因素,在不同情况下他们的含义可能会以不同的形式来定义。根据A. Katkus(1997),C. Drury (2009),R. Bi?iulaitis(2001),D.R. Patrick・S.W. Fardo(2009),K.H.S・ Pickett (2010),长期控制通常与完善与稳固已达到的目标相关。其他信息来源(国际词汇字典,2002;Sakalas,2000;Bu?kevi?iūt?,2008;李萨默斯,1991)控制被强调作为一个特定的检查手段提供了控制调节计划、发展现状以及绩效的可能性。尽管有这些不同的观点,控制的存在应当是合理的,对于控制对象的监督,其强调作为一个重要的正当防卫,对组织绩效和日常运转起一个重要的监督作用。(完整译文请到百度文库)还有一个更具现代化

的方式。例如,V. Navickas(2011)和P. Gupta (2010)认为,控制不仅是影响组织绩效和管理一个主要因素,而且能作为评估决策和实现价值的手段。这样的解释控制的概念显示了控制的主要作用。例如,R. Kanapickien?(2008)对控制的许多种概念作了分析,认为,一个企业应当具备一个有效的和有用的控制,因为每个企业都试图实现它的目标,避免可能的损失,如错误和欺诈。根据J.A. Pfister (2009)的观点,控制的类型有很多种,可分为战略、管理和内部控制。因此,不同的研究人员对于控制的定义不同,它们的解释有不同的标准,但是,控制的不同定义致使对于控制概念分析的多重变化。因此,创建一个有效的控制,统一其概念十分必要,他是确保有效控制组织绩效的基础。不同控制概念的存在也标志着可能有不同的类型或种类的控制。

2.内部控制的概念

内部控制的历史发展作为私企体系的一部分,在科学方向上不如其他管理领域广泛。内部控制的定义首次是由美国注册会计师协会(会计师协会)在1949年提出。它将内部控制定义为企业保护其安全的资产的一种计划或其他协调手段与方式,检查隐秘的与可靠性数据,增加其有效性及确保管理政治的顺利解决。然而,对于控制概念的解释不断得到完善,当前的概念已变得非常广泛,内部控制制度作为组织领导保护企业资产的安全及其正常发展的手段。1992年,COSO模式出现,分析了风险和内部控制的概念。现在,内部控制的概念不仅涉及一种核算错误和防范风险的手段,而且当前的观点认为,其能识别控制管理和流程的范围。全世界都知道的倒闭公司如安然、世通、阿霍德、帕玛拉特和其他决定2002年宣布破产的公司――美国的奥克斯利,他们关注的重点是企业内部控制系统的有效性及其评估。这样的重要法律如萨班斯-奥克斯利法案的代价不仅表明,内部控制制

度的概念必须得到清晰地界定,同样也意味着实施内部控制制度和评估其有效性的方式必须有所转变。内部控制的含义通过立陶宛和外国科学家Сонин(2000),D・罗伯逊(1993),M.R.西蒙斯(1995),I.Toliatien?(2002),V. Lakis(2007),R. Bi?iulaitis(2001),J. Mackevi?ius(2001)和《国际科学组织COSO,国际最高审计机关组织,亚信论坛,IT治理研究所的研究变得更加完善。

结论

对于控制概念的分析表明,大幅度变化的定义和解释证明控制是一个广泛的概念,主要是因为这样的事实:控制有许多不同的方面,它的意义在不同的情况下也可以有不同的定义。

尽管如此,内部控制制度的仍然有许多基本的方面,其中包括确保可靠和全面的信息,保护财产和文档,以确保一个有效的经济效益,遵循会计原则以提供可靠的财务报告,遵守法律和行政条例、企业规则和确保风险的有效控制。

4.外文文献及其翻译电子政务信息+ 篇四

1.政府信息化的含义?

政府信息化是指:政府有效利用现代信息和通信技术,通过不同的信息服务设施,对政府的业务流程、组织结构、人员素质等诸方面进行优化、改造的过程。2.广义和狭义的电子政务的定义?

广义的电子政务是指:运用信息技术和通信技术实现党委、人大、政协、政府、司法机关、军队系统和企事业单位的行政管理活动。(电子党务、电子人大、电子政协)

狭义的电子政务是指:政府在其管理和服务职能中运用现代信息和通信技术,实现政府组织结构和工作流程的重组优化,超越时间、空间和部门分隔的制约,全方位的向社会提供优质规范、透明的服务,是政府管理手段的变革。3.电子政务的组成部分?

①:政府部门内部办公职能的电子化和网络化;

②:政府职能部门之间通过计算机网络实现有权限的实时互通的信息共享;

③:政府部门通过网络与公众和企业间开展双向的信息交流与策; 4.理解电子政务的发展动力?

①:信息技术的快速发展;

②:政府自身改革与发展的需要;

③:信息化、民主化的社会需求的推动; 5.电子政务的应用模式?

模式有:1.政府对公务员的电子政务(G2E); 2.政府间的电子政务(G2G); 3.政府对企业的电子政务(G2B); 4.政府对公众的电子政务(G2C); 6.电子政务的功能?

①:提高工作效率,降低办公成本;

②:加快部门整合,堵塞监管漏洞;

③:提高服务水平,便于公众的监督; ④:带动社会信息化发展; 7.我国电子政务发展存在的主要问题?

①:政府公务员与社会公众对电子政务的认识不足;

②:电子政务发展缺乏整体规划和统一性标准;

③:电子政务管理体制改革远未到位;

④:电子政务整体应用水平还较低;

⑤:政府公务员的素质有待提高;

⑥:电子政务立法滞后;

⑦:对电子政务安全问题缺乏正确认识; 8.政府创新的含义和内容?

含义:是指各级政府为适应公共管理与行政环境的需要,与时俱进的转变观念与职能,探索新的行政方法与途径,形成新的组织结

构、业务流程和行政规范,全面提高行政效率,更好的履行行政职责的实践途径。

内容:政府观念改革和创新、政府管理与创新、政府职能与创新、政府服务与创新、政府服务改革与创新、政府业务流程重组与创新、工作方式的改革与创新 9.政府流程优化与重组的概念?

是指对企业的经营过程进行根本性的重新思考和彻底翻新,以使企业在成本、质量、服务和速度等重大特征上获得明显的改善,并强调通过充分利用信息技术使企业获得巨大提高。

10.政府流程优化与重组的步骤?

①:制定计划; ②:优化与重组准备; ③:审视现有流程; ④:重新设计; ⑤:实施新流程; ⑥:评估反馈;

11.政府流程优化与重组的方法?(尤其是流程图法的掌握41页)

方法有:流程图法、角色行为图法、IDEF系列方法、统一建模语言法、Petri网方法、工作流方法、柔性建模技术

.12.理解“三网一库”?政府信息资源管理中心?(54页)

“三网”指:内网、外网和专网;“一库”指:政务信息资源库

内网即机关内部办公网,以政府各部门的局域网为基础,建立在保密通信平台上,主要运行党政决策指挥、宏观调控、行政执行、应急处理、监督检查、信息查询等各类相对独立的电子政务应用系统。

外网即公共管理和服务网。建立在公共通信平台上,主要用于政府信息发布,向社会提供服务。

专网即办公业务资源网。链接从中央到地方的各级党政机关,上下级相关业务部门。根据机构职能在业务范围与内网有条件的互联,是吸纳地区级别涉密信息共享。专网与内网之间采取逻辑隔离。

政府信息资源库,包括党政和各行业的业务数据和管理信息。它分布于三网之上,按密级和使用要求为不同用户服务。

政府信息资源管理中心建有信息资源元数据库,提供丰富的信息资源供各部门访问。包括:人口信息,法人单位信息、自然资源信息、空间地理以及宏观经济数据等。他在数据存储、备份的基础上,为政府部门和企业和公众提供数据共享、数据交换和决策支持服务。它采取自顶向下的层次结构,分为国家级、省市级和地级市GDC,分别负责本级或本行业的数据服务。它存储的信息主要分为:基础型、公益型、综合型信息。它采取统一的目录服务体系。

13.电子政务系统的层次模型?

它自下而上可分为:网络系统层、信息管理层、应用服务层、应用业务层。层次模型框架:电子政务标准和规范体系、面向电子政务的安全体系。

14.了解VPN?了解OSI即开放式通信系统互联参考模型(7个紧密层次)?

VPN(Virtual Private Network)即虚拟专用网,它采用了一种称为隧道(Tunnel)的技术,使得政府和企业可以在公网上建立起相互独立、安全、可连接分支机构、分布式网点和移动用户的多个虚拟专用网。

OSI参考模型,即开放式通信系统互联参考模型,是国际标准化组织(ISO)提出的一个试图使各种计算机在世界范围内互连为网络的标准框架。

OSI的框架模型分为7层:物理层、数据链路层、网络层、传输层、会话层、表示层、应用层。15.TCP/IP协议簇的内容?

TCP/IP是互联网上广泛使用的一种协议,它实际上是包含多个协议的协议簇,起源于美国国防部。可以映射到4层:①网络访问层,负责在线路上传输帧并从线路上接收帧;②网际层,进行路由选择;③传输层,负责管理计算机间的会话,包括TCP/UDP两个协议;④应用层。16.数据存储与备份?

数据存储备份是指:为防止系统出现操作失误或系统故障导致数据丢失,而将全系统或部分数据集合从应用主机的硬盘或阵列复制到其他的存储介质的过程。

数据存储备份的介质:磁盘阵列、磁带库、光盘塔或光盘库、光盘网络镜像服务器。17.单点登录技术?(84页)

单点登录(Single Sign On),简称为 SSO,是目前比较流行的企业业务整合的解决方案之一。SSO的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。通常情况下运维内控审计系统、4A系统或者都包含此项功能,目的是简化账号登录过程并保护账号和密码安全,对账号进行统一管理。18.了解内部公文处理应用?(87页)

发文管理、收文管理=======自己看书本,懒得打字。19.电子政务决策支持系统的内容(DSS)?城市应急联动(106页)?

内容为:制定决策方案、下达决策指令、执行决策指令、系统反馈和修正。20.移动政务的应用?

应用方式:基于消息的应用(典型代表是基于短信的应用,形式为短信预警、短信公告、短信通知);基于移动互联网的应用(GPRS/CDMA乃至未来的3G/4G数据传输技术的应用);基于位置的应用(利用GPS定位或者移动网络自身定位)21.政府信息资源的构成?

内容构成:①政府决策信息;

②为社会各界服务的信息;

③反馈信息;

④政府间交流; 22.政府信息公开的内容及步骤?

内容为:根据行政机关的级别确定为县级以上人民政府及其部门、设区的市级人民政府、县级人民政府及其部门和乡镇人民政府公开的信息。

步骤:见书129页

23.以政府信息资源的目录服务体系为依托的信息交换?

交换体系是以统一的国家电子政务网络为依托,支持区域、跨部门政府信息资源交换与共享的信息系统。

交换流程为:需求方:需要资源的部门系统提供资源请求;

交换平台;目录服务;提供方:交换平台根据目录返回结果定位资源。

24.一站式服务的形式?(142页)

一站式服务的特点为:以网络为工具,以用户为中心,以应用为灵魂,以便民为母的。

形式有:以利用现代计算机和通信网络技术,提供政府网上服务,提供全面的政务信息,政府资源共享,个性化服务(据功能)25.政府电子化采购的流程(145页)?

流程步骤为:生成采购单、发布采购需求信息、供应商应标、网上开标与定标、签订采购合同、供应商供货、货款结算和支付 26.电子政务安全问题产生原因?

①:技术保障措施不完善:计算机系统本身的脆弱性;软件系统存在缺陷;网络的开放性

②:管理体系不健全:组织及人员风险;管理制度不完善;安全策略有漏洞;缺乏应急体系

③:基础设施建设不健全:法律体系不健全;安全标准体系不完整、电子政务的信任体系问题 ④:社会服务体系问题

27电子政务的安全需求是什么?

需求是:保护政务信息资源价值不受侵犯,保证信息资产的拥有者面临最小的风险和获取最大的安全利益,使政务的信息基础设施、信息应用服务和信息内容为抵御上述威胁而具有保密性、完整性、真实性、可用性和可控性的能力,从而确保一个政府部门能够有效地完成法律所赋予的政府职能。表现为:信息的真实性、保密性、完整性、不可否认性、可用性。28.了解几种网络安全技术?

A.防火墙:①:一般分为数据包过滤型、应用级网关型、代理服务器型。

②安全策略是:一切未被允许的都是禁止的;一切未被禁止的都是允许的。

B.电子签名技术:是将摘要信息用发送者的私钥加密,与原文一起传送给接收者。接收者只有用发送者的公钥才能解密被加密的摘要信息,然后用HASH函数对收到的原文产生一个摘要信息,与解密的摘要信息对比。如果相同,则说明收到的信息是完整的,在传输过程中没有被修改,否则说明信息被修改过,因此数字签名能够验证信息的完整性。

C.非对称密钥加密技术:需要使用一对相关的密钥:一个加密,一个解密。分为两种基本模式:加密模式和验证模式

D.入侵检测系统:是依照一定得安全策略,对网络、系统的运行状况进行监视,尽可能的发现各种攻击企图、攻击行为或攻击结果,以保证网络系统的机密性、完整性和可用性。类型有:基于主机的入侵检测系统,基于网络的入侵检测系统、分布式入侵检测系统。方法有:基于特征的检测、基于异常的检测、完整性检验。E.防病毒系统:分为主机防病毒和网络防病毒。主机房病毒式安装防病毒软件进行实时监测,发现病毒立即清除或修复。网络防病毒是有安全提供商提供一整套的解决方案,针对网络进行全面防护。F.漏洞扫描系统:功能有:动态分析系统的安全漏洞,检查用户网络中的安全隐患,发布检测报告,提供有关漏洞的详细信息和最佳解决对策,杜绝漏洞、降低风险,防患未然。

G.安全认证:用户访问系统之前经过身份认证系统,监控器根据用户身份和授权数据库决定用户能否访问某个资源。电子政务系统必须建立基于CA认证体制的身份认证系统。数字证书用来证明数字证书持有者的身份。

29.PMI与PKI的概念和区别?

概念:PKI即公钥基础设施,又叫公钥体系,是一种利用公钥加密技术为电子商务、电子政务提供一整套安全基础平台的技术和规范,采用数字证书来管理公钥。

PMI即授权管理基础设施,是国家信息安全基础设施的一个重要组成部分,目标是向用户和应用程序提供授权管理服务,提供用户身份到应用授权的映射功能,提供与实际应用出息模式相对应的、与具体应用系统开发和管理无关的授权和访问控制机制,简化具体应用系统的开发和维护。

区别: ①:解决问题的不同。PKI解决对身份的认证问题。PMI是身份认证之后,决定你具有的权限和能做什么的问题。

②:证书不同。首先,公钥证书必须包含拥有者公钥,属性证书而是有一个到证书拥有者的链接。其次,证书的有效时间不同,属性证书时间比公钥的有效时间短。

③:管理部门不同。公钥证书和属性证书的管理颁发部门有可能不同。

④:体系结构类似。PKI是从根CA、下级CA、注册中心到最终用户,PMI是从信任源点、授权服务中心、资源管理中心到最终用户。

30.我国电子政务标准的主要内容?

内容为:①:基于XML的电子公文格式规范;

②:XML在电子政务中的应用法指南;

③:电子政务业务流程设计方法通用规范;

④:信息化工程监理规范;

⑤:电子政务数据元:设计与管理规范;

⑥:电子政务主题词表编制规则;

31.阐述电子政务中你了解的信息技术?(详细介绍见199页)

政府网站建设技术:Web技术、XML技术、网站IA技术、分布式计算机模型。Web技术:建立在客户机模型上,以HTML和HTTP协议为基础,能够提供各种网络服务的、一致的用户界面的一种信息服务系统。Web的开发平台有ASP,PHP,JSP,ASP.Net。在电子政务中的应用模型有:静态模型、动态交互型模型、电子政务企业级模型。

地理信息技术:是以遥感、地理信息系统、全球定位系统和网络等技术为核心的综合性应用技术。(GPS、RS、GIS技术)。应用在环境、自然灾害、资源管理、城乡规划、农业方面。

政务智能技术:是指政府机关用来对各种政务资料进行定量分析的技术策略、过程和工具,核心使命是帮助政府管理者做出及时、正确、可行和有效的决定。核心技术是:数据仓库技术、联机分析处理技术、数据挖掘技术、知识管理技术。

知识管理:是以知识为核心的管理,一种对知识的组织和再组织,在大量的信息中进行知识挖掘,以及对人的显性和隐性知识进行管理。由智能代理、文档转换接口、内容管理、知识发布与共享、决策支持组成。

政务网格技术:就是利用现有的网络基础设施、协议规范、数据库等资源和网格技术,为用户提供一体化的智能信息平台。追求的最终目标是做到服务点播和一站式服务。存在的问题是:资源共享安全性问题、政务网格的建构问题、网格技术的协议与标准问题。

协同办公技术:是在计算机技术支持的环境下,一个群体协同完成一项共同的任务。分为:基于工作流的协同办公技术、基于角色网络的协同办公技术、基于多Agent的技术的协同办公技术、基于P2P技术的协同办公技术。32.电子政务系统项目建设过程?

一般包括:项目准备、项目启动、项目采购、项目实施、系统评价

33.电子政务系统项目管理的内容?

包括:需求管理、风险管理、进度管理、质量管理、人力资源管理、沟通管理、集成管理、文档管理。

34.电子政务评价模型内容?电子政务系统的评价?见书268页

评价模型:评价方法、评价基准、评价数据、评价指标是核心四要素。

①:评价方法:主观赋权法(如层次分析法)、客观赋权法(如因子分析法、数据包络分析)

②:评价基准:内部基准和外部基准。是电子政务评价的参考点。识别前进方向和目标

③:评价指标:是评价模型的骨架。分为:通用类指标、专用类指标、评议类指标

④:评价数据:是评价结果产生的源泉。数据分为定量数据、定性数据。

5.4-外文文献译文 篇五

毕业论文题目: 常用博客和论坛数据自动抓取系

统的设计与实现

文献中文题目: UbiCrawler:一种可扩展的全分布式

网络爬虫

文献英文题目: UbiCrawler: a scalable fully distributed Web crawler 专 业 软件工程 学

号 学 生 姓 名 指 导 教 师 答 辩 日 期 2015-06-25

哈尔滨工业大学 哈尔滨工业大学本科毕业设计(论文)(外文文献)

外文文献译文

UbiCrawler:一种可扩展的全分布式网络爬虫

1.引言

在本文中我们介绍ubicrawler的设计与实现,一种可扩展的,可容错的全分布式网络爬虫,并且我们从先验和后验两方面评估了它的性能。ubicrawler设计的整体结构在[1],[2]和[3]进行了描述。

这项工作是一个项目的一部分,其目的是收集大量的数据集,研究Web的结构。这是从统计分析特定的网络域[4]估计的分布经典参数,如页面排名 5]和重新设计阿里安娜发展的技术,最大的意大利搜索引擎等。

由于该项目的第一阶段,我们发现集中爬虫已不再是足够的在网络中抓取有意义的部分。事实上,它已经认识到,“作为网络的大小成长,成为爬行的过程并行化势在必行,为了完成下载页在一个合理的时间量[6,7]。

许多商业和研究机构运行他们的网络爬虫收集关于Web的数据。即使没有可用的代码,在一些情况下,基本的设计已被公开:这都是是案例,例如,墨卡托 [8](AltaVista爬虫),原来的谷歌爬虫[9],和一些在学术界的爬虫{10–12]。

尽管如此,几乎没有发表的作品实际上探讨了在爬行过程中所涉及的不同任务的并行化这个基本的问题。特别是,我们知道的所有的方法都是使用某种集中管理,决定去访问哪些网址,并存储已经被抓取的网址。最好,这些组件可以被复制,他们的工作可以被划分为静态。

相反,当设计ubicrawler,我们决定把每一项任务,具有明显的可扩展性和容错性方面的优势。

ubicrawler的基本特征: •平台独立性;

• 充分分配每一个任务(没有单一的故障点和没有集中协调); • 基于一致哈希的局部可计算的地址分配;

• 容忍故障:永久性以及短暂的优雅地处理故障; • 可扩展性。

哈尔滨工业大学本科毕业设计(论文)(外文文献)

• 网址的分布应该是平衡的,即,每个代理应该负责约相同数量的网址。在异构代理的情况下,网址的数目应该是成正比的代理的可用资源(如内存,硬盘容量等)。

可扩展性。每秒的页面数和代理应该是(几乎)独立的代理数量。换句话说,我们期望的吞吐量与代理的数量呈线性增长。

文雅性。一个平行的爬虫决不应该试图从一个给定的主机上获取一页以上的一页。此外,一个合适的延迟,应在随后的请求之间引入相同的主机。

容错性。一个分布式的爬虫应该能继续工作在崩溃故障下,这是当一些代理突然死亡的时候。在这种崩溃的存在下,没有行为可以被假定,除了有缺陷的代理停止通信;特别是,一个不能规定任何行动,一个崩溃的代理人,或恢复其状态之后。当一个代理崩溃,剩余的代理应继续满足就地平衡计算分配的要求:这意味着,在特定的URL,这架代理将被重新分配。

这有2个重要的后果。

• 不可能假设网址是静态分布。

• 由于“就地平衡计算任务的要求必须满足在任何时间”,在崩溃之后依靠分布式分配协议这是不合理的。事实上,在重新分配的要求将被破坏。

3.软件体系结构

ubicrawler由几个代理,自主协调它们的行为,在这样一种方式,每个人扫描其网络的共享。一个代理执行它的任务,通过运行多个线程,每一个单独的主机单独访问。更确切地说,每一个线程扫描一个主机使用广度优先访问。我们确保不同的线程访问不同的主机在同一时间,因此,每个主机不超载太多的要求。这是不是本地主机的给定样本被派遣到代理权,使其在页面被访问队列。因此,整体的Web访问是广度优先,但尽快达到一个新的主机,它是完全访问(可能有界深度达到或总页数),再次在广度优先的方式。

更先进的方法(可以考虑适当的优先级相关的网址,如,他们的排名)可以很容易地实现。然而,值得注意的是,有几个作者(见,例如,[13])认为,广度优先访问倾向于在爬取的时候找到高质量的网页。关于页面质量的一个更深入的讨论,在第6节中给出。

哈尔滨工业大学本科毕业设计(论文)(外文文献)

一个重要的优势是,每个主机广度优先访问DNS请求是罕见的。网络爬虫使用全球广度优先策略必须在DNS服务器的高延迟:这通常是由一个多线程缓存缓冲请求通过了。同样,没有缓存是由“机器人排除标准”[ 14 ]所需的robots.txt文件需要;事实上这样的文件可以下载,当主机访问开始。

代理的主机分配考虑到在每个代理的质量存储资源和带宽。这是目前所做的一个单一的指标,称为能力,这是作为一个权重的分配功能分配主机使用。在某些情况下,每一个代理的主机比例的比例,其容量的主机(见4节的一个精确的描述如何工作)。注意,即使每个主机的URL数量参差不齐,代理人之间的URL分布趋于均匀在大爬虫中。除此之外的经验统计的原因,也有其他的动机,如用于边界的最大数量的网页抓取的政策的使用和访问的最大深度。这样的政策是必要的,以避免(可能是恶意)网络陷阱。

最后,对ubicrawler必不可少的组成部分,是一个可靠的故障检测器[15]使用超时检测撞剂;可靠性是指一个撞剂最终会被每一个活性剂(通常称为故障探测器的理论完备性较强的属性)。故障检测器是ubicrawler唯一同步组件(即使用定时功能的唯一部件);所有其他的组件在一个完全异步的方式进行交互。

4.功能分配

在本节中我们描述的ubicrawler功能分配,和我们解释为什么这个功能可以实现每一个任务和实现容错的目标。

让A表示我们的代理标识符(即潜在的代理的名字),L ⊆ A是活着的代理设置:我们必须指定主机代理L.更确切地说,我们已经设置了功能δ,每个非空集合L活剂,和为每个主机H,代表的责任,取(URLs)H的代理δL(H)∈L。

下列属性是需求的功能分配。

1.平衡。每个代理应该得到大约相同数量的主机;换句话说,如果m是主机(总数),我们想要|δ−1L(a)| ∼ m/|L| 对于每一个 a ∈ L.2.逆变。分配给一个代理主机的设置应该就在失活和活剂激活设置在逆变方式转变。更确切地说,如果L ⊆ L 然后 δ−1 L(a)⊇ δ−1 L(a);也就是说,如果代理的数量增长,每一个代理的网页抓取的部分必须收缩。逆变具有根本性的后果:如果增加一个新的代理,没有旧的代理将

5哈尔滨工业大学本科毕业设计(论文)(外文文献)

上一篇:班级卫生管理的反思下一篇:许昌市城乡规划评审专家库管理办法