网络营销中数据挖掘技术的应用论文(通用8篇)
1.网络营销中数据挖掘技术的应用论文 篇一
大数据技术在营销客户服务中的应用及研究
当前,电力企业改革发展面临新的形势和任务,随着电力体制改革的不断升入,尤其是受市场广泛关注的售电公司的出现,电力市场的交易将更加“民主、开放”,交易方式将逐步升级,出现电网+互联网+信用+期货+零售+批发等多种灵活、自主的交易方式,导致电力企业在开拓售电市场、防范经营风险等方面面临的压力与日俱增,同时面临着优质客户减少、市场份额下降及优质人才流失的严峻挑战,尤其对营销服务业务提出了更高的要求和新的挑战。对电力企业来说,利用大数据技术构建营销服务技术支撑平台,对营销客户用电特点及需求进行分析,可以为制定电力营销方案提供数据支持、为电力企业抢占市场及用户提供重要的数据支撑,从而提高企业经济效益,不断提升客户服务水平和服务质量。基于此,此课题的研究具有非常重要的现实意义。
一、大数据概述
“大数据”(big data)是与智能制造、无线网络革命并行的又一次颠覆性的技术变革,“大数据”是指量大、复杂、增长迅速的数据集合,也指在一定时间内无法通过传统的数据库软件工具对其内容进行抓取、管理和处理的数据集合,它涵盖了从生成、采集、存储、加工、转换、计算、分析挖掘、展示到使用整个数据全生命周期管理的过程,以及在这些过程中所用到的各项技术。
大数据技术的重要意义不仅仅在于掌握其中海量的数据信息,而且在于对这些含有重要意义的数据信息进行专业化的加工和处理、对于海量数据进行存储和分析。
二、电力大数据的价值及特征
每一个行业和业务领域都蕴含着大量的数据信息,而且逐渐成为其重要的生产因素。对于电力行业而言,电力大数据综合了电力企业的产、运、销及运营和管理数据,是以行业形势?A判、数据价值的挖掘为目标,利用大数据核心关键技术,实现企业管理模式转变、服务理念的提升,从而完成企业的转型升级,适应新的改革形势和外部环境。
电力大数据的特征主要为:
数据量大。这是电力大数据的一个重要特征。随着电力信息化建设的不断推进,电力数据的增长速度和规模已远超出电力企业的预期。
类型多(Variety),是指电力大数据包含各种各样的数据类型,如结构化、半结构化和非结构化数据。
速度快(Velocity),是指对电力大数据的采集处理和加工分析的速度。
有价值(Value),是指电力数据当中包含有很多有价值的信息。
一方面,随着电力体制改革的不断深入,电力企业将从生产型企业逐步转变为服务型企业,企业的业务流程需要围绕用电客户的需求进行优化和重组,同时,企业内部也需要变革管理模式、进行战略性转型。另一方面,随着“三集五大”体系建设的深入推进,SG186、SG-ERP等系统的建设及推进,已实现了企业级数据资源的初步整合及共享利用,但随着电力数据量的快速增长、数据类型的多样化以及跨专业、跨平台应用的日益深化,电力大数据必将面临着数据的高性能存储及高可扩展性等多项挑战。
因此,通过数据挖掘等技术深入挖掘并分析不同电力客户的需求,把最大限度满足客户的需求同提高企业的经营效益统一起来;站在客户的立场,以客户为中心,及时主动满足用电客户的需求,已成为电力企业的核心竞争点。电力改革环境下,企业必须进行业务流程的变革以适应时代的要求。
三、电力营销面临的机遇和挑战
大数据技术给电力营销带来了新的发展机遇,但也面临着很多挑战。“数据海量,知识匮乏”是大数据时代多数企业的通病。国家电网公司在“十二五”期间提出了“一型五化”的大营销体系(客户导向型、业务集约化、管理专业化、机构扁平化、管控实时化、服务协同化),一方面,随着“大营销”体系的全面建立,各类信息系统数据量多而重复,数据种类繁多,数据量大而冗余,给营销管理和决策者均带来了很大挑战。另一方面,当前营销各类业务的数据信息以业务工单的模式存储在不同的信息单元中,从而形成了多个信息孤岛;且同样的数据信息,不同专业进行统计分析时所采用的信息来源和统计方法都不尽相同,又造成了数据统计口径的不一致,这在很大程度上影响着营销管理服务及决策。
随着智能电网建设的全面开展以及SG186营销业务应用系统的建设完善,海量的业务数据被积累,且当前电力企业的运营方式正在向以电力市场需求和提高客户满意度的方向发展,这就对电力企业的营销服务质量提出了更高的要求,使得电力企业面临了多方面的压力。
一是海量的业务数据分属不同的应用体系,且类型繁杂,不少业务数据也都被分散在各自的系统内,造成了数据孤岛;数据庞大且分散,无法被有效利用与提炼升华;对于同一组数据,由于基于的统计方法、统计背景和数据来源都可能不一致,必定会造成数据统计口径有偏差。
二是售电侧业务放开对公司传统营销模式将带来巨大冲击。新一轮电力体制改革深入推进,公司面临优质客户减少、市场份额下降和优秀人才流失的严峻挑战。电力企业要在市场竞争环境中谋求发展和生存,只有充分了解市场化规则,找准市场定位,变革企业管理机制,才能适应电力体制改革,不被市场所淘汰,稳步向前发展。
三是行业监管和市场竞争给优质服务提出新的挑战。电力改革催生市场主体多元化竞争,不断推动供电服务从“监管+自律”向“监管+竞争”转变,服务风险和舆情预控难度加大。
四是客户提出了更多的服务需求及更高的服务质量。一方面随着市场化经济的不断深入,企业不仅要为用户提供优质的产品,还需要提供越来越优质的服务。另一方面,经济时代逐步向知识经济社会进行过渡,用户对电力企业提供的产品和服务都提出了更高的要求,客户满意度将成为供电企业发展的重要因素,成为供电企业效益的根本源泉。
同时,数据背后隐藏着面对客户越来越个性化、多元化的消费需求,对电力企业的服务内容、服务方式、服务质量、经营管理都提出了更严峻的挑战。
四、大数据的关键技术
电力行业营销系统包含结构化数据,如客户资料、设备记录等,非结构化数据如合同、身份证和其他扫描图片等格式的文件。大数据技术需要加强对电力行业营销类数据存储和分析能力,同时数据挖掘和模式识别技术在客户用电行为分析的应用可以有效支持需求响应。
在电力大数据时代下,大数据已成为电力企业进行决策的基础。只有运用现代化的技术手段,对海量数据进行深度的加工和处理,发现并利用其中蕴含的重要的信息,为电力企业决策者提供数据支撑,才能真正发挥电力大数据的重要作用。
大数据技术分为四层:数据存储层、数据集成层、数据计算层和数据应用层,每一层包含不同的关键技术,其中数据应用层数据挖掘技术需要进行提高及深入应用。数据挖掘是指通过算法发现隐藏于海量数据中信息的过程。数据挖掘需要通过统计、在线分析和处理、机器学习、专家系统(依靠过去的?验法则)、情报检索和模式识别等多种方法来实现目标。
数据挖掘过程的总体目标就是从一组数据中提取信息并将其转换成一个可以理解的结构进行进一步的使用,除了初步的分析,它还包括数据库和数据管理,数据预处理、建模和推理,结构的后期处理,可视化,和在线更新等方面。
数据挖掘使用过去的信息数据来分析一个特定的问题或可能出现的情况的结果。数据挖掘工作分析所有存储在数据仓库中的数据,这个数据可能来自所有的业务,从生产到管理,管理者还可以使用数据挖掘来决定他们产品营销策略,和竞争对手比较。
五、构建统一的数据平台
电力行业每一个业务部门数据相互之间不能相互共享及融合,有些数据形成了信息孤岛,也有些数据存在于多个系统中,且录入、修改的途径有多种,采用不同的采集方式采集相同的数据,得到的结果在一定程度上存在着一些偏差,数据具有广泛的异构。因此需要整合各专业、各平台之间各个环节数据,对数据进行提炼、分析及挖掘,实现跨部门、跨业务、跨平台间数据的共享。如:涉及多专业的电力资产全寿命周期管理、营销、生产等都需要融合不同的来源数据,从而形成以数据为中心的企业信息化管理系统,构建统一的数据管理平台,促进数据资源共享,发挥数据的价值。
基于开展电力营销服务的优势与机遇以及大数据关键技术的研究,提出了利用大数据技术构建营销服务技术支撑平台,依托营销基础数据服务平台、营销业务管理平台建设,整合市场发展、经营活动、客户服务、资产运行等数据信息,研究其多维度分析主题、动态分析评价指标体系,数据的动态采集、合理存储、自动化处理方法,科学分析模型,建立覆盖政策、市场、营业等的营销服务技术支撑平台。平台核心应用应该包括数据采集服务、数据查询服务、数据搜索服务、分布式离线计算服务、分布式实时计算服务、数据挖掘服务、分布式协调服务、分布式队列监控、分布式数据库服务、分布式文档存储服务、数据订阅服务、开发式监控服务及集群管理等核心应用子系统。
六、创新营销服务模式
电力营销要始终把握好“以客户为中心,以市场为向导”的原则,重点做好以下工作:加快转变营销发展方式和服务模式。高度重视市场变化,积极主动,在参与竞争中掌握先机;高度关注客户需求和变化,快速响应,在优质服务中扩大客户群体,切实加强新形势下营销服务体系的建设。
(一)实现电力需求的预测
依托电力大数据技术,整合电力营销各业务系统数据,获取海量的用户数据信息,建立客户的数据关联机制,结合国家政策、经济发展水平、地理环境等因素,对其进行分类、分区域、分行业的数据分析,深入了解不同群体的用电规律和用电行为,实现用户对电力需求的预测,并实现对电力的合理调度以及电力需求的合理管控。
(二)为客户提供差异服务
通过数据分析获得用户的电力消费水平,实现了对用电客户的细分,制定出针对不同客户的行之有效的电力营销策略和服务方案;以客户细分数据为基础,为重要用户提供优质服务,并根据各类客户的特性提供有针对性的、差异化服务。针对重要用户,要主动上门走访,提供技术支撑,并在业务流程、服务机制及服务价格等方面提供高品质的产品和服务,从而满足其对电力企业服务的高需求和高期望。一方面建立业务办理专用“绿色通道”,成立服务工作组,配备专职服务人员为其提供主动式上门服务,另一方面,为这些大客户提供自主式供电时间,提前告知内部消息等服务。同时,供电企业要定期组织开展专业技术及安全知识培训,免费对其各类用电设备进行现场检查,不断提升客户的粘连度、忠诚度和满意度。
(三)降低企业经营风险
根据用户电量电费及缴费习惯等数据进行监测,通过对客户评估与客户行为追踪,预选出一些拒缴、拖欠电费的客户,创建用电客户的信用等级,提高电款回收效率,实现风险的合理规避,有效防止客户风险转嫁,将企业经营风险降为最低;同时需要结合移动互联网技术,深度整合渠道,充分发挥营业厅、95598网站、网上营业厅、掌上电力APP、电e宝、微信等渠道,为用户提供多渠道缴费模式,提高电费回收率,确保经营成果颗粒归仓。
(四)用户服务需求分析
在互联网时代,供电企业的优势更多反映在对用户需求的掌控和生态系统引领上,针对不同类型的用电客户进行创新服务,通过电力企业大数据平台,汇总分析客户需求以及客户投诉等信息,掌握客户关心的中心、投诉集中反映的问题、投诉用户的构成及分布、问题解决效率和追踪,总结、提炼、分析用电客户的聚焦问题。通过建立客户需求导向模型,对用户的需求进行可行性分析,提供一对一的服务,从而提高服务质效;对于用户投诉的共性问题,开展深入的诊断分析,提出有效整改方法,并定时开展供电服务明察暗访及电话回访,收集用户的满意度信息。
(五)建立客户质量评价体系
借助大数据平台,深入分析用户的电费缴费习惯、违约窃电情况以及社会上各行各业的信用评价等信息,建立客户质量评价模型,通过分析和筛选形成优质客户清单,并对其推送个性化信息,提供特殊化服务;同时,对客户信用进行评估,建立用户信用等级,根据其信用等级确定其电费缴纳方式,形成电力企业内部黑名单用户清单,加强此类用户风险防控,提升企业风险控制能力。
(六)支撑营销管理决策
以营销服务技术支撑平台为基础,依托营销基础数据服务平台、营销业务管理平台建设,整合市场发展、经营活动、客户服务、资产运行等数据信息,深度挖掘各类信息数据中的潜在关系,为各类管理和决策者提供多维度、多方位的分析预测性数据,提升工作效率,为企业发展指明正确的方向。
七、总结语
大数据时代,数据蕴含着巨大的利用价值,如何利用这些大数据信息对企业的发展具有很重要的战略意义。随着电力体制改革进一步深入,将大数据相关技术应用到电力企业内部的各个环节,充分挖掘现有电力数据的有效信息及无限的价值,为电力营销策略的制定提供重要的数据支撑,为电力用户提供高水平服务,提升电力企业的经济效益,这将具有深远的意义,同时也将成为电力企业持续发展的重要研究课题。
2.网络营销中数据挖掘技术的应用论文 篇二
关键词:数据挖掘,关联规则,精准营销
0 引言
进入21世纪,以网络和信息技术为核心的精准营销体系,在一定程度上将取代传统的营销方式,逐步成为现代企业营销发展的新趋势。虽然中国企业在精准营销方面有了一定的发展,但仍然存在很多亟待解决的问题,其中如何精确地发现潜在的目标用户群是摆在企业面前的一道难题。本文给出了一个数据挖掘的系统实现方案,并给出应用的案例以验证方案的可行性。在此方案的基础上,可以为企业精准营销提供决策支持。
1 软件实现方案
软件设计如图一所示。整个软件功能从四个层面上来实现:最底层为数据存储层,从某大型数据库中获取原始数据,经过处理最终到达精准营销系统数据仓库;其次是功能层,为与企业用户的交互提供后台的支持,主要的功能模块有企业自助服务和数据分析管理者,其中,前者包括企业信息管理、登录员工管理、黑白名单管理、企业客户管理等;后者包括行业管理、企业客户分析、企业池管理等;展示层以功能层为后台支持,提供与客户直接交互的各种组件;最后是服务层,主要实现数据采集、计费帐务、广告业务、数据分析等功能。
2 数据挖掘系统设计
数据挖掘系统设计如图二所示。
(1)潜在用户定位模型:包括企业潜在用户定位以及企业行业用户定位。
(2)行业地位分析模型:通过挖掘数据,比较结果分析,得出企业所在行业的行业地位。
(3)行业用户共享模型:通过行业相似性分析,找到拥有共同客户特性的行业,共享它们之间的用户群。
(4)效果分析模型:通过对比企业实行精准营销宣传计划前后的客户相应情况。
3 关联规则的挖掘过程
关联规则的挖掘过程如图三所示。
(1)找出所有的频繁项集。首先找出频繁项集,即支持度不小于用户指定的最小支持度的相集。对于有语义约束的规则,可以求出满足约束的频繁项集。
(2)由频繁项集产生强关联规则。事实上这一步又分为两个过程:第一个过程是由频繁项集产生关联规则,即对于每一个频繁项集L,检查的每个非空子集X,生产规则X=>L-X;第二个过程是计算每一个关联规则的置信度,只有那些不小于最小置信度的关联规则才会被作为强关联规则保留下来。
4 案例分析
下面是对汽车行业的试点案例,期望通过对某城市汽车业销售热线的呼叫排名统计,分析出目前哪类汽车较受客户的欢迎以及客户的一些消费习惯。
我们对35家4S汽车店进行了样本抽样,最后导出的抽样结果如图四所示,各品牌汽车一周呼入的排名如图五所示。
对呼叫排名分析可以看出:上海大众一周的呼入量最高,这也基本反映了目前上海大众汽车市场占有率的情况,而在高端市场则奔驰汽车的呼入量最高。
对35个4S店销售热线接通率(即对用户的电话进行应答和用户总的呼叫次数的比率)进行了分析,分析结果如图六所示。
从各4S店销售热线接通率看,各家4S店间的应答试呼比差异较大。但总体来看高档车销售热线的应答率明显高于中低档次车的销售热线;大品牌公司4S店的销售热线较一般品牌4S店的销售热线要高,各4S店销售热线接通率如图六所示。从图中可以看到,有5家4S店的接通率低于50%,占抽样总量的14.3%,其中3家接通率为0。这5家4S店的共同特点是呼叫量比较小,一周呼叫量均低于40次;除东风雪铁龙外,其他名牌均为本地品牌或者属于客车品牌。
(1)通过抽样4S店的咨询热线的呼叫排名基本可以看出在中低档汽车市场上海大众的占有率相对较高,而高档市场则是奔驰。
(2)从4S店一周的呼叫量看,4S店咨询热线的呼叫量并不是很大,其中的原因是随着网络的高速发展,了解信息的渠道更加多样化,网络能够满足客户了解车市的需要。
(3)从话务属性可以看到,对于高档车市场,本地和外地消费者皆有,其主要是由于杭州是省会城市,一些高档车在浙江的销售点仅设在杭州;而中低档汽车,消费者主要以本地客户为主。
(4)从消费者的消费习惯看,高档车消费者对汽车有较深的理解,对汽车的选择有自己的主见,因此极少联系两家不同品牌的汽车销售商;而中低档车消费者对汽车的选择可能还是更加注重性价比,因此,联系两家或者多家销售商的比例比高档车消费者要高。造成这种差异的原因可能在于消费者对车的用途理解不同所致。
(5)从4S店咨询热线呼出和呼入的比例看,中低档车的比例明显高于高档车。这两类消费者消费习惯的不同导致了热线呼出和呼入比例的巨大差异。
(6)从4S店咨询热线的服务质量看,大品牌和高档汽车销售4S店非常重视咨询热线的服务质量,以进一步提升自身的品牌效应。
5 结束语
本文在有关数据挖掘技术--关联规则挖掘的基础上,研究了数据仓库系统和企业信息查询记录对于企业精准营销的利用价值,再在这些数据的基础上,利用数据挖掘技术,找到其中隐藏的有商业价值的规则。从实际应用来看,为相关企业的精准营销策略提供了较好的决策支持。
参考文献
[1]Jiawei Han,Micheline Kambers著.范明,孟小峰译.数据挖掘概念与技术[M].北京:机械工业出版,2007,3.
[2]Margaret H.Dunham著.郭崇慧,田凤占,靳晓明等译.Data Mining Introductory and Advanced Topics[M].北京:清华大学出版社,2005,5.
3.网络营销中数据挖掘技术的应用论文 篇三
关键字:人工神经网络 临床 数据挖掘
中图分类号:G202 文献标识码:A 文章编号:1003-6938(2010)03-0095-004
The Development of Data Mining Based on Artificial Neural Network in Clinical Medicine
Yuan Jinqiu Liu YaliYang Kehu (The Evidence-Based Medicine Center of Lanzhou University, Lanzhou, Gansu, 730000)
Abstract:Data mining technology has greatly developed since the 11th international artificial intelligence joint conference which was held in 1989.The achievement of the date mining technology based on Artificial Neural Networks (ANN) is especially conspicuous in the clinical domain; ANN is widely used in the clinical diagnosis, the prognosis and many other aspects. For a better understanding of ANN of the development status at home and abroad, this paper reviews the ANN model, the ANN data mining tool, recent development of clinical research and other relative aspects which are closely related to clinical fields.
Key words:artificial neural network;clinical;data mining
CLC number:G202 Document code:A Article ID:1003-6938(2010)03-0095-004
ANN是基于人腦神经网络的研究,采用数理方法对人脑神经网络进行抽象,建立的一种简化模型,最早在1943年由W·Mcculloch和W·Pitts提出了。此后,冯·诺依曼, Widrow,Hopfield等人在ANN的发展中作出了重要贡献,并有感知器、Hopfield网络等十几种模型相继诞生。时至今日人工神经网络(ANN)的研究涉及医学、生理学、哲学、信息学、计算机科学等众多学科领域,其在临床领域也取得了较大进展。本文将从与临床领域联系较密切的ANN模型、ANN数据挖掘工具、近期临床研究状况等方面加以综述。
1 ANN模型及原理
现阶段在临床领域应用最多的是BP神经网络和感知机模型。这两种模型也代表了ANN的一般原理。
1.1 BP神经网络
BP神经网络通常由输入层,隐层和输出层构成。BP算法学习过程包括信号的正向传播与误差的反向传播两个过程。正向传播时,输入样本从输入层传入,经各隐层处理后,传向输出层。若输出与期望值不符,则转入误差的反向传播阶段。反传阶段中通过连续不断的在相对与误差函数斜率下降的方向上计算网络权值和偏差,并依次改变权值来逐渐逼近目标。在学习过程中,这两个过程周而复始地进行,直至网络输出的误差减少到可接受的程度或完成预定的学习次数。随着ANN研究的不断深入,新的BP算法从有条件地改变参数的值、针对激励函数及误差函数等方面对传统BP算法进行了改进,并不同程度的弥补了传统BP易形成局部极小、学习效率低下及训练中存在遗忘趋势等缺陷。[1 ]这极大扩展了BP神经网络的应用范围。
1.2 感知器
感知器的基本思想是将一些类似生物神经元的处理单元构成一个计算网络,该网络能够自动地学习如何对模式进行识别和分类。通常它由感知层S,连接层A和反应层R构成。S由输入元素组成。S层与A层的连接权固定为1。中间层的元素位于A层,输出层的元素位于R层。A层与R层的连接权是通过学习来确定,通常在初始时取[-1,1]内的随机值,并在学习阶段根据梯度下降法不断调整,使权值的变化量等于正负输入矢量,最终使之在一定的输入时有期望的输出。实践证明,感知器可以很好的划分线性可分的输入矢量。然而感知器网络必须在输入矢量是线性可分时才有效。在临床领域中主要应用于一些医分类问题。[2 ]
2 ANN数据挖掘工具
ANN数据挖掘工具作为联系临床与ANN计算机科学的桥梁,发挥着重要作用。现阶段数据挖掘工具层出不穷,且大多可以完成关联、ANN等不同类型的数据挖掘任务。目前临床中应用较广的ANN工具有 Spss Clementine、 InsightfullMiner、Enterprise mine等。
2.1 Spss Clementine
SpssClementine是现阶段SPSS公司的核心挖掘产品,是业界领先的快速可视化数据挖掘建模环境。此工具结合了多种图形用户接口分析技术,包含神经网络、关联规则等多种算法,其性能优良:(1)软件平台使用图像象征的方法进行操作,可视化程序高,使其数据挖掘直观而具有交互性; (2)功能强大,易用性良好,用户可以不需编程就可以完成建模、数据汇总、变换等工作,从而集中精力处理具体业务问题;(3)完善的项目管理功能,支持CRISP-DM标准流程,依据该流程可对数据挖掘项目进行有效管理;(4)强大的数据存取能力。[3]目前,Clementine在临床疾病诊断、信号识别、预后等领域已有相当数量的成功应用范例。
2.2 Insightful Miner
Insightful Miner是IBM公司的数据分析和挖掘工具。Insightful Miner包含了目前最广泛的数据挖掘技术和算法,有如下几个重要特点:(1)采用独特的“管线式”架构,可扩展分析组件,高效率处理海量数据;(2)可操作性强,支持完整的数据挖掘流程,使得操作人员可不必关注算法的实现;(3)可实现探索性数据分析,通过Trellis快速图示多维数据,实现单变量描述性统计;(4)可实现模型的自动评估。总体来说,Insightful Miner是目前市场上最大容量及功能强大的工具,在顾客反馈报告中它的整体效能是最好的。目前Insightful Miner在临床疾病分类诊断,信号分析等方面都有不同程度的应用。
2.3 其他
除上述工具以外,Enterprise miner、Microsoft SQL server 2005、Darwin、Knowledge Mine等工具的ANN在臨床诊断、图像识别、预后、决策分析等方面也有一定程度的应用。
3 ANN的临床应用
3.1 疾病诊断分析
ANN精于数据整合,能有效避免人在诊断中由于经验性倾向而导致的诊断失误。在很多应用实例中,ANN诊断的准确率都高于专家诊断的准确率。
(1)临床症状体征诊断分析。症状与体征是医师作出诊断的第一手资料,意义重大。然而由于临床症状体征资料存在复杂性、多样性、不完整性及缺乏数学性质等特点,基于多种复杂临床症状体征数据的ANN数据挖掘应用还为数不多。在国外Abe Hiroyuk等应用ANN作间质性肺病的诊断,研究中选取年龄、肺功能等十项临床参数作为训练输入,经测试所得模型正确性达0.81。进一步将影像学参数加入训练输入项,模型的准确性提高到0.87。[4 ]Eggers等将ANN 应用于早期急性心肌梗塞的诊断和对胸痛病人梗塞面积的预测,选取肌钙蛋白、肌酸激酶同工酶MB等作为诊断指标,应用ANN交叉验证技术建立模型,训练所得系统各项阳性预测值,阴性预测值多大于90%。[5 ]国内孙文恒等建立了一个基于癌胚抗原、甲胎蛋白等6钟血清肿瘤标志物的ANN诊断模型,该模型可以同时区别消化道疾病、胰腺炎与胰腺癌,可为临床胰腺癌的诊断提供有价值的参考资料。 [6 ]此外,我国学者在ANN中医症候诊断方面也作了大量富有成效的工作。
(3)临床图像诊断分析。ANN应用于临床图像诊断分析可以提高诊断的正确性,提高影像资料的利用度,降低资历医师培训花费。近十年来,随着数字化影像技术的飞速发展,ANN 所处理的影像学资料越来越趋向与多维化,复杂化,所处理的影像资料扩张到心脏扫描、脑灌注扫描、磁共振成像及正电子发射断层扫描图像等。Acton等将ANN应用于帕金森病的诊断,该学者将81例病人的 Tc-99m纹状体神经多巴胺断层扫描图像输入ANN模型,所有图像资料同时用作训练和测试,系统总正确率达94.4%。[7 ]Gutte 等将ANN技术应用于肺癌病人的PET/CT图像的自动识别, 研究过程中采用肺脏分割算法分析87 例肺癌病人PET/CT图像,并抽取其中8项指标作为ANN模型的输入,系统准确率达 92% ,极大提高了肺癌病人PET/CT图像分析的水平。 [8 ]
类似于ANN在影像分析上的应用, ANN 在病理标本分析方面也有着显著的诊断优势。目前ANN已成功用于肺小细胞癌皮肺穿刺标本、乳腺细针穿刺细胞学标本、外周病理血管组织、宫颈巴氏物涂片、血细胞识别等方面的计算机辅助诊断。
(3)医学信号诊断分析。现阶段ANN已用于脑电图、肌电图、心电图、多谱勒超声和二氧化碳分析等各种医学信号分析。ANN可以把专家知识融入数学框架,来提取特征、分类和识别模式。由于ANN不需要考虑对数据噪声的统计假设,也不需要将专家知识经验条文化,因而ANN的数据处理方式更合理,在模式识别方面有显著优势。Srinivasan 等将ANN应用于癫痫病人的EEG分析,利用癫痫病人癫痫发作时EEG近似熵锐减这特性,通过训练样本建立起了ANN分析系统,试验测试该系统总精确率达100%。[9 ]Kara等应用多层前馈ANN分析视网膜电图,通过 LM 反传算法训练样本,最后得到的一个可以区分正常与非正常视网膜电图的诊断系统,该系统诊断的正确率94.2%。[10 ]
3.2 ANN应用于临床决策分析
ANN能够综合患者的各项具体情况给出一个特定的预测值,因而对于个体来说意义更大,这是传统的统计分析方法所望尘莫及的。Lisboa.等对1996年到2006年间发表的关于ANN在肿瘤方面应用论文资料进行系统评价,肯定了ANN在肿瘤决策支持应用方面的积极意义,同时作者也呼吁扩大的严谨研究方法的应用。[11 ]此外,Larder等将ANN应用于HIV治疗药物选择的决策支持分析, 研究所得ANN模型有较大实用价值,可以用于HIV耐药的分析及HIV感染者治疗过程中药物选择的决策支持。[12 ]
3.3 预后预测分析
在临床预后的分析中传统的依据统计数字作方法通常显得捉襟见肘。相比之下,ANN应用其个案分析的优势,充分整合各种相关因素,显著提高了精确度。ANN预后分析是近几年来最为活跃的研究领域之一。 Fumiaki Sato等将ANN应用与食道癌的生存率预测,该学者收集418名病人199项临床及病理资料,经训练所得ANN模型对病人的一年存活率及五年存活率预测精确度较高(AUR=0.884,P<0.0001),明显优于依据TNM分期标准的预后方法。[13 ]Heckerling等将ANN与遗传算法结合应用与泌尿道感染病人的预后, 将212名泌尿道感染妇女的尿频、排尿困难等九项指标作为预测变量进行训练,到了较满意的ANN预后系统。作者认为ANN与遗传算法结合能够简化且较精确的预测泌尿道感染,且能够新发现不同症状、体征之间的联系。[14 ]Ivanov将ANN应用于大脑缺血性障碍的疾病进程预测分析,通过对224例病人的超声图谱资料的训练,得到了较好的结果,其预测准确性优于传统预后预测方法。[15]此外ANN还广泛应用于HIV发展过程预测、创伤修复、乳腺癌手术、腹主动脉瘤修复手术、肝移植和心外科手术等相关的预后预测分析。
4 ANN国内外发展动态与趋势
ANN在临床领域的应用研究在不同国家地区中表现地参差不齐,有学者对2000~2001年收录入ISI有关ANN在生物学和医学领域应用的论文作统计分析,发现最多产的五个国家分别为美国,英国,德国,意大利,加拿大(论文数:302,89,76,38,35)。中国以29篇论文收录居第九位,但其影响因子普遍较低,平均只有1.8 。[16 ]从2004年起,欧盟十国整合,使其ANN研究力量极大提升,从而形成了北美、欧盟、亚洲国家三足鼎立的局势。其中北美在放射学,核医学,医学图像处理的ANN研究有相当优势,欧盟则在病理学,微生物学等方面研究较多,亚洲国家的研究水平相对较低,研究的内容也较零散。
相比之下,中国在ANN的临床研究方面存在一定差距,主要表现在创新性缺乏、研究重复率高、研究方法欠严谨等方面。然而,国内研究取得的成果还是值得肯定的,最近几年中被发表的相关论文直线上升,研究范围也不断扩大。这些都表明ANN正逐渐为越来越多的中国学者所关注。值得一提的是,我国学者做了大量将ANN与传统中医结合的工作,主要包括中医症候诊断,中药疗效预测,病情诊断预测、脉象识别等。[17 ]这些研究都积极促进了祖国中医的发展。
近些年来电子病历的被推广使用,补充医学也越来越受重视,[18 ]这为ANN数据挖掘带来了新的契机。以往研究中,许多ANN系统缺乏严格对照,其研究结果真实性存在争议。因此,除进一步扩大ANN的临床应用范围外,利用更严谨的研究方法重复验证已取得的成果,可能在将来的研究中占有很大的分量。此外, 综合ANN应用于多病种的诊断、预后等工作,可能将是以后的研究重点。最后,将ANN与计算机专家系统结合也表现出了相当大的发展潜力。
5 结语
作为一个新兴的工具,ANN在临床领域取得了可喜的成績。然而目前ANN尚且只能被定位为临床辅助工具。要使ANN为临床工作,还需要进一步扩大其临床应用范围、进行多病种融合、以及应用更严谨的临床研究方法加以证实。
参考文献:
[1]陆琼瑜,童学锋. BP算法改进的研究[J].计算机工程与设计, 2007, 28(3): 648-650.
[2]崔雷. 医学数据挖掘[M]. 北京:高等教育出版社,2005.
[3]谢邦昌.数据挖掘Clementine 应用实务[M].北京:机械工业出版社,2008:41-46.
[4]Abe Hiroyuki,Ashizawa Kazuto,Li Feng. Artificial neural networks (ANNs) for differential diagnosis of interstitial lung disease: results of a simulation test with actual clinical cases[J].Acad Radiol, 2004, 11(1): 29-37.
[5]EggersKai M , ElleniusJohan ,DellborgMikael. Artificial neural network algorithms for early diagnosis of acute myocardial infarction and prediction of infarct size in chest pain patients[J].International Journal of Cardiology , 2007,114(3): 366-374.
[6]孙文恒等. 人工神经网络技术在胰腺癌诊断中的应用[J]. 兰州大学学报, 2008,44:223-226.
[7]ActonPaul D , NewbergAndrew.Artificialneural network classifier for the diagnosis of Parkinson's disease using [Tc-99m] TRODAT-1 and SPECT[J].Physics in Medicine and Biology , 2006, 51(12): 3057-3066.
[8]Gutte Henrik, Jakobsson David, OlofssonFredrik, Automated interpretation of PET/CT images in patients with lung cancer[J]. Nucl Med Commun,2007, 28(2): 79-84.
[9]SrinivasanVairavan , Eswaran Chikkannan, SriraamNatarajan.Approximate entropy-based epileptic EEG detection using artificial neural network's[J]. IEEE Transactions On Information Technology In Biomedicine, 2007,1(3): 288-295.
[10]KaraSadik,GuvenAysegul,Oner Ayse Ozturk. Utilization of artificial neural networks in the diagnosis of optic nerve diseases[J]. Computers in Biology and Medicine, 2006,36(4): 428-437.
[11]LisboaPaulo J, TaktakAzzam FG . The use of artificial neural networks in decision support in cancer: A systematic review[J]. Neural Networks, 2006,19(4): 408
-415.
[12]LarderBrendan, WangDechao,Revell. AndyApplication of Artificial Neural Networks for Decision Support in Medicine[J].Methods in Molecular Biology, 2008: 12
3-136.
[13]Fumiaki Sato, Yutaka Shimada , Florin M. Selaru . Prediction of survival in patients with esophageal carcinoma using artificial neural networks[J] .CANCER, 2005, 103 (8): 1596-1605.
[14]HeckerlingPaul S , CanarisGay J , FlachStephen D. Predictors of urinary tract infection based on artificial neural networks and genetic algorithms[J]. International Journal of Medical Informatics ,2007, 76 ( 4): 289-296.
[15]Ivanov Yu S , Semin G F.Diagnosis and prognosis of cerebral ischemic disturbances course using a method of artificial neuronal networks[J]. Zhurnal Nevrologii i Psikhiatrii Imeni S. S. Korsakova,2004,(12): 29-33.
[16]Robert Claude,Arreto Charles-Daniel, AzeradJean. Bibliometric overview of the utilization of artificial neural networks in medicine and biology[J]. Scientometrics, 2004,59 (1): 117-130.
[17]施明辉,周昌乐.人工神经网络在中医诊断中的应用现状与趋势[J].中国中医药信息杂志,2007,14(1):2-5.
[18]Igor Kononenko. Machine learning for medical diagnosis: history, state of the art and perspective[J]. Artificial Intelligence in Medicine, 2001,23(1):89-109.
4.网络营销中数据挖掘技术的应用论文 篇四
1、数据挖掘技术的应用及特点
数据挖掘技术是一种新型的技术,在现代数据存储以及测量技术的迅猛发展过程中,人们可以进行信息的大量测量并进行存储。但是,在大量的信息背后却没有一种有效的手段和技术进行直观的表达和分析。而数据挖掘技术的出现,是对目前大数据时代的一种应急手段,使得有关计算机数据处理技术得到加快发展。数据挖掘技术最早是从机器学习的概念中而产生的,在对机器的学习过程中,一般不采用归纳或者较少使用这种方法,这是一种非常机械的操作办法。而没有指导性学习的办法一般不从这些环境得出反馈,而是通过没有干预的情况下进行归纳和学习,并建立一种理论模型。数据挖掘技术是属于例子归纳学习的一种方式,这种从例子中进行归纳学习的方式是介于上述无指导性学习以及较少使用归纳学习这两种方式之间的一种方式。因此,可以说,数据挖掘技术的特征在出自于机器学习的背景下,与其相比机器主要关心的是如何才能有效提高机器的学习能力,但数据挖掘技术主要关心如何才能找到有用、有价值的信息。其第二个特征是,与机器学习特点相比较而言,机器关心的是小数据,而数据挖掘技术所面临的对象则是现实中海量规模的数据库,其作用主要是用来处理一些异常现象,特别是处理残缺的、有噪音以及维数很高的数据项,甚至是一些不同类型数据。以往的数据处理方法和现代的数据挖掘技术相比较而言,其不同点是以往的传统数据处理方法前提是把理论作为一种指导数据来进行处理,在现代数据挖掘技术的出发角度不同,主要运用启发式的归纳学习进行理论以及假设来处理的。
2、数据挖掘技术主要步骤
数据挖掘技术首先要建立数据仓库,要根据实际情况而定,在易出现问题的有关领域建立有效的数据库。主要是用来把数据库中的所有的存储数据进行分析,而目前的一些数据库虽然可以进行大量的存储数据,同时也进行了一系列的技术发展。比如,系统中的在线分析处理,主要是为用户查询,但是却没有查询结果的分析能力,而查询的结果仍旧由人工进行操作,依赖于对手工方式进行数据测试并建模。其次,在数据库中存储的数据选一数据集,作为对数据挖掘算法原始输入。此数据集所涉及到数据的时变性以及统一性等情况。然后,再进行数据的预处理,在处理中主要对一些缺损数据进行补齐,并消除噪声,此外还应对数据进行标准化的处理。随后,再对数据进行降维和变换。如果数据的维数比较高,还应找出维分量高的数据,对高维数数据空间能够容易转化为检点的低维数数据空间进行处理。下一步骤就是确定任务,要根据现实的需要,对数据挖掘目标进行确定,并建立预测性的.模型、数据的摘要等。随后再决定数据挖掘的算法,这一步骤中,主要是对当前的数据类型选择有效的处理方法,此过程非常重要,在所有数据挖掘技术中起到较大作用。随后再对数据挖掘进行具体的处理和结果检验,在处理过程中,要按照不同的目的,选择不同的算法,是运用决策树还是分类等的算法,是运用聚类算法还是使用回归算法,都要认真处理,得出科学的结论。在数据挖掘结果检验时,要注意几个问题,要充分利用结论对照其他的信息进行校核,可对图表等一些直观的信息和手段进行辅助分析,使结论能够更加科学合理。需要注意的是要根据用户来决定结论有用的程度。最后一项步骤是把所得出的结论进行应用到实际,要对数据挖掘的结果进行仔细的校验,重点是解决好以前的观点和看法有无差错,使目前的结论和原先看法的矛盾有效解除。
3、数据挖掘技术的方法以及在电力营销系统中的应用和发展
数控挖掘技术得到了非常广泛的应用,按照技术本身的发展出现了较多方法。例如,建立预测性建模方法,也就是对历史数据进行分析并归纳总结,从而建立成预测性模型。根据此模型以及当前的其他数据进行推断相关联的数据。如果推断的对象属于连续型的变量,那么此类的推断问题可属回归问题。根据历史数据来进行分析和检测,再做出科学的架设和推定。在常用的回归算法以及非线性变换进行有效的结合,能够使许多问题得到解决。电力营销系统中的数据挖掘技术应用中关联规则是最为关键的技术应用之一。这种应用可以有效地帮助决策人员进行当前有关数据以及历史数据的规律分析,最后预测出未来情况。把关联规则成功引入电力营销分析,通过FP-Growth算法对电力营销的有关数据进行关联规则分析,从中得出各种电量销售的影响因素以及外部因素、手电水平等的关联信息,以便更好地为电力的市场营销策略提供参谋和决策。对电力营销系统的应用中,时间序列挖掘以及序列挖掘非常经典、系统,是应用最为广泛的一种预测方法。这种方法的应用中,对神经网络的研究非常之多。因此,在现实中应用主要把时间序列挖掘以及神经网络两者进行有效地结合,然后再分析有关电力营销数据。此外,有关专家还提出应用一种时间窗的序列挖掘算法,这种方式可以进行有效地报警处理,使电力系统中的故障能够准确的定位并诊断事故。此算法对电力系统的分析和挖掘能力的提高非常有效,还可判定电力系统的运行是否稳定,对错误模型的分析精度达到一定的精确度。
4、结语
5.网络营销中数据挖掘技术的应用论文 篇五
网络中的数据通信
教师寄语:辛勤的蜜蜂永远没有时间悲哀。
【学习目标】
1.了解网络通信的基础知识。2.理解网络协议的基本概念。
3.能描述网络的开放系统互联协议(OSI)分层模型的基本思想。【新课导入】
现代信息社会,人们被由电话线、有线电视线、卫星和微波、无线电波及电视信号等组成的通信设施所传输的数据包围。计算机数据也是用这些通信设施传输数据,本节课我们学习通信设施的电缆和传输设备是如何传输计算机信息及在进行信息传输时必须使用的协议。
【自主学习】
一、研读课本P16—20,完成下列任务。
1.声波是一种__________信号,能够在空气中传播。
2.电话就是将人的声音信号变换成__________之后来传送的,再通过逆转换装置将其转换为声音信号。
3.计算机是以数字信号来表示和贮存信息的,数字信号只有两种状态,数字上用___和_______表示。
4.说明字符“A”是如何传送的? 5.为什么计算机在拨号上网和远程联机过程中使用MODEM? 调制:___________________ __________________________。
解调:____________________ ___________________________。6.信道(channel)是通信双方之间以传输介质为基础传递信号的_____________。7.根据传输介质的不同,(例如:普通导线、双绞线、同轴电缆、光缆以及各种频段的无线电传播等)的不同,信道可以分为_______信道和________信道。
8.带宽与宽带各指什么?
带宽(bandwidth)是指通信信道的_____________。宽带是具备较高通信速率和较高吞吐量的_____________。9.解释说明“分组交换技术”。
【当堂练习】
1.计算机网络是指把多台处于不同地域的独立的计算机,通过通信设备和传输介质按一定的几何结构互相连接起来,在一定的通信协议的控制下能够进行_____传递的计算机系统。
A.信息 B.电压 c.信件 D.声音
2.以下_____不属于计算机网络基本功能:
A.共享软件资源 B.共享打印机等硬件资源 C.网络视频会议 D.货物运输
3.以下不属于网络硬件的是_____。
A.交换机 B.路由器 C.中继器 D.网络操作系统
4.网络可以按拓扑结构和覆盖范围分类,以下不属于按网络拓扑结构分类的是_____。
A.星型
B.网状
C.总线型
D.局域网
5.Intemet是指_____。
A.国际互联网
B.局域网
C.校园网
D.邮电网
【当堂检测】
一、选择
1.关于搜索引擎,下列说法错误的是_____。
A.搜索引擎中,可以使用多个关键词组合进行搜索
B.通过搜索引擎,可以在因特网中搜索需要的信息
C.我们可以用搜索引擎来搜索需要的图片
D.搜索引擎是插在计算机主板上的硬件卡
2.因特网用户通过电子邮件_____。A.只可以传送文本信息
B.可同时传送文本信息与多媒体文件
C.不能附加任何文件
D.不能传送多媒体文件
3.LAN 在计算机网络中表示的是()
A.因特网
B.广播网
C.广域网
D.局域网
4.一个教室内计算机联成的网络属于()
A.因特网
B.广域网
C.局域网
D.城域网
二、判断
1.建立计算机网络的主要目的之一是为了实现计算机资源的共享。()2.通过网络可以实现文件的共享。()
3.用光纤只能连接广域网,不能连接局域网。()4.因特网发展到如今,已经有一百多年的历史了。()
【知识拓展】
1.网络中的信号是如何传输的(以“A”为例)?
2.ADSL的工作原理 ADSL(Asymmetric Digital Subscriber Line)的中文名称即非对称数字用户专线。传统的电话线使用了0KHz~4KHz的低频段进行语音传送,而电话线理论上有接近2MHz的带宽,窄带N—ISDN进行抽样编码划分信道可基本将2MHz的带宽充分利用,在窄带N—ISDN方式下,想进一步获得大于2M的带宽,只能转向宽带B—ISDN。但宽带B—ISDN 一直因设备复杂,成本极高而无市场推广价值。
ADSL因使用普通电话线作为传输介质,却有很高的带宽而得到迅速发展。ADSL正是使用了26KHz以后的高频带才提供了如此高的速度。具体工作流程是:经ADSL MODEM编码后的信号通过电话线传到电话局后再通过一个信号识别/分离器,如果是语音信号就传到电话交换机上,如果是数字信号就接入Internet。
ADSL的核心是编码技术,目前有离散多音复 用DMT(Discrete Multitone)和抑制载波幅度和相位CAP(Carrierless Amplitude/Phase Modulation)两种主要方法。两种方法的共同点是DMT 和CAP都使用正交幅度调制(QAM)。两者的区别是,在 CAP中,数据被调制到单一载波之上;在 DMT中,数据被调制到多个 载波之上,每个载波上的数据使用 QAM进行调制。两者相比,DMT技术复杂成本也要稍高一些,但由于DMT对线路的依赖性低,并且有很强的抗干扰和自适应能力,已被定为标准。因为modem传输数据与语音传送共用一个频率,而ADSL采用DMT,即采用语音传送以外的频率.3.为什么以前使用MODEM拨号上网时不能同时打电话,而现在用ADSL上网就可以? 传统的电话线系统使用的是铜线的低频部分(4kHz一下频段)。而ADSL采用DMT(离散多音频)技术,将原来电话线路okHz到1.1MHz频段划分成256个频宽为4.3khz的子频带。其中,4khz以下频段人用于传送POTS(传统电话业务),20KhZ到138KhZ的频段用来传送上行信号,138KhZ到1.1MHZ的频段用来传送下行信号。DMT技术可以根据线路的情况调整在每个信道上所调制的比特数,以便充分的地利用线路。一般来说,子信道的信噪比越大,在该信道上调制的比特数越多,如果某个子信道饿信噪比很差,则弃之不用。目前,ADSL可达到上行640kbps、下行8Mbps的数据传输率。
6.多媒体数据库在网络教学中的应用 篇六
邱宏其
邵
娜
(南通广播电视大学
江苏
南通
226006)
摘要: 网络教学是近几年提出的新概念,网络化教育的核心之一就是数据库建设。提出一种新型数据库架构主从分布式模型,介绍多媒体数据库在网络教
学中的发展方向语义模型及模糊数据库,并根据上述技术和我们现行的环境设计一个新型数据库VisualE-Sch001。
关键词: 多媒体数据库;分布式处理;语义模型;模糊数据库
中图分类号:G43 文献标识码:A
文章编号:1671-7597(2010)0920117-02
0 引言
计算机网络是为了实现计算机与计算机间信息交流、资源共享而川通 信线路将它们连接起米所构成的。计算机网络按其覆盖范围可分为局域 网、城域网、广域网。为了实现在更人范围内的信息传递,于是将多个计 算机网络联接在一起:这就构成了互联网(INTERNET),可以说互联网是 一种网间网。真止意义上的网络应由硬件和软件两部分组成,硬件(具体 的网络设备)具备了,还需要具备软件(网络上的信息)。网络硬件和软 件的关系,就像高速公路和路上跑的午。有时候我们形容那些没有真正发 挥作用的网络为,高速公路已经建成了,而在这条公路上没有多少车在 跑,或是车上没有高品质的货。同样,网络化教育所占有的信息量非常 大,如果没有大量的文字、声音、图画、视频等数字化教学资源(软 件),即使各种硬件设施再完备,要实现网络化教育也只能是一种空话。网络教学中所有这些文字、声音、图画、视频等数字化资源必然要使川多 媒体数据库来存储、管理,这种数据库不但信息量非常大,而且要求很高 的管理、应用性能。因此,数据库建设是实现网络化教育的核心工作。一个数据库通常包含该学科的大量相关信息,可以说是包罗万象。而
通过网络义可以把许多这样的数据库连接起来,构成一个庞大的网络化教 育信息资源,可见其容量相当惊人。再就是信息内容要求具有稳定地长期 不变和适时更新两重性,以满足不同学科不同访问对象的多种需要,以保 持数据的实用性。由于网络的传输带宽有限,因而在网络化教育系统的实 际应用中对数据库的冗余度、查询算法、结构分布等就提出了更高的要 求。而针对这些要求,一些新的数据库模式、结构、算法不断涌现,进一
步推动了多媒体数据库的发展和应用。本文拟先就多媒体数据库的发展及其在网络教学中的应用做一些简单的介绍,然后再结合我们的实践提出一
个新型数据库设计方案,有不当之处,恳请老师和同学们指正。1 网络数据库的呈现模式
目前,广泛使用的数据库呈现方法有两种:种是网页呈现模式,使用
诸如HTML、ASP、PSP、CFM等技术,最常见的是川在网站的注册、登录等功 能上:另一种是窗口模式,即用Windows的界面呈现数据,如1CQ、OICQ、超星阅读器等。两者的数据库分布结构都是Clint/Server型,即数据库存 放在远方的数据服务器中,本地机中不保存任何与数据库相关的数据。服 务器和客户机之间用“请求应答”的方式共享数据,以异步方式从服务器 中查询,升以数据流的形式传输查询的结果子集,在客户端完成对该子集 的操作后,数据将不予永久保存。两者的主要区别在于:基于浏览器方式 的数据库呈现由于网络安全的限制,无法对本地的文件进行操作
(Cookie除外),而基于Windows窗口方式可以对本地机的资源进行必要的 操作。但前者的远程通讯连接由浏览器自动完成而后者必须由程序员调出 WinSockAPl进行连接。由此可见基于浏览器的方式无需安装客户端软件,但对客户端资源的操作有很大的限制,基于Windows窗口方式对客户端资源 的操作则有很大的灵活性,但由于其连接程序必须由程序员自行完成,而 在数据连接的稳定性和安全性方面的设计十分繁琐,因此这种模式也没有
很大的发展前途。为此,在多媒体数据库研究领域出现了如下所述的几项新发展,下面试给予简单的说明。2 一种新型数据库架构
当前网络教学数据库的架构多为以上两者。为了更好地将数据库技术应用于网络教学,笔者试提出一种新型数据库架构主从分布式模型。与
Clint/Server模型中在客户端无数据源不同,在此我们不妨将与客户端密 切相关的数据存放于本地,而与服务端有关的数据存放于远端,从而形成 分布处理的模型。如下例:有一学生考试查分系统,其数据库包括学生基 本信息(Student)和考试成绩(Mark)两张二维表,其中用学号关联,如 果用Clint/Server结构,我们必须用SQL语句Select Student.name,Student. sex,Student. number,Student. class,Mark. Maths,Mark. English from Student,Mark where Student. number=Mar k.number。返回查询两张表后的结果子集。现在由于我们已把Student表 置于客户端,这样我们只需用Select Mark.Chinese,Mark.Maths,Mark..English from Mark where Student.Number=Mark.number即客 户端反向服务器传输了学号索引便可得到结果子集,人人减少了网络间的 数据传输量。笔者经过测试在基于浏览器的ASP环境中,从本地机上返回包 含14个字段的一条记录(在154条记录中搜索)仅需5-7秒,比使用原来的数 据存放模式要快得多。其数据库模型将传统的关系模型作了拓展,其结构 特点如下:
本地和服务端的数据库分布如下图所示:
分布式的数据库分布模型 本地到远程的关系连接如下图: 系统的数据库分布模式 语义模型数据库
在网络教学的实践过程中,为了提高多媒体数据库的效率(时间和空 间),有关专家提出了一种新型数据库——语义数据库。现代数据库的模 型多为关系模型,其实质是由ER模型扩展的数据库结构模型。语义模型是 1998年提出的,它是以语义对象、属性和对象实例为基础的,其结构类似 于OOP方法。下图所示是语义模型数据库的视图。
语义模型对象“Department”的同性在两个应用视图中都可见。而
Student只在Studentlist的视图中可见,而PROFESSOR只有在Staff中可
见。阅此Department是父类,而PROFESSOR和Student是它的私有属性,其
作用域分别是Studentlist和Staff表。语义模型相对关系模型最大的优势 在于我们查询一个数据库时并不需要所有字段(在语义模型中称属性),而仅是其中一部分。语义模型通过对某些属性的屏蔽,如上图中的 Studentlist表无法查看PROFESSOR,减少字段的查询数量,缩短查询时 间,提高数据平台在网络教学中的反应能力。4 模糊数据库的应用
在多媒体数据库网络教学应用中,数据查询是最经常的工作。但查询 的需求是多种多样的,而且经常需要一种模糊的而不是很精确的查询结 果,为了解决这个问题,也为了提高多媒体数据库的效率,产生了模糊数 据库概念。模糊数据库广泛应用于计算机技术的各个领域,如学生操行等 第的评定、声音识别系统等。从数据库的概念提出到现在已提出儿十种数 据模型,但几乎所有的数据模型都仅仅表示精确数据,而对模糊数据的表 示效果很差。如在学生成绩数据库中学生的数学成绩是75分(精确数据),但你无法评定其优、良、中、差的等第,这便是模糊数据。因为如果你以 为75是良,那么74分呢?良或中?在教学中存在人量诸如此类的模糊问题,这就引入了模糊数据模型的概念。其基本原理如卜:设D1,D2,……,Dn为几个论域,关系R(D1,D2,……,Dn)为叉积D1XD2X……XDn的一个
子集,设其内含表示为P(X1,X2,……,Xn),Xi正Di,l=1,2……,n。如果把其中的部分变量约束为相应论域中的固定值,如将X2,X 3,……,Xn约束成d2,d3,……,dn(di为DI中的常数),则得到受谓词 P(X1,d2,d3,……,dn),由此Xi与R(D1,D2,……,Dn)组成了一 个“元纽函数”,记为(X1,d2,d3,……,dn),X1巨Di,设有一模糊规 则P1(x,y),P2(y,z)一Q(X.Z),(CF,?)。其中变量的定义域 分别是x巨X,yEY,z正Z:表示为元组函数:
(PI,x,y,P2,y,Z,Q,x,z,CF,?)。
如有以下语义实例,“如果X比张二成绩奸且张三比Y成绩好,则X比 Y成绩好”就有以下元组函数:
(成绩,X,张三,成绩,张二,Y,成绩,X,Y,成绩好,1)其中X,Y是变元。“张三”为一个值,如有成绩表(成绩姓名),先
根据第前提找出比张三成绩好的人,再根据第二前提找出比张三成绩差的 人,形成查询子集。由于采用了关系来表示推理规则,用查询代替了人脑的 推理思维,人人提高了教学数据的处理能力,有利于处理复杂的教学数据。5 VisliltI E-SChOOI方案
以上我们简要介绍了多媒体数据库在网络教学中的几个发展方向(即 分布式处理,语义模型的使用,模糊技术的应用)。值得指出的是,由于 网络教学中教学数据既庞人义复杂,再加上网络条件的限制,以上儿种技 术都是以提高数据查询速度为着眼点的,多媒体数据库还有很多问题没解 决,在这方面还有很长的路要走。近年来我们也做了一些有益的尝试,尝 试着应用上述分布式处理和语义模型技术并根据实际情况设计了个通山的
新型数据库——E-School,以下是其简单的介绍。5.1 方案的应用。本方案在徐州师范大学信息与传播学院运用,现正
处于试运行阶段,有些功能还不够完善。其在服务器及教师终端上的配置 与通常做法也有很大的差别(见网址:http://xcx.xznu.edu.cn/中的 “教师在线教学课堂”):
1)使用MACROMEDIA公司的COLDFUSION5配置服务器。COLDFUSION5可运 行在Java平台和Microsoft.NET架构上,针对XML、Web服务和丰富Internet 应用程序进行了优化。新版本Macromedia ColdFusion MX以前的研发代号 为“Neo”,它将易用而高效的ColdFusion带到了以Java为标准并可升级的 技术架构上。ColdFusion MX可提供创建丰富Internet应用程序和处理
XNL、Web服务和Microsoft.NET架构的创新方法。企业和单位可以使用高 效的ColdFusion加快项目开发速度,他们的应用程序将可以运行在业界最 强大的底层结构上。
2)教师使用SiteObjects公司的在线编辑软件soEditorLite2.1在个
人计算机上备课。在线编辑使得老师编制的教案即编即用,并分散存储在 各位教师的终端上,省去了上传服务器这一时间。人人提高了备课效率。SiteObjects公司的soEditor2.1是将一个ColdFusion用户使得普通的文本 编辑区域转变为What-YouSee-lsWhatYou-Get(WYSIWYG)基于浏览器的 HTML编辑(在线编辑)。soEditor的Pro和Lite两个版本都在你的网络站点 和网络应用增加了具有类似处理器特征的可理解的字母。soEditor使得任 何人制作网页成为可能,即使他不具备HTML知识或者编程技术。5.2 方案的基本配置。硬件:校园网或教学局域网、台服务器、若干
学生终端无盘工作站(也可加装硬盘);教师终端、网卡+BootRoom;软件: WinNT4. 0或 Win2000Server或 Win9X,PWS(Personal WebServEr),COLDFUSION Mx。如图所示虚拟教学网的结构图:
用SQL SERVER数据库作数据平台,前台刚ASP(CFM)呈现,其中的各 部分关系由据库连接完成,所有的数据由数据库记录,因此E-School是一 个基于多媒体数据库的网上教育平台。它能代替教师完成授课、作业、考 试等工作。评判一个网上教学系统的质量最主要的是看其交互性和智能 化。在完善的网络数据库体系中交互和智能教学系统都是可以实现的。其 网络结构如图所示:
其中由“经验交流”模块(聊天室),“网上答疑模块”模块(BBS),教师授课,作业上传等功能构成反馈网络,其功能体系是 基于数据库的。
本方案对数据的分布处理作了尝试,教师的终端也存放某些数据(即 教师的备课教案等),可供教师利学生查询;对某些表的设计我们也受语 义模型的启发,使得某些数据在检索时被屏蔽,而同一张表的其他数据可 见:但对模糊数据处理技术,我们尚停留在理论的学习阶段,还没有联系 实际进行试验。网络多媒体数据库在网络教学中的应用是十分广泛的。随 着教学改革的深入发展,对多媒体数据库的要求也越来越高,在这领域还 有很多新事物需要我们探索利研究。作为这一领域的教育工作者,我们应 该加倍努力,不断提高在网络教学中开发和应用多媒体数据库的能力,为 深化教学改革、提高教学质量服务。参考文献:
7.网络营销中数据挖掘技术的应用论文 篇七
关键词:数据挖掘技术,图书馆,应用探讨
随着当代信息技术的快速发展, 网络信息数据库的规模和范围不断扩大, 已从单一的记录发展到整个网络, 使得各企业或是政府部门多年的资料在短时间内迅速积累了海量的数据资料进行检索, 从而需要更加准确的检索工具。数据挖掘技术是适合当代技术而诞生并迅速发展起来的, 本文将结合数据挖掘技术的基本理论与实际进行探讨和分析。
一、数据挖掘技术
数据挖掘技术是从大量的、不完全的、有噪声的、模糊的、随机的数据中进行检索, 并提取其隐含在其中的人们不知道的, 但又是潜在有用的信息和知识的过程。
(一) 图书馆信息服务中应用数据挖掘技术的必要性。
在当今网络科技中, 超媒体是一款非常方便的信息系统, 该系统可在任何地点、任何时间收取信息, 并将大量信息传播给受众, 从而给受众带来更多方便。然而, 在给受众带来方便的同时, 超媒体中的数据管理起来也是一项非常麻烦的工作, 其信息量庞大, 真伪辨识, 信息的保密程度都是难以进行规划和处理的。该如何进行对信息的管理, 是目前摆在管理人员面前最为困难的问题。
在庞大的海量信息中寻找专业知识, 对于管理人员而言, 是非常困难的, 但管理人员要将不可能变为可能, 正是管理人员展现才华的机会。由于超媒体网络的迅速发展, 人们越来越依靠因特网来获取知识。而来到图书馆寻找知识的次数越来越少, 这对从事图书馆工作的工作人员而言是一项巨大的挑战。现今, 专业的图书馆工作人员提出了在网上建立数字图书馆的设想, 并且, 目前, 数字图书馆的设想已然成功。数字图书馆是采用数据存储, 通过各种超链接在大范围的内容下进行检索, 从而使得需求者更加快速地检索到自己需求的信息, 并且, 数字图书馆是对所有用户开放的, 对于, 信息高速发展的今天, 简单、快速即是现代社会的一切, 用户只需简单的操作, 即可获得海量的信息。
数字图书馆不仅具有传统图书馆的内容, 而且对于难以理解的信息还提供了专门的信息服务, 数字图书馆将是未来图书馆的信息枢纽中心。但数字图书馆的管理人员必须选取有效的检索引擎来进行配合工作, 传统引擎无法灵活地对信息加以验证, 在这种大条件下, 数据挖掘技术是克服以上缺点最为理想而必需的工具。
(二) 图书馆信息服务中的数据挖掘技术。
数据挖掘技术中的数据源必须是真实的、大量的、是用户感兴趣的、可接受的、可理解并且能够运用的, 特定发现问题。而此类数据是结构化的, 是文本、图形、图像相互结合的数据, 是可演绎归纳的。数据挖掘技术中的数据源可用于信息管理, 优化并且能够用于数据自身的维护。现今, 数据挖掘技术已成为一门重要的学科, 其中包含着人们从查询到挖掘知识, 最后到给用户进行决策提供支持。在这种条件下, 数据挖掘技术汇聚了各个领域的研究者, 数据库的建立管理, 数据的统计, 可视化技术的发展, 工程计算运行的技术等等一系列的工程人员投身至此, 形成新的技术热潮。
(三) 网络环境下的数据挖掘技术。
数据挖掘技术在网络环境下被定义为超媒体挖掘, 定义为超媒体挖掘有两方面的意义, 一是可自动地在数以百万计的超媒体站点和数据库中, 搜索出有用的信息和资料, 这也称为超媒体的内容挖掘;二是可一个用户访问多个站点或是数据库, 可节省大量验证时间, 也可称为是超媒体使用挖掘。近年来, 各领域研究人员不断的对超媒体内容挖掘进行研究, 并且致力于开发智能化的信息检索工具。人工智能系统可代表特定用户, 自动地进行发现并组织超媒体信息, 也一并检索出用户感兴趣的信息, 这是将超媒体中非结构化的数据进行组织, 使其成为结构化的数据资料。
二、数据挖掘技术在图书馆信息服务中的应用
数据挖掘是目前非常有前景的一类检索工具, 相对于传统的搜索引擎进行检索, 搜索出来的信息往往都不完全, 并且大多数都无法进行信息验证。超媒体挖掘技术应用在图书馆中, 进行信息服务的检索工作, 使得图书馆管理人员能够依照用户的习惯, 为用户检索出更好的质量信息。
(一) 在信息咨询服务中的应用。
随着现代社会生活日益发展, 人们检索信息的质量也不断提升。信息质量要求的综合性、复杂性、有序性的要求也越来越高。面对各式各样要求的信息检索, 图书馆目前采用的数据挖掘技术能够打破传统数据库的限制, 对大量文献进行深层次的挖掘, 并保证数据的一致性、完整性和安全性, 以其检索的高效性满足用户特定的信息需求。
(二) 在个性化服务中的应用。
在以往的图书馆信息服务中, 一般是一对一地进行解答, 这种方式一般是由客户进行发文, 才能够得到想要的信息。数据挖掘技术可完全根据客户的历史记录, 对客户的兴趣爱好、研究方向进行整理分析, 从而制定出个性化的信息服务。管理人员只需对数据库的资料进行整理, 即可为客户带来更好的个性化服务。
三、结语
综上所述, 我国目前的数据挖掘技术正慢慢走向成熟阶段, 在信息处理技术上有自己独特的方面, 并在信息处理自动化技术上占有基础性的地位。作为现代社会快速发展的信息检索的代表性检索工具, 数据挖掘技术在图书馆领域的应用还处在刚刚萌芽的状态, 但数据挖掘技术不可估量的前景, 将爆发出无限的发展潜力与广阔的发展前景。
参考文献
[1].Chang Yang-Ming, but good news, Su Yang mobile customer value evaluation method research[A].China optimization program evaluation and review technique and economic mathematicsseminar of the eighth national congress and members of the eighth China management science academic conference proceedings[C], 2008
[2].王令群, 郑应平, 周爱华等.数据挖掘技术在半导体生产过程数据分析中的应用[A].2009年中国智能自动化会议论文集[C], 2009
[3].王伟, 殷国富.基于数据挖掘的多维联机分析处理系统研究[A].全国先进制造技术高层论坛暨制造业自动化、信息化技术研讨会论文集[C], 2009
[4].王令群, 郑应平, 周爱华等.数据挖掘技术在半导体生产过程数据分析中的应用[A].2009年中国智能自动化会议论文集[C], 2009
[5].Zhengzhou, Gao Tao-Long, Yang Lin-Yao data warehouse and data mining technology and the relationship between the[A], in 2009 China intelligent automation conference proceed-ings (part ii) [C], 2009
8.网络营销中数据挖掘技术的应用论文 篇八
关键词:Web数据挖掘;个性化教学;网络教育
随着互联网技术的应用和发展,基于Internet的网络教学逐渐成为有效利用社会优势教育资源的一种途径。
网络教学能够突破传统教学模式的时空限制,利用其多媒体和信息量大、交互性强、覆盖面广等特点,为更多的人提供接受高等教育的机会,有力推动了我国高等教育大众化的进程;网络教学也是实现现代远程教育的重要桥梁,许多高校设立了网络教育学院,为学生共享学习资源、规划学习进度、自查学习效果、完成学位论文等提供了优良的网络环境;网络教学方式成为各高校必不可少的教学手段,是高校改革教学方法、优化教学过程、实施素质教育的必然结果。
1 网络教学现状
目前,基于WWW(World Wide Web)的网络教学系统在国内外逐步发展起来,许多大学建立了自己的远程教学站点,以高校精品课程网站为代表的教学网站建设对于提高高等学校人才培养质量,改进学校育人环境,激发师生工作学习的积极性和创造性,有着重要的作用。然而,通过对网络教学系统的调查和学生反馈信息,发现不少网络教学系统存在一定的问题:
(1)动态交互功能不强。远程教育系统多是教学材料的堆砌,学生只能被动地浏览教学内容,不能实际地参与到系统中进行发现式、创造式地主动学习,这样就很难达到最佳的学习效果。
(2)系统的智能性较低。其一,不能根据学生的具体情况提供合适的、智能化的交互界面,调动学生的兴趣。其二,不能根据学生的学习能力和学习情况提供相应的指导,实现因“才”施教。
(3)系统的测试和评价功能不强。现有的网上测试系统多是在固定的Web页面上放一些固定的试题,不能根据学生的要求和学习情况自动选题组卷、变换题目,灵活性较差,不能根据学生某个知识点上的薄弱发现学生知识体系中其他相关弱点,而且难度级别较粗略,评价标准不够准确。
(4)缺乏有效的引导。学生在网络环境中随意性较大,有的甚至盲目漫游,既浪费了时间又达不到学习的目的。
2 Web数据挖掘技术在网络教学中的应用
目前网络教学系统之所以存在上述缺陷,主要是由于忽视了受教育对象个体之间存在着极大的差异性,例如:个人学习目标不同、学习能力不同、认知风格不同,所以网络教学必须是一种适应个别化学习需求的个性化教学。
为改善这些这不足之处,本文提出了个性化网络教学的概念,通过将传统的数据挖掘[1](Data Mining)同Web结合起来,进行Web数据挖掘[2],即从Web文档和Web活动中抽取学生感兴趣的潜在的有用模式和隐藏的信息,作为对学生提供个性化教学服务的依据,协助管理者优化站点结构,提高站点效率,更好地为网络教学服务。其主要研究方法如下:
(1)改进网络教学系统性能。对Web系统的特性数据进行分析,如:可以提供Web流量行为的分析,利用它来处理Web缓存、存取平衡等,可以改进远程教育系统性能。另外,随着网上交费等服务的展开,系统安全成为一个需要重点关注的问题,Web使用挖掘可以提供有用的挖掘模式来检测远程教育站点入侵、欺诈等行为[3]。
(2)完善网络教学站点结构。对所有学生的浏览路径进行挖掘,发现其中某些页面的逻辑关联,把频繁访问的一些页面直接链接,以改善远程教育站点结构。
(3)提供智能化服务。学生如何使用远程教育网站来进行学习对于远程教育提供者来说是很重要的。通过对学生行为和所选课程等关系的挖掘,发现其中的学生群学习特征和趋势等,为远程教育提供者提供决策依据。
(4)个性化需求设计。从单个学生的浏览信息发现学生的兴趣,向每位学生提供符合其兴趣要求的个性化界面。
3 基于Web数据挖掘的个性化网络教学系统设计[4]
实现个性化网络教学系统的关键就是在学习的各个阶段对个体进行差异化的分析处理和协助学习。首先需要对参加学习的个体情况进行分类以安排相应的教学内容和进程;其次在学习的过程中,知识表示的内容需要根据对学习者的个人情况要求具有不同的形式;最后就是要对每一个阶段的学习进行相应的考核评估和反馈。
个性化的网络教学系统模型如图1所示。在该模型中引入了一个闭环反馈环节,让系统根据不同的信息自动调整来适应用户学习需求,其中个性化处理引擎包括三个主要组成部分:分别是用户信息收集中心、个性化分析中心、信息调度中心。
(1)用户信息采集中心。这一模块是个性化远程教育的基础,这是个性分析引擎的数据来源,其收集信息的质量与数量将直接影响个性系统分析的质量,采集的基本信息有用户的经常访问的地址与栏目感兴趣的话题、用户的IP地址、停留时间、访问的时间频率、经常提问搜索的关键字、作业与考试的完成过程与结果、进行电子讨论的话题访问的时间段、用户的必要个人信息。信息采集模块负责收集这些信息,并把这些采集的信息顺利的送往下一步的个性分析中心。对于用户来说,用户一旦登陆这个网站,其在上面发生的大多数的行为都可能被信息采集模块所收集,用来进行用户的个性分析。
(2)个性化分析中心。个性分析中心有两大主要组成部分:一是用户的信息库,二是分析处理模块。它的工作方式是分析处理模块结合最新采集的信息与信息库中的数据资源进行新的分析,并把分析结果传递到信息调度模块,同时更新用户信息库中的数据。
(3)信息调度中心。根据个性分析引擎处理后的个性参数来调度几大子系统,并选择合适的教育信息资料将页面反馈给用户以满足其需求,同时把用户在子系统中的个性活动信息反馈给个性化分析中心,然后由个性分析中心进行再加工,来更新用户信息库。对于用户来说,其发出一个请求得到一个响应,中间的过程是透明的,其个性处理的内部过程并不为用户所察觉。
(4)各子系统的工作协调。这些子系统之间的联系是由个性化引擎和用户个性信息库来完成。比如说,一个学生在答疑系统中对于某方面的问题提问次数比较多。那么相应地这一信息将会被个性化引擎及时捕获,并记录到用户个性信息库中,在下一次用户进入作业系统时,个性化引擎将根据这一个性信息调度作业系统对此学生着重进行这一方面问题的训练。
4 结束语
随着远程教育的广泛开展,基于Web数据挖掘技术的教学网站将大大提高学习者的主动权,使学生明确学习目标,加快学习进度,使得不同方式、不同兴趣的个性化的学习需要得到充分的满足,真正做到因材施教。
参考文献
[1]韩家炜.数据挖掘概念与技术[M].北京:机械工业出版社,2001.
[2]KANTARDZIC M.数据挖掘:概念、模型、方法和算法[M].闪四清,陈茵,程雁,译.北京:清华大学出版社,2003.
[3]宋爱波.Web挖掘研究综述.计算机科学[J].2001,28(11):13-15.
【网络营销中数据挖掘技术的应用论文】推荐阅读:
网络技术应用论文10-19
大数据时代的餐饮网络营销思维10-01
浅析网络营销在我国酒店业的应用解读11-03
浅谈计算机网络安全技术的应用09-14
网络技术应用总结09-13
关于OSPF路由协议在企业网络中的应用06-18
计算机网络技术应用07-25
现代网络技术及应用学习总结08-16
计算机网络应用技术实习报告07-28
计算机网络应用技术应届生简历10-06