为您找到与实用中医药大数据研究导论相关的共200个结果:
浏览量:22
下载量:0
时间:
一、数据库及其主要特点
(一)数据库
数据库是对数据的组织、存储、管理的仓库,它是储存大量的信息的一个巨大的仓库。数据库的发展给人们查找信息提供了很大的作用,在数据库里的信息很容系被找到。因此,数据库现在被许多企业所应用。
(二)数据库主要特点
1.实现数据的资源共享:数据的资源共享包括全部用户能同时进行数据库数据的修改、查询、保存,用户也能够通过端口进行操作数据库,并提供数据的资源共享。
2.减少数据的冗杂度:与文件系统相比较,数据库减少了数据的冗杂,是数据具有一致性。
3.数据的独立性:它包括数据库中数据的逻辑结构和程序的相对独立。
4.数据实现集中控制:文件管理中,数据是一种处于分散的结构,不容易进行控制。而数据库能够对数据进行控制和管理,还能通过联系建立关系。
5.数据的安全性:文件管理数据容易造成数据的丢失,破损。而数据库中的数据是有维护的,数据库管理系统提供一套数据的安全,能够及时发现和修护系统,因而防止数据库中数据的破坏。
二、数据库技术在电子商务中的应用
(一)数据库技术的发展
现在,数据库技术已成为这个时代必备的技术,电子商务中也应用其数据库的技术。数据库是对数据的组织、存储、管理的仓库,它是储存大量信息的一个仓库。而在电子商务中的应用是一是对数据进行存储、收集、管理。二是进行决策。三是对数据库进行支持。电子商务的用户建立各种类型的数据库仓库,是为了保证系统的安全与稳定,也是为了利用数据库能够发现更多的信息资源,可以使用户自己的公司进一步发展.电子商务中的数据库很多是用Access软件,这种技术用起来也很简便、快捷。现在人们对天猫、淘宝、赶集网、蘑菇网、搜狗、百度等等,这些再熟悉不过了。而这些都是电子商务的类型,它们的建立是需要大量的数据和信息,在建立它们的同时也要对其数据进行整理、组织、筛选,这就用到数据库的操作来实现。
(二)数据库技术在齐齐哈尔工程学院百草家园中的应用
1、设计方法
数据库技术在电子商务中的应用很多,例如:以齐齐哈尔工程学院的百草家园为例,要把百草家园这个网站发布到互联网上,我们就要用数据库来完成。首先在Access中先建立表,就是二维表。表中要装入与百草家园相关的信息,表的部分完成后,还要建立查询,查询的功能就是讲大量的信息进行筛选,把用户所需要的体现出来。例如:用户现在想查看一下百草住所区的房间,那么百草的其他信息就可以不用显现出来,这时就要用到查询的功能。而后是窗体,窗体主要作用就是建立网站的主页面、背景等,窗体还可以设置命令按钮,能做到用一个窗体就可以把大量的数据调用出来。例如:打开百草的主窗体,点下屏幕的住所区窗体,用户就会看到住所区的相关数据,一个一个窗体通过一个小的按钮就可以显示出来。接着是报表,报表的功能就是把数据用不同的方式体现出来。可以清晰的看出数据的所占比例,数据能用最佳的方式显示。最后是页、宏、模板。完成以上七个步骤完成后就可以在网上发布这个百草家园网站了。
2、应用效果
数据库建立程序,提高了数据的资源共享,减少了数据的冗杂,还保证了数据的安全性和一致性。建立了百草家园网站提高了百草家园的知名度,让人们更加地了解、认识它,顾客可以在网上直接进行预订房间,减少了许多中间环节。
(三)数据库在齐齐哈尔工程学院百草家园中的应用存在的问题
1、网页的效果制作不是十分美观
2、数据库中百草家园的信息安全问题
(四)数据库在齐齐哈尔工程学院百草家园中的应用的解决措施
1、数据库的主要功能是进行数据的组织、筛选、整理,建立完整的数据系统。在Access中想要实现网页的唯美,只能先进行网页的制作,在网页制作中完成网页背景,通过操作把背景导入数据库中,然后在其数据库里建立信息。这样就完成了数据库中网页效果的问题。
2、互联网的技术发展高速,信息的大量繁杂,想保证数据的安全性和一致性,就要做好数据库安全措施。应用数据库访问控制,全面性地约束,进行秘密通道数据库加密及数据库管理者来维护数据的安全。
三、数据库技术在电子商务中未来的发展
数据库技术在电子商务中的使用,是以在Web为基础的一个新的里程碑,而现在已发展到特殊的数据库界面,互联网的飞速发展,必将带动数据库技术的发展,同时也要提高数据库的技能,人工的技术将与网络进行连接。现在的电子商务应用中数据的冗杂给用户带来了许多头疼的问题,用户必须从冗杂的数据中找出关联性,这样才会更好的发展。但是完成这项任务很是麻烦,因此要人工技术与互联网技术相结合,会大大提高工作效率,也会使数据更简单的进行整理。总而言之,数据库技术在电子商务中的应用,对信息的处理、筛选、查询能在互联网上实现。
浏览量:2
下载量:0
时间:
【论文摘要】风险评估是指识别、分析相关风险以实现既定目标的过程,是完善公司内部控制的重要保证,这一过程受公司董事会、管理层及其他员工的影响,包括对内外部因素进行检查以识别相关风险,对这些风险的重大程度、发生的可能性进行分析,并考虑使公司所承担的风险处于自己管理的范围之内,以合理保证公司能够取得既定目标。作为寿险公司,其本身就是风险集合的中介,具有经营的高风险性,因此寿险公司的风险评估更为重要。
【论文关键词】风险评估
制定了风险处理计划后,并非一劳永逸,在公司的运行过程中风险还可能会增大或者衰退。因此,在公司的经营管理过程中,需要时刻监督风险的发展与变化情况,并确定随着某些风险的消失而带来的新的风险。风险监控就是要跟踪识别的风险,识别剩余风险和新出现的风险,修改风险管理计划,保证风险计划的实施,并评估消减风险的效果。风险监控是与控制活动密切结合在一起的,要使公司的风险监控发挥积极作用,就必须在控制活动的各个环节确立不同的控制方式:预防性监控、检查性监控、纠正性监控、指导性监控。除了以上一般的风险监控形式外,还有针对某个环节不足或者缺陷而采取的补偿性监控,为加强计算机管理而实施的计算机监控等等。这些风险监控形式,合理保证了公司风险监控的效率和效果,有助于公司管理风险。
要解决好风险识别、评估、处理与监控之间的关系,离不开公司内部每一位员工的共同努力。要使风险监控在整个风险评估流程中发挥重要作用,一是必须建立良好的风险管理组织架构;二是对影响已识别风险或事件因素进行定期核查。
浏览量:2
下载量:0
时间:
摘要:根据国家2003—2007年火灾的相关统计数据,应用回归分析,研究了火灾引起的经济损失与火灾中伤人数目及烧毁建筑面积之间的关系,建立了二元线性回归模型,对方程的精度进行了相关性检验。
关键词:火灾;二元线性回归分析;相关性检验
相关性检验是指对已确定的回归方程能够代表自变量与因变量之间相关关系的可靠性进行检验。只有通过相关性检验后,才能以此回归方程为依据进行分析和预测。一般用R检验和F检验等方法。下面我们用R检验法。令
Syy=(yi-i)2=(i-y)2 =Q+U
式中:y——上页表1中5个因变量yi的平均值;i——xi1与xi2的值代入(2)式所得的值。
r=是R检验中的相关系数,它越接近于1,就说明回归方程中自变量与因变量的线性相关的近似程度越高,该方程的误差越小。通过计算可得r=0.9988,故方程(2)通过了相关检验,可用它定量的描述火灾中伤人数、烧毁建筑面积及直接经济损失的关系。
另外,从回归方程中还可以看出,火灾伤人数前面的偏回归系数较大,这主要是因为统计数据中烧毁建筑面积的数字较高,且没有考虑其他方面,例如火灾中的物资损失等,带来的经济损失。为使以上三个变量量纲一致,我们可采取以下方式,令
zi=yi/y,ti1=xi1/xi1,ti2=xi2/xi2,(3)
式中:y——上页表1中5个因变量yi的平均值,tik——上页表1中5个自变量xik的平均值(k=1,2).
对由(3)式得到的数据,利用上面的方法便得到的回归方程为:
=0.8264x1+0.177x2
相关系数r=0.9990,也通过了相关性检验。
浏览量:2
下载量:0
时间:
内容摘要:“麦当劳化”的商业营销面临着模式趋同,竞争同质化严重等困惑,在体验经济时代,需要“迪士尼化”的商业营销。商业营销“迪士尼化”是体验经济时代的一种必然的趋势,它能打破目前商业营销困局,通过克服同质性营销的枯燥无味和疲软乏力而带给消费者难忘的体验,从而打造企业核心竞争力。精心构思主题,突出顾客参与,满足全面体验是“迪士尼化”的商业营销行的关键环节。“迪士尼化”的商业营销使企业以一种大营销的视域避免急功近利的急躁和浮躁,真正走进消费者的内心,并与之建立长期的伙伴关系。
关键词:体验经济 商业营销 迪士尼化
商业作为最古老的行业之一,如今已经成为中国经济中最活跃最具活力的行业之一。近10多年来,商业业态让人眼花缭乱,各种新兴的商业业态如超级市场、专卖店、折扣店、仓储式商店、便利店、购物中心、邮购商店以及网络商店纷纷涌现,还有原有的传统业态诸如百货商店、专业店等。竞争空前惨烈,营销模式越来越趋同,竞争同质化也越来越高,在市场空间越来越狭小的情况下,许多商业企业不得不投入价格战,纷纷推出返券、打折、抽奖、特价、买赠等优惠活动,似乎价格战成了营销的代名词,市场营销的功能局限于广告和价格,由此“传统的市场营销不是即将消亡—事实上,它已经不存在了,老式市场营销已经死亡,就像猫王已经逝去一样”。美国《哈佛商业评论》指出:“再次光临的顾客可为公司带来25%-85%的利润,而吸引他们再次光临的因素中首先是服务质量的好坏,其次是商品本身,最后才是价格”。商业企业必须另辟蹊径,绕开单一的价格竞争模式,打造自己的核心竞争力,培养忠诚顾客,以此获得超常发展职称论文。
商业企业完全依赖广告和降价来推广产品一方面致使企业的广告投入呈几何级数增长。而实际上,广告资源却只有20%在起作用,其余80%则因为媒体高度分散而浪费了。更为残酷的是广告浪费会吞噬着企业的利润空间。另一方面,价格战造成的行业性集体自伤更是让企业难以承受。在体验经济时代,企业可以通过让顾客体验产品、确认价值、促成信赖后自动贴近产品,成为忠诚客户。不仅要强调企业和客户的互动,更要强调客户与客户的互动。让事实说话,让“美好的感觉”口碑相传。
“迪士尼化”的商业营销注重为顾客创造真实可信的、能使他们生活得更加快乐、富裕和满足的购物机会和经历。而体验的内涵就是通过商品、企业或服务者与顾客的互动来激发顾客的反应。没有顾客的积极参与,营销效果将大打折扣。而吸引顾客参与的关键建立在对顾客需求的准确把握上。顾客的需求过于隐蔽,连消费者自己也难以说清,商业企业应通过建立顾客数据、成立专门部门、与权威研究机构合作等挖掘顾客兴奋点。“迪士尼化”的商业营销要求企业员工的工作文化独具特色,有明显的表演色彩。表演性劳动的很多方式充当着整个程序的润滑油,他能让本身平凡的商品和服务拥有特色,能表达主题,增强与顾客互动,还能增强顾客购买商品的意向。
美国加州一家运动内衣店安装了一套由摄像机和计算机组成的制衣设计系统,对顾客先进行拍照,然后计算机根据拍摄结果计算出顾客的身高、胸围、腰围等数据,接着在屏幕上显示顾客穿着新衣服在正面、侧面、后面等不同角度的视觉效果。顾客可从150多种样衣中选出自己中意的一种。通过网络,顾客选中的衣服式样数据被传到生产车间,几天后,顾客即可拿到非常合体的独一件的成衣,顾客充分感受到企业的尊重和体贴。
比如,某商场多次举办“一百当做二百花”活动,但收效有限。后来在研究顾客心理需求基础上策划了一次“人民币尾号翻倍花”活动,即尾号是88的100元钞票可以当二百元,尾号是888的100元则可当300元花,一下子引起广泛轰动,人们纷纷到银行取款遍找尾号带88或888的钞票。其实跟商场过去的换券优惠幅度不相上下,结果却天壤之别,究其原因在于实现了互动,体验更直接。每一个潜在消费者都翻看自己的钱包找尾号带88的钞票,一旦发现立即有钞票升值的体验,即便当时没找到也会向亲朋好友传播,银行也排起了取钱的长龙,甚至有人到外地银行去找,一时间街头巷尾热议不断。顾客的兴奋点被引爆而激起巨大的参与热情,此体验营销的威力让单纯的打折、返券相形见绌。
浏览量:2
下载量:0
时间:
摘要:本文根据霍布斯着作《利维坦》、《论公民》,从性恶论、自然法、社会契约、绝对君权四方面来阐述其政治哲学理论。霍布斯第一次用人的本质,代替欧洲当时流行的“君权神授”观点,用****对抗神权,打开了长期封闭民众观念的思想阀门,传播新思维,为新兴资产阶级和新贵族专政开辟了哲学道路,引领了政治哲学研究领域的转型。
关键词:战争状态;自然法;社会契约;政治哲学;君主****
欧洲着名思想家霍布斯作为资产阶级和新贵族的喉舌,他运用自己的政治哲学理论为当时英国新兴资产阶级和新贵族的****政权的时代性进行论述,根据他的机械唯物主义自然观和认识论,以自然人的本质为基点,又在人性探讨的基础上论述了自然法和社会契约理论,最后推出了绝对君权的必然结论。
人类的最大利益是保全自己,而这种每一个人对每一个人的战争状态严重威胁的人们的生命权利,不是最大利益所追求的,人们为了保全生命就必须想办法使这种状态向着有利于人的最大利益方向转化,但由于人的本性即人的自然欲望,人要实现自己的最大利益困难重重,“因为只要每个人都保有凭自己喜好做任何事情的权利,所有的人就永远处在战争状态之中”。对此,理性便是使人们脱离这种状态的唯一方法,即霍布斯的自然法。“自然法是正确的指令,它为了最持久地保存生命的可能,规定了什么是应该做的,什么是不该做的”。
浏览量:2
下载量:0
时间:
俞可平,浙江诸暨人,政治学博士,教授、博士生导师,中共中央编译局副局长。2006年《北京日报》在争鸣版刊发他的《民主是个好东西》这篇文章后,随后被《学习时报》文摘版、人民网、新华网全文转载,一时洛阳纸贵,被海外媒体解读为中国最新政治风向标,视为是对传统意识形态的重大突破。《中国新闻周刊》认为他“将政治民主提上公共议程,打开一扇虚掩太久的窗”[1]、 是 “民主的思想推手”[2]。由此可见,近二十年来俞可平有关民主的研究取得较高的成果,并对政界、学术界以至国外产生颇大的影响。为此,恰逢改革开放三十周年,中国改革到了“突破”的关口之际,对俞可平有关民主的研究进行梳理,对进一步促进民主研究及民主化进程具有一定的理论和现实意义。
一
俞可平对于民主的研究主要有三方面特征:首先,俞可平对民主的诠释是建立在马克思的民主思想之上的。正如他在《马克思论民主的一般概念、普遍价值和共同形式》所强调的那样:“马克思的民主思想并没有离开人类民主理论和实践发展的长河,正是因为马克思充分吸取了人类创造的一切民主政治的优秀成果,才使他实现了民主思想史上的革命性飞跃。”正是如此,在《民主是个好东西》中俞可平认为民主包含六个方面:1,民主是个好东西, 是对整个国家和民族而言的, 是对广大人民群众而言的;2,民主不是十全十美的, 它有许多内在的不足;3,民主它只是人类众多制度中的一种, 主要规范人们的政治生活, 而不能取代其他制度去规范人类的全部生活,有内在的局限性;4,民主需要代价;5,民主是有条件的;6,民主最实质性的意义,就是人民的统治,人民的选择。[3]
其次,俞可平还引进当前西方有关民主研究的最新成果。当前西方,政治学家们开始把民主争论的重点从“人民”和“统治”本身逐渐转向“人民”与“统治”这两者的关系。一些人强调“人民”对于民主的意义,另一些人则强调“统治”对于民主的意义。强调“人民”的理论被称为“实质民主论”,而强调“统治”的理论被称为“程序民主论”。很显然,俞可平借鉴更多的是程序民主论,为此还专门把他近年来的主要研究成果编辑成书,就取名为《民主与陀螺》,而且在许多场合多次强调:“民主就是主权在民,或人民是权力的主体。具体地说,民主是这样一种政治状态,在这种政治状态下,个人的权利得到了最大或者最充分的保护。它既是一种实体,又是一种程序。作为一种实体,民主就是这样一种制度,在这种制度下有一部法律,一般是宪法,它规定这个国家的权力是属于人民的。人类成功的民主实践表明,民主通常只有在宪政条件下才能实现。民主不光具有实体的意义,而且同样也具有程序的意义,即必须有一整套实现民主的运行机制。所以我特别打一个比喻,民主就像陀螺,必须运转起来才有意义”[4]。而当现场观众问道:“‘民主是一个陀螺,要运转起来才有意义’,那么抽这个陀螺的鞭子拿在谁的手里?”时,他又确信的回答“人民群众自己和官员合起来,就是民主这个陀螺旋转的动力”。[5]在理解民主的基本内涵之后,俞可平进一步指出民主亟待厘清六个关系,分别是民主与法治、民主与集中、民主与民生、民主的普遍性与特殊性、选举民主与协商民主、党内民主与社会民主。[6]
最后,俞可平对民主研究还借鉴当前西方流行的治理理论。上个世纪九十年代,西方兴起一种新的治理理论潮流,那就是善治。在当时,对于西方政治学界新起的“治理”理论,对于中国学者来说,治理与善治还是新的概念,甚至连统一的中文译名还没有。而在当时国内仅能发现的4篇从政治学角度研究治理和善治的文章中,有3篇是由俞可平撰写的。俞可平认为,人类的政治核心在20世纪末和21世纪初已经发生了根本性的变化,善治已经成为政治合法性的主要来源。他认为,“善治包含了传统的政治理想状态,如善政、仁政。但是它又超越了善政、仁政”。从此意义上,俞可平的善治理念并不排斥公民社会。那么善治与当今
世界普遍认可的民主、法治理念有什么关系?俞可平认为,“善治包含现代民主政治的大多数基本要素。同时,它超越了民主的范畴。民主需要法治、需要公民参与、需要透明和政府责任,所有这些也都是善治的基本要素。但是善治也包括了效率、稳定、公正、严谨等——这些也是有些人用来反对民主的要素。”可民主政治不包含效率、稳定、公正、严谨等这些政治目标,这是可以商榷的,或者说良好的民主政治与善政之间的区别并不那么明显。但俞可平还是强调,“善治与民主并不能等同,但善治确实能包含民主的诸多要素,从某种意义上,善治是民主想要达到的理想状态。”
当然,俞可平最为强调的是还是善治的超时空性。“在政治领域,很难有什么东西可以普遍认可,许多政治概念充满着争议和分歧,民主、人权等东西之间南辕北辙,甚至在中国学者内部也充满争议。善治的时空适应性就更大”。如果说善治是超时空性的,那么是可以超越民主政治(主要是西方式的民主宪政)直接到达善治,还是通过民主政治走向善治?对此,俞可平把视角引向国内。
民主作为人类政治文明发展的成果,诚如俞可平所强调的那样“民主是个好东西”,但民主本为作为一个美好理想,在现实的“风吹雨打”当中往往会让步于现实,具体呈现在人们面前是一个“虚虚实实”混合体。时至今日,人们还在不停地追问,民主究竟是什么?但不管怎么追问,要民主已在世界各国达成共识,这也就是俞可平研究民主问题的最大现实意义。当然,俞可平有关民主的研究存在许多的不足与理论缺陷,就像学术界一直对俞可平所追问的 “提出增量民主意义有多大?”“如何实现增量民主,其途径方法何在?”一样,争论仍在继续,研究也在进行。但不管怎样,正如俞可平的比喻:“民主是一个陀螺:它只有像陀螺那样运转起来才有意义”。
浏览量:3
下载量:0
时间:
跟随对方之劲路,随屈就伸,人刚我柔,我顺人背,虽变幻无穷,但丝毫不含抵抗性。以柔克刚,关键在不顶抗对方,而 让它的力量在我之圈里走化掉,使之引进而落空。当对方失去重心,以迅雷不及掩耳之势将其击倒。功夫深者可以借力将人腾空击出。
浏览量:3
下载量:0
时间:
伴随着不同时期的社会变革和思想的发展,女性的自我意识不断觉醒,对社会现状也有了越来越深刻的认识,随着女性主义的进一步发展,女性争取到了选举权,教育和就业方面也取得了很大的成就, 并以制度和法律的形式得以确立。比如:中华人民共和国成立后废除了一切歧视、束缚妇女的反动法律。在宪法和有关选举、劳动、教育、婚姻家庭和继承等一系列法律和法规中,都鲜明地体现了彻底的男女平等的精神。但是,法律上的平等并不等同于实质平等,现实世界的多个领域中仍然存在着阻碍女性获得更高职位或更高薪水的无形壁垒。“玻璃天花板”现象就是其中的典型代表。
路径依赖(Path-Dependence)是指人类社会中的技术演进或制度变迁均有类似于物理学中的惯性,即一旦进入某一路径(无论是“好”还是“坏”)就可能对这种路径产生依赖。在“女性上升的无形壁垒”这一问题中路径依赖存在于多个方面:
1、路径依赖决定了对男女性别群体的不同性别期待。由于女性长期在社会政治经济生活中角色的缺失,使人们形成一种观点:认为女性是没有进取心和社会责任感,只能充当被看的花瓶。这种观念就形成了特定的性别期待。这种特定的性别期望把职业刻画为适合男性的,而男性也是适合于职业的,对女性的可能成就期望极低,因此在就业时对女性设置诸多门槛,或者安排女性到边缘岗位,这样就限制了女性的发展机会。
2、路径依赖的存在造成了男女性别群体之间资本占有的不平等。由于民间“传男不传女”继承制度的继续存在,造成了男女家庭资本占有、教育资源占有、社会资本占有等方面的不平等。“男主外、女主内”“女人不宜抛头露面”的文化传统可能使女性自身与她们的家人很少期望她们能在社会关系上有所作为[6]。因此,女性往往对社会关系资本的占有和利用也是不够的。资源占有的劣势阻碍了女性的进一步发展,使女性的上升空间受到局限。
浏览量:5
下载量:0
时间:
论文关键词:财政收支体系;财税制度;税收体系;网络贸易税收
论文摘要:我国应适应经济全球化的发展,完善财政收支体系,加大财政对科研开发及人力资本的投入,实行税收政策倾斜,对新经济给予税收支持,以适应和促进知识经济的发展。
国外企业界认为,R&D经费占销售收入1%以下的企业难以生存,达到5%以上才有竞争力。鉴于我国企业投入R&D经费比例较小,并呈下降趋势,我国政府应积极制定有关财税政策,鼓励企业加大R&D投入的力度,促进企业技术创新。
财政支持。在计划经济时期,部分企业由于政策性经营所承担的债务,国家财政应在严格审批的基础上逐步解决。同时,政府应开辟多种融资、投资渠道,建立技术创新基金,加大对进行技术创新的财政补贴。建立一套以企业投入为基础、技术创新基金为补充、银行贷款为保证的技术创新融资机制,为企业创造良好的技术创新环境。
税收扶持。可以借鉴以美国为代表的西方发达国家的做法,将税收作为政府推动企业技术创新的基本手段,通过制定形式多样的税收优惠政策,降低企业技术创新的税负,提高企业进行技术创新的积极性,提高企业的技术水平。将企业引进和应用高新技术设备进行技术改造的投资按照一定的比例进行所得税抵免;对企业购进的固定资产,允许抵扣增值税进项税额,并允许企业对固定资产实行加速折旧,加快技术设备的更新换代;对企业为提升技术水平而产生的R&D费用,按照10%的比例计算增值税进项税额,并准予所得税税前抵扣;对企业外购无形资产按一定的比例予以减税,并可按受益年限折旧,加快无形资产周转速度,促进企业技术进步;对企业技术转让所得、技术服务报酬,可免征或减征营业税和所得税,提高企业、科研单位科技开发的积极性,促进科技成果转化;允许企业税前按一定比例提取科技开发风险基金,增强企业技术创新的积极性。
浏览量:4
下载量:0
时间:
中医药数据库建设工作起源于1985年,数据库资源的详细描述与统一管理,包括数据库元数据管理、每个中医药相关的数据库涉及表的管理、每个表的数据元管理3个部分。今天读文网小编要与大家分享:构建中医药数据资源结构图谱的探讨相关论文,具体内容如下,欢迎阅读:
【关键词】 中医药信息学;数据资源;数据结构整合
构建中医药数据资源结构图谱的探讨
本研究通过分析中医药数据库资源的类型、特点和中医药资源存在的问题,提出基于现有数据库资源与结构,参考现有资源整合技术,从数据层、物理层、基础层3个方面入手,并结合体系构建等相关的资源深层整合技术,探讨构建中医药数据资源结构图谱的实际解决方案。
中医药数据库建设工作起源于1985年,目前,已经建立了覆盖中医药学科的复杂的多类型数据库,总数据量约200 G,文献数据库收集年代跨越58年。数据库建设主要包括单表数据库、结构性数据库和数据平台的建设。目前,中医药现代资源数据库的建设已经具有一定的规模,已经形成以中医药科学数据中心与分中心为主体的中医药文献型及事实型数据库群,几乎涉及到中医药信息的方方面面。 然而这些资源库群是彻底异构的,从数据结构、操作系统,到数据库系统、应用系统;从命名方式,到数据格式、结构模型、用户界面,都有可能完全不同,目前还没有标准规范能够对这个各个层次的异构进行适当的约束
中医药科学数据中心缺少完整解决方案。1.1 局部有序、整体无序 从某一种具体资源的角度来看,他们都是经过一定程度加工整序,具有统一的分类体系和检索界面。但从全局的角度来,中医药科学数据中心拥有的各种资源是一个个的“信息孤岛”, 各种资源内容交叉,信息重复,关联度低,用户查找资料时不但要在多个数据库中来回穿梭、重复操作,还要精通各种不同数据库、不同界面的数字资源系统检索技术,否则便难以查全或查准所需要的资料。
1.2 数据结构与标准不统一
各种不同类型的数字资源不但采用Oracle、mySQL、SQL、Access等不同的数据库物理模型或半结构、非结构的数据结构,而且在对资源的描述与揭示时没有采用元数据、数据元、数据模式等标准。数据库字段与数据表命名差异性较大,例如:“ZZ”表名对应数据字段名就有“主治”、“著作”、“作者”等。
1.3 数据来源多途径与数据版本复杂
中医药数据资源是指中医药科学数据中心与分中心收集的各类型专业数据,这部分资源数量众多,构成了学术数字资源的主体,现已成为重要的文献来源。从文献类型上看,有期刊、图书、会议论文、学位论文等;从文献级别上看,有题录、文摘、全文等不同的层次。自建数据库有多种载体、多种形式、多种类型、分散异构的信息资源,这些数据库形成时间长,数据更新多次,缺少清晰的资源定义与描述。
1.4 系统平台与应用程序各异
各种不同类型的数字资源有着不同的系统平台;不同的数据资源存在着过程数据的不同服务方式,例如:期刊文献数据库、结构型文献数据库、分析结构型文献数据库;同时,数据表存在着基础数据库、粗表数据库、细表数据库、单元素数据库等,部署在共建、共享的服务器上,也给数据管理带来麻烦。
2.1 数据资源整合
整合的实质就是各个单独事物共同遵循统一的原则、标准、规定,打破原来的界限形成有机的统一体。数据资源的整合[1],英文可译作“digital resource integration”,就是通过各种手段和工具将已有的信息资源集成起来,并按照一定的逻辑关系进行组织,实现信息资源的有效共享,为用户提供条理化的信息服务,为后续信息的管理与使用提供规范,从而实现信息的增值利用。
数字资源整合主要集中在数据集的整合和应用的整合两个方面,再具体细分还可以划分为数据集成、信息集成、信息系统集成及业务(或工作流)集成等4个阶段。
通常数据资源整合的范围可以包括4个方面。①数据整合:数据标准、主题数据库、数据交换平台、基于语义的全局数据视图。②应用整合:使用统一用户认证、使用统一的数据交换、使用门户实现应用集成。③内容整合:信息规划、信息导航、统一搜索、信息专题、信息门户。④流程整合:统一数据采集加工处理流程、统一数据存储管理、统一数据访问和调用接口。
信息资源整合根据系统论的原则,依据一定的需要,对各个相对独立系统中的数据对象、功能结构及互动关系进行融合、类聚和重组,重新构建一个新的有机整体,形成一个效能更好、效率更高的新的信息资源系统。目前,数字资源整合的方式主要包括:基于OPAC资源系统的整合、基于数字资源导航的整合、基于异构数据库跨库检索的整合、基于数字图书馆应用系统的整合等。
2.2 数据资源整合技术
2.2.1 DOI技术
DOI(Digital Object Identifier)由International DOI Foundation组织构造。该系统提供了一个框架,为数字环境中的数字对象分配唯一的、永久性的标识,方便该对象被管理和使用。DOI系统由4部分构成:申请DOI;创建对指定DOI对象的描述;解析系统;规则。
2.2.2 SFX技术
SFX即Special Effects Cinematography,它是比利时根特大学的萨姆堡尔为首的研究小组提出的。通过Open URL框架把复杂的数据库之间的互连通过简单的链接完成。
2.2.3 Web Services技术
Web Service是为实现“基于web无缝集成”的目标而提出的全新概念,希望通过Web Service能够实现不同的系统之间能够用“软件-软件对话”的方式相互调用,打破软件应用、网站和各种设备之间格格不入的状态。
2.2.4 地域性索引服务平台技术
A.N.ZINCIR-HEYWOOD提出一个地域性索引服务平台(Domain Index Server),建议依靠一个索引代理去创建成主要的原文献索引,这个代理通常是软件系统,能够在异构信息支撑下自动行动(搜索)的系统。
2.2.5 MAP资源整合系统
INNOPAC公司推出的MAP (Millennium Access Plus)是一个集成的资源整合系统,它可实现不同信息资源的动态链接。这些资源包括全文电子资源、题录和文摘数据库、书目数据库、图书馆在线书目系统、图像数据库及搜索引擎等其他Web资源。
2.2.6 OAI标准整合模式
OAI是指open archives initiative,它的目标是发展和促进互操作标准,促进内容数据的有效传播。①数据提供者:提供元数据的Web服务器。②服务提供者:向数据提供者发出请求并且利用得到的元数据构建增值服务。③存储体:由数据提供者管理的可以在网上访问的服务器,它提供服务提供者需要采集的元数据。④采集器:在服务提供者方作为从存储体中搜集元数据的一种应用工具。
2.2.7 情报源图谱
美国国立医学图书馆主持了一项长期研究和开发计划,即统一医学语言系统(UMLS),其项目中有一个是关于生物医学机读信息资源的情报源图谱,其目的是利用超级叙词表和语义网络实现情报源与特定提问的相关性;有效组织信息资源,为用户提供特定信息源的范围、功能和检索条件等人工可读的信息;自动连接相关信息源;在一个或多个情报源中自动检索并自动组织检索的结果。
3.1 中医药数据资源结构图谱框架(见图1)
3.2 中医药数据资源结构图谱内容
3.2.1 物理层
系统运行的硬件、软件环境,解决如何为应用系统提供统一的支撑环境,支持应用系统的运作。
3.2.2 基础层
位于物理互连的网络协议之上,用于标准化、规范化描述数据,为更上层的数据交换提供基础性支持的标准、规范。基础性协议标准又可以划分为数据描述层面和数据访问层面。前者主要包括元数据、XML、RSS,后者主要包括开放数据库互连标准(ODBC)等。在数据描述层面内部,RSS具有提供内容聚合的功能,是为实现内容聚合而制定的一种信息描述、组织的规范,但它也具有资源发现、发布的功能,更是一种新形式的描述规则。因此,将RSS归入基础的描述层面标准。准确的说,RSS本身也是基于XML格式的,其实是XML成功应用的一个典型。从这一层总体来看,这些基础的标准、规范(除了RSS之外),大多数都不是专门为解决资源整合的问题而制定的,主要是从信息组织、跨异构数据库的互连、互访用途出发的。但是,它们确为更好地实现资源整合提供了有力的支持。
3.2.3 数据层整合
旨在屏蔽各数据源异构性,使得各数据源之间能够进行数据的交换与交互,令用户可透明地访问多个数据源。要实现数据整合,必须对数据进行跨数据源的收集、组织、处理与集成。根据整合系统与数据源之间交互的特点,又可以分为3种形式:基于联邦的整合、基于采集的整合、基于链接的整合;数据层整合协议的重点是解决系统之间的数据交换和数据交互。
整合揭示以下功能。①不同文献层次、级别的指引关系:题录信息→标引信息→文摘信息→全文→结构信息,一次文献和二次文献之间的对应联系。②中心数字资源和网络数字资源之间的交叉、重复和互补关系:全文数据库与中心文献相重复的部分;又如PUBMED的生物医学资源中的期刊包括绝大多数的馆藏期刊,并提供了大部分题录和部分免费全文。③数字资源之间的主题相关或学科相关,内容上的重合和互补关系:引用和被引用及共同引用的关系,说明资源在内容上的相互关联。④数字资源与服务之间的关系:共建资源与服务资源之间存在密切联系,但因服务层次需求分为全文、结构、粗表、细表、分析表等资源。
3.2.4 具体整合要求
数据库资源的详细描述与统一管理,包括数据库元数据管理、每个中医药相关的数据库涉及表的管理、每个表的数据元管理3个部分。数据库的元数据管理需要对数据制作相关的信息如制作人、起始日期、制作背景、目标、更新周期等信息进行管理,并可以使用中医药的分类词表对数据库进行描述;表的数据元管理需要指明字段的名称、类型、大小、取值范围以及所对应的标准。此外,多个数据库之间也存在一定的关系,如方剂数据相关的数据库,就有中国方剂数据库、方剂现代应用数据库等,对于方剂类数据库需要制定统一的方剂数据库制作标准,并对这些库之间的关系进行描述。
要求研制管理工具,能够增、删改每个数据库的元数据、数据元,以及每个数据库之间的关系,并能够逐层次的展示各层的信息以及关系。能够使用检索方式、分类方式来具体的定位到相关的信息。
应用软件的详细描述与统一管理,包括应用软件的描述、应用软件使用数据库资源的描述。应用软件包括软件开发的起始日期、目标、版本、开发语言、开发人员、源代码、可运行包、状态、安装运行条件、软件描述、使用者、帮助文档、安装文档等信息。
管理工具需要管理这些信息并能够映射数据库资源,能够看到每个软件所使用的数据资源,并能够从数据库资源导航到相关的软件。
服务器信息的管理主要指数据库资源在具体服务器上的分布以及存贮信息,包括服务器的编号、所安装的数据库、数据量、可存贮量、实际的数据存贮情况、每个数据库的超级管理员帐号、数据库表空间的帐户信息等。每个数据库资源需要映射到相应的服务器。
3.3 中医药数据资源结构图谱功能
由于中医药数字资源的内在联系不是单向或线性的,而是呈网状的复杂关系,因此,不可能通过单一的线索或统一的机制描述全局的状况。建立中医药资源结构图谱目标是要通过多种模式,多角度和多层次地挖掘和揭示这些内在关系,通过链接、集成和嵌入实现资源之间、资源和服务的整合。其实现的主要功能如下。
3.3.1 数据库资源管理功能
该项功能主要实现对数据库元数据的管理和展示,主要分数据库管理、单个数据库管理、单个表的管理以及数据库信息展示4个子功能。
①数据库管理。提供对数据库信息的管理,包括以下功能:a.增加和删除数据库元数据,并可以对其进行编辑(元数据包括制作人,起始日期,制作背景,目标,更新周期等);b.管理不同数据库之间的关系,实现数据库之间关系的增加、删除、编辑功能;c.通过中医药分类词表对数据库进行描述。
②数据库中表的管理。提供对指定数据库中所属表信息的管理,包括对数据库中所属表信息的管理。
③单个表对应信息的管理。提供对单个表对应元数据的管理,包括以下功能:a.对单个表的元数据进行管理,表中的字段信息可以直接从数据库中得到;b.管理表对应的标准。
④元数据的定位和展示功能。实现对元数据的定位和展示,包括可以对元数据进行逐层展示。根据数据资源分类标准进行元数据目录分类的分层,并定位元数据。
3.3.2 数据库应用软件管理功能
这项功能主要实现对具体应用程序的描述和管理,包括以下子功能:①应用软件自身信息的展示,包括软件开发的起始日期、目标、版本、开发语言、开发人员、源代码、可运行包、状态、安装运行条件、软件描述、使用者、帮助文档、安装文档等信息。②应用软件使用数据资源的描述,可以查看软件对应的数据资源。③增添元数据管展示功能,可以通过数据资源导航到相关软件。
3.3.3 应用程序信息管理功能
实现对应用程序相关信息的管理,包括以下子功能:①增加、删除和编辑应用程序的元数据;②管理应用程序与其数据资源之间的关系,可以建立、删除、编辑应用程序与数据资源(数据库中的表)之间的关联。
3.3.4 服务器信息的管理
实现对服务器上数据资源信息的管理,包括以下子功能:①建立、删除、编辑服务器元数据,包括服务器的编号、所安装的数据库、数据量、可存贮量、实际的数据存贮情况,每个数据库的超级管理员帐号,数据库表空间的帐户信息等;②建立、删除、编辑数据库与服务器之间的关系。
随着网络信息的海量增长,信息资源的有序化和信息的可用性问题已经成为以数字化为核心的中医信息资源建设中的一个关键问题。中医药科学数据中心与互联网包容的信息内容在数量和覆盖内容方面日趋全面,我们期待着设计更加科学、结构更加完备、管理更加规范、功能更加强大的资源整合系统,为网络资源的发现、整合与利用提供一个全新而高效的技术平台,为中医药信息服务开辟更加广阔的发展前景。
浏览量:3
下载量:0
时间:
研究一个随机变量Y对另一个(X)或一组(X1,X2,…,Xk)变量的相依关系的统计分析方法。研究一 个或多个随机变量Y1 ,Y2 ,…,Yi与另一些变量X1、X2,…,Xk之间的关系的统计方法。又称多重回归分析。通常称Y1,Y2,…,Yi为因变量,X1、X2,…,Xk为自变量。今天读文网小编要与大家分享的是:基于二元回归分析的火灾数据研究相关论文。具体内容如下,欢迎阅读!
摘要:根据国家2003—2007年火灾的相关统计数据,应用回归分析,研究了火灾引起的经济损失与火灾中伤人数目及烧毁建筑面积之间的关系,建立了二元线性回归模型,对方程的精度进行了相关性检验。
关键词:火灾;二元线性回归分析;相关性检验
论文正文:
基于二元回归分析的火灾数据研究
火灾属于突发伤害事故,是当前社会中发生频率较高且危害较大的一种灾害,特别是在近年来发生的多起群死群伤突发伤害事故中,火灾事故占相当比例,每年都会造成人员伤亡和巨大的经济损失。鉴于此,本文对造成火灾经济损失的直接相关因素进行了研究,并对相关的统计数据进行了回归分析。
现实生活中,对于具有相关关系的变量,我们往往不能像函数关系那样找到它们之间的精确表达式,但是通过大量的试验(观测)数据,可以发现它们间存在一定的统计规律性,数理统计中研究某一随机变量(因变量)与其他一个或几个普通变量(自变量)之间变动关系的一种有效方法就是回归分析。由回归分析求出的关系式,称为回归方程。回归方程为线性的称为线性回归,否则成为非线性回归。线性回归是回归分析的基本模型,很多复杂的情况都能转化为线性回归进行处理,例如,文献[1]讨探讨了统计学对认识和解决火灾问题的重要性,文献[2~3]利用线性回归模型研究了相关火灾问题。
本文主要针对国家2003—2007年火灾的相关统计数据,对火灾引起的损失费用与火灾中伤人数目及烧毁建筑面积之间的关系进行分析,建立了二元线性回归模型。
1.收集数据。表1是中国2003—2007年火灾中伤人数目、烧毁建筑面积与直接经济损失的统计数据。
2.设定回归方程。通过定性分析可知火灾中的伤人数越多,烧毁的建筑越多那么造成的经济损失就越大,并且如果火灾中没有人烧伤,房屋没有被烧毁,可认为没有经济损失。因此,可设二元线性回归分析的回归方程为
=b1x1+b2x2(1)
式中:——因变量(直接损失费用);x1——自变量(伤人数);x2——自变量(烧毁建筑面积);b1,b2——回归系数。
3.确定回归系数。将已知数据代入设定的回归方程,并用最小二乘法(见[4])计算出回归系数,确定回归方程。具体步骤如下:从表1已知,2003—2007年共有五组数据:
(x11,x12,y1),(x21,x22,y2),…,(x51,x52,y5)
设剩余平方和为
Q=(yi-i)2=(yi-bixi1-b2xi2)2
式中:yi——上页表1中第组数据的因变量;xik——第i组数据的第k个自变量(k=1,2)。
通过微积分的知识计算Q的最小值,即令Q关于每个回归系数的偏导数等于零,然后联立这两个方程=0,=0可解得回归系数b1=49.0119,b2=0.0033。因此回归方程为
=49.0119x1+0.0033x2(2)
相关性检验是指对已确定的回归方程能够代表自变量与因变量之间相关关系的可靠性进行检验。只有通过相关性检验后,才能以此回归方程为依据进行分析和预测。一般用R检验和F检验等方法。下面我们用R检验法。令
Syy=(yi-i)2=(i-y)2 =Q+U
式中:y——上页表1中5个因变量yi的平均值;i——xi1与xi2的值代入(2)式所得的值。
r=是R检验中的相关系数,它越接近于1,就说明回归方程中自变量与因变量的线性相关的近似程度越高,该方程的误差越小。通过计算可得r=0.9988,故方程(2)通过了相关检验,可用它定量的描述火灾中伤人数、烧毁建筑面积及直接经济损失的关系。
另外,从回归方程中还可以看出,火灾伤人数前面的偏回归系数较大,这主要是因为统计数据中烧毁建筑面积的数字较高,且没有考虑其他方面,例如火灾中的物资损失等,带来的经济损失。为使以上三个变量量纲一致,我们可采取以下方式,令
zi=yi/y,ti1=xi1/xi1,ti2=xi2/xi2,(3)
式中:y——上页表1中5个因变量yi的平均值,tik——上页表1中5个自变量xik的平均值(k=1,2).
对由(3)式得到的数据,利用上面的方法便得到的回归方程为:
=0.8264x1+0.177x2
相关系数r=0.9990,也通过了相关性检验。
上述回归方程显示火灾引起的经济损失与火灾中伤人数及烧毁的建筑面积均呈正相关关系,这与我们的定性分析一致。有了该定量的关系后,在没有统计出火灾造成的经济损失前,我们可以根据当年的火灾的伤人数及烧毁建筑面积对该年的经济损失作出大致的预测,或者若想把未来一年由火灾引起的经济损失限制到一定数额,那么我们就可以根据该回归方程,给出火灾伤人数及烧毁建筑面积的上限。
为了减少火灾引起的损失和伤亡,我们必须注重消除火灾隐患,建议针对火灾危险因素采取综合防范措施,加强城市公共消防设施和消防组织建设,加大消防安全宣传力度,提高人们的消防安全意识和火灾自救知识技能。
[1]刘东海,嵇涛,等.火灾统计问题的探讨[J].消防技术与产品信息,2005,(5):35-37.
[2]周崇敏.谈火灾统计与消防监督[J].武警学院学报,2002,(2):28-29.
[3]曹文娟.统计模型在火灾统计中的应用[J].武警学院学报,2006,(2):23-25.
[4]盛骤,谢式千,等.概率论与数理统计(浙大四版)[M].北京:高等教育出版社,2008.
浏览量:2
下载量:0
时间:
环境统计作为环境管理工作的一项基本制度,是各级环保部门科学决策和量化管理的重要基础性工作,是实现环境管理现代化、科学化的基础。今天读文网小编要与大家分享的是:环境统计数据质量控制问题研究相关论文。具体内容如下,欢迎阅读!
摘要:随着中国经济体制改革、产业结构调整的不断深化,面对经济及社会改革的新形势,如何准确、及时、可靠、全面掌握工业企业及社会生活污染及治理情况,做好环境统计工作,是摆在环境统计工作人员面前的一个新课题。环境统计工作者应当本着对本职工作高度负责的精神进行全过程的、全员参加的环境统计数据质量控制。要尽可能采用计算机处理统计资料,最大限度的减少人工参与,加强对环境统计人员的职业道德和专业水平培训以及加大统计执法力度等,以保证源头数据的准确性,使我们的环境统计工作更好地为现代社会经济服务。
关键词:环境;统计数据;质量控制
论文正文:
环境统计数据质量控制问题研究
环境统计是一门新兴的统计学科,它伴随着环境保护工作的产生而产生并不断深化发展。环境统计以全面的综合统计数字资料反映环境污染和环境保护的状况,环境统计数据的准确性是环境统计工作成败的关键。环境统计数据能够动态体现中国环境保护事业发展变化的情况,是国家制定环境决策和加强环境管理的重要科学依据,同时也为研究探索中国经济建设与环境保护协调发展的经验和规律提供数据支持。是从数量角度研究环境现象发展变化及其规律性的实践活动。因此要始终不渝地把提高统计数据质量问题,摆到统计工作的首要位置,并采取综合治理措施,切实抓紧抓好。下面就环境统计数据质量问题谈谈自己一些粗浅的看法。
近几年来,科学技术飞越进步,生产力迅猛发展。伴随着工业发展,环境问题日渐突显,加强环境管理工作迫在眉睫。环境统计作为环境管理工作的一项基本制度,是各级环保部门科学决策和量化管理的重要基础性工作,是实现环境管理现代化、科学化的基础。它是我们了解全市环境污染及治理情况的一个重要途径,也为政府和环境保护行政主管部门制订环境保护和计划、实施主要污染物排放总量控制、加强环境监督管理提供了必要的依据。最为基础依据环境统计数据的准确性和及时性这两项基本要求尤显重要。其中,准确性的要求是第一位的,是统计工作的生命。它确定着统计资料是否有效和价值的高低,是衡量统计数据质量的根本标志。准确可靠的统计数据,便于决策和管理者正确地把握环境发展趋势,客观地剖析环境污染问题,从而作出科学的规划和决策。因此,环境统计工作者必须以对本职工作高度负责的精神,以环境统计数据为对象,以消除环境统计数据的差错为目标,千方百计搞准统计数据,达到强化环境统计数据质量控制的目的。
1.数据虚假。这是最常见的环境统计数据质量问题,也是危害最为严重的数据质量问题,不实的数据比没有数据危害更大。这类统计数据完全是虚构的杜撰的,毫无事实根据。造成环境统计数据虚假的因素多种多样:有意虚报,瞒报统计数据资料,指标制定不严密,统计制度不完善,不配套等。这种过错包括环境统计人员为某种目的的故意过错,也包括过失过错。
2.拼凑的数据。这种数据是把不同地点,不同条件,不同性质的数据在收集、加工、传递过程中,人为地拼凑成同一时间、地点、条件和性质下的同一数据。这种东拼西凑的数据,虽然分别有事实根据,但是从整体上看数据是不符合事实的,其性质与数据虚构相同。如,环境统计人员为了填报方便把两台锅炉的数据简单叠加,不考虑其烟囱距离、有效高度等因素,不进行加权处理。
3.指标数值背离指标原意。这是由于对指标的理解不准确,或者是因为指标含义模糊,指标计算的随意性大等原因造成的数据质量问题,表现为收集整理的环境统计数据不是所要求的统计内容,数据与指标原意出现走样,面目全非。如,环境统计人员对工艺过程了解不够,使原煤和燃料煤之间,工艺过程和燃烧过程排放的二氧化硫之间的数据混淆不清。
4.数据的逻辑性错误。这是指统计资料的排列不合逻辑,各个数据、项目之间相互矛盾。如某企业报送的材料,燃煤量增加,煤的硫份不变,但燃烧过程产生的二氧化硫量却减少,这就存在着矛盾,表明数据有逻辑性错误。
5.数据的非同一性。它是指同一个指标在不同时期的统计范围、口径、内容、方法、单位和价格上有差别而造成的数据的不可比性。如某电厂,第一季度报送的产品发电量以亿度为单位,第二季度报送的产品发电量以万度为单位,在“十一五”环境统计软件系统中 ,对比过程由于单位识别不清,就会造成产品一项的指标突变。
6.数据不完整。这里指填报单位出现遗漏,所列项目的资料没有搜集齐全,不符合统计资料完整性的要求。数据不完整,就不可能反映研究对象的全貌和正确认识现象总体特征,最终也就难以对现象变化的规律性做出明确的判断,甚至会得出错误的结论。如企业填报的材料,由烟尘的产生量和去除量,却没有粉煤灰的产生量,这明显是错误的,因为烟尘的去除过程必然会有粉煤灰的产生。
7.统计手段和统计分析落后。目前许多企业统计工作仍处于手工状态,很原始!即使采用计算机也仅仅是减少工作量去做一些汇总、指标计算,并没真正引用先进的计算机技术和网络技术。所作的统计分析也局限于事后分析,即对统计数据进行单纯的讲解说明;不能利用网络技术实行信息共享等方式进行事前分析和预测。换句话说,“统计预测”这一职能根本没有发挥作用,缺乏对信息的收集、综合和系统化。
此外,常见的统计数据问题还有计算错误、笔误等。可见,统计数据质量问题既可能是来自于设计阶段,也可能是来自于统计资料的整理阶段。
1.环境统计工作者本身应提高自身素质。环境统计人员不仅应掌握深厚环境监测和评价的相关知识,还要掌握统计法律及基本知识,具有丰富的实际工作经验,并应跟上时代及时进行知识储备及更新。因此,环境统计人员应该加强培训工作,各环境保护部门应建立配套的培训机制,对每一层次的环境统计岗位实施针对性的培训,必要时应聘请有关专家学者授课,或到相关单位进行考察学习,做到取长补短。环境统计工作者本身也应该努力学习专业知识,钻研业务,不断提高环境统计业务素质和水平,杜绝因业务不熟悉而造成的数据质量问题。
2.加强对统计人员的职业道德培训。目前,上级部门下达计划和各类政绩考核对环境统计数据干扰不可低估。有些地方,以是否完成计划和各类数据的高低作为考核地方政绩的依据,导致很多下级部门所报的环境统计数据受制约于计划数,这并不是计划部门的计划多么精确合理,而是说明某些环境统计对象或环境统计部门受某种利益或压力的驱动而使环境统计数据的质量得不到保障。当然,数据不真实、不准确的原因是多方面的,其中环境统计人员的思想道德对环境统计数据的影响是很大的。这就要求我们加强对统计人员的思想品德和职业道德教育,要求每一个统计工作者必须坚持实事求是的工作作风,认真对待每一个统计数据,如实地反映情况。
3.加大统计执法力度,保证源头数据的准确性。环境保护部门今后应在加强环境统计信息工程建设的基础上从数据采集的圈子中跳出来,重点加大环境统计执法检查,对弄虚作假的单位要坚决严肃查处。在立法上,罚款数额应该大幅增加,以威慑环境统计违法者,逐步建立全社会的环境统计诚信体系。
总之,在环境统计工作中要进一步加强统计信息自动化建设,抓环节,保质量,力求做到环境统计数据的全面、可靠和准确性,抵制环境统计上弄虚作假的行为,提高环境统计数据的质量水平,使环境统计工作逐步走向科学化、程序化、规范化,建立健全环境统计工作网络。充分发挥环境统计的调查、信息、监督三大功能,切实为环境管理提供服务,提高监测监管能力,确保完成“十一五”节能减排任务,促进环境友好型社会建设和经济社会又好又快发展。
[1] ISBN 978-7-5037-4602-4统计工作务实[M].北京:中国统计出版社,2007:20-50.
[2] ISBN 978-7-5037-4604-8统计基础理论及相关知识[M].北京:中国统计出版社,2007:1-50.
[3] “十一五”国家环境统计综合年报软件使用说明[Z].
浏览量:3
下载量:0
时间:
毕业设计论文是毕业设计工作的总结和提高,应有一定的实际应用价值,能反映出作者所具有的专业基础知识和分析解决问题的能力。 以下是读文网小编今天为大家精心准备的关于计算机的毕业论文范文:嵌入式移动数据库研究,内容仅供参考,欢迎阅读!
摘要:嵌入式技术已在人们生活中得到广泛应用;移动计算更是给人们的生活带来了极大的方便。有移动计算技术推动发展的新的数据库技术让人耳目一新。嵌入式移动数据库技术因此产生。主要论述了嵌入式移动数据库的特点及应用,嵌入式移动数据库管理系统(EMDB)的功能需求及特点,嵌入式移动数据库的系统结构。
关键字: 嵌入式 移动计算 嵌入式移动数据库 EMDB 系统结构
随着移动计算技术的发展,移动数据库逐步走向应用,在嵌入式操作系统中加入移动数据库,也越来越显示出其重要性。
1.1 嵌入式系统
嵌入式系统是以应用为中心,以计算机技术为基础,并且软硬件可裁剪,适用于应用系统对功能、可靠性、成本、体积、功耗有严格要求的专用计算机系统。它一般由嵌入式微处理器、外围硬件设备、嵌入式操作系统以及用户的应用程序等四个部分组成,用于实现对其他设备的控制、监视或管理等功能。
嵌入式系统一般指非PC系统,它包括硬件和软件两部分。硬件包括处理器/微处理器、存储器及外设器件和I/O端口、图形控制器等。软件部分包括操作系统软件(OS)(要求实时和多任务操作)和应用程序编程。有时设计人员把这两种软件组合在一起。应用程序控制着系统的运作和行为;而操作系统控制着应用程序编程与硬件的交互作用。
1.2 移动计算
移动计算是一种新型的技术,它使得计算机或其它信息设备,在没有与固定的物理连接设备相连的情况下,能够传输数据。移动计算的作用在于,将有用、准确、及时的信息与中央信息系统相互作用,分担中央信息系统的计算压力, 使有用、准确、及时的信息能提供给在任何时间、任何地点需要它的任何用户。移动计算环境比传统的计算环境更为复杂和灵活。 典型的移动计算环境有[1]:
(1) 智能计算设备+ 无线网络。通过无线网络,智能计算设备可以随时进入MCE 主网络;
(2) 智能计算设备+ 调制解调器+ 电话网络。在不同地点, 将调制解调器和附近的电话相连接, 通过电话网进入MCE 主网络;
(3) 移动用户+ 传统工作站+ 传统有线网络。移动用户在不同场地使用静态计算机获得MCE 的服务。
1.3 嵌入式移动数据库
数据库技术一直在随着计算的发展而不断进步。凡是有数据的地方,就要用到数据库来协助管理数据。移动计算也是对数据的处理,离开对数据的管理、处理,计算机就毫无意义。移动计算同时又强调其移动性,传统的PC机要做到移动,同时在苛刻的环境下作到良好的运作也是不可能的。此时,嵌入式很好的满足了移动计算对移动客户端计算的要求。三者从这一点上结合就产生了当今数据库的一个新的发展空间:嵌入式数据库技术。移动数据库是指支持移动计算环境的分布式数据库。由于移动数据库系统通常应用在诸如掌上电脑、PDA、车载设备、移动电话等嵌入式设备中,因此,它又被称为嵌入式移动数据库系统。
2.1 嵌入式移动数据库特点
嵌入式移动数据库在实际应用中必须解决好数据的一致性(复制性)、高效的事务处理、数据的安全性等问题。
(1)数据的一致性
移动数据库的一个显著特点是,移动终端之间以及与服务器之间的连接是一种弱连接。即低带宽、长延迟、不稳定和经常性的断开。为了支持用户在弱环境下对数据库的操作,现在普遍采用乐观复制方法(Optimistic replication 或 Lazy replication)允许用户对本地缓存上的数据副本进行操作。待网络重新连接后再与数据库服务器或其它终端交换数据修改信息,并通过冲突检测和协调来恢复数据的一致性。
(2)高效的事务处理
移动事务处理要解决在移动环境中频繁的、可预见的、拆连情况下的事务处理。为了保证活动事务的顺利完成,必须设计和实现新的事务管理策略和算法,方法如下:
根据网络连接情况来确定事务处理的优先级,网络连接速度高的事务请求优先处理。
根据操作时间来确定事务是否迁移,即长时间的事务操作将全部迁移到服务器上执行,无需保证网络的一直畅通。
根据数据量的大小来确定事务是上载执行还是下载数据副本执行后上载。
事务处理过程中,网络断接处理时采用服务器发现机制还是采用客户端声明机制。
事务移动(如:位置相关查询)过程中的用户位置属性的实时更新。
完善的日志记录策略。
(3)数据的安全性
许多应用领域的嵌入式设备是系统中数据管理或处理的关键设备,因此嵌入式设备上的数据库系统对存取权限的控制比较严格。同时,许多嵌入式设备具有较高的移动性、便携性和非固定的工作环境,也带来潜在的不安全因素。同时某些数据的个人隐私性又很高,因此在防止碰撞、磁场干扰、遗失、盗窃等对个人数据安全的威胁上需要提供充分的安全性保证。保证数据安全的主要措施如下:
对移动终端进行认证,防止非法终端的欺骗性接入。
对无线通信进行加密,防止数据信息泄漏。
对下载的数据副本加密存储,以防移动终端物理丢失后的数据泄密[2]。
2.2 嵌入式移动数据库应用
目前,嵌入式移动数据库有两种应用,可划分为水平应用和垂直应用。所谓水平应用,是指应用方案能够用于多种不同行业,只需要极少的定制工作;而垂直应用则针对特定行业的应用,数据处理具有独特性。与水平应用相比,垂直型应用具有明显的行业特殊性,不同领域的应用之间差别较大,结果表示和服务器数据库的管理也有很大不同。主要涉及保险、银行业、航班信息、政府部门等具体的行业领域。如图所示[3]:
图 1 嵌入式移动数据库的应用分类
3.1 嵌入式移动数据库管理系统的功能需求
移动计算环境中的数据库管理系统,是一种动态分布式数据库管理系统。由于嵌入式移动数据库管理系统运行在移动计算的环境之下,应用于嵌入式操作系统之上,所以它有自己的功能需求:
(1)微小内核结构
考虑到嵌入式设备的资源有限,嵌入式移动DBMS应采用微型化技术实现,可在满足应用的前提下,紧缩其系统结构以满足嵌入式应用的需求。
(2)对标准SQL的支持
嵌入式移动DBMS应能提供对标准SQL的支持。支持SQL92 标准的子集,支持数据查询(连接查询、子查询、排序、分组等)、插入、更新、删除多种标准的SQL 语句,以充分满足嵌入式应用开发的需求。
(3)事务管理功能
嵌入式移动DBMS应具有事务处理能力,可自动维护事务的完整性、原子性等特性;支持实体完整性和引用完整性。
(4)完善的数据同步机制
数据同步是嵌入式数据库最重要的特点。通过数据复制,可以将嵌入式数据库或主数据库的变化情况应用到对方,以保证数据的一致性。
(5)支持多种连接协议。
嵌入式移动DBMS应支持多种通信连接协议。可以通过串行通信、T C P /IP、红外传输、蓝牙等多种连接方式,实现与嵌入式设备和数据库服务器的连接。
(6)完备的嵌入式数据库的管理功能
嵌入式移动DBMS应具有自动恢复功能,可进行嵌入式数据库管理,并能够提供数据的备份和恢复,保证用户数据安全可靠。支持多种嵌入式操作系统嵌入式移动DBMS 应能支持Windows CE、Palm OS 等多种目前流行的嵌入式操作系统,这样才能使嵌入式移动数据库管理系统不受移动终端的限制。
3.2 嵌入式移动数据库管理系统的特点
基于以上分析不难得出嵌入式移动数据库的管理系统应具有如下特点:
(1)提供多种数据同步方式。具有上载同步、下载同步和完全同步三种同步方式。
(2)具有完善的冲突检测机制,和灵活的冲突解决方案,具有冲突日志记录功能。企业级应用中冲突是不可避免的,不同的数据库系统认为冲突发生的位置是不一样的。解决冲突的规则可以是系统预定义的也可以是用户自定义的。
(3)支持快速同步。系统同步时,只传递变化的数据,即增量上下载,节省了大量的同步时间。
(4)支持表的水平分割和垂直分割复制,最大限度地降低了嵌入式数据库的大小。
(5)支持异构数据源连接同步。可以用支持ODBC 的异构数据源,作为主数据库和嵌入式设备上的数据库,以进行数据同步。
(6)具有主动同步的功能。允许用户对系统提供的同步事件自定义过程实现,并提供最大灵活度的同步过程。
图2 数据管理模式
嵌入式数据库的应用分为个人应用和企业级应用。在个人应用中,与外界较少交换数据,而且不必考虑多个数据库的数据一致性。在企业级应用中,嵌入式数据库要与企业级数据库交换数据,构成分布式数据库系统,支持复杂的业务活动。
在数据库三级应用模式中,EMDB系统一般采用EMDB+同步/复制服务器+企业级DB,如我们见到的IBM提供的嵌入式设备和移动企业级应用解决方案就是由3部分组成:DB2 Everyplace 嵌入式数据库、DB2 Everyplace Sync Server和Universal Database企业级数据库。在此模式中,EMDBS由移动设备中的EMDBMS和固定节点上的同步/复制服务器这两部分构成。这种方案的指导思想是将DBMS的功能分解,简化移动设备中的功能,进而减少对移动设备资源的需求[4]。
(1) 数据库服务器DBSVR (Database Server)
可以是大型数据库系统, 如: Oracle, Sybase, DB2,SQL Server, 一般为固定结点。每个DBSVR 上维护本地数据库的一个完整的副本, 服务器之间由可靠的高速互联网连接在一起, 构成一个传统意义上的分布数据库系统。
图3 典型嵌入式移动数据库的系统结构
(2)移动支持结点MSS (Mobile Support Station )
进行分布式事务处理, 控制EMDB和DBSVR之间的数据交换并支持一个无线单元(cell),具有无线联网能力和同步功能,MSS也位于高速网络中。服务器可以与MSS为同一台机器。
(3)位置服务器LS(Location Server)
(4)可信部分
由固定网络以及网络上的固定主机组成, 固定主机分为两类: 一类是不带无线通讯的主机, 如DSSVR 和LS; 另一类是带有无线通讯接口MSS。
(5)移动客户机MC (Mobile Client)
MC的处理能力与存储能力相对于服务器来说非常有限, 且具有移动性(即可以出现在任意一个无线单元中) , 在它上面保存一部分数据库副本, 并通过EMDB对本地数据进行管理,可以通过无线链路与一个MSS通信,通过MSS上的ODBC 接口, EMDB可以与DBSVR进行数据交换。从而与整个固定网络连通, 也可以接受由MSS 发送的广播信息。它会经常与服务器断接(指MC无法与任意一个联机通信) 即使在与服务器保持连接时, 由于MC 所处的网络环境多变,MC与服务器之间的网络带宽相差很大,且可靠性较低,网络延迟较大。
(6)本地数据库Rep(Replication) 数据库副本
(7)EMDB
嵌入式移动数据库, 工作方式为: 每当MC发出一个查询请求Q1时,它首先查询本地数据库(移动子集上),若满足查询条件要求则直接返回给MC, 否则就向VS提交查询请求, 由VS代替MC完成查询并将结果返回给MC(前提是两者处于连接状态)。若MC 处于断接状态, 则也只能在MC上执行本地查询。若在断接期间更新了MC上的数据, 则该数据将在VS再次连接时, 进行数据重集成, 通过一致性维护算法来保证一致性。主要EMDB的应用模式都是立足于嵌入式设备作客户端, 在嵌入式设备上运行一个精巧的EMDB,在通过同步或复制技术与企业级数据库连接。这种应用模式在支持嵌入式设备的同时, 还支持移动设备,甚至无线移动设备, 构成基于移动环境的应用[5]。
现在,世界已经进入了后PC机时代。信息电器如个人数字助理、web可视电话、移动电话的GPS或W-CDMA产品、TV机顶盒、电视会议机、数码相机等嵌入式设备已经在人们生活中广泛应用。相信随着科技的发展,嵌入式移动数据库技术也必将给人们的生活带来更大的方便和改变。
[1] 冯玉才李东等.一种移动数据库管理系统的体系结构,计算机研究与发展[J],2001年
[2] 黄军政.蔡瀛捷.移动计算推动数据库移动,中国计算机用户[J],2004年9月第36期
[3] 周克江.嵌入式移动数据库及其应用问题研究,湖南第一师范学报[J],2004年9月第4卷第3期
[4] 王彤.王良.嵌入式移动数据库的综述及评价,计算机工程[J],2001年12月第12期
[5] 朱英.嵌入式移动数据库及其相关问题,桂林电子工业学院学报[J],2003年6月第3期
浏览量:2
下载量:0
时间:
在毕业设计期间,尽可能多的阅读文献资料是很重要的,一方面是为毕业设计做理论准备,另一方面是学习论文的写作方法。一篇优秀的论文对启发我们的思维,掌握论文的写作规范很有帮助。 以下是读文网小编今天为大家精心准备的关于计算机的论文范文:嵌入式移动数据库应用研究,内容仅供参考,欢迎阅读!
摘要:随着移动计算技术的发展,移动数据库逐步走向应用,在嵌入式操作系统中移动数据库更显示出其优越性。本文分析移动数据库的特点、体系结构;介绍移动数据库系统中的一些关键性技术,并指出了移动数据库应用方向。
关键词:嵌入式系统;移动数据库;移动计算;事务处理
数据库技术一直随着计算的发展而不断进步,随着移动计算时代的到来,嵌入式操作系统对移动数据库系统的需求为数据库技术开辟了新的发展空间。随着智能移动终端的普及,嵌入式移动数据库技术目前已经从研究领域逐步走向广泛的应用领域。
在数据库系统的研究历史中,传统的分布计算与分布式数据库的研究是基于有线网络和固定主机的。这些都采用了一些默认的隐含假设,例如固定网络连接、对等通信代价、主机节点固定不变等。但进入20世纪90年代以来,随着移动通信技术和网络技术迅速发展,加之移动计算机和移动通信设备的大量普及,许多计算节点可以在移动过程中与网络建立连接,使得上述假设条件不成立。移动计算环境具有移动性、低带宽、频繁断接性、网络通信的非对称性、电源电力的有限性等特点,使得传统分布式数据库中的方法和技术不能直接应用于移动数据库。
从数据库技术的发展过程来看,计算环境和数据库技术基本保持着一种同步发展的态势,互相影响、互相促进。移动计算的概念是对“任何时间、任何地点的立即通讯”的扩展。在分布式计算的基础上,计算环境进一步扩展为包含各种移动设备、具有无线通信能力的服务网络,构成了一个新的计算环境,即移动计算环境。相应地,数据库系统先后出现了集中式数据库系统、分布式数据库系统、B/A/S多层结构的数据库系统、嵌入式数据库和移动数据库。当然,这些系统也可以共存在同一个计算环境中。
一般说来,嵌入式移动数据库可以从系统的体系结构方面来定义:嵌入式移动数据库系统是支持移动计算或某种特定计算模式的数据库管理系统,数据库系统与操作系统、具体应用集成在一起,运行在各种智能型嵌入设备或移动设备上。其中,嵌入在移动设备上的数据库系统由于涉及数据库技术、分布式计算技术,以及移动通讯技术等多个学科领域,目前已经成为一个十分活跃的研究和应用领域——嵌入式移动数据库或简称为移动数据库(EMDBS)。
2.1体系结构
在传统的分布式计算系统中,各个计算节点之间是通过固定网络连接并保持网络的持续连接性的,而移动计算系统改变了这种假设条件。移动计算系统是固定节点和移动节点构成的分布计算系统。
移动计算的网络环境具有鲜明的特点:移动性、断接性、带宽多样性、可伸缩性、弱可靠性、网络通信的非对称性、电源能力的局限性等。移动环境中的分布式数据库就是移动数据库。它是传统分布式数据库系统的扩展,可以看作客户与固定服务器节点动态连接的分布式系统。移动数据库系统的体系结构如图1所示。
其中,移动客户机MC(Mobile Client)包括便携式电脑、PDA等;MSS(Mobile Support Station)支持移动计算的固定节点,具有无线通信接口;FH(Fixed Host)没有无线通信接口,安装有数据库和数据库管理系统。
2.2主要特点
移动数据库的计算环境是传统分布式数据库的扩展,它可以看作客户端与固定服务器节点动态连接的分布式系统。因此移动计算环境中的数据库管理系统是一种动态分布式数据库管理系统。由于移动数据库在移动计算的环境下应用在嵌入型操作系统之上,所以它具有:微小内核结构、对标准SQL的支持、事务管理功能、完善的数据同步机制、支持多种连接协议、完备的数据库管理功能和支持多种嵌入型操作系统的特点和功能需求。
在移动数据库中还需要考虑诸多传统计算环境下不需要考虑的问题,如对断接操作的支持、对位置相关查询的支持、对查询优化的特殊考虑以及对提高有限资源的利用率和对系统效率的考虑等等。为了有效地解决上述问题,诸如复制与缓存技术、移动事务处理、数据广播技术、移动查询处理与查询优化、位置相关的数据处理及查询技术、移动信息发布技术等技术仍在不断的发展和完善,它们会进一步促进移动数据库技术的发展。
移动数据库涉及的理论和技术含盖了当今通信、计算机和嵌入式系统的最新成果,其中在移动环境下如何进行数据管理是实现移动数据库的关键。根据目前国际有关机构研究的研究表明这些关键技术主要集中在以下几个方面。
3.1数据复制与缓存
复制是在多个移动节点上维护数据的备份,包括服务器之间的复制和移动计算机上保存数据库的复制。一般前者称为复制后者称为缓存。复制的主要目的是提高分布式数据库系统的可用性、可靠性和访问性能。首要的问题是如何维护多个复制节点上数据状态的一致性。按照维护复制一致性的方式来划分,现有的复制协议可以分为严格一致协议和弱一致协议两种。严格一致协议要求任何时刻所有数据库的复制都是一致的;而弱一致协议允许各个复制之间存在暂时的不一致,但这种不一致总能够保持在一定的界限之内,而且总是能够趋于一致(收敛性)。目前,针对移动计算特点开展数据复制/缓存技术的研究最具代表性的是:J. Gray的两级复制机制、CODA系统以及缓存失效报告广播技术等,另外,SYBASE公司的移动数据库产品SQL ANYWHERE和SQL REMOTE也采用该技术来支持移动计算环境。
3.2数据广播
通俗地讲,数据广播是指在移动计算环境中,利用客户机与服务器通信的不对称性,以周期性广播的形式向客户机发送数据。其最大的优点是,广播开销不依赖移动用户数量的变化而变化,借助数据广播,可以在一定程度上解决移动数据库系统的断接问题。数据广播的研究可分为服务器和客户机两个方面:服务器主要考虑如何组织广播数据,即数据广播的调度;移动节点主要考虑如何利用本地缓存进一步减少查询广播数据的时间。在国内,长沙国防科技大学的周兴铭院士对数据广播进行了深入研究,提出了数据广播的多盘调度算法。衡量数据广播调度算法好坏的参数是访问时间和调谐时间。
3.3位置相关查询优化
在移动数据库中,存在着与位置相关信息的查询及更新。查询通常是与位置相关的,即使是同一个问题,在不同的地方,所得查询结果是不同的,如“最近的超市在哪里?”。移动查询优化技术是指在传统分布式数据库查询优化技术的基础上,利用多种方法,消除带宽多样性、断接等因素造成的影响,使查询引擎能够根据当前可用网络条件采取恰当的优化策略;同时,针对移动计算机有限电源能力,合理地组织本地数据库管理、远程数据库访问等耗电能较多的操作,达到节能目的,延长关键数据的可用时间。
采用基于分割的地址更新策略时,由位置服务器维护的移动用户对象包含以下数据成员和方法:
分割集合——记录MSS的分割情况,例如{Cell1,Cell2},{Cell3,Cell4,Cell5};
LOC——记录移动用户最近报告的地址(无线单元的ID),例如Cell1 ;
ERR——移动用户当前所在的分割,例如,若LOC= Cell1 ,则ERR={Cell1,Cell2};
loc()——一个方法,用于返回该用户的实际地址,即上面介绍的地址查询过程。
在移动查询的应用中,有各种各样涉及地址的查询,例如“请寻找一家校园附近的超市”,“查找X, Y, Z,这三人都在同一条公路上,且Y在X与Z之间”,等等。一般地,可以把这一类地址相关查询表示为:
SELECT x1 ,x2 ,…, xn
FROM Users
WHERE (x1.loc=l1 ∧…∧ xn.loc=ln ) ∧ C(l1,…,ln ) ∧ W(x1 ,…, xn )
其中C(l1, …, ln )是关于地址l1, …, ln 的n元约束条件,而 W(x1, …, xn ) 是关于对象x1 ,x2 , …, xn 非地址属性的n元约束条件,Users 是所有移动用户的集合。
关于计算机的论文:嵌入式移动数据库应用研究
3.4移动事务处理
事务处理是数据库管理系统的一个基本功能,主要用于维护数据的一致性,支持多用户的并发访问,使用户可以可靠地查询和更新数据库。一般来说,用户对数据库系统的访问都是通过事务来完成的。在传统的数据库系统中,一个事务由一系列读写操作组成。事务处理必须满足四个准则,即原子性、一致性、隔离性和永久性(简称ACID)。移动计算环境的特点,使传统数据库系统中的事务处理技术不能满足移动事务处理的要求。
通常,将移动客户机发出的事务叫移动事务,它属于分布事务。移动事务处理具有以下特点:
1) 移动性。这不仅指移动事务执行期间,发出事务的移动客户机是移动的,而且事务本身也在相应地移动。
2) 长事务。由于无线网络通信的低带宽、高延迟以及移动客户机的频繁断接性,都可能使移动事务成为长事务。
3) 易错性。由于移动客户机不如固定结点可靠,而且无线网络通信也不如固定网络稳定,因此,与一般事务相比,移动事务更容易出错。
4) 异构性。由于客户机的移动性,移动事务可能要访问分布的异构数据库系统。
总之,移动事务不同于传统事务,传统的ACID模型已不能很好地描述移动事务,需要为移动事务寻找更好的模型。维护数据的一致性和解决过区切换(handoff)问题是移动事务管理的重要任务。
移动数据库技术的许多特性都与信息时代的不断进步的需求相吻合, 有着广阔的发展空间。
4.1嵌入式移动数据库在物流领域有着广阔的应用前景
物流的信息化在未来的物流发展中将发挥日益重要的作用,因为及时准确的信息有利于协调生产、销售、运输、存储等业务的展开,有利于降低库存,节约在途资金等。在运输方面,利用移动计算机与GPS/GIS车辆信息系统相连,使得整个运输车队的运行受到中央调度系统的控制。在存储环节,带有嵌入式移动数据库的手持计算机输入的信息通过无线通信网络写入中央数据库,大大提高了工作效率和信息的时效性,有利于物流优化控制。在配送环节,输入手持计算机的数据通过无线网络传入中央数据库。因此,在投递的同时,用户即可查询物品投递的情况。
4.2嵌入式移动数据库为移动银行铺平了道路
在我国,移动用户是最具消费潜力的群体,因此针对移动用户开发的移动银行业务将具有很大的市场潜力,而且能够推动移动电子商务的发展。移动银行可以使客户在异地对自己的帐务进行实时查询、交易,方便、省时,降低成本,同时安全可靠,机动灵活。客户可以在任何时间,任何地点进行交易,节约了去银行的时间。出差或旅游在外仍可享受银行服务。
4.3嵌入式移动数据库非常有助于提高实地调查/工作的效率
煤气、水电等公用事业检查员查验数据就是一个很好的应用实例,目前一般的检查员仍然是将检验的数据记录在纸上。如果利用移动计算机记录和传输数据,遇到纠纷时还可以实时地查询历史记录,这将使得我国的公用事业单位的收费工作大大地改善。
除了上述主要应用之外,移动数据库技术还在零售业、制造业、金融业、医疗卫生等领域展现了广阔的应用前景。随着移动计算、移动数据库和无线数据通信等相关技术迅猛发展,移动数据库将成为信息社会的重要支柱。
本文给出嵌入式移动数据库的定义,描述了嵌入式移动数据库的体系结构并简单分析它的特点,然后详细分析了嵌入式移动数据库的关键技术,最后展望了嵌入式移动数据应用前景。嵌入式移动数据的相关技术研究不断取得进步,这为嵌入式移动数据的成熟应用打下了坚实的基础。
1 李东,曹忠升,冯玉才,等. 移动数据库技术研究综述[J]. 计算机应用研究,2000(10): 4~7
2 Madria S K,Mohania M,et al. Mobile data and transaction management. Information Science 141 (2002) 279~309
3 Antonio Si, Hong va Leng. Query optimization for broadcast database. Data & Knowledge Engineering 29 (1999) 351~380
4 王珊,丁治明,张孝. 移动数据库及应用[J]. 计算机应用, 2000,20(9)
浏览量:2
下载量:0
时间:
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。以下是读文网小编为大家精心准备的:试论数据挖掘在化学研究生产中的应用相关论文。内容仅供参考,欢迎阅读!
化学是一门研究化合物组成、性质以及变化的一门学科。在长期的化学、化工实验中产生了大量的数据,但是数据的海量增加却造成了诸如信息过量、信息安全隐患、信息真假难辨等困难。同时,这些海量的数据内部存在着很多有价值的信息和规律,如何从这些数据中发现更多更有价值的信息和规律也成为化学、化工专家关注的焦点,需要是发明之母,面对这一要求,数据挖掘技术在化学、化工中的应用也就应运而生,并显示了强大的生命力。在化学领域内,数据挖掘理论和算法的发展,极大地促进了计算机化学、化学计量学和化学信息学等新学科的发展。本文就针对数据挖掘方法在化学、化工各方面的应用进行简述。
数据挖掘(Data mining),是数据库知识发现(KDD, Knowledge-Discovery in Databases)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索发现隐藏于其中的规律和信息的过程。近十年来,数据挖掘技术不管是在理论上还是在实际应用上,都已取得了很大的进展[1],同时也出现了各种专用或商用的数据挖掘软件。
数据挖掘领域利用的主要思想有:统计学的抽样、估计和假设检验;人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘同时也迅速地接纳了最优化、进化计算、信息论、信号处理、可视化和信息检索等领域方面的思想。目前,常用的数据挖掘方法主要有以下几种:数学统计方法、决策树、模式识别方法、人工神经网络方法、遗传算法、粗糙集方法、支持向量机方法等。
数据挖掘利用多学科领域的知识从全新的角度以及更深层次中发掘存在于海量信息内部有效的、新颖的模式。在化学与化工生产中利用这种数据挖掘技术可从化学和化工生产数据中寻找潜在的规律,同时利用这些规律指导企业的生产过程,最终实现生产过程的优化以及企业效益的最大化。
3.1 中草药成分分析中的数据挖掘
方兆华等对化妆品专利中草药成分利用关联规则进行分析,得出化妆品中有当归、白芷和芦荟等高频单味药,有当归-川芎等高频药对,有芦荟-芝麻-向日葵子等高频药组;基于置信度和支持度分析,得到了化妆品中中草药应用的13 条强关联规则,如向日葵子-芝麻等。陆爱军等利用关联规则对中医药效、植物科属、化学的成分活性、中药提取物和现代药理之间的相互关系进行研究,在分析之前对数据进行预处理,然后再对处理后的数据进行挖掘,从而得到一些有趣的关联规则,比如中药药效和植物科分类的关联规则,都是因为在该科下面的植物很多具有相应的中药药效。
3.2 化学研究中的数据挖掘
朱建国分析了数据的具体特征,采用ID3 的决策树算法将数据的离散化和属性选择进行预处理,使决策树树状结构的分类器对数据能进行更有效的分类。通过二苯乙烯系列化合物实验数据的建树过程,以及对所得到的规则进行分析,将决策树有效地运用在二苯乙烯系列化合物研究过程中,并开发方案实现系统让研究者能够清晰地表达分类规则,从而给研究者带来了极大的方便。
李峰等将数据挖掘应用在稀土掺杂纳米TiO2结构与光催化活性的关系中,用多元逐步回归分析对数据样本间的联系进行挖掘,从而发现结构参数与光催化剂的表观速率常数间之间存在着良好的相关性,其相关系数大于0.99,说明该模型具有良好的稳定性和预测能力。溶胶-凝胶法制备的不同稀土掺杂纳米TiO2不管是实验结果还是计算机模拟结果都表明其纳米结构相似,光催化活性是相近的,对于系列光催化剂制备及其动力学性质研究都能较好地建立起定量构效关系,进而通过XRD参数测试,发现活性相近的催化剂,为选择高效的光催化剂节约资源。
Ru等人提出了一种称为BSVR(Boosting support vector regression)的方法,该方法支持向量回归,以Boosting 结合支持向量回归(SVR)为分类器,继而用它来处理硝基苯类,并且将其用作5-脂肪氧化酶抑止剂的1-phenyl[2H]-tetrahydro-triazine-3-one类化合物的QSAR数据预测毒性,实验结果表明这种方法在病毒性预测的准确性方面有明显的提高。
Cai 与Feng 等人提出了一种称为LogistBoost 的算法,该算法基于对数回归策略,可以对蛋白质结构数据(基于氨基酸序列)的二类、多类分类问题进行预测,实验结果表明这种算法具有很好的预测结果。Boosting 算法在蛋白质结构分类方面的预测应用是以构成蛋白质的氨基酸种类、排列顺序作为主要属性对蛋白质的二级结构进行判断。随着数据挖掘在化学中的应用,Boosting算法有望能够对蛋白质的3D结构进行预测。Friedman 等人提出了梯度Boosting 算法,该方法在回归问题上直接应用Boosting 算法,从而有效解决了数据挖掘中在化学应用中回归问题上常见的问题,而Tao 等人提出的新Boosting算法则能够有效解决数据挖掘在化学应用中异常值的检测问题。
3.3 化工生产中的数据挖掘
张泉灵等利用多支持度关联规则的挖掘算法,开发了化工生产过程的数据挖掘软件,通过数据挖掘软件对操作参数和配方进行优化,使产品的收率和有效成分得到提高,并将该系统应用在三唑磷的合成过程中,使三唑磷提高了1.5%的收率,同时三唑磷的含量也提高了三个百分点,从80%提高到83%,为企业带来了较好的经济的效益和社会效益。
陆治荣等利用数据挖掘方法开发了适用于生产过程优化、故障诊断、优化新产品研制和配方设计的系列软件DMOS,该软件为化工、炼油等行业生产过程优化的工程化运营创造了条件,并将该系统应用到某石化厂,主要解决丙烯的收率不能满足下游生产的问题,更重要的是回收的丙烯收率的提高可以提高经济效益,结果表明经过DMOS数据挖掘后提出了新的生产参数,对原来正常的生产状态进行优化后提高了丙烯的收率,优化后丙烯的收率从14.7%提高到了19.11%。
基于合成氨生产效益的数据挖掘,用于解决氨合成装置DMOS合成氨优化系统,用于解决合成氨工业生产参数的优化,实现氨合成装置生产时实时工况诊断、实时趋势浏览、优化操作指导、报表生成等功能。通过对云维集团有限公司氨合成装置合成塔生成数据的数据挖掘,找出了影响装置目标变量的主要工艺参数,建立目标变量与有关工艺参数间的数学模型,通过实验表明所建模型的可靠性强,能够优化装置工艺操作,提高合成氨产量,全面提高企业的经济效益。
3.4 化学分类中的数据挖掘
李琳等[15]利用决策树对玻璃和葡萄酒进行分类,玻璃有9 个属性作为衡量指标,葡萄酒为意大利某地的三种酒、含有13 个属性作为分类指标。他们首先使用MDLP(最小长度描述方法)进行离散化,再用LVF(LasVegas Filter)方法进行属性选择,剔除冗余数据后,再由C4.5 方法构建决策树。通过实验表明:由决策树建成的分类模型具有良好的预报性能,适合于化学分类知识模式的挖掘。基于预处理的决策树克服了一般决策树方法难以处理连续型数据集的缺点,又具有其它方法所不具备的优势,可从大量数据中挖掘出潜在的分类知识,并具有简沽直观的表达形式,易为专业人员理解和分析。
本文对数据挖掘方法在化学和化工生产过程中如何利用海量数据、发现和挖掘出新的规律和信息,为化学研究和化工生产提供有效准确的依据。虽然数据挖掘技术在化学和化工生产过程中获得了大量应用,但是,目前应用的范围不是很广。在化学和化工生产过程中的应用是数据挖掘当前的一个研究热点,受到越来越多研究人员的青睐。数据挖掘技术能够根据大量的化学和化工生产领域中的数据挖掘出有价值且隐藏的知识。因此,在化学研究过程中、化工生产过程的建模、控制、优化、故障诊断等方而有非常重要研究的价值,并且越发显示其重要作用。
【试论数据挖掘在化学研究生产中的应用论文】相关
浏览量:3
下载量:0
时间:
高校信息管理中心在大数据时代,面临着存储空间巨大、管理复杂、存储利用率低下以及拓展数据分析新业务的诸多挑战。针对大数据大量化、多样化、快速化、不确定和价值难的特性。以下是读文网小编为大家精心准备的:基于大数据时代下的高校信息管理研究相关论文,内容仅供参考,欢迎阅读!
【摘要】:在大数据时代,数据已成为重要的战略性资源,正在对社会管理的各项决策产生越来越重要的影响.分析了高校信息管理存在的问题,认为高校应抓住大数据时代带来的新机遇,进一步推进信息化建设,构建基于大数据的高校管理与决策支持的信息平台体系架构,建立起信息技术和行政管理协同保障机制,以此不断提升信息化管理水平.
【关键词】: 高校 信息管理 大数据 信息系统
所谓大数据,是对海量信息的概念性称谓,具体可以描述为“因其信息规模过于巨大,包含广泛的资料,传统的信息管理方式无法满足对其的分析和处理和有效利用,使其转换成可用信息需要的难度较大,需要使用先进的技术和足量的资源,随之产生的是对海量数据信息进行管理的平台分析系统。大数据有四个特点:一是数据的规模较大。二是数据的种类繁多。三是科学的利用下,信息处理速度较快。四是数据的潜在价值回报较高。对大数据的利用水平可以反映出特定对象信息管理的能力和价值获取的能力,随着大数据概念的提出,信息技术进入了一个新的发展时代。
(一)大数据概念的提出和发展为高等院校的现代化校园建设带来了技术依据和良好的发展机遇。
任何一家高等学校在教学管理和信息化建设中均会产生大量的数据,例如,教师与学生在日常接触中的交流信息,教学过程中的信息注册与课程选择信息,教学管理中的学籍管理以及学生成绩信息等。这些数据统一构成了整个校园内的信息源泉,各项信息完整、客观,潜含着很高的实用价值。树立起大数据思想,研究相关的信息技术,尽可能的发掘海量数据的可利用之处,将有效提高高校工作效率,为教学管理和日常决策提供信息支撑,推动高校现代化、信息化的发展。
(二)大数据概念的提出对高校信息化建设的整合带来了契机。
我国当前各大高校的信息化建设步伐逐渐加快,陆续开发建立起各种信息管理系统,如,远程教学系统、图书馆信息管理系统、人力资源管理系统、选课系统、财务集中管理系统等。这些系统本身就时刻产生着海量的信息数据。利用大数据的概念,将可以有序、高效的对这些数据进行归集整合,纳入统一的信息平台,综合分析,分化利用,为学校管理提供决策支持和帮助,逐步建立起高效的智慧化院校。
(三)大数据技术的发展将对改革高校教学模式和教学方法提供助益。
在传统的教育过程中,对学生的管理多数为提前设定,按不变的计划去管理。在计划的指引下,各项管理和教学活动按部就班的开展。大数据概念的引入,将有可能为呆板的教学活动重新注入活力,利用数据分析和价值挖掘技术,可以随时分析教学管理、学生学习生活的现实状态,查找出其中存在的问题,进而采取更为有效地管理和教学方法去适应教学需求,适应学生的实际需要。
近年来,信息化建设在各大高校的教学管理工作中已逐步普及,但其发展现状仍处于初步、不成熟状态。在我国各高校中,受传统思想的禁锢,传统的信息交换应用还是较为普遍,对现代信息技术手段没有完全真正的认同。而对于大数据的认识,更是处于懵懂阶段。
(一)人力资源方面存在欠缺,教学管理人员信息处理能力普遍较低。
大数据技术的应用对于科技信息人员的要求较以往更高,要求其对数据分析拥有着较高的能力,对教学业务也要在一定程度上予以精通。然而现实却是,高校本身的科技人员限于历史发展限制,一般意义上的信息人员储备本就不足,在适应大数据的需求方面就更是其短板。此外,大数据背景下,信息的应用需要达到各类信息使用和教学管理具体业务的紧密结合,所有的数据整理和分析应首先基于具体的业务使用上,让数据为业务服务。而当前各大高校在此方面差距较大。
(二)信息管理缺乏统一规划,大数据的使用缺乏信息技术基础。
大数据的搜集、整理和分析,需要在一个独立的平台上开展。当前各大高校的信息化建设虽然有了一定的发展,但各类信息系统往往相互独立,互不衔接,无畅通的数据接口,更无现成的统一的综合性数据平台可以使用,这造成各类信息的各为其主,缺乏共享,使大数据的发展缺乏平台基础。同时,数据德质量亟待加强,高校各平台散乱的信息,数量虽多但质量不高,大数据的利用缺乏有效信息支撑。
(三)数据的保密性无法保证,大数据的应用缺乏安全监管。
信息化教学管理信息系统是基于网络的,由于网络病毒层出不穷,系统漏洞不断出现,当前很多高校已经出现了信息泄露现象,部分高校信息系统时而遭受黑客攻击,信息系统的安全性成了当前需要各大高校尤为关注的另一项重要工作,这也是制约大数据在高校信息化建设中快速发展的重要原因之一。
随着高等教育改革的不断深入以及教育国际化的冲击,我国各大高校面临的竞争愈加剧烈,在管理水平上的缺失,必将落后于同业的发展。各大高校必须对大数据和信息化建设切实引起足够的重视,并将其作为后期发展的重点和改革深化的主要抓手,建立起基于现代的,符合发展潮流的大数据信息管理支持平台,并将其真正应用于日常的教学管理和学校发展。主要措施可以有如下几点:
(一)建立高校信息化管理人员的培养机制。
高校和管理部门要充分了解现代教学管理思想的发展,提高对大数据时代发展的认识,提高对数据意识,加快系统化建设进程。为此,各高校首先在人力资源上下功夫,及时开展人才建设和相关培训机制建设,包括以信息化为基础的现代教育技术思想观念的培训和应用信息技术的意识观念。从岗位配置和管理角度,建立一支责任心强、技术过硬、专业技术水平和政治素质较高的信息技术管理人员队伍。在此,合格的高校信息技术人员具备敏锐的信息意识,善于抓到有价值的信息,具有坚实的信息知识,提高对数据信息处理的速度和效率。
(二)规范大数据的搜集、整理,提高数据规模和质量。
大数据的发展前提就是数据的规模数量,缺少了足够的数据支撑,大数据的利用就成为了空中楼阁,真正的成为了一个“概念”。因此,一方面,高校首先需要加强对各类数据的采集,通过各种渠道,利用各种手段,发动各方人员,通过各种有形无形的介质尽量齐全的搜集校园和校外各类教学和学员信息,以扩大数据采集的完整性和全面性。另一方面,要对高校中现有的各类信息系统予以整合,建立数据连结端口,使信息能够在各个平台上充分的共享,或在其基础上重新开发建立一个统一的信息数据平台,为大数据的整合、梳理、分析搭建起软硬件基础,为后期的数据挖掘和使用提供充沛的、高质量的支撑。
(三)提高数据分析能力,深挖信息利用潜力。
有了高质量的充沛的信息资源之后,进而对其进行有效的开发利用,寻找出可用的信息并转化为管理和教学能力,才是大数据和信息化建设的最终目的及价值体现。在当前的发展程度下,高校可以主要从如下几个方面入手:在各类教学和管理系统应用方面,可以通过对系统具体使用信息的分析,确定尤为受到关注的系统模块,分析各类教学资源的具体利用效率,进而提高资源配比的科学性,提高教学管理效率。在学生管理方面,可以充分归纳分析学生的家庭、学习背景、特长等信息,为后期学校招生、学科建设、从业指导等方面提供参考。在教研方面,可以充分利用各类信息资源,给科研工作提供借鉴和对照,促进科研内容的深层次研究,以获得潜在的更大价值成果。
(四)加强全员信息意识的培养,强化考核、激励机制的正向引导。
一项产业的发展需要广泛的认同,大数据和信息化建设同样如此。为提高大数据应用的影响范围,切实提高其利用率,高校要进一步加强对广大教师员工、特别是管理人员相关知识的培训和数据意识的培养,逐步提高教师员工的大数据的接受度和需求的急迫性。同时,为保证学校信息管理,提高数据质量,高校应建立严格严禁的信息管理和应用的奖惩激励机制,从而促进信息质量提升,确保信息系统的科学性、严禁性、先进性和安全性。
总之,随着对大数据理念和实用价值的深入理解,以及其应用技术的逐步推广,大数据技术将为我国高等院校的现代化和信息化建设带来更多的价值和活力,真正让信息技术发挥出对高效教学管理和校园建设的辅助作用,为高效的日常教学和学生生活提供更实用和优质的信息服务,持续提升高校信息化管理水平,提高国际竞争力。
相关
浏览量:3
下载量:0
时间:
数据挖掘是近年来随着数据库技术和人工智能技术的发展而出现的一种全新的信息技术,它融合了数据库、人工智能以及统计学等多种学科的知识,试图从数据中提取出先前未知、有效和有用的知识。 随着Internet的迅速发展和普及,电子商务的发展越来越多地引起研究者们的关注,期望能够在这种新型的商务模式下,充分利用它的优点,获得更多的经济效益。Web已经成为企业开展电子商务的基础。以下是读文网小编为大家精心准备的:Web数据挖掘在移动电子商务领域的应用研究相关论文。内容仅供参考,欢迎阅读!
摘要: 随着移动通信技术的飞速发展,移动电子商务以其方便、快捷等优点获得了大量的网络用户。移动互联网端的用户行为分析已经成为迅速发展的知识领域。Web数据挖掘技术作为用户行为分析的基础在移动电子商务领域具有很高的实用价值。文章主要介绍了基于Web的数据挖掘定义及Web的数据特点,并对Web使用模式挖掘的过程和算法进行了重点分析,包括数据的预处理、模式发现和模式分析。
1.1 移动电子商务与数据挖掘的关系 目前,移动互联网技术和数据库技术飞速发展,移动电子商务正显示出越来越强大的生命力,它把电子交易从传统的PC端转移到了移动终端,使人们可以随时随地进行电子商务活动,这加速了社会经济的电子化进程,同时也使得数据爆炸的问题越来越严重。数据挖掘的兴起为电子商务提供了强大的数据支撑,利用数据挖掘技术可以有效的帮助企业分析网上获取的大量数据,发现隐藏在其背后的知识,为电子商务客户提供个性化服务,建设智能商务网站,指导企业的营销策略,由此使企业线上的业务得到进一步的发展。
移动电子商务便捷以及交互式的服务可以为数据挖掘提供海量的数据。因为客户对网站的每一次点击都会被网络服务器记录在日志中,由此产生了点击流数据。网站的服务器日志,后台数据库中客户相关的数据,以及大量交易记录等数据资源中都蕴含着海量有待充分挖掘的信息,海量数据是数据挖掘的一个必要条件,如果数据量少,则挖掘的信息是不够精准的。
移动电子商务网站可以为数据挖掘提供“干净的”数据。因为许多相关的信息是从网站上直接提取的,无需从历史系统中集成,避免了很多错误。通过良好的站点设计,不需要进行分析、计算和预处理等步骤,就可以直接得到与数据挖掘相关的数据。移动电子商务网站的数据,非常可靠,无需人工输入,从而避免了很多错误。此外,可以通过良好的站点设计来控制数据采样的颗粒度。
基于移动电子商务的数据挖掘能够使得挖掘的成果非常容易应用。很多其他的数据挖掘研究虽然有很多的知识发现,但是这些知识很多不能轻松的在商业领域中应用并产生效果。因为要应用这些知识可能意味着需要进行复杂的系统更改、流程更改、或改变人们日常的办事习惯,这在现实中是相对困难的。而在移动电子商务领域,很多知识发现都可以直接应用。如改变站点设计(改变布局,适当进行个性化设计),针对于特定目标或消费群进行的随时随地的网上促销,根据对广告效果的统计数据改变相应的广告策略,根据数据特点可以很容易地进行网上捆绑式销售等。
1.2 Web挖掘的定义 Web数据挖掘(Web Data Mining),是数据挖掘技术在Web环境下的应用,是从大量的Web文档集合和在站点内进行浏览的相关数据中发现潜在的、有用的模式或信息。它是一项综合技术,涉及到Internet技术、人工智能、信息学、统计学等多个领域。
面向电子商务的数据挖掘是Web挖掘的一个典型应用,Web上的日志文件,如客户的访问行为,访问频度,浏览内容及时间等,包括很多可挖掘内容,对这些内容进行提取、加工、分析,可以将客户的访问数据从潜在的、隐含的状态,变为企业分析市场、制定经营策略、管理客户关系的有力依据,从而实现Web上电子商务活动的本质,即获得商务的增值。 对应于不同的Web数据,Web挖掘也分成三类:Web内容挖掘(Web Content Mining)、Web结构挖掘(Web Structure Mining)和Web使用模式挖掘(Web Usage Mining)。(图1)
Web内容挖掘就是对网络页面的内容进行挖掘分析,包括对文本、图像、音频、视频、元组数据的挖掘,但目前多数是基于文本信息的挖掘,这又可以进一部分为网页内容挖掘和搜索结果挖掘,前者是传统的依据内容搜索网页,后者是在前者搜索结果的基础上进一步搜索网页。Web内容挖掘和通常的平面文本挖掘的功能和方法比较类似,但由于互联网上的数据基本上都是HTML格式的文件数据格式流,因此可以利用文档中的HTML标记来提高Web文本挖掘的性能。
Web结构挖掘是对网络页面之间的结构进行挖掘,从网页的实际组织结构中获取信息。整个Web空间中,页面内容和页面结构中都可能会存在有用的知识。Web结构挖掘主要就是针对页面的超链接结构进行分析,通过分析一个网页链接和被链接数量以及对象来建立Web自身的链接结构模式。这种模式可以用于网页归类,并且由此可以获得有关不同网页间相似度及关联度的信息。如果发现有较多的超链接都指向某一页面,那么该页面就是重要的。这种知识可以用来改进搜索路径。
Web使用模式挖掘是对用户和网络交互的过程中抽取出来的第二手数据进行挖掘,包括网络服务器访问记录、浏览器日志记录、注册信息等。最常用到的是网络服务器访问记录挖掘,它通过挖掘Web日志文件及客户交易数据来发现有意义的客户访问模式和相关的潜在客户群。其主要特点是对客户信息数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。这里需要特别指出的是,Web使用模式挖掘还可以进一部分为一般访问模式跟踪和定制使用跟踪,前者是一种查看网页访问历史记录的使用模式挖掘。这种挖掘可以是一般化的,也可以是针对特定的使用或使用者,这便是后者。
1.3 Web挖掘的数据源
很多数据都可以在Web上进行数据挖掘分析,并且这些数据存在很多类型,具体来说主要有以下几种类型的数据。
1.3.1 服务器数据 通常只要有客户访问站点就会在Web服务器上留下相应的痕迹,即日志数据,这些日志数据存储在服务器上的形式通常都是文本文件,比如cookie logs、error logs、sever logs等。
1.3.2 查询数据 它是电子商务站点在服务器上产生的一种典型数据。例如,对于在线客户也许会搜索一些产品或某些广告信息,这些查询信息就通过cookie或是登记信息连接到服务器的访问日志上。
1.3.3 在线市场数据 在线时长数据主要包括存储在传统关系数据库里的商品信息、客户购买信息和电子商务站点信息等。
1.3.4 Web页面 主要是指HTLM和XML页面的内容,包括本文、图片、语音、图像等。
1.3.5 Web页面超级链接关系 主要是指页面之间存在的超级链接关系,这也是一种重要的资源。
1.3.6 客户登记信息 客户登记信息是指客户通过Web页输入的、要提交给服务器的相关客户信息,这些信息通常是关于用户的人的特征。在Web的数据挖掘中,客户登记信息需要和访问日志集成,以提高数据挖掘的准确度,使之能更进一步地了解客户。
Web使用模式挖掘是Web数据挖掘中最重要的应用,其数据源通常是服务器的日志信息。Web服务器的日志记载了用户访问站点的信息,这些信息包括:访问者的IP地址、访问时间、访问方式(GET/POST)、访问的页面、协议、错误代码以及传输的字节数等信息。
每当网页被请求一次,Web日志就在日志数据库内追加相应的记录。站点的规模和复杂程度与日俱增,利用普通的概率方法来统计、分析和安排站点结构已经不能满足要求。只有通过数据挖掘技术处理服务器的日志文件,才能分析用户访问站点的规律,改进网站的组织结构及其性能,增加个性化服务,实现网站自适应,发现潜在的用户群体。
Web使用模式挖掘的过称具体包括数据的预处理过程、模式发现过程以及模式分析过程。
2.1 数据预处理过程
在数据预处理过程中,首先需要做一些数据清洗。其次由于日志文件中只记录了主机或代理服务器的地址,需要运用Cookie技术和一些启发规则来帮助识别用户,之后还要确认Web日志中是否有重要的访问页面被遗漏,如果有,需要进行相关的路径补充。最后要进行事务识别工作,即将用户的会话针对挖掘活动的特定需要进行定义、细分,使挖掘更加精确,得到想要的知识。
数据清洗:即把日志文件中一些与数据分析的无关项处理掉,例如剔除Web请求方法中不是“get”的记录。以及删除Web服务器日志中与挖掘算法无关的数据,一般来说只有服务器日志中的HTML与挖掘相关,Web日志文件的目的是获取用户的行为模式,通过检查URL的后缀,可以删除不相关的数据。例如:将日志文件中后缀名为JPG,GIF等图片文件删除,将后缀名为CGI的脚本文件删除。
用户识别:数据清洗之后,使用基于日志的方法同时辅助以一些启发式规则,可以识别出每个访问网站的用户,这个过程就叫做用户识别。在时间区间跨越较大的Web日志中,某一用户可能多次访问该站点,这时就要用到会话识别。其目的就是将用户的访问记录分为单个会话(Session)。那么如何来分呢?可以做如下设定:用二元组S表示一个用户会话
S=,
其中userid是用户标识,RS是用户在一段时间内请求访问Web页面的集合,RS内包含用户请求页面的标识符Pid及请求时间time,那么这段时间的访问集合RS即可划分为:
RS={,…}, 于是,用户会话可表示为:
S=,…}>,
由此可以看出分成的每一个单独的会话。
路径补充:由于代理服务器本地缓存和代理服务器缓存的存在,使得服务器的日志会遗漏一些重要的页面请求,路径补充就是利用引用日志和站点的的拓扑结构将这些遗漏的请求补充到用户会话中,设遗漏的请求为,其中请求时间timek为设备前后两次请求的平均值,那么,用户会话即可表示为:
S=,……}>(k
事务识别:上面讲到的用户会话是Web日志挖掘中唯一具备的自然事物元素,但对于某些挖掘算法来说可能它的颗粒太粗,区分度较低,为此需要利用分割算法将其转换为更小的事物,即进行事务识别。
HTML通过“Frame”标记支持多窗口页面,每个窗口里装载的页面都对应一个URL,Frame页面用来定义页面的大小、位置、及内容,“Subframe”用来定义被Frame包含的子窗口页面,当用户访问URL对应的是一个Frame页面时,浏览器通过解释执行页面源程序,会自动向Web服务器请求该Frame页面包含的所有Subframe页面,这一过程可以重复进行,直到所有Subframe页面都被请求。如果在这样的用户会话文件上进行挖掘,Frame页面和Subframe页面作为频繁遍历路径出现的概率很高,这自然就降低的挖掘的结果价值。为此应当消除Frame页面对挖掘的影响,得到用户真正感兴趣的挖掘结果。
2.2 模式发现过程
数据预处理之后,可以对“干净整齐”的数据进行挖掘,即找出有用的模式和规则的过程。下面主要分析三种常用的Web使用模式挖掘方法:关联分析、分类与预测、聚类分析、时间序列分析。
关联分析:即通过分析用户访问网页间的潜在联系而归纳出的一种规则,如80%的用户访问页面company/product1时,也访问了页面company/product2,这说明了两个页面的相关性。那么可以进行一个页面的预取,来减少等待时间。用{A,B}来表示两个页面,那么在用户访问A时,可以把页面B提前调入缓存中,从了改善Web缓存,改善网络交通,提高性能。若A和B表示两个产品页面,则两种产品对客户来说有很大的相关性。利用这一点可以做出很有效的促销和广告策略。
关联规则的算法思想是Apriori算法或其变形,由此可以挖掘出访问页面中频繁在一起被访问的页面集,这种频繁在一起被访问的页面就成为关联页面,可用A=>B表示。那么,若有:
A=>B=>C,A=>B=>D,A=>B=>E,A=>B=>F=>G,…,
则说明A=>B。
分类和预测:可以用分类来提取出用来描述重要数据类的模型,并可以用分类模型来划分未知数据的类,从而预测未知数据的趋势。常用的算法思想为决策树,神经网络、贝叶斯分类等。例如可以根据用户的资料数据(包括用户一些属性)或其特定的访问模式将其归入某一特定的类。
可以根据客户对某一类产品的访问情况,或如其抛弃购物车的情况,来对客户分类(即对哪一类产品感兴趣)。更深入一点,可以为客户添加一些属性,如性别,年龄,爱好等(可在网站注册信息中获得),并将对哪一类产品感兴趣定义为目标属性,那么基于这些属性可以用决策树算法来进行分类,可以得出符合目标属性的人的特点,如40岁以上的男性更容易网购皮鞋等,这样可以更精准的捕捉客户并制定营销策略。
聚类分析:聚类即将对象的集合分成由类似的对象组成的多个类的过程。常用的算法思想有划分方法、层次方法、基于密度的方法等。如可以用K-mean的划分方法做到类之间差异化最大,而类内相似性最大。
在使用模式挖掘中主要有两种聚类。一种是页聚类,即将内容相关的页面归到一个网页组,这对网上搜索引擎对网页的搜索有很大帮助。另一种是客户聚类,即将具有相似访问特性的客户归为一组,那么可以分析出喜好类似的客户群,从而可以动态的为客户群制定网页内容或提供浏览意见,如通过对众多的浏览“sports”网页的客户分析,发现经常在该网页上花上一段时间去浏览的客户,再通过对这部分客户的登记资料分析,知道这些客户是潜在要买运动产品的客户群体。就可以调整“sports”网页的内容和风格,以适应客户的需要。这在电子商务市场的分割和为客户提供个性化服务中起到了很大的作用。
2.3 模式分析过程
在挖掘出一系列客户访问模式和规则后,还需要进一步观察发现的规则、模式和统计值,之后确定下步怎么办,是发布模式还是对数据挖掘过程进行进一步调整。
如果存在冗余或无关的知识,需要将其剔除。如果经过模式分析发现该模式不是想要的有价值的模式,则需要对挖掘过程进行调整,再转入第二步重新开始。反之,即发现感兴趣的规则模式,则可采用可视化技术以图形界面的方式提供给使用者。
许多传统制造业或零售业的业务正在进行着电子化的转型,电子商务、移动客户端、线上大平台的思路不断发展。那么,如何建设一个企业的电子化平台,如何有效收集平台产生的海量数据,数据挖掘技术如何应用于海量数据,这些都是值得深入研究的问题。
3.1 建设企业线上大平台
目前许多企业都面临着客户资源管理分散,客户数据的物理化、静态化、分散化,以及缺乏对客户的深层分析和需求挖掘等问题。按照传统企业想要占有电子商务市场或移动客户端市场的需求,为了更好地以大数据集中为基础,推进客户营销服务个性化,企业可建设以会员管理为核心的大客户管理系统,把原有的各类信息系统、业务网站、电子商务网站等融汇在一个大平台下,并分阶段实施数据大集中,实现“海量客户资源共享,一个客户、多个产品、多频次使用”的一站式营销服务。通过数据的整合管理,分析客户特点,实现客户在企业内各板块的迁移和共享。 会员管理的实质是为用户提供连续的、长期的产品和服务。实现了为用户提供持续的、长期的产品和服务就需要将短期的用户发展为长期型和稳定型用户,而会员制正式实现这种转变的最合适的方法,这就需要建立起强大的会员平台,从而掌握会员的消费数据,实现会员制的管理。
许多企业拥有的业务众多,这就造成了各业务拥有自己众多的忠实用户,但目前各个业务的用户没有达到行业内的共享。会员管理平台为这些分散在行业内的用户提供统一的平台达到行业内的统一,在会员管理的平台上不同业务的用户可以实现统一登录、统一管理、统一办理业务来达到账号统一、业务统一、积分统一、信用统一,从而使企业多元化的各项业务达到资源和信息的行业内统一。
3.2 基于线上平台的数据采集平台
建设会员管理平台的根本目的是进行数据挖掘,以庞大的会员信息来进行市场洞察和市场预测。因此建设数据收集系统并与会员管理平台对接,可以有效收集到客户数据并进行挖掘工作。
在数据的收集方面,目前许多企业数据信息的作用主要是统计收入和业务量、清分核算以及考核,而大数据这一数据价值最为关键的特性却没有被很好利用。
企业现有的平台有时并不能很好地完成有效数据的收集,许多数据多为财务列收数据或业务完成情况数据。该类数据的属性并无太多挖掘价值,无法进行有效的数据分析。数据挖掘需涉及到分类、聚类、关联分析等算法的应用,以此来定位目标客户,这对数据的属性要求是比较高的。企业要充分挖掘和分析各类数据,开展信息应用,进行业务创新和运作流程的优化,提升经营管理能力和客户服务水平。
数据收集平台系统正是基于此目的进行开发,需达到真实有效的客户信息数据、业务数据、Web服务器日志数据的全面收集,功能包括:
①与电子化平台对接,可以收集到平台的会员及非会员的客户信息数据。在系统中可设客户的年龄、职业、爱好、收入等客户相关属性项,从而把会员俱乐部中的有效客户信息数据归类收集,为分析不同类型客户做准备。
②有效收集到客户交易数据以及相关业务数据,系统中设定各类客户指标(收入贡献、交易额、价值度等),为分析不同类型业务做准备。
③能够进行WEB服务器日志数据的收集。对于企业业务网站及企业电子商务平台,系统可抽取和收集网站的WEB服务器日志数据,从而为进行相关的页面访问频度、浏览时间、页面指向等客户行为模式分析做准备。
3.3 Web挖掘在企业的应用
目前Web数据挖掘技术已经在企业得到了广泛应用,分析其原因是该技术能够挖掘出活动过程中的各类潜在信息,进而帮助企业得到更高的发展,其优势具体如下:
3.3.1 发现潜在客户 由于Web数据挖掘技术可以把客户在电子化平台上的浏览行为存储下来,通过查看这些客户的浏览行为就可以了解到客户的兴趣和购买意向,由此就可以发现潜在客户,进而有针对性地对这些潜在客户采取某种谋略,使其尽快的成为在册客户群体,如此一来,电子商务网站的经济效益将会越来越好。
3.3.2 提供优质个性化服务,提高客户忠诚度 在电子商务中,虽然客户和销售商之间的空间距离消失了,但客户的选择面更广了,客户只需轻点几下鼠标就可以从这家电子商务网站转换到另一家电子商务网站。在这种情况下,各家电子商务网站必须各出奇招,努力使自家网站的内容和层次、用词、标题和奖励方案等比其它网站更具优势、更吸引人,通过提供优质个性化的服务,不断提高客户的忠诚度。
3.3.3 改进系统性能,增强安全性 对于电子化平台的各种数据统计分析,有助于改进系统性能,增强系统安全性,并提供相关决策支持。客户衡量网站满意度的一个关键指标就是Web服务器的性能,通过应用Web数据挖掘技术可以清楚了解到哪个站点的客户是最多的,最容易造成拥塞记录的,然后有针对性的采取有效的Web缓存策略,减少网站的传输压力,同时运用Web数据挖掘技术还可以将非法进入电子商务网站的人员挖掘并清除出去,因此可以说Web挖掘在企业的应用改进了系统性能,增强了安全性,保证了业务的正常展开。
3.3.4 改进网站设计,增强客户体验 Web挖掘在企业的应用还能够有效的改进网站设计,增强客户体验,具体表现在以下三个方面:
①通过对Web日志的挖掘,发现客户访问页面的相关性,从而对密切联系的网页之间增加链接,方便客户使用。②利用路径分析技术判定在一个Web站点中最频繁的访问路径,可以考虑把重要的商品信息放在这些页面中,改进页面和网站结构的设计,增强对客户的吸引力,提高销售量。③通过对Web日志的挖掘,发现客户的期望位置。如果在期望位置的访问频率高于对实际位置的访问频率,可考虑在期望位置和实际位置之间建立导航链接,从而实现对Web站点结构的优化。
3.3.5 应用于收索引擎 通过对Web网页内容的挖掘,可以实现对网页的聚类和分类,实现网络信息的分类浏览与检索;通过客户使用的历史记录分析,可以有效地进行扩展,提高客户的检索效果;通过运用Web挖掘技术改进关键词加权法,可以提高网络信息的准确度,改善检索效果。通过挖掘客户的行为记录和反馈情况可以为站点设计提供改进的依据,从而进一步优化网站组织结构和服务方式来提高网站效率。
站点的结构和内容是吸引客户的关键,站点上页面内容的安排和连接如同超市中物品在货架上的摆设一样,把具有一定支持度和信任度的相关联物品摆放在一起有助于销售。比如利用关联规则,可以针对不同客户动态调整站点结构,使客户访问的有关联的页面之间的链接更直接,让客户很容易访问到想要访问的页面。这样的网站往往能给客户留下好印象,提高客户忠诚度,吸引客户不断访问。
3.3.6 聚类客户 许多企业都对企业的客户、市场、销售、服务与支持信息进行深层次发掘和分析,对客户价值进行分类,发现新的市场机会,增加收入和利润。所以聚类电子化平台客户是一个重要的方面。通过分组具有相似浏览行为的客户并分析组中客户的共同特征,可以帮助企业更好地了解自己的客户,及时调整页面及页面内容使商务活动能够在一定程度上满足客户的要求,向客户提供更适合、更面向客户的服务,使商务活动对客户和销售商来说更具意义。 4 小结
数据挖掘技术正以前所未有的速度发展,并且扩大着用户群体,在未来越来越激烈的市场竞争中,拥有数据挖掘技术必将比别人获得更快速的反应,赢得更多的商业机会。
基于Web的数据挖掘在移动电子商务中的应用将是一个非常有前景的领域,有很多优势,经过近几年的发展已逐渐成为数据挖掘与知识发现领域的一个重要分支。其针对移动电子商务网站用户的行为模式进行挖掘,可以找到用户的潜在兴趣与偏好,指导网站建设,支持企业营销决策。
企业在运营电子商务网站时,尤其是移动电子商务,会产生海量的业务数据,所以需要建设一个线上的电子化大平台来汇集业务,同时在这个大平台基础之上高效地收集业务数据,针对Web数据,使用Web挖掘技术预测客户的消费趋势、市场走向,维系客户关系、指导企业建设个性化智能网站,带来巨大商业利润。这可以为企业创造新的商业增长点,使其在激烈的市场竞争中处于有利位置,抢占先机。
相关
浏览量:3
下载量:0
时间:
规范的英语学术摘要写作是论文进入著名国际检索系统的关键,,然而在国际学术领域,中国学者尤其是非英语专业硕士研究生英语学术写作能力却很薄弱,无法将其科研成果展现在国际舞台上进行有效的学术交流。以下是读文网小编为大家精心准备的:中医药研究生学术论文英语摘要语类研究相关论文。内容仅供参考,欢迎阅读!
摘 要: 语类分析是篇章语言学重要的研究内容,而迄今为止对中医药学术论文摘要语类的研究较少。作者通过对六十篇中医药学术论文摘要语类进行分类和语步分析,发现中医药学术论文摘要并不完全遵循Swales(1990)的CARS论文英语摘要写作模式;中医药硕士学位论文英语摘要、中医药博士论文英语摘要、中医药期刊论文英语摘要在语篇模式上存在差异。该研究对中医药研究生英语学术论文写作教学和研究具有借鉴意义。
关键词:中医药研究生学术论文 英语摘要 语类分析
(一)语类分析
语类分析是篇章语言学重要的研究内容之一(Thompson,1999;Hyland,1999,2004a,2005a,2005b;Paltridge,Starfield,2007)。语类是为实现某一交际目标,得到特定交际社团公认的语言交际类型(葛冬梅、杨瑞英,2005;庞继贤、叶宁,2009)。语类分析主要在语篇层面结合功能进行,目的是阐释学术文体的语篇推进结构和语言特征,体现了学术文体写作的规范要求。
语类分析学说认为,每个学科的语类都有自己的特点,都遵循该学科的写作要求,都采用相似的范式和步骤安排结构和语言形式,学术论文作者通过适当的语步构建学术空间,发出自己的声音,并得到所在交际社团的承认(Swales,1990)。当前有许多论文对期刊论文摘要的语类分析(如刘胜莲、魏万德,2009;余莉、梁永刚,2006等),但学位论文摘要和期刊论文摘要在语篇结构和语言特征上不尽相同(Hyland,2005b),需要认真研究。
(二)摘要研究述评
学位论文摘要是位于学位论文正文之前对论文整体内容进行概述的独立学术语类。《MLA格式指南与学术出版准则》(1998)对论文摘要的要求是长度不超过350字,内容包括该论文的研究背景、研究问题、研究方法和结论。英语摘要,在中医药研究生学位论文中,除标题外,是唯一用英语写作的部分,其质量直接影响着论文的整体质量,是评判研究生论文质量的重要指标。
目前对学术论文体裁的研究主要集中在对论文引言的研究。普遍认为引言的组织结构与整个论文的结构基本一致,即Swales的CARS语篇模式(Create a Research Space),包括导言(introduction)―方法(method)―结果(result)―讨论(discussion)四个语步,即I-M-R-D模式(Swales,1990)。在导言部分,Swales(1990)有详尽的语步分析,如下表1(改动自黄婷婷、许明武,2003)。目前对于方法(method)、结果(result)、讨论(discussion)三个语步的语步分析较少。
Swales的CARS语篇模式已经成为学术论文体裁研究的通用分析模式,为学术界所公认。而国内大多数对学术论文体裁的研究,也沿袭Swales的CARS语篇模式,对论文的引言部分进行体裁分析,而鲜有用此模式对学术论文的英文摘要进行分析。实际上,摘要和引言属于不同的体裁,Graetz(1985)认为论文摘要由四语步构成,即问题的提出(problem)―方法(method)―结果(result)―结论(conclusion)。Bhatia(1993)认为,摘要由以下语步构成:(1)介绍研究目的;(2)描述研究方法;(3)总结研究结果;(4)讨论研究结论。因此,学术论文英语摘要区别于引言,一则在于摘要由于字数限制,较少涉及研究领域的前期研究成果,侧重点在于提出问题和介绍研究目的;而引言部分必须从文献综述入手,否则很难建立自己的研究领域,无法开展下一步的讨论(徐有志等,2007)。二则摘要语篇较之于引言语篇,更需要有效提供研究结论,而不宜占用过多篇幅展开讨论。因此,一方面,鉴于国内对于学术论文摘要部分研究较少,而另一方面,学术论文摘要区别于引言,在第一语步和第四语步有其独特特点,所以,有必要借鉴Swales(1990),Graetz(1985),Bhatia(1993)等前人研究进行深入的探讨和研究。
国际上对学位论文摘要的研究,包括对机械工程、西医外科学、应用语言学文、社会学的研究,当前对中医药英语摘要的研究,关注的焦点是偏误分析(如段平、顾维萍,2002;戈玲玲,2002;王高生,2005),没有对硕博士学位论文摘要的研究,也没有在更高层次上对中医药期刊论文摘要的语类特点进行考察。
本项研究的语料是中医药硕士学位论文英语摘要(500字左右)、中医药博士论文英语摘要(500―1000字)、中医药期刊论文英语摘要(50―100字)各20篇。以上论文从中国知网期刊论文库和硕博士论文库中随机抽样。论文上传的时间在2009年、2010年及2011年。为了保证本项研究的信度和效度,结合中医药类学术论文实际,在对论文进行编号后我对语料进行预分类,分类标准如下。
(一)理论研究类
就某一时间内,作者针对中医药类某一专题,对中医理论进行分析梳理,或者对大量前人经验、数据、资料和主要观点进行归纳整理、分析提炼而写成的论文,如文献综述、医案研究、名家经验总结。
(二)实验研究类
在实验室中,以中医药理论为指导,进行较为严格的变量控制,观察假设中各变量之间是否存在相关关系或因果关系,从中探索中医药作用规律的一种研究方法,受试往往为实验动物。如观察某经典方对受试的治疗效果。
(三)临床研究类
在临床研究中,或在临床实际运用中,以中医药理论为指导,进行较为严格的变量控制,观察假设中各变量之间是否存在相关关系或因果关系,从中探索中医药作用规律的一种研究方法,受试往往为患者。如观察某经典方对受试的治疗效果。
同时,根据Swales的CARS模式,并借鉴黄婷婷、许明武(2003)的研究方法。我对论文摘要进行四大语步的分类:导言(introduction)―方法(method)―结果(result)―讨论(discussion)。判断摘要的文字的语步范围,来自于该文字使用的关键词和关键句型。
(一)语步及体裁分类
通过对语料进行初步分类。分类结果如下:
如表2所示,中医药学术论文摘要并不完全遵循传统的论文英语摘要写作模式。首先,理论研究类是区别于其他学科领域论文的特有类型。由于中医药研究重视对传统医学知识的集成和积累,因此文献综述、医案研究、名家经验总结是不可或缺的论文体裁,而其他学科领域中,尤其在理工科和西医学术论文中,除期刊论文可以有文献综述的体裁,一般不允许硕士学位论文和博士论文以纯理论研究的形式出现,因而在摘要中也不会出现理论研究的类型。
其次,通过实际分类发现,在中医药学术论文摘要中普遍存在混合研究的情况,即介绍和讨论理论背景后,通过实验室或者临床应用证明理论指导下对受试进行实验,或者对患者进行施治的情况。而期刊论文摘要由于篇幅所限,往往选择省略对理论背景的讨论,使用直接描述实验或者临床应用的写作策略。同时,在硕博士学位论文中,也存在省略背景讨论的情况,只对实验过程或者临床作用进行讨论。
最后,可以发现,在类型分布上,硕士学位论文学位摘要的种类数量比较平均,以理论研究稍多;而博士学位论文明显以理论研究加实验室研究的混合研究类较多,可以推断,博士论文在理论深度上要求更高,博士生也更多参与实验室研究工作,故而此类较多。同样,因为大多数博士论文的摘要中会包含理论背景,临床研究类的论文数量较少。期刊论文除不存在混合研究外,在其他三种类型中分布平均。这可能和期刊论文的篇幅有限有关,侧重点往往只在一方面。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
(二)语步分析
1.理论研究语步分析。
通过对理论研究的基本语步进行分析,如表2所示,可以看出理论研究类并不遵循Swales的CARS模型,往往只有导言部分(introduction)。另外,学位论文和期刊论文虽然长度不同,均涵盖导言部分的三大语步,即M1:建立研究领域(Establishing a territory);M2:建立研究地位(Establishing a niche);M3:占据研究地位(Occupying the niche)。以硕士学位论文A7每段开头为例:
The virus pneumonia is a commonly significant disease in clinic (M1 S1) .
That the Chinese medicine treats virus pneumonia has the unique superiority and has accumulated rich experience (M2 S4).
This paper aims to study the effects of Xuanchangfeiqi Tang on virus pneumonia and its clinical utilization rule of ventilating lung (M3 S1).
在期刊论文全文中有相似语步,以C2为例:
Di dang Decoction, a classic prescription of promoting blood circulation to remove blood stasis,was used to treat stagnated blood syndrome in ancient times (M1 S1).
Recently,physicians have found that interior stagnant-heat syndrome is manifested in many kinds of internal damage and miscellaneous diseases,so the prescription can treat diseases of different systems (M2 S4).
This paper aims to review the recent clinical reports of Didang Decoction (M3 S1).
2.实验研究、临床研究语步分析。
在具体语步分析中,我们发现实验研究、临床研究语步极为相似。硕博士学位论文均采用IMRC的结构,即introduction(objective)―method―results―conclusion的结构。有两点值得注意:(1)与表1进行对照,论文作者在摘要的导言(introduction)部分只阐明研究目的(Outlining purposes),达到占据研究地位的效果(Occupying the niche)。但很少有作者提及Swales的导言部分的其他语步。(2)IMRC结构与Swales(1990)的IMRD结构略有不同,讨论部分(discussion)为结论部分(conclusion)所替代,实际上印证了Graetz(1985),Bhatia(1993)的观点,可见摘要语篇篇幅所限,作者往往选择突出研究方法、步骤和结果的策略,而省略导言语步和讨论语步。
3.混合研究语步分析。
首先,在三种英语论文摘要中,在期刊论文摘要中混合研究数量为零。我认为,并非期刊论文的实验过程和临床应用没有结合理论,而是在语步中理论并没有体现。
同时,博士学位论文英语摘要的语步特点最完整,使用IMRD或IMRC的语步推进模式,对理论研究部分的描述最全面。以博士论文B9为例,有清晰的元语篇标记(meta-discourse)完成语步转换:
In theoretical research, the article holds that ...(第二段第一句)
In experimental research,we reproduce the mouse model of ...(第三段第一句)
然而,并非所有的元语篇标记在硕博士学位论文中都十分明显。在博士论文B19中文摘要中,然而,并非所有的元语篇标记在硕博士学位论文中都十分明显。在博士论文B19中文摘要中,原作者在首段介绍感染性肺炎的定义和分类,提到此病“一般属于中医风温、咳嗽等范畴”。第二段的元语篇结构为:
“本文分为理论研究和临床研究两个部分。理论研究方面,运用温病学理论、认识感染性肺炎的病因病机及辨证论治,重点探讨中医与现代现代医学之感染性肺炎在病因、病理认识上的契合点。”
第四段出现对应的元语篇结构:
“临床研究方面,根据症状表现,对南京中医药大学附属医院,江苏省中医院收治的105例感染性肺炎住院患者进行辨证分型,总结临床用药,结果显示,感染性肺炎临床常见证型为痰热壅肺与风热犯肺型;最常用具有宣降肺气以透邪的中药属解表、清热、怯湿、止咳、化痰等类。”
在英文摘要中,相对应的原作者的表述为:
Pneumonia is classified under Feng-wen,or Ke-sou (cough) category in traditional Chinese Medicine (TCM).Literature study showed that both conventional and TCM shared similar views on causes and pathology of pneumonia.However,in terms of treatment,TCM has its rules and characteristics,which is currently still being recognized as clinically effective.
对比后可发现,原作者的中文摘要中用第一段中对感染性肺炎的分类代替了对本文结构的阐述。而临床研究部分合并缩短至理论研究之后。我检查全文,此后的段落中,只有对研究意义的阐述,而没有对临床研究中更详细的阐述,如中文摘要中涉及的患者人数、所在医院情况,都没有再提及。由此可以判定,原作者虽然对中文摘要的语步和元语篇功能具有有效应用,然而该意识没有顺利转移到英文摘要中,导致英文摘要内容空泛,语步不清晰。
最后,我们发现,和实验研究、临床研类的语步不同的是,硕博士学位论文摘要中混合研究的语步更多出现讨论部分,或者讨论和结论并存,更符合Swales(1990)的IMRD的语步推进模式。主要原因是篇幅容量足够进行讨论,以及论文评审的要求。
四、结论与意义
通过以上分析,我们发现中医药学术论文英语摘要的语类分析从两个方面体现复杂性。首先,在前人研究中(Swales,1990;黄婷婷、许明武,2003),也发现类似的语步分析。但前人研究并没有对论文进行分类,中医药论文类型复杂,除学位论文和期刊论文长度不同造成内容取舍外,中医药论文本身也有理论研究、实验研究、临床研究和混合研究分类,刘胜莲、魏万德(2010)指出,国外论文摘要的IMRD语步出现频率很高,而国内论文作者常省略方法语步,或者将方法语步和引言或结果语步并合,而我们发现,在中医药论文摘要中,理论研究甚至会省略方法、结果、讨论等多语步,实验研究部分有独立式的结论语步。此外,在论文抽样中没有出现混合研究的期刊论文摘要,原因可能是篇幅所限无法展开导言(introduction)部分,只能完成实验研究和临床研究的语步推进。因此,中医药学术论文英语摘要除IMRD语步推进模式,还有I及IMRC语步推进模式。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
本文对中医药学术论文摘要的语类进行了探索性的分析和归类,对中医药研究生英语学术论文写作教学和研究具有借鉴意义,在教学中应当注意规范学生对论文写作语篇规范和论文分类的意识。同时,由于选取的语料数量有限,抽样样本较小,而不能和摘要作者进行交流,不能了解论文摘要建构过程。最后,论文作者可能的中医药文化背景和教育经历可能对语篇建构产生的影响。这些都是值得进一步深入探讨的研究思路。
[1]Bhatia,V.K.Analyzing Genre:Language Use in Professional Settings [M].London: Longman,1993.
[2]Graetz,N.Teaching EFL Students to Extract Structural Information from Abstracts[M].In J. M. Ulijn and A. K. Pugh. Reading for Professional Purposes. Leuven: ACCO.1985:123-135.
[3]Paltridge,B.& Starfield,S.Thesis and Dissertation Writing in a Second Language:A Handbook for Supervisors[M].London: Routledge,2007.
[4]Swales,J.M.Genre Analysis:English in Academic and Research Settings[M].Cambridge: CUP. 1990.
[5]Thompson,P.Exploring the Contexts for Writing:Interviews within PhD supervisors[M].1999. in P. Thompson (ed.) Issues in EAP Writing Research and Instruction. Reading:Centre for Applied Language Studies.
[6]Hyland,K.Talking to students: Metadisourse in introductory coursebooks [J].English for Specific Purposes, 1999,18:3-26.
[7]Hyland,K.Disciplinary interactions: Metadiscourse in L2 postgraduate writing [J].Journal of Second Language Writing, 2004a, 13:133-151.
[8]Hyland,K.Metadisourse:Exploring Interactions in Writing[M].London: Continuum.2005a.
[9]Hyland,K.Stance and engagement: A model of interaction in academic discourse [J].Discourse Studies, 2005b, 7:173-192.
[10]刘胜莲,魏万德.英文摘要方法语步中体裁结构及语言特点分析[J].武汉理工大学学报,2010,32,(14):197-200.
[11]段平,顾维萍.医学论文标题与摘要汉译英常见错误分析[J].中国翻译,2002,23,(4):47-55.
[12]葛冬梅,杨瑞英.学术论文摘要的体裁分析[J].现代外语,2005,28,(2):138-146.
[13]戈玲玲.科技论文摘要英译的语用失误――对非英语专业本科生的一项调查[J].中国科翻译,2002,15,(2):44-46.
[14]黄婷婷,许明武.中外经济类期刊英文摘要语步结构分析[J].外语教育,2003:34-38.
[15]庞继贤,叶宁.语类意识与英语研究论文写作.外语与外语教学,2009,(3):34-36.
[16]王高生.论文摘要的撰写及英译[J].中国科技翻译,2005,18,(2):9-12.
[17]徐有志,郭丽辉,徐涛.学术论文体裁教学不可或缺――英语专业硕士学位论文引言写作情况调查[J].中国外语,2007,4,(4):47-51.
[18]余莉,梁永刚.英语科技论文摘要的写作范式研究[J].外语教学,2006,27,(1):34-37.
中医药研究生学术论文英语摘要语类研究相关
浏览量:2
下载量:0
时间:
世纪之交的二十年,是管理会计理论进步、方法创新、影响力与日俱增的二十年,管理会计理论研究呈现日益繁荣的局面。管理会计研究内容发生了哪些变化?目前的研究热点是什么?这些研究内容是否与实务关注的焦点相一致?基于此,下是读文网小编为大家精心准备的:会计理论和会计实务的实用性对比研究相关论文。内容仅供参考,欢迎阅读!
摘要:高职会计专业的学习主要分为两个方向,其中一个是会计理论方面知识的学习,另一个是在会计实务方面学习,二者相互契合,其中会计实务方面,包括会计工作、审计工作、财务管理,税务等工作内容,在从事这方面工作的时候要求从业人员对于会计理论十分的熟悉,本文对高职会计专业的会计教育形式进行了探讨,从会计理论以及会计实务角度出发,加快会计人才的教学及人才的培养。
关键词:会计理论;会计实务;实用性对比;人才培养
会计作为一门有效的管理工具,在现代社会的运行管理中发挥着十分重要的作用,尤其是在满足公司的资本要求的方面,会计的工作以及学习主要包含了两个方面,其中一个是会计实务,另一个就是会计理论。
其中会计理论是由各类的理论要素相互联系、相互制约而形成的学科体系,在知识体系内形成一套有机运行的整体,会计理论是人们在长期的实践和研究的过程中对客观会计规律的认知,当前的会计理论中包含了会计环境、会计目标、公认会计原则、会计假设、会计准则、职业道德、经济业务、账项调整、资产、负债、收入以及成本等等,会计基础理论是以经济学基本原理为依据,阐述会计理论领域内会计运行的基本理论。
会计基础理论的作用是:首先,会计理论可以指导会计规范的制定以及形成,协调各个具体的会计规范之间的关系,其次,在会计行业内灵活的引导会计人员应用会计规范,高效率的开展会计实务,最后,会计理论能够加深对会计实务的理解,有效的督促会计理论的进一步研究。
而会计实务指的是会计应用理论,将会计基础理论当做进行会计业务的基础,将会计理论基础当做会计实践中的具体运用理论,其中包含的业务有会计核算程序、会计核算、会计管理以及会计方法等等,会计实务在进行的时候具有非常鲜明的特殊性的特点,在可变性以及时间性方面都能够处处的体现具体的规律,其中会计基础理论在会计实务的实施进行中具有非常巨大的作用,包括了归纳、预测以及指导的作用,帮助会计实务有效的传递信息和总结经验,还可以有效的解释和评价会计实务实施进行的效果,最终可以发挥出预见以及实践的功能。
当下,将会计系统分成两类,一类是会计理论界,主要代表有高校、财政研究机构等。另一类是会计实务界,主要代表有企业(公司)、会计师事务所等。 两个类型在社会运转的过程中常常会出现交叉。例如:在理论研究机构内研究人员根据具体业务制定相应的会计准则、法规和制度,在这一过程中需要对实际的会计业务进行全面的了解,特别是在出现新业务时,但在这一过程中没有实际的账务处理操作;而在企业内的会计人员必须在熟悉基本会计原理的基础上进行会计业务的处理,这一过程中并不需要掌握深刻的理论。
在高职院校的培养过程中,促使会计专业的学生在掌握高深理论的同时强化学生会计实务的处理能力,致力于培养在会计理论以及会计实务两个领域内的优秀的“跨界”人才,使得当下的会计教育更加的完善,会计人才更加的符合社会需求。
会计理论和实务的传承肯定靠教育,目前我国会计教育有职高、中职、高职、本科、研究生(硕士、博士)多种学历层次;另外还有社会培训,包括实账培训、会计各类证书培训;此外还有新准则培训、新制度培训、后续教育等,由此可以看出会计教育形式呈现多元化,但是在学生就业单位调查中发现:职高、中职、高职就业的绝对主体是在各类实体企业(含金融)、公司(含商贸、投资),但不一定都是具体的会计工作;本科就业的主体还是企业、公司;研究生的就业呈现多元化,一是研究生是本科生就业的延后,眼光、择业面发生变化,其次女性居多,去学校任教居多;再次是研究机构和金融企业居多,总体看会计专业毕业生不一定完全从事会计及相关工作,一些投资公司、金融企业、办公室文员占相当比例。 而社会培训、新准则培训、后续教育依然是在在职会计人员为主体的培训。
在各类型的会计人才培养的过程中,笔者认为高职院校的会计专业更加能够满足社会的需求,主要原因如下:
首先,高职生在接受的教育程度方面比本科生甚至是研究生较差,但是在从事会计工作之后,能够在会计实务的操作中表现优秀,甚至是具有良好的操作能力,只是在会计理论的掌握方面缺乏一定的实力。但是本科生以及研究生在从事会计工作的时候无处应用自己所学的高深的会计理论,使得这些人才认为自己的工作屈才,相比之下,高职毕业的会计人才能够踏实的从事会计基础工作,在工作的过程中夯实会计理论;
其次,会计工作实践性强,理论和实务结合紧密,基础工作强调的是动手能力,不需要太多的高深理论知识,即使是大企业的高级职位,也要结合本企业的实际现状偏重实际应用,本科的理论水平基本足够,研究生的理论学习有点“资源浪费”,即所谓高不成低不就;而在高职院校内学习到的会计理论以及掌握的熟练的会计实务的操作能力已经能够满足企业对于会计职务的需求。
最后,从开设课程与实际工作的实用性角度出发,高职课程兼顾了理论和实际的结合。有针对性的培养企业和公司需求的会计人才,与本科生和研究生的教育重点不同,前者更加的重视实践以及工作能力,后者更注重理论的深化以及创新。
根据以上分析,高职院校的会计专业的学生在接受会计专业教育的时候有如下几个优势:首先,高职院校的学生在学校内接受训练的时候能够在之后的工作中熟练的应用,满足会计工作对于实际操作要求高的需求,在高职院校接受会计专业教育的时候,高职院校的学生可以掌握有实际利用价值的会计基础理论,不需要过于高深的会计理论,只要切合会计专业的理论需求即可。其次,高职院校的会计专业的学生能够在动手能力、理论水平、学历水平以及满足会计专业期望值的时候都有非常高的水平,高职院校的学生在进入到企业工作的时候对于岗位的忠诚度也比较高,获得企业的赞同度较高。最后,在高职院校的培养过程中,会计高职教育的教学从“基础理论+实践(动手能力)”两个角度落实,在这一过程中,教师应当强调学生的实际操作能力,着重解决高职院校学生的动手能力的问题,即工学结合的实训方法、模式研究,同时还要注意在高职会计人才培养的过程中探究出针对高职学生实际情况的、有效的教学方法。
随着经济社会的不断发展,会计的规则、制度有所变化,会计在不断发展完善中,准则、制度、法规的变化有时候可能频繁和剧烈,但基础理论知识作为其中的规律性的东西变化很少,前沿理论推陈出新需要时间的沉淀。但是企业内的会计岗位对于人才的需求依旧是将会计实务的处理能力放在首位,这就需要会计专业的学生在高职院校内学习的时候掌握最先进的会计理论以及会计实务的处理方法,在会计岗位工作的时候紧密的结合理论知识以及会计实务的操作,强化会计实务的处理能力,使得在学校内学习到的会计理论能够在实操的时候广泛的应用,提高高职院校学生的会计实务处理能力,理论的学习是为了更好地利用,实务操作就是把理论与实践相结合。 再高深强大的理论也只有在实际工作中才能体现其作用,会计实务操作才是会计具体工作的重点内容。 只有加强实务处理能力,才能使理论知识得到有效的利用。
[1]葛家澍,林志军.2011.现代西方会计理论(第三版)[M].厦门大学出版社.
[2]袁中文.高职教育改革十年思考――以会计类专业为例[J].河北经贸大学学报综合版,2013(4).
[3]袁中文.高职院校会计类专业实践教学的研究与实践[J].商业会计,2008(23).
相关
浏览量:2
下载量:0
时间: