第五章材料数据库和新材料、新合金的设计
数据库系统的组成与结构
材料科学与工程数据库
第一节数据库系统的组成与结构
发展背景:数据库管理技术的产生与发展原因数据与信息、数据管理与应用状况?
数据:是描述事物的符号记录。
它可以是数字、文字、图形、图像、声音和语言等。
数据模型:是一种对客观事物抽象化的表现形式。
它通 常由数据结构、数据操作和完整性约束(域完整性、实体完整性、参照完整性)三要素组成。
数据模型的特点:
(1)真实地反映现实世界,否则无实际意义;
(2)易于理解,和人们对外部事物的认识相一致;
(3)便于实现。
数据库:是一些长期储存的信息的聚集,是DBMS管理的数据的聚集。
数据库管理系统(DBMS):是专门用于建立和管理数据库的一套软件,介于应用程序与操作系统之间。
功能:
(1)具有基本的数据管理功能;
(2)能保证数据的完整性、安全性;
(3)提供多用户并发控制;
(4)当数据库出现故障时对系统进行恢复。
数据库系统(DBS):它包括与数据库有关的整个系统,数据库、DBMS、应用程序、数据库管理员和用户等。
(1)允许用户用一种叫做“数据定义语言”的专用语言来建立新的数据库。
(2)允许用户用一种叫做“数据操作语言”或“查询语言”的专用语言来对数据库中的数据进行查询和更新。
(3)支持存储大量的数据,保证数据的正确及安全使用。
(4)控制多用户的并发访问,保证并发访问不相互影响,不损坏数据。
一、数据库系统概述
1、数据管理的发展历程
(1)人工管理 时间 计算机的作用 计算机硬件 20世纪50年代中期以前 主要用于科学 计算 外存只有卡片、纸带和磁带,没有磁盘等直接存 取设备; 计算机软件 只有汇编语言,没有操作系统和高级语言,更没有管理数据的软 件 数据处理方式 批处理 人工管理的特点: (a)数据不进行保存。
一个程序对应一组数据。
(b)无专门的数据管理软件。
(c)数据面向应用。
一组数据对应一个程序,数据不能共享。
(d)只有程序概念,基本没有文件概念。
(2)文件管理 背景:随着科学技术的进步,计算机技术有了很大的提高,其应用范围不断扩大。
时间 20世纪50年代末到60年代中期 计算机的作用 不仅用于科学计算,还大量用于管理 计算机硬件 已经有了磁盘、磁鼓等直接存取的外存设备 计算机软件 有了操作系统、高级语言,操作系统中的文件系统是专门用于数据管理的软件 数据处理方式 不仅有批处理,还增加了联机实时处理 文件管理的特点: (A)数据可长期保存在磁盘上。
用户可以反复对文件进行查询、修改、插入和删 除等操作。
(B)文件系统提供了数据与程序之间的存取方法。
应用程序和数据有了一定的独立性。
(C)数据冗余量大。
文件仍然是面向应用,一个文件基本上对应一个 应用程序。
(D)文件之间缺乏联系,相互独立,仍然不能反映 现实世界各种事物之间错综复杂的关系。
(3)数据库管理 时间 20世纪60年代末开始 计算机的作用 科学计算更多,用于管理更经常 计算机硬件 出现了大容量的磁盘 计算机软件 操作系统、高级语言更丰富完善,操作系统中的文件系统日趋系统化和专门化 数据处理方式 数据的联机实时处理更多 (A)出现期:20世纪60年代;大多基于层次数据模型和网状数据模型。
(B)发展期:20世纪70~80年代;基于关系数据库理论的迅速发展;有严格数学基础,简单清晰,易于掌握 (C)迅速发展期:20世纪80年代以来;表现为数据库技术的发展涉及到各种工程和科技领域。
如:分布式数据库,工程数据库,模糊数据库,并行数据库,多媒体数据库等。
(D)进一步完善期:近二十几年来;已从简单数字或短数据记录检索发展到复杂应用,并且新一代面向对象数据库及相关的工具已进入数据库市场。
面向对象(ObjectOriented,OO):是当前计算机界关心的重点。
面向对象的概念和应用已超越了程序设计和软件开发,扩展到很宽的范围。
如数据库系统、交互式界面、应用结构、应用平台、分布式系统、网络管理结构、CAD技术、人工智能等领域。
(4)大数据管理时期 研究机构Gartner定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
[1] 麦肯锡全球研究所给出的定义:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
[4] 大数据技术的战略意义:不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
结构:大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。
价值:第一层面是理论。
理论是认知的必经途径,也是被 广泛认同和传播的基线。
在这里从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。
第二层面是技术。
技术是大数据价值体现的手段和前进的基石。
在这里分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。
第三层面是实践。
实践是大数据的最终价值体现。
在这里分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。
大数据的价值:(精、准)1)对大量消费者提供产品或服务的企业可以利 用大数据进行精准营销;2)做小而美模式的中小微企业可以利用大数 据做服务转型;3)面临互联网压力之下必须转型的传统企业 需要与时俱进充分利用大数据的价值; 发展趋势:
(1)数据的资源化;
(2)与云计算的深度结合;(始于2013年)(物联 网、移动互联网等)
(3)科学理论的突破;(数据挖掘、机器学习和人 工智能)
(4)数据科学和数据联盟的成立;
(5)数据泄露泛滥;
(6)数据管理成为核心竞争力;
(7)数据质量是BI(商业智能)成功的关键;
(8)数据生态系统复合化程度加强 中国大数据发展格局两大研发中心:南贵阳、北盐城几大产业基地:陕西重庆南京天津宁波
2、数据库技术的地位当前数据库技术已成为一门新兴学科,成为计算机软件 的一个重要分支,尤其是大数据。
二、数据库管理系统
1、定义 数据库管理系统(DataBaseManagementSystem:DBMS)是一个负责数据库管理和维护的软件系统。
它位于用户与操作系统间
2、作用
(1)对数据库中数据的各种操作提供一种共用的方法
(2)接受并完成用户提出的访问数据库的各种请求
(3)负责数据库的建立、操纵、管理和维护。
3、任务 保证数据安全可靠,提高数据库应用时的简明性与方便性,大大减轻了用户的工作量和复杂性。
4、分类依据:设计时采用不同的数据模型
(1)层次型:层次模型是数据库系统中最早出 现的数据模型,层次数据库系统采用层次模型作为数据的组织方式。
它用树形结构来表示各类实体以及实体间的联系。
(A)有且只有一个节点没有双亲节点,这个节点称为根节点; (B)根以外的其他节点有且只有一个双亲节点。
(2)网络型网状数据库系统采用网状模型作为数据的组织方式。
(A)允许一个以上的结点无双亲;(B)一个结点可以有多于一个的双亲。
(3)关系型:不同于以往模型,它建立在严格的数学概念基础上。
关系模型的组成:关系数据结构、关系操作集合和关系完整性约束三部分 表现形式:在用户看来,关系模型中数据的逻辑结构是一张二维表。
特点:容易使用。
5、常用DBMS(数据库管理系统)dBASE、ORACLE、MySQL、ACCESS、MSSQL Server:都为关系型数据库。
6、组成
(1)数据库描述和操纵语言
(2)数据库管理和控制程序
(3)数据库服务程序
三、数据库系统的组成与结构
1、组成
(1)数据库一个结构化的相关数据的集合,包括数据本身和数据间的 联系,它独立于应用程序而存在,是数据库系统的核心。
(2)物理存储器保存数据的硬件介质。
磁盘、光盘、优盘、移动硬盘等。
(3)数据库软件 负责对数据库管理和维护的软件。
具有对数据进行定义、描述、操作和维护的功能,接受并完成用户程序及终端命令对数据库的不同请求,并负责保护数据免受各种干扰和破坏。
数据库软件核心就是DBMS。
有些文献上介绍它还包括应用系统、数据库管理员和用户。
2、结构 数据库系统结构为三级结构,分别为子模式(外模式)、模式(逻辑模式)和存储模式(内模式)。
其三级模式有效地实现了数据库的管理。
子模式:数据库用模户式能:够也看称逻见辑和模使式用,是数据 库中全体数据的逻辑结构和特 征的的局描部述数,是据所的有逻用辑户的公共数存结据储构视模和图式特。
:它征是是的数数描据据述库物,系理统结模式构是结和数构存据的储库中方间用式层户的,的既描数不述涉,及是数据数据的据视物在图理数,存据储是库细与内节某和部一硬的件表环示境,也方应与式用具。
有体关的应的用数程据序逻,与所使用辑的表应示用。
开发它工通具常及是高级程序 设计语言无关。
它实际上是数 据模库式数的据子在逻集辑。
上一的个视图。
一个数数据据库库仅可有以一有个多模式个。
数据库子模模式式以。
某一种数据模型为基 础,统一综合地考虑了所有用 户的需求,并将这些需求有机地结合成一个逻辑整体。
四、数据库数据的主要特征
1、数据共享
(1)多个用户同时使用,每人使用一部分
(2)多个用户可同时存取,而互不影响用户数据可以是重叠的,大大提高了数据的利用率。
2、数据具有独立性
(1)应用程序不再与存储器上的具体文件相对应, 每个用户所使用的数据有其自身的逻辑结构。
(2)数据独立性给数据库的使用,调整、优化和 扩充带来了方便,提高了数据库应用系统的稳定性。
3、减少数据冗余数据库系统管理下的数据不再是面向应用,而是面 向系统,数据集中管理,统一进行组织,定义和存储,避免了不必要的冗余及数据的不一致性。
4、数据的结构化数据库系统中的数据是相互关联的,这种联系不仅 表现在记录内部更重要的是记录类型之间的相互关系。
5、统一的数据保护功能多个用户共享数据资源,需要解决数据的安全性, 一致性和并发控制等问题。
为使数据安全可靠,系统对用户使用数据进行严格检查,对非法用户拒绝其加入数据库。
另外,还有其它保护措施。
五、工程数据库的应用
1、定义用于存储、管理和使用面向工程设计所需要的工程 数据和数据模型的数据库系统。
(1)将工程设计方法与数据库技术相结合,人工智能及专家系统与数据库相结合,达到智能化的CAD/CAM集成系统。
(2)它是一种面向对象的数据库,属于第三代数据库,主要存储、管理诸如多媒体数据、空间数据、实时数据、复杂对象、图像对象、知识和超文本等。
2、内容
(1)CAD数据库(计算机辅助设计)
(2)CAM数据库(计算机辅助制造)
(3)技术数据库和设计自动化数据库
3、工程数据库的建立
(1)选择一个适应工程应用的数据库管 理系统作为工程数据库系统的开发平台。
(2)将工程数据映像成数据库管理系统支持的数据模型,利用数据库管理系统提供的数据定义语言和数据操纵语言,设计数据库结构,提供操纵数据库数据的用户界面 第二节材料科学与工程数据库
一、材料数据库的发展
1、建立材料数据库的原因?
(1)材料种类多:目前世界上己有的工程材料就有数 十万种,各种化合物达上千万种。
(2)材料信息量大:材料的性能涉及成分、结构、性能及使用等方面,构成了庞大的信息体系,而且这一体系还在不断更新、扩充。
目前情况:CAD/CAM在各个领域日益普及,使计算机辅助选材(CAMS)和CAD/CAM的结合更加紧密,成为当今发展的必然趋势。
2、计算机材料性能数据库的优点 ①存储信息量大,存取速度快: ②查询方便: 材料(顺查)↔性能(反查); ③帮助选材或材料代用: 比较不同材料的性能数据 ④使用灵活: 随时更新,及时补充 ⑤功能强: 自动进行单位转换,数据可以图形表示,易获得派生数据; ⑥应用广泛: 能与CAD、CAM配套使用,实现计算机辅助选材; 能与知识库及人工智能技术相结合构成材料性能预测或材料设计专家系统。
3、目前的发展状况
(1)国外的发展状况 美国:最发达的国家,数量和规模都居首位。
美国国家标准局:建有数十个各类数据库,其中 材料数据库占有很大的比例, 举例:合金相图数据库、陶瓷相图数据库、材料 腐蚀数据库、材料摩擦磨损数据库。
晶体数据中心:采用X射线、中子衍射和电子衍射 等方法测得并收集了10多万个晶体数据,包括了金属、 无机非金属和有机材料。
此外,它还建有材料力学性能 数据库、金属弹性性能数据中心和金属扩散数据中心等。
它的许多数据库在国内外具有很高的权威性。
建库方式:多采用几个单位甚至几个国家联合建库。
举例: 美国国家标准局的许多材料数据库就是分别与 美国金属学会、陶瓷学会、腐蚀工程师协会及能源 部合作建立的。
欧洲热力学数据科学学会SGTE(Scientific GroupThermodataEurope)包括英、法、德、瑞 士等欧洲国家,合作开发了无机和冶金热力学系统 (thermodynamicdataforanicandmetallurgicalsystems),该数据库可用于热力学计算和材料科学领域。
(2)国内的发展状况 发展概况:20世纪80年代以来,我国在数据库技术方面有了很大发展。
已建成材料数据库: 材料腐蚀数据库:北京科技大学等单位联合建立; 磨损数据库:武汉材料保护研究所建立; 合金钢数据库与军工材料数据库:北京钢铁研究 总院建立; “863”新材料数据库:清华大学材料研究所等单 位在1990年联合建成 涉及领域:新型金属和合金、精细陶瓷、新型高 分子材料、先进复合材料和非晶态材料5个子库。
数据库主要内容:材料牌号、产地、材料成分、 技术条件、材料等级、性能及评价等。
航空材料数据库:航空航天部材料研究所建立,主要包括6个数据库 有色金属数据库:有色金属研究总院纳米科技基础数据库:中国科学院反应堆材料数据库:原子能科学院机械工程材料数据库:上海应用材料研究所机械强度数据库:郑州机械研究所(分布式)稀土数据库:中科院长春应用化学研究所 建库语言及基础:多数采用dBASE,微型计算机。
应用概况: 材料数据库已逐步走向现代化、商业化和网络化,并在材料研究、理化测试、产品设计和决策咨询中得到广泛应用。
通过现代网络数据库系统(Sybase、MSSQLServer、Oracle等),材料科学工作者可以很方便地实现材料数据库、文献资料和程序资源的共享。
我国情况:科研领域已获得广泛应用,但目前己经建立的材料数据库大多是单机版的,不利于推广和使用。
二、材料数据库的应用举例
1、用PC-PDF检索系统分析PVD表面涂层 产生:Hanawalt,RinnandFrevel等人在1938年首次发表了PDF(PowderDiffractionFile); 数量:2005年X衍射PDF卡片已多达52卷、174699张,而且每年还在不断地更新和增加。
(1941-2005:美国材料实验学会(ASTM)) 地位:目前PDF卡片已成为X衍射相分析必不可少的、最权威的工具。
人工检索PDF卡片的缺点:效率低,漏检率高。
计算机处理PDF卡片:自1962年。
目前使用的PDF计算机检索系统:由美、英、法和加拿大等国参加的粉末衍射标准联合委员会组织JCPDS-ICDD(theJointCommitteeonPowderDiffractionStandards-InternationalCentreforDiffractionData)开发,采用WINDOWS界面,使用极为方便快捷。
例:用PC-PDF检索系统分析W6Mo5Cr4V2高速钢TiN多弧离子PVD涂层相组成。
沉积工艺:预抽真空20min,预轰击清洗l5min,离子镀沉积30min后冷却出炉。
为研究不同镀覆工艺参数的影响,实验中分别改变了负偏压(100~300V)、靶电流(35~80A)和氮分压(0.5~1.5Pa),试定性分析涂层相组成。
推断: 大方向:根据涂层厚度在2~3μm范围,可以初步判断X射线衍射图谱为基体的衍射峰和涂层的衍射峰的叠加。
具体推断:根据Fe-Ti相图,Ti在Fe中溶解度小,稳定化合物只有TiFe和TiFe2两种,分析得出优先形成TiFe。
根据Ti-N相图,在PVD的温度下可能形成的稳定相有α-Ti、Ti2N及TiN,此外,还可能出现非平衡相。
图5-3为PC-PDF检索系统的界面。
检索方法:布尔(Boolean)检索法对仅形成Ti-N和Fe-Ti化合物进行检索,检索出12张PDF卡片,其PDF号见图5-4a、b。
再通过选择编号就可得到相应的PDF卡片。
如在图5-4b中选择2就得到PDF#17-0368i的Ti2N卡片,见图5-
5。
在每个记录中存入的主要内容有:序号、PDF卡片号、物相名、该物相所含的元素名、晶体结构参数、衍射靶参数、晶面间距值、相对强度值、晶面指数等。
结合该PVD工艺条件和PDF卡片对试样的X衍射图谱进行分析,得出该TiN涂层表面主要有TiN、Ti2N、TiN0.6、FeTi相。
图5-6为TiN涂层试样X射线衍射图谱及物相分析结果。
PDF卡片检索数据库的作用:与相分析软件相结合,在获得X射线衍射谱后,利用数据库来对照分析,迅速准确对物相进行分析。
例:Philips公司为此开发出了PC-IDENTIFYX衍射图谱计算机分析系统,该分析系统将各衍射峰的值与各个可能存在物相的d值逐个进行比较,最终输出分析结果。
图5-7是采用X射线物相定性计算机分析系统的流程,该分析系统为X衍射仪的一部分,能迅速对物相进行分析。
2、二元相图数据库系统 原因:研究材料组织与性能之间的关系就必须了解材料中各种组织的形成及变化规律。
材料相图是研究这些规律的有效工具。
合金相图:用图解的方法表示合金系中合金状态、温度和成分之间的关系。
利用相图可以知道各种成分的合金在不同温度下有哪些相,各相的相对含量、成分以及温度变化时可能发生的变化。
掌握相图的分析和使用方法,有助于了解合金的组织状态和预测合金的性能,也可按要求来研究新的合金。
如何使用?建立相图数据库美国金属学会(ASM)、美国国家标准局(NIST):通过在世界上征 集和其他各种渠道,收集了最完整的相图资料,开发出了相图数据库系统,包括二元合金相图数据库系统和三元合金相图数据库系统等。
二元合金相图数据库系统:该系统目前有4700余幅二元合金相图,是目前世界上最完整和最权威的二元合金相图来源。
图5-8是二元合金相图计算机数据库系统界面。
通过菜单选择可很方便地查找所需合金相图和合金相结构、晶体结构、最大溶解度、熔点等资料。
该相图数据库系统功能强大,能满足材料研究和使用对相图的需要。
举例:在相图查询菜单中输入合金元素Ti、
N,即得到Ti-N系二元相图,如图5-9所示。
该系统界面友好,有良好的帮助系统,如图5-10所示。
3、现代网络数据库及估算 网络数据库:利用网上资源和网络技术建立,可用于资源访问和科学研究的数据库。
主要依托:国际互联网技术的快速发展 举例:材料热力学模拟软件和物性网络估算系统 FACT的网络模拟程序提供了未来用网络计算机进行热力学计算和开发的基本模式。
FACT在网络上进行了大量的开发工作,收集并整理了有关网络无机热化学网络地址,形成了一个虚拟的无机热化学中心。
下图为FACT的主页。
FACT上使用率最高的应用程序:Compound-Web,Reaction-Web,Equilib-Web和Aqua-Web。
采用技术:CGI(CommonGatewayInterface)。
举例:利用Reaction-Web应用程序,可计算
H、G、
S、Cp、A等热力学函数;利用Compound-Web应用程序,可获得有关化合物的重要数据。
网上免费的实用相图查询: 乔治亚州工学院(ia、InstituteofTechnology): http://cyberbuzz.gatech.edu/asm.tms/phase.dia-garms; SGTE:http://www.met.kth.se/pd。
我国网上数据库发展: 中国科学院化工冶金研究所:http://159.226.63.177(工程化 学数据库)。
通过该网站可查询多个网上数据库的数据。
网络估算:通过特定的网络数据库系统和专业软件来对某人或某事
作出的评价或判断行为过程。
基础:高性能的个人计算机硬件和不断更新的应用软件,网络数据库系统和专业软件的不断完善 发展趋势: 使用方面:功能强大、有价值、免费软件可供科研人员使用。
交流方面:交流不仅限于学术期刊和学术会议上,还可以通 过网络进行。
更加便利、快捷。
它可以是数字、文字、图形、图像、声音和语言等。
数据模型:是一种对客观事物抽象化的表现形式。
它通 常由数据结构、数据操作和完整性约束(域完整性、实体完整性、参照完整性)三要素组成。
数据模型的特点:
(1)真实地反映现实世界,否则无实际意义;
(2)易于理解,和人们对外部事物的认识相一致;
(3)便于实现。
数据库:是一些长期储存的信息的聚集,是DBMS管理的数据的聚集。
数据库管理系统(DBMS):是专门用于建立和管理数据库的一套软件,介于应用程序与操作系统之间。
功能:
(1)具有基本的数据管理功能;
(2)能保证数据的完整性、安全性;
(3)提供多用户并发控制;
(4)当数据库出现故障时对系统进行恢复。
数据库系统(DBS):它包括与数据库有关的整个系统,数据库、DBMS、应用程序、数据库管理员和用户等。
(1)允许用户用一种叫做“数据定义语言”的专用语言来建立新的数据库。
(2)允许用户用一种叫做“数据操作语言”或“查询语言”的专用语言来对数据库中的数据进行查询和更新。
(3)支持存储大量的数据,保证数据的正确及安全使用。
(4)控制多用户的并发访问,保证并发访问不相互影响,不损坏数据。
一、数据库系统概述
1、数据管理的发展历程
(1)人工管理 时间 计算机的作用 计算机硬件 20世纪50年代中期以前 主要用于科学 计算 外存只有卡片、纸带和磁带,没有磁盘等直接存 取设备; 计算机软件 只有汇编语言,没有操作系统和高级语言,更没有管理数据的软 件 数据处理方式 批处理 人工管理的特点: (a)数据不进行保存。
一个程序对应一组数据。
(b)无专门的数据管理软件。
(c)数据面向应用。
一组数据对应一个程序,数据不能共享。
(d)只有程序概念,基本没有文件概念。
(2)文件管理 背景:随着科学技术的进步,计算机技术有了很大的提高,其应用范围不断扩大。
时间 20世纪50年代末到60年代中期 计算机的作用 不仅用于科学计算,还大量用于管理 计算机硬件 已经有了磁盘、磁鼓等直接存取的外存设备 计算机软件 有了操作系统、高级语言,操作系统中的文件系统是专门用于数据管理的软件 数据处理方式 不仅有批处理,还增加了联机实时处理 文件管理的特点: (A)数据可长期保存在磁盘上。
用户可以反复对文件进行查询、修改、插入和删 除等操作。
(B)文件系统提供了数据与程序之间的存取方法。
应用程序和数据有了一定的独立性。
(C)数据冗余量大。
文件仍然是面向应用,一个文件基本上对应一个 应用程序。
(D)文件之间缺乏联系,相互独立,仍然不能反映 现实世界各种事物之间错综复杂的关系。
(3)数据库管理 时间 20世纪60年代末开始 计算机的作用 科学计算更多,用于管理更经常 计算机硬件 出现了大容量的磁盘 计算机软件 操作系统、高级语言更丰富完善,操作系统中的文件系统日趋系统化和专门化 数据处理方式 数据的联机实时处理更多 (A)出现期:20世纪60年代;大多基于层次数据模型和网状数据模型。
(B)发展期:20世纪70~80年代;基于关系数据库理论的迅速发展;有严格数学基础,简单清晰,易于掌握 (C)迅速发展期:20世纪80年代以来;表现为数据库技术的发展涉及到各种工程和科技领域。
如:分布式数据库,工程数据库,模糊数据库,并行数据库,多媒体数据库等。
(D)进一步完善期:近二十几年来;已从简单数字或短数据记录检索发展到复杂应用,并且新一代面向对象数据库及相关的工具已进入数据库市场。
面向对象(ObjectOriented,OO):是当前计算机界关心的重点。
面向对象的概念和应用已超越了程序设计和软件开发,扩展到很宽的范围。
如数据库系统、交互式界面、应用结构、应用平台、分布式系统、网络管理结构、CAD技术、人工智能等领域。
(4)大数据管理时期 研究机构Gartner定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
[1] 麦肯锡全球研究所给出的定义:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
[4] 大数据技术的战略意义:不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
结构:大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。
价值:第一层面是理论。
理论是认知的必经途径,也是被 广泛认同和传播的基线。
在这里从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。
第二层面是技术。
技术是大数据价值体现的手段和前进的基石。
在这里分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。
第三层面是实践。
实践是大数据的最终价值体现。
在这里分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。
大数据的价值:(精、准)1)对大量消费者提供产品或服务的企业可以利 用大数据进行精准营销;2)做小而美模式的中小微企业可以利用大数 据做服务转型;3)面临互联网压力之下必须转型的传统企业 需要与时俱进充分利用大数据的价值; 发展趋势:
(1)数据的资源化;
(2)与云计算的深度结合;(始于2013年)(物联 网、移动互联网等)
(3)科学理论的突破;(数据挖掘、机器学习和人 工智能)
(4)数据科学和数据联盟的成立;
(5)数据泄露泛滥;
(6)数据管理成为核心竞争力;
(7)数据质量是BI(商业智能)成功的关键;
(8)数据生态系统复合化程度加强 中国大数据发展格局两大研发中心:南贵阳、北盐城几大产业基地:陕西重庆南京天津宁波
2、数据库技术的地位当前数据库技术已成为一门新兴学科,成为计算机软件 的一个重要分支,尤其是大数据。
二、数据库管理系统
1、定义 数据库管理系统(DataBaseManagementSystem:DBMS)是一个负责数据库管理和维护的软件系统。
它位于用户与操作系统间
2、作用
(1)对数据库中数据的各种操作提供一种共用的方法
(2)接受并完成用户提出的访问数据库的各种请求
(3)负责数据库的建立、操纵、管理和维护。
3、任务 保证数据安全可靠,提高数据库应用时的简明性与方便性,大大减轻了用户的工作量和复杂性。
4、分类依据:设计时采用不同的数据模型
(1)层次型:层次模型是数据库系统中最早出 现的数据模型,层次数据库系统采用层次模型作为数据的组织方式。
它用树形结构来表示各类实体以及实体间的联系。
(A)有且只有一个节点没有双亲节点,这个节点称为根节点; (B)根以外的其他节点有且只有一个双亲节点。
(2)网络型网状数据库系统采用网状模型作为数据的组织方式。
(A)允许一个以上的结点无双亲;(B)一个结点可以有多于一个的双亲。
(3)关系型:不同于以往模型,它建立在严格的数学概念基础上。
关系模型的组成:关系数据结构、关系操作集合和关系完整性约束三部分 表现形式:在用户看来,关系模型中数据的逻辑结构是一张二维表。
特点:容易使用。
5、常用DBMS(数据库管理系统)dBASE、ORACLE、MySQL、ACCESS、MSSQL Server:都为关系型数据库。
6、组成
(1)数据库描述和操纵语言
(2)数据库管理和控制程序
(3)数据库服务程序
三、数据库系统的组成与结构
1、组成
(1)数据库一个结构化的相关数据的集合,包括数据本身和数据间的 联系,它独立于应用程序而存在,是数据库系统的核心。
(2)物理存储器保存数据的硬件介质。
磁盘、光盘、优盘、移动硬盘等。
(3)数据库软件 负责对数据库管理和维护的软件。
具有对数据进行定义、描述、操作和维护的功能,接受并完成用户程序及终端命令对数据库的不同请求,并负责保护数据免受各种干扰和破坏。
数据库软件核心就是DBMS。
有些文献上介绍它还包括应用系统、数据库管理员和用户。
2、结构 数据库系统结构为三级结构,分别为子模式(外模式)、模式(逻辑模式)和存储模式(内模式)。
其三级模式有效地实现了数据库的管理。
子模式:数据库用模户式能:够也看称逻见辑和模使式用,是数据 库中全体数据的逻辑结构和特 征的的局描部述数,是据所的有逻用辑户的公共数存结据储构视模和图式特。
:它征是是的数数描据据述库物,系理统结模式构是结和数构存据的储库中方间用式层户的,的既描数不述涉,及是数据数据的据视物在图理数,存据储是库细与内节某和部一硬的件表环示境,也方应与式用具。
有体关的应的用数程据序逻,与所使用辑的表应示用。
开发它工通具常及是高级程序 设计语言无关。
它实际上是数 据模库式数的据子在逻集辑。
上一的个视图。
一个数数据据库库仅可有以一有个多模式个。
数据库子模模式式以。
某一种数据模型为基 础,统一综合地考虑了所有用 户的需求,并将这些需求有机地结合成一个逻辑整体。
四、数据库数据的主要特征
1、数据共享
(1)多个用户同时使用,每人使用一部分
(2)多个用户可同时存取,而互不影响用户数据可以是重叠的,大大提高了数据的利用率。
2、数据具有独立性
(1)应用程序不再与存储器上的具体文件相对应, 每个用户所使用的数据有其自身的逻辑结构。
(2)数据独立性给数据库的使用,调整、优化和 扩充带来了方便,提高了数据库应用系统的稳定性。
3、减少数据冗余数据库系统管理下的数据不再是面向应用,而是面 向系统,数据集中管理,统一进行组织,定义和存储,避免了不必要的冗余及数据的不一致性。
4、数据的结构化数据库系统中的数据是相互关联的,这种联系不仅 表现在记录内部更重要的是记录类型之间的相互关系。
5、统一的数据保护功能多个用户共享数据资源,需要解决数据的安全性, 一致性和并发控制等问题。
为使数据安全可靠,系统对用户使用数据进行严格检查,对非法用户拒绝其加入数据库。
另外,还有其它保护措施。
五、工程数据库的应用
1、定义用于存储、管理和使用面向工程设计所需要的工程 数据和数据模型的数据库系统。
(1)将工程设计方法与数据库技术相结合,人工智能及专家系统与数据库相结合,达到智能化的CAD/CAM集成系统。
(2)它是一种面向对象的数据库,属于第三代数据库,主要存储、管理诸如多媒体数据、空间数据、实时数据、复杂对象、图像对象、知识和超文本等。
2、内容
(1)CAD数据库(计算机辅助设计)
(2)CAM数据库(计算机辅助制造)
(3)技术数据库和设计自动化数据库
3、工程数据库的建立
(1)选择一个适应工程应用的数据库管 理系统作为工程数据库系统的开发平台。
(2)将工程数据映像成数据库管理系统支持的数据模型,利用数据库管理系统提供的数据定义语言和数据操纵语言,设计数据库结构,提供操纵数据库数据的用户界面 第二节材料科学与工程数据库
一、材料数据库的发展
1、建立材料数据库的原因?
(1)材料种类多:目前世界上己有的工程材料就有数 十万种,各种化合物达上千万种。
(2)材料信息量大:材料的性能涉及成分、结构、性能及使用等方面,构成了庞大的信息体系,而且这一体系还在不断更新、扩充。
目前情况:CAD/CAM在各个领域日益普及,使计算机辅助选材(CAMS)和CAD/CAM的结合更加紧密,成为当今发展的必然趋势。
2、计算机材料性能数据库的优点 ①存储信息量大,存取速度快: ②查询方便: 材料(顺查)↔性能(反查); ③帮助选材或材料代用: 比较不同材料的性能数据 ④使用灵活: 随时更新,及时补充 ⑤功能强: 自动进行单位转换,数据可以图形表示,易获得派生数据; ⑥应用广泛: 能与CAD、CAM配套使用,实现计算机辅助选材; 能与知识库及人工智能技术相结合构成材料性能预测或材料设计专家系统。
3、目前的发展状况
(1)国外的发展状况 美国:最发达的国家,数量和规模都居首位。
美国国家标准局:建有数十个各类数据库,其中 材料数据库占有很大的比例, 举例:合金相图数据库、陶瓷相图数据库、材料 腐蚀数据库、材料摩擦磨损数据库。
晶体数据中心:采用X射线、中子衍射和电子衍射 等方法测得并收集了10多万个晶体数据,包括了金属、 无机非金属和有机材料。
此外,它还建有材料力学性能 数据库、金属弹性性能数据中心和金属扩散数据中心等。
它的许多数据库在国内外具有很高的权威性。
建库方式:多采用几个单位甚至几个国家联合建库。
举例: 美国国家标准局的许多材料数据库就是分别与 美国金属学会、陶瓷学会、腐蚀工程师协会及能源 部合作建立的。
欧洲热力学数据科学学会SGTE(Scientific GroupThermodataEurope)包括英、法、德、瑞 士等欧洲国家,合作开发了无机和冶金热力学系统 (thermodynamicdataforanicandmetallurgicalsystems),该数据库可用于热力学计算和材料科学领域。
(2)国内的发展状况 发展概况:20世纪80年代以来,我国在数据库技术方面有了很大发展。
已建成材料数据库: 材料腐蚀数据库:北京科技大学等单位联合建立; 磨损数据库:武汉材料保护研究所建立; 合金钢数据库与军工材料数据库:北京钢铁研究 总院建立; “863”新材料数据库:清华大学材料研究所等单 位在1990年联合建成 涉及领域:新型金属和合金、精细陶瓷、新型高 分子材料、先进复合材料和非晶态材料5个子库。
数据库主要内容:材料牌号、产地、材料成分、 技术条件、材料等级、性能及评价等。
航空材料数据库:航空航天部材料研究所建立,主要包括6个数据库 有色金属数据库:有色金属研究总院纳米科技基础数据库:中国科学院反应堆材料数据库:原子能科学院机械工程材料数据库:上海应用材料研究所机械强度数据库:郑州机械研究所(分布式)稀土数据库:中科院长春应用化学研究所 建库语言及基础:多数采用dBASE,微型计算机。
应用概况: 材料数据库已逐步走向现代化、商业化和网络化,并在材料研究、理化测试、产品设计和决策咨询中得到广泛应用。
通过现代网络数据库系统(Sybase、MSSQLServer、Oracle等),材料科学工作者可以很方便地实现材料数据库、文献资料和程序资源的共享。
我国情况:科研领域已获得广泛应用,但目前己经建立的材料数据库大多是单机版的,不利于推广和使用。
二、材料数据库的应用举例
1、用PC-PDF检索系统分析PVD表面涂层 产生:Hanawalt,RinnandFrevel等人在1938年首次发表了PDF(PowderDiffractionFile); 数量:2005年X衍射PDF卡片已多达52卷、174699张,而且每年还在不断地更新和增加。
(1941-2005:美国材料实验学会(ASTM)) 地位:目前PDF卡片已成为X衍射相分析必不可少的、最权威的工具。
人工检索PDF卡片的缺点:效率低,漏检率高。
计算机处理PDF卡片:自1962年。
目前使用的PDF计算机检索系统:由美、英、法和加拿大等国参加的粉末衍射标准联合委员会组织JCPDS-ICDD(theJointCommitteeonPowderDiffractionStandards-InternationalCentreforDiffractionData)开发,采用WINDOWS界面,使用极为方便快捷。
例:用PC-PDF检索系统分析W6Mo5Cr4V2高速钢TiN多弧离子PVD涂层相组成。
沉积工艺:预抽真空20min,预轰击清洗l5min,离子镀沉积30min后冷却出炉。
为研究不同镀覆工艺参数的影响,实验中分别改变了负偏压(100~300V)、靶电流(35~80A)和氮分压(0.5~1.5Pa),试定性分析涂层相组成。
推断: 大方向:根据涂层厚度在2~3μm范围,可以初步判断X射线衍射图谱为基体的衍射峰和涂层的衍射峰的叠加。
具体推断:根据Fe-Ti相图,Ti在Fe中溶解度小,稳定化合物只有TiFe和TiFe2两种,分析得出优先形成TiFe。
根据Ti-N相图,在PVD的温度下可能形成的稳定相有α-Ti、Ti2N及TiN,此外,还可能出现非平衡相。
图5-3为PC-PDF检索系统的界面。
检索方法:布尔(Boolean)检索法对仅形成Ti-N和Fe-Ti化合物进行检索,检索出12张PDF卡片,其PDF号见图5-4a、b。
再通过选择编号就可得到相应的PDF卡片。
如在图5-4b中选择2就得到PDF#17-0368i的Ti2N卡片,见图5-
5。
在每个记录中存入的主要内容有:序号、PDF卡片号、物相名、该物相所含的元素名、晶体结构参数、衍射靶参数、晶面间距值、相对强度值、晶面指数等。
结合该PVD工艺条件和PDF卡片对试样的X衍射图谱进行分析,得出该TiN涂层表面主要有TiN、Ti2N、TiN0.6、FeTi相。
图5-6为TiN涂层试样X射线衍射图谱及物相分析结果。
PDF卡片检索数据库的作用:与相分析软件相结合,在获得X射线衍射谱后,利用数据库来对照分析,迅速准确对物相进行分析。
例:Philips公司为此开发出了PC-IDENTIFYX衍射图谱计算机分析系统,该分析系统将各衍射峰的值与各个可能存在物相的d值逐个进行比较,最终输出分析结果。
图5-7是采用X射线物相定性计算机分析系统的流程,该分析系统为X衍射仪的一部分,能迅速对物相进行分析。
2、二元相图数据库系统 原因:研究材料组织与性能之间的关系就必须了解材料中各种组织的形成及变化规律。
材料相图是研究这些规律的有效工具。
合金相图:用图解的方法表示合金系中合金状态、温度和成分之间的关系。
利用相图可以知道各种成分的合金在不同温度下有哪些相,各相的相对含量、成分以及温度变化时可能发生的变化。
掌握相图的分析和使用方法,有助于了解合金的组织状态和预测合金的性能,也可按要求来研究新的合金。
如何使用?建立相图数据库美国金属学会(ASM)、美国国家标准局(NIST):通过在世界上征 集和其他各种渠道,收集了最完整的相图资料,开发出了相图数据库系统,包括二元合金相图数据库系统和三元合金相图数据库系统等。
二元合金相图数据库系统:该系统目前有4700余幅二元合金相图,是目前世界上最完整和最权威的二元合金相图来源。
图5-8是二元合金相图计算机数据库系统界面。
通过菜单选择可很方便地查找所需合金相图和合金相结构、晶体结构、最大溶解度、熔点等资料。
该相图数据库系统功能强大,能满足材料研究和使用对相图的需要。
举例:在相图查询菜单中输入合金元素Ti、
N,即得到Ti-N系二元相图,如图5-9所示。
该系统界面友好,有良好的帮助系统,如图5-10所示。
3、现代网络数据库及估算 网络数据库:利用网上资源和网络技术建立,可用于资源访问和科学研究的数据库。
主要依托:国际互联网技术的快速发展 举例:材料热力学模拟软件和物性网络估算系统 FACT的网络模拟程序提供了未来用网络计算机进行热力学计算和开发的基本模式。
FACT在网络上进行了大量的开发工作,收集并整理了有关网络无机热化学网络地址,形成了一个虚拟的无机热化学中心。
下图为FACT的主页。
FACT上使用率最高的应用程序:Compound-Web,Reaction-Web,Equilib-Web和Aqua-Web。
采用技术:CGI(CommonGatewayInterface)。
举例:利用Reaction-Web应用程序,可计算
H、G、
S、Cp、A等热力学函数;利用Compound-Web应用程序,可获得有关化合物的重要数据。
网上免费的实用相图查询: 乔治亚州工学院(ia、InstituteofTechnology): http://cyberbuzz.gatech.edu/asm.tms/phase.dia-garms; SGTE:http://www.met.kth.se/pd。
我国网上数据库发展: 中国科学院化工冶金研究所:http://159.226.63.177(工程化 学数据库)。
通过该网站可查询多个网上数据库的数据。
网络估算:通过特定的网络数据库系统和专业软件来对某人或某事
作出的评价或判断行为过程。
基础:高性能的个人计算机硬件和不断更新的应用软件,网络数据库系统和专业软件的不断完善 发展趋势: 使用方面:功能强大、有价值、免费软件可供科研人员使用。
交流方面:交流不仅限于学术期刊和学术会议上,还可以通 过网络进行。
更加便利、快捷。
声明:
该资讯来自于互联网网友发布,如有侵犯您的权益请联系我们。