用户常见问题
用户及数据分级分类 数据来源 数据质量 元数据标准

为规范数据服务工作,并能及时向各类用户提供所需数据,本平台对数据资源实行分级共享,以实现高效有序的数据服务。

一、根据数据的价值、获取难度及重要性的不同,将数据划分为7级(1~7级):

初加工数据:经元数据规范的数据。

精加工数据:经元数据规范、质量检验规范的数据。

获取难度较大的加工数据。

有自筹资金投入的数据。

应用户需求,专门为之整理、加工和生产的科学数据。

为使用者带来直接或巨大商业利益的关键数据。

影响国际竞争力的关键数据;影响国家安全的重要数据。

二、注册用户分为一般用户、认证用户和特殊用户,认证用户又可分为高等院校、科研院所、企业、科学家个人、参与单位5类。根据用户的工作单位性质和利用数据从事活动的属性提供不同的共享方式。

1. 1级数据全部公开发布,社会各界人士均可享用。

2. 科研院所、高等院校等单位可享用1~6级数据,其中1~3级数据为免费无偿提供,4~5级收取数据服务费,6级数据收取部分成本费。

3.企业等经营性单位,可享用1~6级数据,其中1~2级数据为免费无偿提供,3级收取数据服务费,4~6级数据收取部分成本费。

4.政府部门公务活动可享用1~7级数据,全部免费无偿提供。

5.共享网参与单位:可享用1~6级数据,其中1~4级数据免费无偿共享,5~6级数据收取数据服务费。

一般用户升级为认证用户时,应下载并填写认证用户申请表,经所在单位认可后(单位盖章),向数据中心提出申请,审核通过后可获取相应级别的数据下载权限。

注:文中数据服务费包括数据收集、整合及保管费用,数据成本费包括数据研发、试验费用。为防止恶意下载,限制一天数据对象下载个数最多50个。

智能制造科学数据服务平台数据资源的来源具体包括历史积累数据、实验室实验测试数据、现场测试数据、以及统计数据等几个方面,数据资源可信度高,有较大的实用价值和参考价值。

①历史积累数据:大多数从各种专业手册摘录,这些数据一般已得到行业公认并且能够指导行业技术工作,是行业长期工作积累的成果,数据可信度高,资源质量有保障。

②实验室实验、测试数据:主要分两个方面,一种来自专门为生产数据而进行的试验,如几种典型焊接接头的疲劳性能数据和P-S-N曲线、几种材料的低温化学热处理渗层抗胶合、抗疲劳特性数据等,这些数据都是按照有关规范和标准进行试验、测试获得的。另一种是某项科研项目研究过程中进行实验、测试获得的数据,也是按一定的规范要求进行的。数据可信,实用价值大。

③现场测试数据:在进行科学研究或解决某一工程实际问题时现场获取的数据,及对某些事故进行分析获取的现场数据,这些数据都是某种具体条件下产生获得的,有一定的参考价值。

④统计数据:在某个范围内,对一定的样本数据进行统计,用概率分析方法,对某些指标做出判断,获得相关数据。样本数越大,数据的可靠度越高。还有一些统计数据来自产品使用中的各种信息反馈、积累和统计,通过这种途径获得的数据可信度高,对可靠性分析、故障判断、新产品开发有很大的参考价值。

为确保智能制造科学数据质量,为用户提供优质的服务平台,特制定了智能制造科学数据质量控制规范。主要条款如下:

第一条 数据质量分为标准数据、可用数据、可参考数据三档次。

标准数据指已公布的有关智能制造科学数据的国际标准、国家标准、行业标准。

可用数据指非标准数据中,可供用户使用的数据。要求数据准确、数据精度较高、重现性好,相关数据比较完整,数据配套性好。

可参考数据指非标准数据中可供用户参考的数据。要求数据准确、有一定的数据精度,重现性较好。

第二条 标准数据的质量控制。凡采集拟录入的标准数据必须是正式公布的国际标准、国家标准、行业标准,并编写相应的元数据信息,包括标准类别(国际、国家、行业)、名称、编号、公布日期、起草单位、所属标委会等,由经办人(数据专业工作人员)填写智能制造科学数据入库验收单。并由专业数据中心主任核准签字后,才能将标准数据录入数据库。数据入库后,由数据录入人员和数据校对人员签字,将原始资料存档。

第三条 历史积累数据的质量控制。由专业人员提出拟录入数据库的数据内容(一般来源于各专业的技术手册),各专业技术第一级的数据集需提请专家小组审核,由专家小组提出数据入库审核意见,包括可用数据和可参考数据划分的意见,各专业技术最后一层数据集(第四级)由专业人员根据专家审核意见提出历史积累数据入库内容,并填写智能制造科学数据入库验收单,交专业数据中心主任核准签字后,才能将历史积累数据录入数据库。数据入库后由录入人员和数据校核人员签字,将原始资料存档。

第四条 实验室实验、测试数据的质量控制。由专业人员对实验、测试的试件材料进行核实,然后按要求加工试件,选择测试设备(仪器),并对测试设备(仪器)的精度进行校核,最后按标准规定程序进行实验、测试,测试过程必须有严格的记录,并由试验人员和校核人员签字,测试完成后,提出实验测试数据入库报告,并附有测试原始记录和测试的试件、设备(仪器)等有关资料,填写智能制造科学数据入库验收单,交专业数据中心主任审核签字后,才能录入数据库。数据入库后由录入人员和校核人员签字,将原始资料存档。

第五条 科研成果中有关需入库数据的质量控制。由专业人员对科研成果中的有关数据进行摘录、整理,提出拟录入数据库的可用数据和可参考数据,提请专家小组审核,再由专业人员根据专家审核意见提出科研成果中有关数据录入数据库的报告,并附上专家审核意见,填写智能制造科学数据入库验收单,交专业中心主任审核签字后,才能录入数据库。数据入库后,由录入人员和校核人员签字后,将原始资料存档。对于按规定需汇交科学数据的科研项目,按国家科技计划项目科学数据汇交暂行办法规定执行。数据入库后由录入人员和校核人员签字后,并由专业人员将有关资料整理存档。

第六条 现场测试数据的质量控制。数据提供单位需提供现场测试时的详细背景资料,由专业人员提出现场测试数据录入数据库的具体内容,并填写智能制造科学数据入库验收单,交专业数据中心主任审核签字后,才能录入数据库。数据入库后,由录入人员和校核人员签字后,将原始资料存档。

第七条 统计数据的质量控制。由专业人员将需录入的统计数据进行形式审查,包括统计样本是否一致,样本数是否足够等,然后由专家小组审核,根据专家审核意见,由专业人员提出统计数据录入数据库的内容,填写智能制造科学数据入库验收单,交专业中心主任审核签名后才能录入数据库,数据入库后,由录入人员和校核人员签字后,将原始资料存档。

第八条 论文、著作中有关需入库数据的质量控制。由专业人员对论文、著作中选择拟录入的数据产生的背景资料进行了解,对可录用数据提出可用数据和可参考数据的档次,填写智能制造科学数据入库验收单,交专业数据中心主任审核后,才能录入数据库,必要时可提请专家小组审核。数据入库后,由数据录入人员和校核人员签字后,将原始资料存档。

第九条 图表、照片的质量控制。图表、照片必须标有图表、照片的名称,所表达的内容和技术指标必须有明确的示意,照片要求清晰。

当今世界,信息资源浩如烟海,并且每天信息增加量仍呈指数上升,这种情况下,想要以最快的速度准确方便找到自己需要的信息,元数据就派上了用场。通过元数据,用户不仅能够在访问具体数据库之前对数据是否满足使用要求做出判断,而且有利于有效的数据管理和数据的长期保存。

元数据通俗的定义即关于数据的数据,是说明数据的来源、内容、格式、质量、状态及结构等特征的信息。举个例子,一本几百页的书,该书的作者、出版社、出版日期、内容简介甚至该书的关键词语等都可作为该书的元数据信息。当然还有更多信息可以纳入该书的元数据体系,如书的页数,印刷质量(简装本、精装本)甚至书的目录,当然这方面信息越多,对该书的了解认识就越深入,但是对于囊括了数以万计书本信息的海量数据库而言,查询、浏览就显得有些笨重了,另外考虑到与其它数据库系统的兼容问题,也不是越详细越好,这就涉及到一个度的问题。什么信息重要必须纳入元数据体系,什么信息可以不纳入,经过多位专家论证后,将相对重要的信息纳入元数据体系(比如将书的作者、出版社、出版日期),作为一个制度定下来,即为元数据标准。当然标准有一定的适用范围和级别,如国家标准,行业标准,企业标准等。