专业人士都在用的调研平台

数据存储和提取系统

调研家SurveyPlus
2021-10-08

有两种重要的数据存储类型:数据档案和数据仓库。虽然它们在很多方面是一样的——它们都是某种数据库,然而它们也有不同点。

数据档案

数据档案(data achives)是数据的存储库。例如,每个商业组织都有自己的数据档案,而这些数据档案以内部数据库和内部数据仓库的形式存在,这些形成了决策支持系统(DSS)或管理信息系统(MIS)的基础。内部组织也有自己的数据档案,内部人员可随意使用存储的数据。

就像上面提到的,在英国,大量的社会和经济数据存储在英国数据档案馆(UKDataArchive)之中。这个档案内存储的数据是由代表英国政府的、正式的、重复性的调研获取,如劳动力调查、一般家庭调查、家庭支出调查。除了政府产生的数据,此档案馆还存着其他学术性数据——ERSC基金会所调查的数据和来自(国际的)市场调査、独立研究学院和公共部门的数据。这个档案馆的网站(http://www.data-archive.ac.uk/)包含数据集的所有描述及文件(包括定性数据),而且支持多种搜索信息的方式。该档案馆主要的在线检索系统,即著名的BIRON,可以用科目和主题检索,同样也可以根据与研究相关的个人与组织名称进行检索,也可以根据数据收集的日期和地点来检索。BIRON存储在上述档案馆中的目录有效,而这个目录由一些可描述的信息(元数据)组成。

科隆大学的经验社会调研中央档案馆(http://www.gesis.org/)涵盖了来自德国的调研数据,也有来自国际研究组织的数据,这个档案馆是国际社会调查项目(ISSP)的官方档案馆,“欧洲社会价值调查”是它的一个分部。1SSP收集来自世界范围内超过30个国家的重要社会问题和社会科学问题。中心档案馆提供来自每个独立国家的数据访问入口和文件入口,这些文件包含了每个特定国家每年的调研数据。来自欧洲社会调查的数据被存档于卑尔根市的挪威社会科学数据服务中心(http://www.nsd.uib.no/nsd/english/index.html)。

位于密歇根大学(http://www.icpsr.umich.edu/icpsrweb/ICPSR/)的政治社会研究大学联盟(ICPSR)档案馆提供了全球超过400所大学科学技术数据的访问入口。当然也有一些其他性质的数据档案馆,如健康与药物档案馆、国际教育数据档案馆、国家刑事司法档案馆。

数据仓库

数据仓库(data warehouses)是数据的存储,实际上它是一个巨大的数据库,包含来自一个来源或多个来源的数据。它是一个重要的存储设施,在数据存档的概念上向前走了一大步,因为包含数据仓库的数据集是综合的,而且里面的基本要素可以从这一个联系到另外一个(就像一个相关联的数据库)。

存储在数据仓库趋向于用来存储那些有助于组织制定管理决定的数据。在很多方面这就是数据仓库的目的——支持管理决策,以取得进步(Inmon,1996)。一些数据仓库经常被认为是决策支持系统、行政信息系统和企业情报系统(ETS)O如果一个系统(还有它包含的数据)与客户有关,它可能被认为是客户关系管理系统(CRM)。如果一个组织有客户关系管理系统,那么可能很多专业人员会使用里面的数据。在大多数情况下,组织所釆用的一手调研数据不会是相同的人负责,尽管一些组织正在朝着一个整合调研功能发展,包括所有来源的数据、一手资料和二手资(Page,2010andReitsma,2011)。决策支持系统和客户关系管理系统的数据趋向于成为可观测的、行为化的数据和非调查获取的数据。可观测的数据可以来自EPOS扫描仪得出的顾客互动,可以从支付卡的交易获取,也可以从公司的网站、社交媒体网站、移动设备和电子标签以及电子芯片中获取,如条形码、标签、产品中的RFIDo它可能是行政数据,也可能是与管理绩效有关的数据,也可能是供应链的数据。也就是说,它是根据企业的任一或是所有方面推断出来的数据。当你正在检查和规划一个项目时,先好好思考这个问题是很重要的。你正在找寻的信息可能已经被收入某个组织的决策支持系统和客户关系管理系统中。你可能会发现,你不需要去委托别人来做一手资料研究,因为答案就在你所在组织的数据库中。

存储在数据库或数据仓库的数据,当它的规格达到不能用标准计算技术来检索和分析的时候(即当它达到太字节或艾字节的时候),据计算术语,它可以被称为——“大数据”。这样的系统推断出的信息,有时被称为“分析学”。当数据是顾客数据时叫作’顾客分析学';如果数据涉及网络,那就叫作’网络分析学'。大数据分析依赖于数据分解的技术,而这需利用叫作’分析学技术'的软件。产生的信息可能偏向于顾客需求,用来定义新出现的模式和趋势,评定顾客的获取和维系,计划广告活动和其他市场活动,以及创新与开发新产品。

数据仓库是被设计和构造出来的,里面的数据会被编排并给出目录,目的是提高其决策支持作用和快速且有效地访问数据仓库里面的数据。数据仓库主要有两种主要的设计和结构:关系数据库结构,以一个中央事实表为依据进行星状设计,例如销售量和几个相互关联的表格,如产品组、销售区域、销售期间等;另一种是多维数据结构,它是基于多维立方体的设计。比起多维数据结构,具有传统关系数据结构的数据库或数据仓库有两个优点:它允许你相对简单地完善相关联的其他数据库;还有就是在数据存储方面,它是比多维方法更有效的方法,所以它更容易管理和更新。多维结构的主要优点是你能直接得到数据的多维图像。正如数据档案一样,利用专门为处理大量数据而设计的软件工具,可以在数据仓库中检索、询问和分析数据。

文章来源于《市场调研实务(原书第4版)》,作者是[英]伊冯娜·麦吉温(Yvonne McGivern)。

相关推荐

随时随地获取 调研家 观点

关注公众号

调研家,专业人士
都在用的调研平台

关注调研家公众号

随时随地了解问卷编辑、数据收集、数据分析干货分享

调研家,专业人士
都在用的调研平台

获取定制解决方案

《调研家服务协议》
已有账户 马上登录

提交成功

感谢您的申请,我们将在24小时内与您联系

知道了

调研家将为您提供

一对一专业服务,根据您的项目情况,为您定制专属解决方案

专业服务助您事半功倍
样本需求
项目定制
  • 请选择您的需求

  • 提交成功

    感谢您的申请,我们将在24小时内与您联系

    企微咨询顾问

    咨询电话

    188 2459 1379

    Copyright © 2023 SurveyPlus 瀚一数据科技(深圳)有限公司 粤ICP备18114013号 粤公网安备44030502004015号