专业人士都在用的调研平台

数据仓库里的数据组织

调研家SurveyPlus
2021-10-08

1.建立一个数据仓库
数据可以从叫作运营区(operational field)的地方输入数据仓库,例如,从销售点的交易扫描数据,从信用卡交易的支出,从射频识别电子标签,从公司网站和社交媒体网站,或从地理人口信息系统。在以前的数据仓库中,它们被叫作信息区(informational field)。收入数据仓库的数据需要有好的质量:信息是未加工的,将要用来支持重要的管理决策,任何错误和不一致都会影响决策的质量。在发送数据之前,整理数据是一个好习惯,这样可以确保数据的正确性和完整性。还有,采用的术语和变量、编码的方式等应该一致,以便使数据可以与数据仓库中的其他数据完全整合或融合一起。此外,只有与决策支持系统相关联的数据才应被送进数据仓库中。不相关的或没必要的数据会阻塞系统以及增加输入和处理的时间。随着数据自动送入数据仓库系统,数据就不断地增加,于是决定什么数据是相关联的和必要的将变得很困难。在系统中添加一个程序可以用来过滤掉无关联的和不必要的数据。当然,程序员应该设置好这些参数。

2.数据仓库里的数据组织
数据仓库的最终用途是叙述它是怎样构造的以及数据在内部是怎样组织的。数据应该以这样的方式储存和组织,即能够让分析人员从相互关联的视角看待数据,例如,以消费者类型、品牌或市场为依据。当前数据和历史数据应该以某种方式被保存,这种方式有助于更快地获取经常使用的当前数据,但能对旧数据进行提取以进行比较,这样做可以检测趋势或进行预测。实际上,数据仓库是一个多维的结构,包含很多架构和空间。在数据仓库内,不同的数据可以保存在不同的架构或空间中。


数据仓库包含那些告知使用者关于仓库结构的信息,以及如何在数据仓库内的架构和空间中搜索信息,这样的信息叫作“元数据”(meta data)。除了数据仓库的地图,它还发挥目录列表的作用,为使用者提供关于数据仓库中数据库或数据集的详细内容,它们的基本要素,以及这些要素是怎么与数据仓库中其他数据集的要素相关联的。数据仓库中的数据可以改变(改变编码和格式),还有它们能以不同的详细程度存于数据仓库中——从“详细”到清晰总结,再到高度概括。元数据还给使用者这样的信息——告诉他们数据是怎么改变的,做什么改变能使它们相一致,数据是在什么基础上被概括的。
设计优良的数据仓库具有以下重要特点:

・可以存储数量不断增加的数据,且不影响数据处理性能;
・对用户友好;
・在哪里都能访问它;
・很多用户能同时使用,而对处理速度的影响很小;
・有利于从不同视角分析数据;
・分析和反应系统速度快,搜索不影响问题的思考。

文章来源于《市场调研实务(原书第4版)》,作者是[英]伊冯娜·麦吉温(Yvonne McGivern)。

相关推荐

随时随地获取 调研家 观点

关注公众号

调研家,专业人士
都在用的调研平台

关注调研家公众号

随时随地了解问卷编辑、数据收集、数据分析干货分享

调研家,专业人士
都在用的调研平台

获取定制解决方案

《调研家服务协议》
已有账户 马上登录

提交成功

感谢您的申请,我们将在24小时内与您联系

知道了

调研家将为您提供

一对一专业服务,根据您的项目情况,为您定制专属解决方案

专业服务助您事半功倍
样本需求
项目定制
  • 请选择您的需求

  • 提交成功

    感谢您的申请,我们将在24小时内与您联系

    企微咨询顾问

    咨询电话

    188 2459 1379

    Copyright © 2023 SurveyPlus 瀚一数据科技(深圳)有限公司 粤ICP备18114013号 粤公网安备44030502004015号