数据分析概览
数据分析是标识、清除、转换和建模数据的过程,用于发现有意义和有用的信息。 然后通过报表将数据制作成故事进行分析,支持关键的决策过程。
分析的核心部分类别:说明性、诊断性、预测性、规范性、认知性
描述性分析
描述性分析有助于根据历史数据回答有关发生了什么的问题。 描述性分析技术汇总了大型语义模型,向利益干系人描述结果。 描述性分析的示例包括生成报表来提供组织销售和财务数据的视图。
通过开发关键绩效指标 (KPI),这些策略有助于跟踪关键目标的成功或失败情况。 许多行业都使用了投资回报率 (ROI) 等指标,某些行业还开发了专门用于跟踪性能的指标。
诊断分析
诊断分析有助于解答事件发生原因相关问题。 诊断分析技术是对基本描述性分析的补充,通过使用描述性分析的结果来发现这些事件发生的原因。
诊断步骤
- 确定数据中的异常。 这些异常可能是指标或特定市场中发生的意外变化。
- 收集与这些异常相关的数据。
- 使用统计技术来发现用以解释这些异常的关系和趋势。
预测分析
预测分析有助于回答有关将来会发生什么的问题。 预测分析技术使用历史数据来确定趋势并确定它们是否有可能重复出现。 预测分析工具提供将来可能发生什么的有价值见解。
技术包括各种统计和机器学习技术,例如神经网络、决策树和回归。
规范性分析
规范性分析有助于回答应采取哪些措施来实现目标的问题。 通过使用来自规范性分析的见解,组织可基于数据制定决策。
规范性分析技术依赖于机器学习作为在大型语义模型中寻找模式的策略之一。 通过分析过去的决策和事件,组织可以估计不同结果的可能性。
认知分析
认知分析尝试从现有数据和模式中进行推断,并基于现有知识库得出结论,然后将这些结果添加回知识库,以供将来进行推断,这是一个自学习反馈循环。 认知分析有助于了解如果情况发生变化可能发生什么,以及确定如何处理这些情况。 推断不是基于规则数据库的结构化查询,而是从多个源收集的非结构化假设,并以不同的置信度表示。 有效的认知分析取决于机器学习算法,并使用多种自然语言处理概念来利用以前未使用过的数据源,例如呼叫中心对话日志和产品评审。
总结
数据分析的一个基础就是企业需要信任其数据。 数据分析过程的一个实践方案是捕获来自可信来源的数据并将其转化为可使用、有意义且易于理解的内容,用于帮助决策制定过程。 通过数据分析,企业可以借助数据驱动的过程和决策来充分了解其数据,使企业能够放心地做出决策。
数据中的角色
业务分析师
数据分析师与业务分析师之间存在一些相似之处,但这两个角色之间的主要区别在于他们用数据来干什么。业务分析师离业务更近,是解释来自可视化效果的数据的专家。 通常,数据分析师和业务分析师的角色由单人承担。
数据分析师
数据分析师使企业可以通过可视化和报告工具来最大限度地提高数据资产的价值。 数据分析师负责分析、清除和转换数据。 此外,还负责设计和构建可缩放的高性能语义模型,在报表中启用和实现高级分析功能,用于分析报表。 数据分析师会与相关利益干系人合作来确定合适且必要的数据和报表要求,然后将原始数据转换为相关且有意义的见解。
数据分析师与数据工程师合作,确认并找到满足利益干系人要求的合适数据源。 此外,数据分析师需要与数据工程师和数据库管理员协作,确保分析师能够正确访问所需的数据源。 数据分析师还与数据工程师合作来确定新的流程,或改善现有流程来收集数据以供分析。
数据工程师
预配和设置本地和云中的数据平台技术。使用的数据平台可以包括关系数据库、非关系数据库、数据流和文件存储。确保数据服务安全且无缝地跨数据平台进行集成。
数据工程师的主要职责包括使用本地和云数据服务和工具来引入、传出和转换来自多个源的数据。
数据科学家
数据科学家执行高级分析,以从数据中提取价值。 描述性分析通过称为探索性数据分析 (EDA) 的过程来评估数据。 预测分析用于机器学习,以应用可以检测异常或模式的建模技术。 可能涉及深度学习领域,需要反复尝试使用自定义算法来解决复杂的数据问题。
数据库管理员
数据库管理员监视和管理数据库及其所在的硬件的总体运行状况。 数据库管理员负责管理数据的总体安全性,根据业务需要和要求授予和限制用户对数据的访问权限和特权。