数据就是数字化的证据和依据,是事物存在和发展状态或者过程的数字化记录,是事物发生和发展留存下来的证据。

2025.06 湖南·长沙·黄花国际机场

概述篇

企业中的大数据

企业留存和积累的数据越多就越有价值。这些数据一方面可以当作证据,另一方面也可以用来研究规律,成为企业预测未来市场、形成商业洞察的依据。数据的依据价值远远大于其证据价值。

数据技术

  1. 数据采集技术
  2. 数据存储技术
  3. 数据传输技术
  4. 数据处理和数据挖掘技术

如果不能从数据中提取信息用于管理决策,那么采集的数据只会成为企业的成本;如果能够充分发挥数据的力量,在数据中挖掘价值,那么数据就会成为企业的资产。

数据分类

  1. 静态数据表示结果,动态信息表示行为
  2. 加工数据是在原始数据解读基础上的提炼,强调追溯机制
  3. 数据类型
    1. 定性数据
    2. 定序数据
    3. 定距数据
    4. 定比数据

数据结构

数据结构是存储\组织数据的方式,是数据内部的构成方式.数据结构是指数据元素之间存在着一种或多种关系.

  1. 数据的逻辑结构
    1. 数据主体
    2. 数据表
    3. 一条数据
    4. 字段
  2. 数据的存储结构
  3. 数据的运算结构

数据质量

  1. 准确性
  2. 精确性
  3. 真实性
  4. 及时性
  5. 即时性
  6. 完整性
  7. 全面性
  8. 关联性

数据处理

脏数据
  1. 数据不规范
  2. 数据不一致
  3. 标准不统一
  4. 格式不标准
  5. 附加字段
数据杂质
数据噪声
数据清洗
  1. 基本原则:永远给自己留下反悔的余地
  2. 最有效方法: 规范数据采集和数据记录,从源头把控数据质量
  3. 最有效率的有效手段:程序化方法

数据分析的目的

数据分析的目的是为了对过去发生的现象进行评估和分析,找寻事物存在的证据,并在这个基础上对未来事物的发生和发展做出结论并形成能够指导未来行为的知识或者依据.

  1. 数据是数字化的证据:没有记录下来的事情就没有发生过
  2. 追溯:追责、求根源、求真相
  3. 监控:监督、检查、评估、监控、检测
  4. 洞察:探寻规律,掌握发展的钥匙
  5. 商机:挖掘未被满足的需求
  6. 预测:指导未来实践的规律

数据分析的思路

先总后分,逐层拆解

先总后分的分析思路是所有数据分析工作的基础

抽丝剥茧,寻踪问迹

  1. 关注细节
  2. 关注奇异点

必须要追求因果关系,必须要追求现象背后的逻辑关系,这样我们才能从数据中产生智慧。

内涵外延,概念清晰

可视化作图(按照认知规律作图展示)

  1. 散点图
  2. 气泡图
  3. 线图
  4. 柱形图
  5. 面积图
  6. 雷达图
  7. 组合图

识图方法

  1. 辅助线
  2. 找差异、找变化
  3. 找奇异点、特殊群体
  4. 找转折点和拐点
  5. 找特征
  6. 找问题(4W1H)
  7. 找源头
  8. 找关系
  9. 找驱动(A/B测试)
  10. 找规律

管理常识是数据分析的基础

数据分析是用数据来解读商业的逻辑和规律,并对现有的认知进行再次修订的过程。

  1. 经济学常识
  2. 管理学常识
  3. 社会心理学常识

方法篇

对比与对标

对比是识别事物的基本方法

  1. 差异是有原因的,而相同也是有原因的
  2. 数据分析师要从“安全感”中走出来

横向、纵向及对维度对比

  1. 对比的三个要素:主体、客体、度量
  2. 要避免被别人左右比较基准,同时也要利用心理学方法提高对比的认知度

比值比率后面的逻辑

  1. 数据分析师要设计指标来对比,通过指标指数模型来寻找逻辑关系
  2. 丰富的管理指标,会影响企业管理文化和管理体系

对标的层次和维度

通过比较,我们才能发现各种变化,从变化中追踪到事物变化的轨迹,找到问题的根源,从而找到事物发展的规律。这个过程叫做对标。

对标对象
  1. 与自己比
  2. 与别人比
对标维度
  1. 规模指标
  2. 速度指标
  3. 效率指标
  4. 效益指标
  5. 综合指标

标杆管理与榜样的力量

设定标杆的基本功能:目标激励并找到达成目标的路径。

分类是认知事物的基本方法

分类的概念

分类是由分和类组成,其本质就是把事物分开,归到不同类别中并分别识别,从而获得对事物的重新认知。

RFM模型

分类的标准就是分类的维度,一个分类维度叫做单维度,两个分类维度叫做矩阵,三个分类维度就形成了魔方。

解构事物的三要素:要素、属性和行为

解构与结构相对而言,把事物拆解开叫做解构,将事物按照一定配比关系组合在一起叫做结构。

  1. 要素:构成事物的组成部分
  2. 属性:事物自身的特征或者特性
  3. 行为:因为事物构成要素和属性,事物会具有行为上的特征

要通过要素、属性和行为的解构方法来练习解构企业的数据地图。

  1. 维度分类法
  2. 属性分类法
  3. 流程分类法(客户决策漏斗模型)
  4. 层级分类法
  5. 分类中权重设定问题(权重代表重要程度)

聚类:寻找规律的第一步

聚类就是把分散的多个事物归集成不同的类别。分类从整体出发,而聚类从每个事物的具体细节出发。

聚类的基本逻辑

针对复杂的问题,一般采用聚类算法来实现对事物或者对象的聚类。

聚类可以是对对象的的聚类,也可以是对对象的描述属性的聚类。针对描述事物的变量的聚类称为R型聚类,让具有相似性的变量聚集为一类。另一类叫做Q型聚类,它是根据对象的各种属性值对对象进行的聚类。

聚类的因子和主成分

聚类的维度之间需要减少相关性的干扰。当相关性较高时,可以采用主成分分析方法,将不同的聚类变量合并为相互不相关的银子。

聚类的算法决定着聚类的效率。

聚类的步骤

  1. 确定聚类的标准变量
  2. 标准化事物的描述变量
  3. 评价事物之间的相似性(差异性)如何计算
  4. 设计聚类的算法或者程序
  5. 计算类之间的差异性以及保证类与类之间的距离最大化
  6. 聚成多少个类更加核实?不同数量的聚类之间有什么不同?
  7. 解读聚类后的事物分类以及描述每一个类别
  8. 验证聚类结果并应用到实际工作中
  9. 持续在实践中检验,对业务以及效果进行评估
  10. 算法的改进和调整

有序聚类与时间序列聚类

如果只有单一维度的变量,则可以把该变量放到图形化的时间轴上,从而可以看到事物的阶段性特征。当描述变量非常多时,或者事物本身就比较复杂时,就需要利用聚类的方法来划分事物发展的历史阶段。

逻辑关系:寻找事物之间的因果规律

数据分析的核心目的是掌握事物的发展规律。

相关性与相关系数分析

事物之间的相关性并非说明因果关系。寻求事物之间的因果关系是我们掌控事物发展的手段。

我们可以通过计算相关系统的方式来衡量两个事物之间的逻辑关系强弱。

事物之间的逻辑关系与科学规律

事物之间存在着逻辑关系。

事物之间的关系会随着环境的变化而发生变化。

果因关系与因果关系

通过果因关系,构建数学模型,用数据量化影响结果的因素,就能够探索出事物的因果关系,从而得到量化的因果关系,从而让企业的管理更加理性化、科学化、数据化。

事物发展规律的复杂性与科学抽象

科学抽象是数据分析的核心思想之二。我们在研究事物时,需要将事物的发展抽象出来,利用科学的思维方法来研究事物,从而构建数学模型。

社会学、经济学和管理学与自然科学本质的区别在于研究事物的时候会容许更大的误差、更大的偏差,容忍更多的未知。

因果关系与回归分析

在了解事物之间可能存在的逻辑关系之后,就可以采用量化的方法来评价这种逻辑关系的强弱。

逻辑回归

关联与共生

数据只能告诉我们现象,却无法告诉我们原因。事物之间有些是因果关系,有些是共生关系,在进行数据分析时都体现为相关关系。

预测:数据分析的终极目标

预测是数据分析的终极目的

数据分析最重要的目的就是从数据中寻找规律,找到能够指导我们未来实践的原则和方法,它是产生智慧的主要途径。所以预测分析是数据分析的终极目的。

预测包括现象的预测和规律的预测。

预测的必要性和误差的必然性

事物是复杂的,我们对事物的认知是有限的,正因如此,事物在发展的过程中会发生超越我们预期的偶然事件和随机事件,我们把这些叫做误差,误差是必然存在的。随着我们对事物的认知越清楚,掌握的信息数据越完善,这个误差就会越小,偶然事件就会越少。

掌控未来发展是人类的本能,也是人类进化的动力。

  1. 经验法
  2. 类比法
  3. 惯性法
  4. 逻辑关系法

结构:事物组成的配方

解构与结构

一个组织在不同的结构下会成为不同的而组织。

一家企业组织力量的配置,决定了其优势所在。

结构关系影响着事物的根本属性

事物的构成方式决定着事物的本质属性,结构不同决定了最终事物也不同。

结构不是单纯的组合关系,而是组合后的相互关系。。

只有真正的交互相容,才能够称为结构关系。

结构的基准

事物的结构是有基准的,我们的常识是事物结构最初步的基准。

只有超越预期的方案才是更好的方案。组织变革不仅仅是一个数字游戏,更是一个心理游戏。

关键要素与非关键要素

每个人都应该认清自己岗位的职责,要寻找优化的最佳路径,而不是以其他部门的问题为借口。

在销售环节,产品的品质不是关键要素,对客户需求的深度理解,不靠过度承诺来获取客户芳心才是销售部门的核心能力。

最佳组合

  1. 运筹学的应用
  2. 资源有限情况下,通过合理配置让产出最大化
  3. 产出确定情况下,通过合理配置让资源投入最小化
  4. 在给定的约束条件下,将需要解决的最优问题构筑成方程来求最优解
  5. 规划求解的算法原理一般是用迭代的方式来尝试,直到尝试出最优解

结构化效率分析

  1. 人机料法环模型
  2. 模型的逻辑架构能够帮助我们更好查找问题
  3. 需要积累各种模型,进行定制化的设计,形成管理工具库和知识库

应用篇

略……