免费学习 · 零基础可懂

把统计讲成“看一眼就懂”的工具

这里不是考试用的统计学,而是让工程/生产/质量人员真正能用上的统计工具。 你只需要看懂:什么在变、变得多厉害、是不是“真的改善”。

你遇到的问题,我们用统计解决

良率波动大

今天好、明天差,没人说得清原因。

先用标准差与分布看“波动有多大”。

改善方案不确定

改了参数,真的变好了吗?

用抽样误差/样本量判断“是否可信”。

规格总是踩线

过程能力不足,交付风险高。

用 Cp/Cpk 看“能不能稳定满足规格”。

互动概念区:拖一拖就懂

把抽象概念变成直观感觉。

统计基础

标准差:波动有多大

拖动滑条,看“波动”如何影响稳定性。

较稳定
估算良率(规格±10):59.5%

均值 / 中位数 / 众数

拖动异常值,看三者差别。

中心位置
均值 53.0中位数 50.0众数 50
结论:异常值主要拉动均值。

异常值:1 个极端点会扭曲均值

拖动“异常值”,看均值和中位数怎么变。

异常值敏感
均值 53.0中位数 50.0
结论:均值很“脆”,中位数更稳。

方差 vs 标准差

方差是“平方单位”,标准差才是原单位。

σ²=16
结论:标准差更直观,方差更便于计算。

分布与正态

正态 vs 非正态

不同分布形状会影响“是否能用正态假设”。

正态
结论:非正态数据下,很多检验结论会失真。

Q-Q 直觉:点是否贴直线

偏离直线 = 非正态。

偏离程度 0.0

直方图分箱

分箱不同,形状直觉会变化。

8 bins

偏态 / 峰度

偏斜改变左右,峰度改变尖/平。

形状调节

分布:数据是“钟形”还是偏斜

偏斜会让异常值更集中,风险更高。

形状感知
提示:偏斜分布会让“坏点”更集中,质量风险更难预估。

正态不满足怎么办?

非参数检验更稳:Mann-Whitney / Kruskal-Wallis。

更适合非参数检验

抽样与判断

抽样误差:样本小 ≠ 真相

样本越小,结论越不稳定。

置信区间
误差范围(±)≈ 6.20
结论:样本越大,误差越小,判断越可靠。

样本均值:样本越大越稳

均值会跳,但样本越大跳得越小。

中心极限定性
结论:样本越大,均值越稳定。

是否真的改善?

效果越大、样本越多,结论越可信。

证据不足
估算 p 值:0.248 | 效果差异:2.0
结论:样本太少时,差异很可能只是运气。

置信区间覆盖率

抽样多次,看区间是否覆盖真值。

覆盖率 100%

检验效能(Power)

样本越大、效果越大,越容易检出。

Power 53%
结论:低功效时,容易漏掉真实差异。

Bootstrap 均值分布

重复抽样看均值稳定性。

抽样 80
区间: 46.8 ~ 56.7

效应量(Cohen's d)

差异 ÷ 波动,才是“有多大差”。

d 0.67

假设检验:选对工具

不同问题对应不同检验方式。

均值差异(t 检验)
使用场景:比较两组均值差异(如改参数前后均值)。

定性与流程

SIPOC 速写

把流程从供应商到客户一图拉通。

一眼看流程
点击卡片切换候选项

VOC → CTQ

客户语言翻译成可量化指标。

优先级 3
CTQ: 周期≤48h
衡量: 交期达成率

鱼骨图分类

人机料法环测,快速全覆盖。

根因池
: 待补充
: 待补充
: 待补充
: 待补充
: 待补充
: 待补充

5 Whys 追问

问到“可行动的根因”。

深度 3
1. 问题出现
2. 因为工艺波动
3. 因为温湿控制弱

FMEA 风险优先级

严重度×发生度×检出度。

RPN 120

变更阻力地图

支持度 × 影响力,找关键人。

干系人
生产主管
质检
设备
财务

项目落地与控制

项目章程(可执行性)

范围/影响/周期平衡。

可行度 3.7
范围 3/10
影响 4/10
周期 6

收益评估(期望值)

收益×成功率−成本。

EV 8.0

控制计划覆盖率

关键控制点是否被监控。

覆盖 60%

SOP 标准化清单

清单越完整,复发越少。

完成 2/5

风险缓解

风险-措施=残余风险。

残余 2

偏差与测量

抽样偏差

只看“方便样本”,均值会被拉偏。

偏差 8.0
真实均值 50 vs 抽样均值 58.0

幸存者偏差

只看“活下来”的结果会高估表现。

幸存 3
全部均值 49.4 vs 幸存均值 57.1

MSA / Gage R&R

测量波动占比越大,数据越不可信。

R&R 53%
R&R 5.0 / 总波动 9.4

建模直觉

同方差 vs 异方差

波动随 X 增大=异方差。

异方差

贝叶斯直觉

先验强度越大,越“难被证据拉走”。

后验 0.59
先验 0.30 · 证据 0.70

相关与因果

相关 ≠ 因果

共同原因会制造“看似相关”的假象。

相关系数 0.77
结论:相关高,不一定是因果关系。

控制变量前后

控制混杂后,相关更可信。

相关 0.89

时间序列“伪相关”

同一趋势会制造高相关。

相关 1.00

回归线与噪声

斜率越大、噪声越小,关系越清晰。

相关 0.89

过程稳定

控制图:偏移一出现就能抓到

把“偏移量”拉大,看看失控点出现。

过程稳定
结论:一点点系统性偏移,也会被控制图捕捉。

CUSUM 累积偏差

小偏移累积后会被放大。

偏移明显

CUSUM 报警线

跨过阈值就报警。

阈值 ±25

EWMA 平滑控制

λ 越大,越敏感;越小,越平滑。

λ 0.30

EWMA 报警线

λ 决定报警线收紧速度。

UCL 55.0

过程能力:能不能稳定满足规格

Cpk < 1 = 基本不稳定,交付风险高。

能力不足
Cp: 0.83 | Cpk: 0.83

DOE 实验设计

全因子:看主效应+交互

A、B 组合不同,响应差很多。

响应 49.0
A -1 / B -143.0
A 1 / B -149.0
A -1 / B 145.0
A 1 / B 163.0

部分因子:省次数,但会混淆

次数减少,代价是效果被“别的因子”混在一起。

运行数 8
混淆关系:AB 与 CD 混在一起

主效应图(直觉版)

线越陡,因子影响越大。

主效应

交互效应图

线不平行 = 有交互。

交互明显

混淆矩阵(别名)

部分因子会把效应“混在一起”。

1/2 设计
A≈BCD
B≈ACD
C≈ABD
D≈ABC

区组效应(Blocking)

把批次差异隔离出来。

差异 6.0
区组 A 均值 58.5
区组 B 均值 52.5

响应曲面

响应曲面与爬坡实验

Response Surface & Steepest Ascent

当前实验点

类型中心点
X₁ (温度)0
X₂ (时间)0
响应值 Y60

序贯实验流程

1筛选实验 (2^k)
2爬坡实验 (最速上升)
3优化实验 (CCD/BB)

爬坡路径 (X₁ × X₂)

响应值趋势

响应面等高线图

低响应
中等
较高
高响应

响应曲面等高线

拖动点,看响应变化。

响应 73.7

田口设计

田口方法 (Taguchi)

Robust Parameter Design - 稳健参数设计

正交表信息

正交表L9
实验次数9
因子数3
水平数3

最优参数组合

因子 A
SN=39.7dBL3
因子 B
SN=44.0dBL2
因子 C
SN=43.3dBL2
预计总信噪比42.3 dB

田口理念

  • 离线质量控制
  • 稳健性设计
  • 减少变异
  • 信噪比最大化

正交表

RunABC
1111
2122
3133
4212
5223
6231
7313
8321
9332

信噪比响应图

因子 A
因子 B
因子 C

信噪比计算公式

望大特性
SN = -10 log(1/n Σ(1/y²))
如:强度、产量
望小特性
SN = -10 log(1/n Σy²)
如:缺陷、噪音
望目特性
SN = -10 log(Σ(y-m)²/n)
如:尺寸、电压

田口信噪比

信号越大、噪声越小,S/N 越高。

S/N 2.5

混料设计

混料设计:配比决定结果

三种原料比例相加必须等于 100%。

响应 71.4
A 40% · B 30% · C 30%
ABC

方差分析

方差分析:组间差异大不大?

组间差异越大、组内波动越小,结论越明显。

F≈4.0
结论:组内越稳、组间越分开,越可能显著。

把“学不会”变成“立刻能用”

全部免费,直接用交互把抽象概念变成直觉。