连续概率分布

连续概率分布是显示连续随机变量的频率和相对频率的表格。 回想一下,连续随机变量可以在一个或多个区间内取任何值。 例如,假设学生有 60 分钟的时间完成考试。 学生完成测试所需的时间可以在一个间隔内取任何值,例如 45 分钟到少于 46 分钟的间隔或 [45, 46].
假设一所大学的所有 4000 名学生都参加了数学考试。 还假设我们有以下频率和相对频率分布 学生完成考试所需的时间
学生完成测试所需的时间(以分钟为单位)或 x | F | 相对频率 |
45 到 46 以下 | 80 | 0.02 |
46 至 47 以下 | 200 | 0.05 |
47 至 48 以下 | 600 | 0.15 |
48 至 49 以下 | 1600 | 0.4 |
49 到 50 以下 | 600 | 0.15 |
50 到 51 以下 | 500 | 0.125 |
51 至 52 以下 | 300 | 0.075 |
52 到 53 以下 | 120 | 0.03 |
N = 4000 | 总和 = 1 |
下面,我们展示了一个直方图和一个连续随机变量 x 的概率分布曲线的近似值。 该曲线也称为概率密度函数。 如果您尝试显示 4000 名学生(或总体)完成测试所用的时间,这就是曲线的大致样子。 这不是一个完美的图表!
你注意到连续概率分布的以下特征了吗?
一种。 x 可以取的所有区间的总概率等于 1。
湾。 47 和 48 之间的正态曲线下区域的形状几乎像梯形。 法线曲线下的面积与矩形的面积相同。 这是因为绿色矩形的面积与蓝色矩形的面积相同。
因此,我们可以通过寻找曲线下的面积来估算完成测试用时 45 分钟到不到 46 分钟的学生的百分比。 在我们的示例中,这不是必需的,因为我们可以通过矩形的面积找到它。
矩形的高度 = 0.15 和宽度 = 1
面积 = 0.15 乘以 1 = 0.15 = 15%
C。 任意两点之间的曲线下面积在 0 和 1 之间,它是这两个点之间概率的度量,如下所示。

d。 连续随机变量取单个值的概率始终为零。 这是有道理的,因为单个值不会创建区域。
使用我们之前的示例 P(x = 47) = 0。正如您所见,x = 47 只是一条线,因此没有面积,因此没有概率。
一般来说,如果 a 和 b 是 x 可以取的两个值,则 P(a) = 0 和 P(b) = 0
那么我们可以得出以下结论。
对于连续随机变量,P(a ≤ x ≤ b) = P(a < x < b)