A random variable is a variable whose value is determined by the outcome of a random event. It serves as a function that maps outcomes from a sample space to numerical values.
For example, if we roll a die, we can define a random variable X as the number that appears face up. In this case, X can take values 1, 2, 3, 4, 5, or 6, each with a probability of 1/6.
Mathematical Definition
\[ X: \Omega \rightarrow \mathbb{R} \]
Where \(\Omega\) is the sample space and \(\mathbb{R}\) is the set of real numbers.
The study of random variables involves understanding their distributions, which describe how probability is allocated across the possible values of the random variable.
Case Study: Customer Service Calls
A call center receives a random number of calls each hour. The manager wants to understand this randomness to better staff the center.
Problem:
A small business receives customer service calls throughout the day. Define a suitable random variable to model the number of calls received in a 1-hour period.
Solution:
Let's define a random variable \(X\) as "the number of customer service calls received in a 1-hour period."
This random variable has these characteristics:
It maps from the sample space (all possible call scenarios) to numerical values
It can only take non-negative integer values: 0, 1, 2, 3, ...
Each value has some probability of occurring
For practical use, the business might collect data over several weeks to estimate the probabilities:
\(x\) (number of calls)
0
1
2
3
4
5+
P(X = x)
0.15
0.30
0.25
0.15
0.10
0.05
With this probability distribution, the business can make informed decisions:
The most likely scenario is receiving 1 call per hour (30% probability)
There is a 45% chance of receiving 2 or more calls
They can plan staffing to ensure adequate coverage based on these probabilities
Pengenalan Peubah Acak
Peubah acak adalah variabel yang nilainya ditentukan oleh hasil dari peristiwa acak. Ini berfungsi sebagai fungsi yang memetakan hasil dari ruang sampel ke nilai numerik.
Sebagai contoh, jika kita melempar dadu, kita dapat mendefinisikan peubah acak X sebagai angka yang muncul menghadap ke atas. Dalam hal ini, X dapat mengambil nilai 1, 2, 3, 4, 5, atau 6, masing-masing dengan peluang 1/6.
Definisi Matematis
\[ X: \Omega \rightarrow \mathbb{R} \]
Di mana \(\Omega\) adalah ruang sampel dan \(\mathbb{R}\) adalah himpunan bilangan real.
Studi tentang peubah acak melibatkan pemahaman tentang distribusinya, yang menggambarkan bagaimana peluang dialokasikan di antara nilai-nilai yang mungkin dari peubah acak tersebut.
Studi Kasus: Panggilan Layanan Pelanggan
Sebuah pusat panggilan menerima jumlah panggilan acak setiap jam. Manajer ingin memahami keacakan ini untuk lebih baik dalam mengatur staf pusat.
Masalah:
Sebuah bisnis kecil menerima panggilan layanan pelanggan sepanjang hari. Tentukan peubah acak yang sesuai untuk memodelkan jumlah panggilan yang diterima dalam periode 1 jam.
Solusi:
Mari kita definisikan peubah acak \(X\) sebagai "jumlah panggilan layanan pelanggan yang diterima dalam periode 1 jam."
Peubah acak ini memiliki karakteristik berikut:
Memetakan dari ruang sampel (semua skenario panggilan yang mungkin) ke nilai numerik
Hanya dapat mengambil nilai bilangan bulat non-negatif: 0, 1, 2, 3, ...
Setiap nilai memiliki beberapa peluang untuk terjadi
Untuk penggunaan praktis, bisnis tersebut mungkin mengumpulkan data selama beberapa minggu untuk memperkirakan peluang:
\(x\) (jumlah panggilan)
0
1
2
3
4
5+
P(X = x)
0.15
0.30
0.25
0.15
0.10
0.05
Dengan distribusi peluang ini, bisnis dapat membuat keputusan berdasarkan informasi:
Skenario yang paling mungkin adalah menerima 1 panggilan per jam (peluang 30%)
Ada peluang 45% untuk menerima 2 atau lebih panggilan
Mereka dapat merencanakan staf untuk memastikan cakupan yang memadai berdasarkan peluang ini
Types of Random Variables
There are two main types of random variables:
Discrete Random Variables
A discrete random variable can take on a countable number of distinct values. Examples include:
Number of students in a class
Number of heads in 10 coin flips
Number of customers arriving at a store in an hour
\[ P(X = x) \geq 0 \text{ for all } x \]
\[ \sum_{x} P(X = x) = 1 \]
Continuous Random Variables
A continuous random variable can take on any value in a continuous range. Examples include:
Height of a randomly selected person
Time required to complete a task
Temperature at a specific location
\[ P(X = x) = 0 \text{ for all } x \]
\[ \int_{-\infty}^{\infty} f(x) dx = 1 \]
Key Differences
Feature
Discrete Random Variables
Continuous Random Variables
Values
Countable distinct values
Uncountable values in a range
Probability
Can have positive probability at individual points
Zero probability at any individual point
Distribution
Probability mass function (PMF)
Probability density function (PDF)
Case Study: Comparing Discrete and Continuous Variables
Case 1: Manufacturing Defects (Discrete)
A quality control engineer inspects 20 randomly selected products from a production line and counts the number of defects.
Problem: Model the number of defective products as a random variable.
Solution:
Let X = number of defective products in the sample of 20 items.
X is discrete because it can only take whole number values: 0, 1, 2, ..., 20
Each value has a specific probability P(X = x)
If the production line has a 5% defect rate, we can model X using a binomial distribution with n = 20 and p = 0.05
For example, the probability of finding exactly 2 defects would be:
So the probability of exactly 18 correct classifications out of 20 emails is about 25.01%. This information helps the email service provider understand the expected performance of their spam filter.
Case 2: Call Center Response Time (Exponential Distribution)
A call center tracks the time customers spend on hold before speaking with a representative.
Problem: If the average hold time is 3 minutes and follows an exponential distribution, what is the probability that a customer will wait less than 2 minutes?
Solution:
The exponential distribution is often used to model waiting times. For an exponential random variable X with rate parameter λ:
So the probability that a customer will wait less than 2 minutes is approximately 48.66%. This helps the call center set realistic expectations for customers and adjust staffing to meet service level targets.
Distribusi Peluang
Distribusi peluang menggambarkan bagaimana peluang didistribusikan di antara nilai-nilai peubah acak.
Fungsi Massa Peluang (PMF)
Untuk peubah acak diskret, kita menggunakan fungsi massa peluang (PMF).
\[ p(x) = P(X = x) \]
Sifat-sifat PMF:
\(p(x) \geq 0\) untuk semua \(x\)
\(\sum_{x} p(x) = 1\)
Fungsi Kepadatan Peluang (PDF)
Untuk peubah acak kontinu, kita menggunakan fungsi kepadatan peluang (PDF).
\[ f(x) = \lim_{\Delta x \to 0} \frac{P(x < X \leq x + \Delta x)}{\Delta x} \]
Jadi peluang tepat 18 klasifikasi benar dari 20 email adalah sekitar 25,01%. Informasi ini membantu penyedia layanan email memahami kinerja yang diharapkan dari filter spam mereka.
Kasus 2: Waktu Respons Pusat Panggilan (Distribusi Eksponensial)
Sebuah pusat panggilan melacak waktu pelanggan menunggu sebelum berbicara dengan perwakilan.
Masalah: Jika waktu tunggu rata-rata adalah 3 menit dan mengikuti distribusi eksponensial, berapa peluang bahwa seorang pelanggan akan menunggu kurang dari 2 menit?
Solusi:
Distribusi eksponensial sering digunakan untuk memodelkan waktu tunggu. Untuk peubah acak eksponensial X dengan parameter laju λ:
Jadi peluang bahwa seorang pelanggan akan menunggu kurang dari 2 menit adalah sekitar 48,66%. Ini membantu pusat panggilan menetapkan ekspektasi yang realistis bagi pelanggan dan menyesuaikan staf untuk memenuhi target tingkat layanan.
Distribution Function
The Cumulative Distribution Function (CDF) gives the probability that a random variable X is less than or equal to a particular value x.
\[ F(x) = P(X \leq x) \]
CDF for Discrete Random Variables
For a discrete random variable, the CDF is calculated as:
\[ F(x) = \sum_{t \leq x} p(t) \]
Properties:
\(0 \leq F(x) \leq 1\) for all \(x\)
\(F(-\infty) = 0\) and \(F(\infty) = 1\)
\(F(x)\) is non-decreasing
\(F(x)\) is right-continuous
\(P(a < X \leq b) = F(b) - F(a)\)
CDF for Continuous Random Variables
For a continuous random variable, the CDF is calculated as:
\[ F(x) = \int_{-\infty}^{x} f(t) dt \]
Properties:
\(0 \leq F(x) \leq 1\) for all \(x\)
\(F(-\infty) = 0\) and \(F(\infty) = 1\)
\(F(x)\) is non-decreasing
\(F(x)\) is continuous
\(f(x) = \frac{dF(x)}{dx}\) where \(f(x)\) is the PDF
Uses of the Cumulative Distribution Function
Finding probabilities of ranges: \(P(a \leq X \leq b) = F(b) - F(a)\)
Determining percentiles: If \(F(x) = p\), then x is the pth percentile
An insurance company models claim amounts using a probability distribution to assess risk and set premiums.
Problem: Historical data shows that auto insurance claims follow a lognormal distribution with parameters μ = 7.5 and σ = 1.2. The company wants to determine:
The probability that a claim will be less than $2,000
The 90th percentile of claim amounts (to set reserves)
Solution:
For a lognormal distribution with parameters μ and σ, the CDF is:
Studi Kasus: Menggunakan CDF dalam Penilaian Risiko
Jumlah Klaim Asuransi
Sebuah perusahaan asuransi memodelkan jumlah klaim menggunakan distribusi peluang untuk menilai risiko dan menetapkan premi.
Masalah: Data historis menunjukkan bahwa klaim asuransi mobil mengikuti distribusi lognormal dengan parameter μ = 7,5 dan σ = 1,2. Perusahaan ingin menentukan:
Peluang bahwa klaim akan kurang dari Rp2.000.000
Persentil ke-90 dari jumlah klaim (untuk menetapkan cadangan)
Solusi:
Untuk distribusi lognormal dengan parameter μ dan σ, CDF-nya adalah:
Jadi persentil ke-90 adalah sekitar Rp8.400.000, artinya 90% klaim diharapkan di bawah jumlah ini.
Implikasi praktis:
Perusahaan dapat menggunakan CDF untuk menetapkan harga polis dengan tepat, memastikan premi mencakup jumlah klaim yang diharapkan
Mereka dapat menetapkan cadangan sebesar Rp8.400.000 per polis untuk menutupi 90% potensi klaim
Untuk pertanggungan katastropik, mereka mungkin melihat persentil yang lebih tinggi (mis., ke-95 atau ke-99)
Memahami distribusi membantu dengan keputusan reasuransi untuk klaim yang sangat besar
Interactive Examples
Experiment with different probability distributions to better understand their properties.
Binomial Distribution Simulator
The binomial distribution models the number of successes in a fixed number of independent trials, each with the same probability of success.
10
0.5
Probability Mass Function
Cumulative Distribution Function
k =
Result will appear here
k =
Result will appear here
Normal Distribution Simulator
The normal distribution is a continuous probability distribution that is symmetric about the mean, showing that data near the mean are more frequent than data far from the mean.
0
1
Probability Density Function
Cumulative Distribution Function
a =b =
Result will appear here
Contoh Interaktif
Bereksperimen dengan berbagai distribusi peluang untuk lebih memahami sifat-sifatnya.
Simulator Distribusi Binomial
Distribusi binomial memodelkan jumlah keberhasilan dalam sejumlah percobaan independen dengan probabilitas keberhasilan yang sama.
10
0.5
Fungsi Massa Peluang
Fungsi Distribusi Kumulatif
k =
Hasil akan muncul di sini
k =
Hasil akan muncul di sini
Simulator Distribusi Normal
Distribusi normal adalah distribusi peluang kontinu yang simetris terhadap mean, menunjukkan bahwa data di dekat mean lebih sering terjadi daripada data yang jauh dari mean.
0
1
Fungsi Kepadatan Peluang
Fungsi Distribusi Kumulatif
a =b =
Hasil akan muncul di sini
Test Your Knowledge
Answer the following questions to test your understanding of random variables and probability distributions.
Question 1:
In a discrete uniform distribution with outcomes {1, 2, 3, 4, 5, 6}, what is P(X = 4)?
A) 1/3
B) 1/4
C) 1/6
D) 1/2
Explanation: In a discrete uniform distribution, all outcomes have the same probability. Since there are 6 possible outcomes, P(X = 4) = 1/6.
Question 2:
For a continuous random variable X, what is P(X = c) for any specific value c?
A) 1
B) 0
C) 0.5
D) It depends on the value of c
Explanation: For a continuous random variable, the probability of any specific point is always 0. This is because continuous random variables can take uncountably infinite values in an interval, and we calculate probabilities using integrals over ranges rather than sums of individual points.
Question 3:
In a binomial distribution with n = 10 and p = 0.2, what is the expected value (mean) of X?
A) 2
B) 0.2
C) 10
D) 5
Explanation: For a binomial distribution, the expected value (mean) is E[X] = n·p = 10 × 0.2 = 2. This represents the average number of successes we expect in 10 trials with a success probability of 0.2.
Question 4:
If F(x) is the cumulative distribution function (CDF) of a random variable X, which of the following is NOT a property of F(x)?
A) 0 ≤ F(x) ≤ 1 for all x
B) F(x) is non-decreasing
C) F(-∞) = 0 and F(∞) = 1
D) F(x) must be a continuous function for all random variables
Explanation: Option D is NOT a property of all CDFs. While the CDF of a continuous random variable is continuous, the CDF of a discrete random variable is typically a step function with jumps at the points where the random variable has positive probability. The other properties (A, B, and C) are valid for all CDFs.
Question 5:
A normal distribution has a mean of 70 and a standard deviation of 5. Approximately what percentage of values falls within the range [65, 75]?
A) 50%
B) 68%
C) 95%
D) 99.7%
Explanation: The range [65, 75] corresponds to [μ-σ, μ+σ], or one standard deviation on either side of the mean. According to the 68-95-99.7 rule (empirical rule) for normal distributions, approximately 68% of values fall within one standard deviation of the mean.
Your score:
Uji Pengetahuan Anda
Jawab pertanyaan berikut untuk menguji pemahaman Anda tentang peubah acak dan distribusi peluang.
Pertanyaan 1:
Dalam distribusi seragam diskret dengan hasil {1, 2, 3, 4, 5, 6}, berapakah P(X = 4)?
A) 1/3
B) 1/4
C) 1/6
D) 1/2
Penjelasan: Dalam distribusi seragam diskret, semua hasil memiliki peluang yang sama. Karena ada 6 kemungkinan hasil, P(X = 4) = 1/6.
Pertanyaan 2:
Untuk peubah acak kontinu X, berapakah P(X = c) untuk nilai spesifik c apa pun?
A) 1
B) 0
C) 0,5
D) Tergantung pada nilai c
Penjelasan: Untuk peubah acak kontinu, peluang titik spesifik mana pun selalu 0. Ini karena peubah acak kontinu dapat mengambil nilai tak terhitung dalam interval, dan kita menghitung peluang menggunakan integral pada rentang daripada jumlah titik individu.
Pertanyaan 3:
Dalam distribusi binomial dengan n = 10 dan p = 0,2, berapakah nilai harapan (mean) dari X?
A) 2
B) 0,2
C) 10
D) 5
Penjelasan: Untuk distribusi binomial, nilai harapan (mean) adalah E[X] = n·p = 10 × 0,2 = 2. Ini mewakili jumlah rata-rata keberhasilan yang kita harapkan dalam 10 percobaan dengan peluang keberhasilan 0,2.
Pertanyaan 4:
Jika F(x) adalah fungsi distribusi kumulatif (CDF) dari peubah acak X, manakah dari berikut yang BUKAN sifat dari F(x)?
A) 0 ≤ F(x) ≤ 1 untuk semua x
B) F(x) tidak menurun
C) F(-∞) = 0 dan F(∞) = 1
D) F(x) harus merupakan fungsi kontinu untuk semua peubah acak
Penjelasan: Opsi D BUKAN sifat dari semua CDF. Meskipun CDF dari peubah acak kontinu adalah kontinu, CDF dari peubah acak diskret biasanya merupakan fungsi tangga dengan lompatan pada titik-titik di mana peubah acak memiliki peluang positif. Sifat-sifat lainnya (A, B, dan C) berlaku untuk semua CDF.
Pertanyaan 5:
Sebuah distribusi normal memiliki mean 70 dan deviasi standar 5. Kira-kira berapa persentase nilai yang jatuh dalam rentang [65, 75]?
A) 50%
B) 68%
C) 95%
D) 99,7%
Penjelasan: Rentang [65, 75] sesuai dengan [μ-σ, μ+σ], atau satu deviasi standar di kedua sisi mean. Menurut aturan 68-95-99,7 (aturan empiris) untuk distribusi normal, sekitar 68% nilai berada dalam satu deviasi standar dari mean.