\(~~~~~~~~~\)Probability and Statistics\(~~~~~~~~~\)
หัวข้อ ความน่าจะเป็น

อ.ดร. สมศักดิ์ จันทร์เอม

วิทยาลัยนานาชาตินวัตกรรมดิจิทัล มหาวิทยาลัยเชียงใหม่

8 มกราคม 2569

สัญชาตญาณ vs คณิตศาสตร์
🤔 vs 📐

ทำไมความรู้สึกถึงเชื่อถือไม่ได้?

🚪 Monty Hall Game

ขั้นตอนที่ 1: แบ่งทีม (ก่อนเปิดประตู)

ตอนเริ่มเกม มีประตู 3 บาน สมมติคุณเลือก ประตูเบอร์ 1 ให้มองว่าเราแบ่งประตูออกเป็น 2 ทีมทันทีครับ:

  • 🟦 ทีมของคุณ (ประตู 1): มีสมาชิก 1 บาน = โอกาสชนะ 1/3 (33%)

  • 🟥 ทีมคนอื่น (ประตู 2 และ 3): มีสมาชิก 2 บาน = โอกาสชนะ 2/3 (66%)

ถาม: ถ้ายืนยันจะอยู่ทีมเดิม โอกาสชนะของคุณคือเท่าไหร่? ตอบ: 33% (เพราะทีมคุณมีแค่ประตูเดียว)

ขั้นตอนที่ 2: พิธีกรคัดออก (จุดเปลี่ยนสำคัญ)

พิธีกร (ซึ่งรู้เฉลย) เดินไปที่ 🟥 ทีมคนอื่น และเปิดประตูแพะให้ดู 1 บาน (สมมติเปิดประตู 2) บ: การเปิดประตูแพะ ไม่ได้ทำให้ความน่าจะเป็นรวมของ “ทีมคนอื่น” ลดลง** ทีมนั้นยังคงกุมความได้เปรียบที่ 2/3 (66%) อยู่เหมือนเดิมตั้งแต่วินาทีแรกที่เริ่มเกม

เพียงแต่ตอนนี้… พลัง 66% นั้นไม่ได้กระจายอยู่ 2 ประตูแล้ว แต่มัน “ไหลมารวมกัน” อยู่ที่ประตูเดียวที่เหลือรอดครับ (ประตู 3)

สรุปภาพรวม

  • 🚪 ประตูที่คุณเลือก (เบอร์ 1): แบกความหวังไว้แค่ 33% (เท่าเดิม ไม่เปลี่ยนแปลง)
  • 🚪 ประตูที่เหลือ (เบอร์ 3): แบกความหวังของ “ทีมคนอื่น” ไว้ทั้งหมด 66%

ดังนั้น: การ “เปลี่ยน” ก็คือการกระโดดจากทีมเล็ก (33%) ไปอยู่ทีมใหญ่ (66%) ที่เหลือตัวรอดเพียงตัวเดียวนั่นเอง

ตัวอย่างที่ 1: การโยนเหรียญที่ยุติธรรม

เซตตัวอย่าง \(S\):
ผลลัพธ์ที่เป็นไปได้ทั้งหมด
\[ S = \{\text{หัว}, \text{ก้อย}\} \]

เหตุการณ์ \(A\): ได้ผลเป็น “หัว”
\[ A = \{\text{หัว}\} \]

ตัวอย่างที่ 2: การทอยลูกเต๋าหกหน้า

เซตตัวอย่าง \(S\):
\[ S = \{1, 2, 3, 4, 5, 6\} \]

เหตุการณ์ \(A\): การทอยได้เลขคู่
\[ A = \{2, 4, 6\} \]

ตัวอย่างที่ 3: การจั่วไพ่จากสำรับไพ่มาตรฐาน 52 ใบ


เซตตัวอย่าง \(S\): ไพ่ทั้งหมด 52 ใบที่ไม่ซ้ำกัน

S = {เอซโพแดง, 2 โพแดง, \(\ldots\), คิงโพดำ}

เหตุการณ์ \(A\): การจั่วไพ่สีแดง

A = {ไพ่โพแดงทั้งหมดและไพ่ข้าวหลามตัดทั้งหมด(รวม 26 ใบ)}

สัจพจน์ของความน่าจะเป็น (Axiom of Probability)

สัจพจน์ของความน่าจะเป็น มีอยู่ สามข้อ ซึ่งเป็นกฎพื้นฐานที่กำหนดคุณสมบัติของความน่าจะเป็น

สัจพจน์เหล่านี้เสนอโดย อันเดรย์ โคลโมโกรอฟ (Andrey Kolmogorov) ในปี ค.ศ. 1933 และเป็นพื้นฐานของทฤษฎีความน่าจะเป็นสมัยใหม่


~~~~~~~Andrey N. Kolmogorov

\(~~~~~~~\)Andrey N. Kolmogorov

สัจพจน์ของโคลโมโกรอฟ:

ให้ \(S\) เป็นเซตตัวอย่าง (sample space) และให้ \(A\) เป็นเหตุการณ์ใด ๆ ที่เป็นเซตย่อยของ \(S\) สัจพจน์ทั้งสามมีดังนี้:

สัจพจน์ที่ 1 ความน่าจะเป็นต้องไม่เป็นค่าลบ

\[P(A) \geq 0\]

สำหรับทุกเหตุการณ์ \(A\) หมายความว่าค่าความน่าจะเป็นต้องไม่เป็นค่าลบ อาจเป็นศูนย์หรือเป็นค่าบวกก็ได้เสมอ

สัจพจน์ที่ 2 ความน่าจะเป็นของเซตตัวอย่างเท่ากับ 1

\[P(S) = 1\]

ซึ่งหมายความว่า ความน่าจะเป็นของเหตุการณ์ที่ครอบคลุมผลลัพธ์ที่เป็นไปได้ทั้งหมด ต้องมีค่าเท่ากับ 1

สัจพจน์ที่ 3 การบวกความน่าจะเป็นของเหตุการณ์ที่เกิดร่วมกันไม่ได้

ถ้า \(A\) และ \(B\) เป็น เหตุการณ์ที่เกิดร่วมกันไม่ได้
หมายความว่าไม่มีผลลัพธ์ใดที่เหมือนกัน (เช่น \(A \cap B = \emptyset\)) ดังนั้น
\[ P(A \cup B) = P(A) + P(B) \]
ซึ่งหมายความว่า ถ้าเหตุการณ์สองเหตุการณ์ไม่สามารถเกิดขึ้นพร้อมกันได้ ความน่าจะเป็นที่เหตุการณ์ใดเหตุการณ์หนึ่งจะเกิดขึ้น เท่ากับผลรวมของความน่าจะเป็นของแต่ละเหตุการณ์

ผลลัพธ์ที่ได้จากสัจพจน์ของความน่าจะเป็น

จากสัจพจน์ทั้งสามข้อ เราสามารถอนุมานสมบัติสำคัญอื่น ๆ ได้ เช่น

ความน่าจะเป็นของเหตุการณ์ที่เป็นไปไม่ได้มีค่าเท่ากับศูนย์

\[P(\emptyset) = 0\]

เหตุการณ์ที่เป็นไปไม่ได้จะมีความน่าจะเป็นเท่ากับศูนย์
เนื่องจากไม่สามารถเกิดขึ้นได้เลย

กฎของส่วนเติมเต็ม (Complement Rule)

\[P(A^c) = 1 - P(A)\]

ซึ่งหมายความว่า หากความน่าจะเป็นของเหตุการณ์ \(A\) คือ \(P(A)\) แล้วความน่าจะเป็นของเหตุการณ์ที่ ไม่ใช่ \(A\) จะเท่ากับ
\[1 - P(A)\]

กฎการบวกทั่วไปของความน่าจะเป็น (General Addition Rule of Probability)

สำหรับเหตุการณ์ใด ๆ \(A\) และ \(B\):

\[P(A \cup B) = P(A) + P(B) - P(A \cap B)\]

สูตรนี้ใช้ได้แม้ในกรณีที่เหตุการณ์ทั้งสองมีส่วนที่ทับซ้อนกัน

ตัวอย่างการประยุกต์สัจพจน์ของความน่าจะเป็น

การทอยลูกเต๋าหนึ่งลูก

ให้ \(S = \{1, 2, 3, 4, 5, 6\}\)

  • เหตุการณ์ \(A\): การทอยได้เลขคี่ → \(A = \{1, 3, 5\}\)
  • เหตุการณ์ \(B\): การทอยได้เลขมากกว่า 4 → \(B = \{5, 6\}\)
  • \(P(A) = \frac{3}{6} = 0.5\), \(P(B) = \frac{2}{6} = 0.333\),
    \(P(A \cap B) = \frac{1}{6} = 0.167\)

ใช้กฎการบวก: \[P(A \cup B) = P(A) + P(B) - P(A \cap B)\]

\[= 0.5 + 0.333 - 0.167 = 0.666\]

ความบังเอิญที่มีรูปแบบ 🎲 ➡️ 📊

From Randomness to Patterns

📉 Galton Board

ตัวแปรสุ่ม (Random Variable)

ตัวแปรสุ่ม คือ ตัวแปรที่แทนค่าของผลลัพธ์จากการทดลองแบบสุ่ม โดยค่าของมันถูกกำหนดจากความบังเอิญหรือความน่าจะเป็น ตัวแปรสุ่มมักถูกใช้ในสถิติและทฤษฎีความน่าจะเป็นเพื่ออธิบายการกระจายความน่าจะเป็นของข้อมูล

ตัวแปรสุ่มแบ่งออกเป็นสองประเภทหลัก ได้แก่:

  1. ตัวแปรสุ่มแบบไม่ต่อเนื่อง (Discrete Random Variable)

  2. ตัวแปรสุ่มแบบต่อเนื่อง (Continuous Random Variable)

1. ตัวแปรสุ่มแบบไม่ต่อเนื่อง (Discrete Random Variable)

  • มีค่าที่เป็นไปได้แบบนับได้ (countable number of possible values)

  • มักใช้กับเหตุการณ์ที่สามารถนับผลลัพธ์ได้ เช่น
    จำนวนแต้มที่ได้จากการทอยลูกเต๋า หรือจำนวนคำตอบที่ถูกต้องในแบบทดสอบ

ตัวอย่าง

  • การทอยลูกเต๋า: ให้ \(X\) เป็นค่าที่ปรากฏบนลูกเต๋า → \(X\) = {1, 2, 3, 4, 5, 6}

  • การโยนเหรียญ: ให้ \(Y\) เป็นจำนวนครั้งที่ได้หัวเมื่อโยนเหรียญ 3 ครั้ง →
    \(Y = \{0, 1, 2, 3\}\)

  • จำนวนลูกค้าที่มาซื้อของในแต่ละวัน: ให้ \(X\) เป็นจำนวนลูกค้าที่มาซื้อของในแต่ละวัน → \(X = \{0, 1, 2, 3, 4, \cdots \}\)

2. ตัวแปรสุ่มแบบต่อเนื่อง (Continuous Random Variable)

  • เป็นตัวแปรที่สามารถมีค่า ใด ๆ ก็ได้ ภายในช่วงของจำนวนจริง

  • ใช้สำหรับ ปริมาณที่สามารถวัดได้ เช่น น้ำหนัก ส่วนสูง หรือเวลา

ตัวอย่าง

  • เวลาการให้บริการลูกค้า: ตัวแปร \(T\) อาจมีค่าอยู่ระหว่าง 0 ถึง 10 นาที

  • อุณหภูมิของเมือง: ตัวแปร \(Z\) อาจมีค่าอยู่ในช่วง 25°C ถึง 35°C

  • อัตราผลตอบแทนจากการลงทุน: ตัวแปร \(r \in (-100\%, \infty)\)

เมื่อเราสามารถนิยามรูปแบบฟังก์ชันเฉพาะของการกระจายได้ เราจะเรียกสิ่งนั้นว่า การแจกแจงความน่าจะเป็น (Probability Distribution)

การแจกแจงความน่าจะเป็น (Probability Distribution)

การแจกแจงความน่าจะเป็น คือการอธิบายว่าค่าของตัวแปรสุ่มแต่ละค่ามีโอกาสเกิดขึ้นบ่อยเพียงใด หรือมีความเป็นไปได้มากน้อยเพียงใด

สมบัติของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง (Properties of a Discrete Probability Distribution)

ให้ \(X\) เป็นตัวแปรสุ่ม และให้ \(P(X)\) เป็นความน่าจะเป็นของค่าที่เป็นไปได้แต่ละค่าของ \(X\)
โดยต้องเป็นไปตามเงื่อนไขดังต่อไปนี้:

  1. \(0 \leq P(X) \leq 1\) สำหรับทุกค่าของ \(X\)
  2. \(\sum P(X) = 1\) (ผลรวมของความน่าจะเป็นทั้งหมดต้องเท่ากับ 1)

ตัวอย่าง

การทอยลูกเต๋า

ให้ตัวแปรสุ่ม \(X\) แทนค่าตัวเลขที่ปรากฏบนลูกเต๋าหกหน้า
(\(X = 1, 2, 3, 4, 5, 6\))

\[ P(X) = \begin{cases} \frac{1}{6}, & X = 1, 2, 3, 4, 5, 6 \\ 0, & \text{อื่น ๆ} \end{cases} \]

คำถามที่ 1:

จงหาความน่าจะเป็นที่จำนวนที่ทอยได้จะ น้อยกว่า 4

\[ P(X < 4) = P(1) + P(2) + P(3) = \frac{1}{6} + \frac{1}{6} + \frac{1}{6} = \frac{3}{6} = 0.5 \]

คำถามที่ 2:

จงหาความน่าจะเป็นที่จำนวนที่ทอยได้จะเป็น เลขคู่

เลขคู่บนลูกเต๋า: 2, 4, 6

\[ P(\text{เลขคู่}) = P(2) + P(4) + P(6) = \frac{1}{6} + \frac{1}{6} + \frac{1}{6} = \frac{3}{6} = 0.5 \]

คำถามที่ 3:

จงหาความน่าจะเป็นที่จำนวนที่ทอยได้จะ มากกว่าหรือเท่ากับ 5

ตัวเลขที่เป็นไปได้: 5, 6

\[ P(X \geq 5) = P(5) + P(6) = \frac{1}{6} + \frac{1}{6} = \frac{2}{6} = \frac{1}{3} \approx 0.333 \]

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องที่สำคัญ

  1. การแจกแจงแบบเบอร์นูลลี (Bernoulli Distribution):
    ใช้สำหรับเหตุการณ์ที่มีเพียงสองผลลัพธ์ เช่น “สำเร็จ / ล้มเหลว”

  2. การแจกแจงแบบทวินาม (Binomial Distribution):
    ใช้จำลองการทดลองที่เป็นอิสระหลายครั้ง โดยแต่ละครั้งมีสองผลลัพธ์ที่เป็นไปได้

  3. การแจกแจงแบบปัวซอง (Poisson Distribution):
    ใช้จำลองจำนวนเหตุการณ์ที่เกิดขึ้นภายในช่วงเวลาหรือพื้นที่คงที่

การแจกแจงแบบเบอร์นูลลี (Bernoulli Distribution)

คำจำกัดความ (Definition):

การแจกแจงแบบเบอร์นูลลี เป็น การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง
สำหรับตัวแปรสุ่มที่มี เพียงสองผลลัพธ์ที่เป็นไปได้เท่านั้น ได้แก่:

  • ความสำเร็จ (Success) — มักแทนด้วยค่า 1

  • ความล้มเหลว (Failure) — มักแทนด้วยค่า 0

การแจกแจงนี้จำลองผลลัพธ์ของ การทดลองเพียงครั้งเดียว
ซึ่งผลลัพธ์สามารถเกิดได้เพียงหนึ่งในสองกรณีเท่านั้น

นิยามทางคณิตศาสตร์ (Mathematical Definition):

ให้ \(X \sim \text{Bernoulli}(p)\) โดยที่

  • \(X \in \{0, 1\}\)

  • \(p\) คือ ความน่าจะเป็นของความสำเร็จ (เช่น \(P(X = 1) = p\))

  • \(1 - p\) คือ ความน่าจะเป็นของความล้มเหลว (เช่น \(P(X = 0) = 1 - p\))

  • \(0 \leq p \leq 1\)

ฟังก์ชันมวลความน่าจะเป็น (Probability Mass Function; PMF):

\[ P(X = x) = p^x (1 - p)^{1 - x}, \quad \text{เมื่อ } x \in \{0, 1\} \]

คุณสมบัติ (Properties):

  • ค่าเฉลี่ย (Mean): \(\mathbb{E}[X] = p\)

  • ความแปรปรวน (Variance): \(\text{Var}(X) = p(1 - p)\)

ตัวอย่าง (Examples):

  • การโยนเหรียญ (หัว = 1, ก้อย = 0)

  • การสอบผ่านหรือไม่ผ่าน (ผ่าน = 1, ไม่ผ่าน = 0)

  • การคลิกโฆษณา (คลิก = 1, ไม่คลิก = 0)

  • การตรวจสอบสินค้าในโรงงาน (มีตำหนิ = 1, ไม่มีตำหนิ = 0)

ทำไมการแจกแจงแบบเบอร์นูลลีจึงสำคัญ?

  • เป็น พื้นฐานสำคัญ สำหรับการแจกแจงอื่น ๆ เช่น การแจกแจงแบบทวินาม (Binomial distribution) ซึ่งใช้จำลองจำนวนความสำเร็จจากการทดลองแบบเบอร์นูลลีหลายครั้งที่เป็นอิสระต่อกัน

  • ถูกนำไปใช้ในหลายสาขา เช่น การจำแนกแบบทวิภาค (Binary Classification), การเรียนรู้ของเครื่อง (Machine Learning), เศรษฐศาสตร์ และ การควบคุมคุณภาพ (Quality Control) เป็นต้น

ตัวอย่าง (Example)

ให้ \(X \sim \text{Bernoulli}(p)\)
เราจะใช้ค่าของ \(p\) (ความน่าจะเป็นของความสำเร็จ) ที่แตกต่างกันในแต่ละตัวอย่าง

ตัวอย่างที่ 1: การโยนเหรียญที่ยุติธรรม

หัว = 1 (ความสำเร็จ) และ ก้อย = 0 (ความล้มเหลว) ดังนั้น \(p = 0.5\)

คำถาม: ค่า \(P(X = 1)\) คือเท่าใด?
คำตอบ: \(P(X = 1) = p = 0.5\)

คำถาม: ค่า \(P(X = 0)\) คือเท่าใด?
คำตอบ: \(P(X = 0) = 1 - p = 0.5\)

คำถาม: ค่าคาดหมาย (Expected Value) คือเท่าใด?
คำตอบ: \(\mathbb{E}[X] = p = 0.5\)

ตัวอย่างที่ 2: การควบคุมคุณภาพในโรงงาน

เครื่องจักรผลิตชิ้นส่วน โดยมีความน่าจะเป็นที่ชิ้นส่วนนั้นจะเป็น ของเสีย (Defective) เท่ากับ 0.1

ให้ \(X = 1\) เมื่อชิ้นส่วนเป็นของเสีย และ \(X = 0\) เมื่อไม่เป็นของเสีย

คำถาม: ความน่าจะเป็นที่ชิ้นส่วนจะเป็นของเสียคือเท่าใด?
คำตอบ: \(P(X = 1) = p = 0.1\)

คำถาม: ความแปรปรวนของการแจกแจงนี้คือเท่าใด?
คำตอบ: \(\text{Var}(X) = p(1 - p) = 0.1 \times 0.9 = 0.09\)

ตัวอย่างที่ 3: การคลิกโฆษณาออนไลน์

มีความน่าจะเป็นที่ผู้ใช้จะคลิกโฆษณาเท่ากับ 0.25

ให้ \(X = 1\) เมื่อมีการคลิก และ \(X = 0\) เมื่อไม่มีการคลิก

คำถาม: ค่า \(P(X = 1)\) คือเท่าใด?
คำตอบ: \(P(X = 1) = p = 0.25\)
คำถาม: ค่า \(P(X = 0)\) คือเท่าใด?
คำตอบ: \(P(X = 0) = 1 - p = 0.75\). คำถาม: ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) คือเท่าใด?
คำตอบ: \(\text{SD}(X) = \sqrt{p(1 - p)} = \sqrt{0.25 \times 0.75} = \sqrt{0.1875} \approx 0.433\)

การแจกแจงแบบทวินาม (Binomial Distribution)

การแจกแจงแบบทวินาม เป็น การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ซึ่งอธิบายจำนวน ความสำเร็จ ที่เกิดขึ้นจากจำนวนการทดลองแบบ เบอร์นูลลีที่เป็นอิสระ (Independent Bernoulli Trials) โดยแต่ละการทดลองมีเพียงสองผลลัพธ์เท่านั้นคือ ความสำเร็จ หรือ ความล้มเหลว

คำจำกัดความ (Definition):

หากตัวแปรสุ่ม \(X \sim \text{Binomial}(n, p)\) ดังนั้น

  • \(n\): จำนวนครั้งของการทดลอง
  • \(p\): ความน่าจะเป็นของความสำเร็จในการทดลองแต่ละครั้ง
  • \(X\): จำนวนครั้งที่ประสบความสำเร็จจาก \(n\) การทดลอง \(X \in \{0, 1, 2, \ldots, n\}\)

ฟังก์ชันมวลความน่าจะเป็น (Probability Mass Function; PMF):

\[ P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k} \]

  • \(\binom{n}{k} = \dfrac{n!}{k!(n - k)!}\)

  • \(k\): จำนวนครั้งของความสำเร็จ

ค่าเฉลี่ยและความแปรปรวน (Mean and Variance):

  • ค่าเฉลี่ย (Expected Value): \(\mathbb{E}[X] = np\)

  • ความแปรปรวน (Variance): \(\text{Var}(X) = np(1 - p)\)

ตัวอย่างในชีวิตจริง (Examples in Real Life):

สถานการณ์ การทดลอง (Trial) ความสำเร็จ (Success)
การโยนเหรียญ 10 ครั้ง แต่ละครั้งที่โยน ได้หัว (Head)
การสำรวจความคิดเห็น 20 คน แต่ละคนที่ตอบ ชอบผลิตภัณฑ์ (Likes product)
การตรวจสอบคุณภาพสินค้า 100 ชิ้น แต่ละชิ้นสินค้า ไม่ชำรุด (Not defective)

เมื่อใดควรใช้การแจกแจงแบบทวินาม (When to Use Binomial Distribution):

  • จำนวนการทดลอง \(n\) ถูกกำหนดตายตัว
  • แต่ละการทดลองมี เพียงสองผลลัพธ์ที่เป็นไปได้: สำเร็จหรือไม่สำเร็จ
  • ความน่าจะเป็นของความสำเร็จ (\(p\)) เหมือนกันในแต่ละครั้งของการทดลอง

ตัวอย่าง (Example)

ตัวอย่างที่ 1: การโยนเหรียญที่ยุติธรรม 5 ครั้ง

คุณโยนเหรียญที่ ยุติธรรม 5 ครั้ง จงหาความน่าจะเป็นที่จะได้ หัว 3 ครั้งพอดี

ให้ \(X \sim \text{Binomial}(n = 5, p = 0.5)\)

วิธีทำทีละขั้นตอน (Step-by-step): \(n = 5\), \(k = 3\), \(p = 0.5\)

\[ \begin{aligned} P(X = 3) &= \binom{5}{3}(0.5)^3(1 - 0.5)^{5 - 3}\\ &= \frac{5!}{3!2!}(0.5)^3(0.5)^2\\ &= 10 \times 0.125 \times 0.25 = 0.3125 \end{aligned} \]

คำตอบ (Answer): \(P(X = 3) = 0.3125\)

ตัวอย่างที่ 2: สินค้าที่ชำรุดในชุดการผลิต

เครื่องจักรผลิตสินค้าที่มีอัตราของเสีย 10%
หากตรวจสอบสินค้า 8 ชิ้น จงหาความน่าจะเป็นที่มี ของเสีย 2 ชิ้นพอดี

ให้ \(X \sim \text{Binomial}(n = 8, p = 0.1)\)

วิธีทำทีละขั้นตอน (Step-by-step):

  • \(n = 8\), \(k = 2\), \(p = 0.1\)

\[ \begin{aligned} P(X = 2) &= \binom{8}{2}(0.1)^2(0.9)^6\\ &= \frac{8!}{2!6!}(0.01)(0.531441)\\ &= 28 \times 0.01 \times 0.531441 = 0.1488 \end{aligned} \]

คำตอบ (Answer): \(P(X = 2) \approx 0.1488\)

ตัวอย่างที่ 3: การคลิกโฆษณาออนไลน์

ผู้ใช้แต่ละคนที่เห็นโฆษณามีโอกาสคลิกเท่ากับ 25%
จากผู้ชมทั้งหมด 12 คน จงหาความน่าจะเป็นที่มี 4 คนพอดี ที่คลิกโฆษณา

ให้ \(X \sim \text{Binomial}(n = 12, p = 0.25)\)

วิธีทำทีละขั้นตอน (Step-by-step):

  • \(n = 12\), \(k = 4\), \(p = 0.25\)

\[ \begin{aligned} P(X = 4) &= \binom{12}{4}(0.25)^4(0.75)^8\\ &= 495 \times 0.00390625 \times 0.100112915\\ &= 495 \times 0.000390625 \approx 0.1937 \end{aligned} \]

คำตอบ (Answer): \(P(X = 4) \approx 0.1937\)

🪙 Coin Flip Random Walk

ความน่าจะเป็นในสถานการณ์พิเศษ 🎂 • 📞 • 🚑

Special Cases & Distributions

🎂 The Birthday Paradox

การแจกแจงแบบปัวซอง (Poisson Distribution)

การแจกแจงแบบปัวซอง เป็น การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ที่ใช้จำลองจำนวนของ เหตุการณ์ (events) ที่เกิดขึ้นภายใน ช่วงเวลาหรือพื้นที่คงที่ ภายใต้สมมติฐานดังต่อไปนี้:

  1. เหตุการณ์เกิดขึ้นอย่าง เป็นอิสระต่อกัน
  2. อัตราเฉลี่ยของการเกิดเหตุการณ์ \(\lambda\) มีค่า คงที่
  3. เหตุการณ์สองเหตุการณ์ ไม่สามารถเกิดขึ้นพร้อมกันในเวลาเดียวกันได้

คำจำกัดความ (Definition):

หากตัวแปรสุ่ม \(X \sim \text{Poisson}(\lambda)\)
จะอธิบาย ความน่าจะเป็นของการเกิดเหตุการณ์จำนวน \(k\) ครั้งพอดี ภายในช่วงเวลาหรือพื้นที่ที่กำหนด

  • \(\lambda\): จำนวนเหตุการณ์เฉลี่ยต่อช่วงเวลา (เช่น ต่อชั่วโมง, ต่อวัน, ต่อกม² ฯลฯ)
  • \(X\): จำนวนเหตุการณ์ที่สังเกตได้ \(X \in \{0, 1, 2, \ldots\}\)

ฟังก์ชันมวลความน่าจะเป็น (Probability Mass Function; PMF): \[ P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!} \]

โดยที่:

  • \(e \approx 2.71828\) (ค่าคงที่ของออยเลอร์, Euler’s number)
  • \(k\): จำนวนเหตุการณ์ (0, 1, 2, …)

ค่าเฉลี่ยและความแปรปรวน (Mean and Variance):

  • \(\mathbb{E}[X] = \lambda\)
  • \(\text{Var}(X) = \lambda\)

เมื่อใดควรใช้การแจกแจงแบบปัวซอง (When to Use Poisson Distribution):

  • ใช้ในการนับจำนวน เหตุการณ์ที่เกิดขึ้นไม่บ่อย (rare events) ในช่วงเวลา หรือในพื้นที่

  • เหตุการณ์เกิดขึ้นแบบสุ่ม (random) และ เป็นอิสระต่อกัน (independent)

  • อัตราการเกิดเหตุการณ์ (rate) มีค่า คงที่ตลอดเวลา

ตัวอย่างในชีวิตจริง (Real-life Examples):

สถานการณ์ ตัวแปรแบบปัวซอง (Poisson variable)
จำนวนสายโทรศัพท์ที่เข้าศูนย์บริการต่อชั่วโมง จำนวนสายโทรศัพท์ (Number of calls)
จำนวนคำผิดในแต่ละหน้าของหนังสือ จำนวนคำผิด (Number of typos)
จำนวนผู้ป่วยที่มาถึงห้องฉุกเฉินในแต่ละคืน จำนวนผู้ป่วย (Number of patients)
จำนวนอีเมลที่ได้รับในแต่ละวัน จำนวนอีเมล (Number of emails)

ตัวอย่าง (Example)

ตัวอย่างที่ 1: ศูนย์บริการลูกค้า (Call Center)

ศูนย์บริการลูกค้าได้รับสายโทรศัพท์ เฉลี่ย 4 สายต่อชั่วโมง จงหาความน่าจะเป็นดังต่อไปนี้:

a) \(P(X = 2)\): มีสายโทรศัพท์เข้า 2 สายพอดี

\[ P(X = 2) = \frac{e^{-4} \cdot 4^2}{2!} = \frac{e^{-4} \cdot 16}{2} = 8 \cdot e^{-4} \approx 8 \cdot 0.0183 = 0.1465 \]

b) \(P(X \leq 2)\): มีสายโทรศัพท์เข้า ไม่เกิน 2 สาย

\[P(X \leq 2) = P(0) + P(1) + P(2)\]

\[ \begin{aligned} P(0) &= \frac{e^{-4} \cdot 4^0}{0!} = e^{-4} = 0.0183 \\ P(1) &= \frac{e^{-4} \cdot 4^1}{1!} = 4 \cdot e^{-4} = 0.0733 \\ P(2) &= 0.1465 \ \text{(จากข้อ a)} \\ P(X \leq 2) &= 0.0183 + 0.0733 + 0.1465 = 0.2381 \end{aligned} \]

c) \(P(X \geq 3)\): มีสายโทรศัพท์เข้า ตั้งแต่ 3 สายขึ้นไป

\[ P(X \geq 3) = 1 - P(X \leq 2) \]

\[ P(X \geq 3) = 1 - 0.2381 = 0.7619 \]

ตัวอย่างที่ 2: ห้องฉุกเฉินในโรงพยาบาล (Hospital ER)

โดยเฉลี่ยมี ผู้ป่วยมาถึงห้องฉุกเฉิน 3 คนต่อคืน จงหาความน่าจะเป็นดังต่อไปนี้:

a) \(P(X = 5)\): มีผู้ป่วยมา 5 คนพอดี

\[ P(X = 5) = \frac{e^{-3} \cdot 3^5}{5!} = \frac{e^{-3} \cdot 243}{120} \approx 0.0498 \cdot 2.025 = 0.1008 \]

b) \(P(X \leq 5)\): มีผู้ป่วยมา ไม่เกิน 5 คน

\[P(X \leq 5) = \sum_{k=0}^{5} P(k)=P(0)+P(1)+P(2)+P(3)+P(4)+P(5)\]

\[ \begin{aligned} P(0) &= e^{-3} = 0.0498 \\ P(1) &= 3 \cdot e^{-3} = 0.1494 \\ P(2) &= \frac{9}{2} e^{-3} = 0.2240 \\ P(3) &= \frac{27}{6} e^{-3} = 0.2240 \\ P(4) &= \frac{81}{24} e^{-3} = 0.1680 \\ P(5) &= 0.1008 \\ P(X \leq 5) &= 0.0498 + 0.1494 + 0.2240\\ &~~~+ 0.2240 + 0.1680 + 0.1008 = 0.9160 \end{aligned} \]

c) \(P(X \geq 2)\): มีผู้ป่วยมา อย่างน้อย 2 คน

\[ P(X \geq 2) = 1 - P(0) - P(1) \]

\[ P(X \geq 2) = 1 - (0.0498 + 0.1494) = 1 - 0.1992 = 0.8008 \]

หมายเหตุสำคัญ (Important Note)

ในโปรแกรม Jamovi คุณสามารถติดตั้งและใช้งานโมดูลภายนอกที่ชื่อว่า distrACTION เพื่อคำนวณค่าความน่าจะเป็นสำหรับทั้งการแจกแจงแบบ Binomial และ Poisson ได้

distrACTION Module

distrACTION Module

สมบัติของการแจกแจงความน่าจะเป็นแบบต่อเนื่อง (Properties of a Continuous Probability Distribution)

ให้ \(f(x)\) เป็น ฟังก์ชันความหนาแน่นของความน่าจะเป็น (Probability Density Function; PDF) ซึ่งต้องเป็นไปตามเงื่อนไขดังต่อไปนี้:

  1. \(f(x) \geq 0\) สำหรับทุกค่า \(x\)
  2. \(\int_{-\infty}^{\infty} f(x) \, dx = 1\)

ความน่าจะเป็นที่ตัวแปรสุ่ม \(X\) จะอยู่ในช่วง \(a \leq X \leq b\)
คำนวณได้ดังนี้:

\[ \begin{aligned} P(a < X < b) &= P(a \leq X < b) \\ &= P(a < X \leq b) \\ &= P(a \leq X \leq b) = \int_{a}^{b} f(x) \, dx \end{aligned} \]

ตัวอย่างสำคัญ (Key Example)

การแจกแจงปกติ (Normal Distribution)

\[ f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}, \quad \mu \in \mathbb{R},\ \sigma^2 > 0,\ x \in \mathbb{R} \]

  • \(\mu\) คือ ค่าเฉลี่ย (mean)
  • \(\sigma^2\) คือ ความแปรปรวน (variance)
  • รูปร่างของกราฟเป็นโค้งระฆัง (bell curve) และมีสมมาตร

การแจกแจงความน่าจะเป็นแบบต่อเนื่องที่สำคัญ

  1. การแจกแจงปกติ (Normal Distribution):
    ใช้กันอย่างแพร่หลายในทางสถิติ

  2. การแจกแจงแบบสม่ำเสมอ (Uniform Distribution):
    ทุกค่าภายในช่วงที่กำหนดมีความน่าจะเป็นเท่ากัน

  3. การแจกแจงแบบเอ็กซ์โปเนนเชียล (Exponential Distribution):
    มักใช้จำลองเวลาการรอคอยของเหตุการณ์ (waiting times)

🎯 Monte Carlo Simulation (Estimating π)

การตัดสินใจ
(Decision Making)\(~~~~~~\)

💘 The Girlfriend Problem

1. ปัญหาโลกแตก: “เลือกก่อน หรือ รอต่อ?” 🤯

ในชีวิตจริง เรามักเจอสถานการณ์ที่ “ของดีมักมาทีหลัง… แต่ถ้า รอนานไป ของดีอาจจะผ่านไปแล้ว”

  • ถ้าตัดสินใจเร็วไป: เราอาจเสียดาย เพราะคนข้างหน้าอาจจะดีกว่า (FOMO)
  • ถ้าตัดสินใจช้าไป: เราอาจจะเสียใจ เพราะคนที่ดีที่สุดผ่านไปแล้ว และเราต้องจำใจเลือกคนที่เหลือ (ขึ้นคาน/ได้ของเหลือ)

โจทย์ของคณิตศาสตร์ข้อนี้คือ: “เราควรจะหยุด ‘ดูใจ’ และเริ่ม ‘ตัดสินใจ’ ที่คนลำดับที่เท่าไหร่ ถึงจะมีโอกาสชนะมากที่สุด?”

2. คำตอบคือ: กฎ 37% (The 37% Rule) 📐

นักคณิตศาสตร์ได้พิสูจน์ออกมาแล้วว่า จุดที่สมดุลที่สุดระหว่าง “การหาข้อมูล” กับ “การตัดสินใจ” คือตัวเลข 37% ครับ

กลยุทธ์การเล่นเพื่อชนะ (Algorithm): แบ่งคนทั้งหมด (N) ออกเป็น 2 ช่วงครับ:

  1. ช่วงเก็บข้อมูล (Explore Phase - 37% แรก):

    • สมมติมี 10 คน → (ปัดเป็น 3 หรือ 4 คนแรก)

    • กฎ: ห้ามเลือกใครเลยในช่วงนี้! ให้ปฏิเสธทุกคน

    • เป้าหมาย: เพื่อหาว่า

    “มาตรฐานความเก่งสูงสุด” ของกลุ่มนี้คือเท่าไหร่ (Set Benchmark)

  2. ช่วงล่าเป้าหมาย (Leap Phase - คนที่เหลือ):

    • เริ่มตั้งแต่คนที่ 4 เป็นต้นไป

    • กฎ: เจอใครคนแรกที่มีคะแนน “สูงกว่า” มาตรฐานสูงสุดในช่วงแรก… ให้เลือกทันที! (ไม่ต้องดูต่อแล้ว)

3. ตัวอย่างการใช้งานจริง (จากเกม 10 คน)

สมมติคะแนนคนคุย 10 คน เรียงตามลำดับที่เข้ามาดังนี้: [40, 70, 55, 60, 85, 95, 20, 90, 10, 30] (คนเก่งสุดคือ 95 อยู่ลำดับที่ 6)

ถ้าใช้สูตร 37% (ดู 3 คนแรก):

  1. ช่วงดูใจ (3 คนแรก): 40, 70, 55

    • เราปล่อยผ่านหมด ❌

    • แต่เราจำไว้ว่า “มาตรฐานสูงสุดตอนนี้คือ 70” (Benchmark)

  2. ช่วงตัดสินใจ (คนที่ 4 เป็นต้นไป):

    • คนที่ 4 (คะแนน 60): น้อยกว่า 70… ผ่าน ❌

    • คนที่ 5 (คะแนน 85): มากกว่า 70 แล้ว!เลือกทันที! ✅

ผลลัพธ์: ในกรณีนี้ เราจะได้คนคะแนน 85 (ซึ่งเก่งเป็นอันดับ 2) แม้จะไม่ใช่ 95 แต่ก็ได้คนเกรด A+ แน่นอน และดีกว่าการสุ่มเลือกมาก

(หมายเหตุ: ถ้าคนเก่งที่สุดดันอยู่ใน 3 คนแรก สูตรนี้จะล้มเหลวทันที เพราะเราจะหาคนที่ดีกว่ามาตรฐานไม่ได้เลย จนต้องจำใจเลือกคนสุดท้าย แต่นั่นคือความเสี่ยงที่คำนวณมาแล้วว่าคุ้มค่าที่สุดครับ)

4. ทำไมต้อง 37%? (คณิตศาสตร์เบื้องหลัง) 🧮

ตัวเลขนี้ไม่ได้มาจากการสุ่ม แต่มาจากค่าคงที่ทางคณิตศาสตร์ที่ชื่อว่า

  • (Euler’s number) มีค่าประมาณ

  • มีค่าประมาณ 0.368 หรือ 36.8%

กราฟความน่าจะเป็นจะบอกว่า:

  • ถ้าดูใจน้อยไป (เช่น 10%) ข้อมูลเราจะน้อยเกินไป โอกาสพลาดสูง
  • ถ้าดูใจนานไป (เช่น 90%) คนเก่งๆ ก็ผ่านไปหมดแล้ว โอกาสพลาดสูง
  • จุดพีกสูงสุดของกราฟระฆังคว่ำ ที่ทำให้โอกาสเจอคนเก่งที่สุด (Win Rate) สูงที่สุด อยู่ที่จุด 37% พอดีครับ

สรุป: ไม่ว่าจะจีบสาว, หาเลขา, หรือหาที่จอดรถ… อย่าเพิ่งรีบตัดสินใจตั้งแต่แรก และอย่ารอจนวินาทีสุดท้าย “ดูเชิงสัก 1 ใน 3 แล้วลุยเลย” คือทางรอดที่ดีที่สุดครับ! 😉