مساله ۵۴. متغیرهای تصادفی نرمال

به طور متوسط چند بار از توزیع نرمال 0,1 متغیر‌ تصادفی انتخاب‌ کنیم‌ که‌ مجموعشون‌ بیشتر از ۱ بشه؟

سوال کمی به صورت دقیق‌تر: ما در هر مرحله یک عدد با توزیع نرمال با پارامترهای میانگین=0 و واریانس=1 تولید می‌کنیم. توزیع احتمال عدد تولید شده در هر مرحله مستقل از بقیه اعداد است. اگر مجموع اعدادی که تاکنون تولید کرده‌ایم بیشتر از ۱ شد، بازی تمام می شود، وگرنه می‌رویم به مرحله‌ی بعد. امیدریاضی تعداد مراحل چند است؟

لینک سوال در توویتر: https://twitter.com/Riazi_Cafe/status/1737371553971818497

پاسخ برابر با ∞ است. به عبارت دیگر، میانگین تعداد مراحلی که قبل از رسیدن مجموع به حداقل 1 طی می‌کنیم، بی‌نهایت است.

فرض کنید $e_x$ نشان‌دهنده میانگین تعداد نمونه‌برداری از N(0,1) تا زمانی باشد که قدر مطلق مجموع متغیرها حداقل x باشد. s را مجموع متغیرها در نظر بگیرید که در ابتدا برابر با 0 است. به طور میانگین، $e_1$ مرحله طول می‌کشد تا قدر مطلق مجموع متغیرها (|s|) حداقل 1 شود. در این لحظه، اگر s مثبت باشد، فرآیند متوقف می‌شود، در غیر این صورت مجموع کل متغیرها کوچک‌تر یا مساوی با 1- خواهد بود. توجه داشته باشید که از آنجایی که N(0,1) متقارن است، احتمال منفی بودن s دقیقاً 0.5 است.

حال، برای حالتی که s < -1 است، متغیرهای جدیدی را از N(0,1) نمونه‌برداری می‌کنیم تا زمانی که قدر مطلق مجموع متغیرهای جدید حداقل 2 شود. این کار به طور میانگین $e_2$ مرحله طول می‌کشد. توجه داشته باشید که مجدداً از آنجایی که s در ابتدا کوچک‌تر یا مساوی با 1- است، s هرگز قبل از اینکه قدر مطلق مجموع متغیرهای جدید حداقل 2 شود، به مقدار 1 نمی‌رسد. برای سادگی فرض می‌کنیم که اگر مجموع کل متغیرهای جدید حداقل 2 باشد، فرآیند متوقف می‌شود (اگرچه این ممکن است در واقعیت چنین نباشد). با این حال، می‌دانیم که با احتمال 0.5، مجموع کل متغیرهای جدید کوچک‌تر یا مساوی با 2- است که در این صورت مقدار جدید s کوچک‌تر یا مساوی با 3- خواهد بود. اکنون، همین فرآیند را تکرار می‌کنیم تا زمانی که قدر مطلق مجموع متغیرهای جدید حداقل 4 شود. این کار ادامه می‌یابد تا اینکه در مرحله‌ای i، مجموع متغیرهای جدید حداقل $2^{i-1}$ شود و در این حالت فرآیند را متوقف می‌کنیم.

توجه داشته باشید که در مرحله اول، به طور میانگین $e_1$ متغیر نمونه‌برداری می‌کنیم. در مرحله دوم، به طور میانگین $e_2$ متغیر نمونه‌برداری می‌کنیم و به طور کلی در مرحله i به طور میانگین $e_{2^{i-1}}$ متغیر نمونه‌برداری می‌کنیم. علاوه بر این، احتمال اینکه در فرآیند خود به مرحله i برویم، $1/2^{i-1}$ است. بنابراین، با توجه به خطی بودن امید ریاضی، میانگین تعداد متغیرهایی که نمونه‌برداری می‌کنیم حداقل $\Sigma(e_{2^i}/2^i)$ است. در ادامه نشان می‌دهیم که $e_x ≥ x$ است که نشان می‌دهد عبارت راه حل محدود به هیچ عدد حقیقی نیست. بنابراین، پاسخ مسئله بی‌نهایت است.

لم: $e_x ≥ x$

اثبات: توجه داشته باشید که E(|N(0,1)|) (امید ریاضی قدر مطلق یک متغیر نرمال با میانگین 0 و واریانس 1) کمتر از 0.8 است. بنابراین، به طور میانگین حداقل x/0.8 مرحله طول می‌کشد تا قدر مطلق مجموع متغیرها حداقل x شود.