توزیع حاشیه ای
{{جا:ثبت}}
در نظریه آمار و احتمال، توزیع حاشیه ای از یک زیرمجموعه از یک مجموعه ای از متغیرهای تصادفی، توزیع احتمال از متغیرهای موجود در زیر مجموعه هست. احتمال مقادیر مختلف متغیرها را در زیرمجموعه بدون مراجعه به مقادیر سایر متغیرها ارائه می دهد. در حالی که توزیع شرطی، احتمالات را مشروط به مقادیر متغیرهای دیگر می کند.
متغیرهای حاشیه ای آن متغیرها در زیرمجموعه متغیرهایی هستند که حفظ می شوند. این مفاهیم "حاشیه ای" هستند زیرا با جمع کردن مقادیر در جدول در امتداد سطرها یا ستون ها و نوشتن حاصل جمع در حاشیه جدول ، می توان آنها را یافت.[۱] توزیع متغیرهای حاشیه ای (توزیع حاشیه ای) توسط حاشیه سازی حاصل می شود، یعنی تمرکز روی مبالغ موجود در حاشیه بیش از توزیع متغیرهای کنار گذاشته شده است، و گفته می شود که متغیرهای دور انداخته شده، به حاشیه رانده شده اند.
به طور ساده تر گاهی نیاز داریم توزیع مستقل دو متغیر تصادفی را هم از توزیع توام به دست آوریم. جواب این سوال ما در توزیع حاشیهای نهفته است.
تعریف[ویرایش]
برای حساب کردن توزیع حاشیهای یکی از این متغیرها کافی است به نوعی تاثیر آنرا بر روی تابع توزیع توام حذف کنیم.
تابع جرم احتمال حاشیه ای[ویرایش]
فرض کنید توزیع توام[۲] دو متغیر تصادفی گسسته X و Y به ما داده شده است. توزیع حاشیه ای هر یک از این متغیر ها - به عنوان مثال X - برابر است با توزیع احتمال X هنگامی که مقادیر Y در نظر گرفته نمی شوند. این را می توان با جمع کردن احتمال توزیع توام روی تمام حالات Y محاسبه کرد. به طور مشابه، برای عکس آن نیز درست است. یعنی توزیع حاشیه ای Y را نیز می توان با جمع کردن احتمال توزیع توام روی حالات X محاسبه کرد.
X Y |
x1 | x2 | x3 | x4 | pY(y) ↓ |
---|---|---|---|---|---|
y1 | 432 | 232 | 132 | 132 | 832 |
y2 | 332 | 632 | 332 | 332 | 1532 |
y3 | 932 | 0 | 0 | 0 | 932 |
pX(x) → | 1632 | 832 | 432 | 432 | 3232 |
احتمال حاشیه ای می تواند به صورت امید ریاضی نیز نوشته شود.
به طور شهودی احتمال حاشیه ای X با بررسی احتمال شرطی X به شرط مقدار خاصی از Y، و سپس میانگین این احتمال شرطی بر روی توزیع همه مقادیر Y محاسبه می شود.
این از تعریف امید ریاضی ( بعد از انجام قانون LOTUS) می آید.
تابع چگالی احتمال حاشیه ای[ویرایش]
فرض کنید توزیع توام دو متغیر تصادفی پیوسته X و Y به ما داده شده است. تابع چگالی احتمال حاشیه ای X را می توان از انتگرال احتمال توزیع توام روی تمام حالات Y محاسبه کرد.
و یا به طور شهودی تر داریم:
تابع توزیع تجمعی حاشیه ای[ویرایش]
به راحتی می توان تابع توزیع تجمعی حاشیه ای را از روی تابع چگالی احتمال حاشیه ای به دست آورد.
تابع توزیع تجمعی حاشیه ای متغیر تصادفی گسسته[ویرایش]
برای متغیر های تصادفی گسسته داریم:
تابع توزیع تجمعی حاشیه ای متغیر تصادفی پیوسته[ویرایش]
برای متغیر های تصادفی پیوسته داریم:
حال فرض کنید میخواهیم توزیع تجمعی حاشیهای یک متغیر تصادفی را از روی توزیع تجمعی توام بدون استفاده از تابع چگالی آنها بدست آوریم.
توزیع احتمال حاشیهای و توزیع احتمال شرطی[ویرایش]
تعریف[ویرایش]
احتمال حاشیهای، احتمال رخ دادن یک رخداد مستقل از رخدادهای دیگر است. از سمت دیگر احتمال شرطی، احتمال رخ دادن یک رخداد به شرطی که رخدادهای مشخص دیگری اتفاق افتاده باشند است. این بدین معنا است که در چنین احتمالی محاسبات مربوط به یک متغیر تصادفی به محاسبات متغیرهای تصادفی دیگر وابسته میباشد.[۳]
توزیع احتمال شرطی یک متغیر تصادفی به شرط رخ دادن متغیر تصادفی دیگر معادل توزیع احتمال توأم هر دو متغیر تصادفی تقسیم بر توزیع احتمال حاشیهای متغیر تصادفی دیگری است که بالاتر معرفی شد میباشد.[۴] پس داریم،
- برای متغیرهای تصادفی گسسته،
- برای متغیرهای تصادفی پیوسته،
مثال[ویرایش]
فرض کنید دادههای مربوط به دانشجویان یک کلاس ۲۰۰ نفری را داریم. این دادهها شامل میزان زمان مطالعه دانشجویان (X) و درصد جوابهای درست دانشجویان در امتحان (Y) هستند.[۵] فرض کنید که X و Y متغیرهای تصادفی گسسته هستند؛ توزیع احتمال توأم X و Y را میتوان با استفاده از لیست کردن تمام مقادیر ممکن p(xi,yj) همانند جدول پایین، تعریف کرد.
X Y
|
میزان زمان مطالعه (دقیقه) | |||||
---|---|---|---|---|---|---|
% جوابهای درست | x1 (0-20) | x2 (21-40) | x3 (41-60) | x4(>60) | pY(y) ↓ | |
y1 (0-20) | 2200 | 0 | 0 | 8200 | 10200 | |
y2 (21-40) | 10200 | 2200 | 8200 | 0 | 20200 | |
y3 (41-59) | 2200 | 4200 | 32200 | 32200 | 70200 | |
y4 (60-79) | 0 | 20200 | 30200 | 10200 | 60200 | |
y5 (80-100) | 0 | 4200 | 16200 | 20200 | 40200 | |
pX(x) → | 14200 | 30200 | 86200 | 70200 | 1 |
توزیع احتمال حاشیهای میتواند تعداد دانشجوهایی که نمره ۲۰ یا کمتر گرفته اند را مشخص کند:
، یعنی ۱۰ دانشجو یا ۵ درصد دانشجویان.
توزیع احتمال شرطی برای مشخص کردن احتمال اینکه یک دانشجو که ۶۰ دقیقه یا بیشتر مطالعه کرده باشد، نمرهٔ ۲۰ یا پایینتر کسب کند به کار میرود:
، این عبارت به این معنی است که ۱۱ درصد احتمال این وجود دارد که نمره دانشجو پس از حداقل ۶۰ دقیقه مطالعه، ۲۰ شود.
نمونه ای از دنیای واقعی[ویرایش]
فرض کنید احتمال برخورد یک عابر پیاده با ماشین در حین عبور از جاده در گذرگاه عابر پیاده بدون توجه به چراغ راهنمایی محاسبه شود. فرض کنید H یک متغیر تصادفی گسسته باشد که یک مقدار از {Hit, Not Hit} را می گیرد. فرض کنید L (برای چراغ راهنمایی) یک متغیر تصادفی گسسته باشد که یک مقدار از {RED، YELLOW، GREEN} را می گیرد.
در واقع، H به L وابسته خواهد بود. یعنی P(H = Hit) بسته به قرمز، زرد یا سبز بودن L مقادیر متفاوتی خواهد گرفت (و به همین ترتیب برای P(H = Not Hit)). برای مثال، یک عابر زمانی که چراغهای راهنمایی سبز هستند، احتمال بیشتری وجود دارد که هنگام عبور با خودرو برخورد کند تا زمانی که قرمز باشد. به عبارت دیگر، برای هر جفت مقادیر ممکن معینی برای H و L، باید احتمال توزیع توام H و L را در نظر گرفت تا در صورت نادیده گرفتن حالت چراغ راهنمایی توسط عابر، احتمال وقوع آن جفت رویدادها با هم پیدا شود.
هرچند، در تلاش برای محاسبه احتمال حاشیه ای P(H = Hit)، آنچه مورد نظر است، احتمال برخورد H = Hit در شرایطی است که مقدار خاص L ناشناخته است و در آن عابر پیاده وضعیت چراغ راهنمایی را نادیده می گیرد. به طور کلی، اگر چراغ ها قرمز باشد یا اگر چراغ ها زرد و یا اگر چراغ ها سبز باشند، می توان به عابر پیاده ضربه زد. بنابراین، پاسخ احتمال حاشیهای را میتوان با جمع P(H | L) برای همه مقادیر ممکن L، با وزن هر مقدار L با احتمال وقوع آن یافت.
در اینجا جدولی وجود دارد که بسته به وضعیت چراغ ها، احتمالات مشروط ضربه خوردن را نشان می دهد. (توجه داشته باشید که ستون های این جدول باید تا 1 جمع شوند زیرا بدون توجه به وضعیت نور، احتمال اصابت یا عدم اصابت 1 است.)
L H
|
Red | Yellow | Green |
---|---|---|---|
Not Hit | 0.99 | 0.9 | 0.2 |
Hit | 0.01 | 0.1 | 0.8 |
برای یافتن توزیع احتمال توام، داده های بیشتری مورد نیاز است. برای مثال، فرض کنید P(L = red) = 0.2 و P(L = yellow) = 0.1 و P(L = green) = 0.7. ضرب هر ستون در توزیع شرطی در احتمال وقوع آن ستون منجر به توزیع احتمال توام H و L می شود که در مستطیل 2×3 وسط داده شده است.
L H
|
Red | Yellow | Green | Marginal probability P(H) |
---|---|---|---|---|
Not Hit | 0.198 | 0.09 | 0.14 | 0.428 |
Hit | 0.002 | 0.01 | 0.56 | 0.572 |
Total | 0.2 | 0.1 | 0.7 | 1 |
احتمال حاشیه ای P(H = Hit) مجموع 0.572 در امتداد ردیف H = Hit این جدول توزیع مشترک است، زیرا این احتمال برخورد زمانی است که چراغ ها قرمز یا زرد یا سبز هستند. به طور مشابه، احتمال حاشیه ای که P(H = Not Hit) مجموع در امتداد ردیف H = Not Hit است.
توزیع احتمالهای چند متغیره[ویرایش]
برای توزیع احتمالهای چند متغیره، همان فرمولی را به کار میگیریم که بالاتر از آن استفاده کردیم با این تفاوت که در این جا نمادهای X و/یا Y به عنوان بردار شناخته میشوند. بطور خاص میتوان گفت که هر جمع یا انتگرال بر روی تمام متغیرها، بجز متغیرهایی که در X قرار دارند، اعمال میشود.[۶] یعنی، اگر X1,X2,…,Xn متغیرهای تصادفی گسسته باشند، آنگاه تابع جرم احتمال حاشیهای باید به شکل زیر تعریف شود:
اگر X1,X2,…,Xn متغیرهای تصادفی پیوسته باشند، آنگاه تابع چگالی احتمال حاشیهای باید به شکل زیر تعریف شود:
جستارهای وابسته[ویرایش]
پانویس[ویرایش]
- ↑ Trumpler, Robert J.; Harold F. Weaver (1962). Statistical Astronomy. Dover Publications. pp. 32–33. Unknown parameter
|name-list-style=
ignored (help)صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد. - ↑ «توزیع توأم» [آمار] همارزِ «joint distribution» مترادفِ: «توزیع چندمتغیره» همارزِ واژهٔ بیگانهای دیگر (multivariate distribution)؛ منبع: گروه واژهگزینی. جواد میرشکاری، ویراستار. دفتر یازدهم. فرهنگ واژههای مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی. شابک ۹۷۸-۶۰۰-۶۱۴۳-۴۵-۳ (ذیل سرواژهٔ توزیع توأم)صفحه پودمان:Citation/CS1/fa/styles.css محتوایی ندارد.
- ↑ "Marginal & Conditional Probability Distributions: Definition & Examples". Study.com (به English). Retrieved 2019-11-16.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
- ↑ "Exam P [FSU Math]". www.math.fsu.edu. Retrieved 2019-11-16.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
- ↑ Marginal and conditional distributions (به English), retrieved 2019-11-16صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
منابع[ویرایش]
- https://en.wikipedia.org/w/index.php?title=Marginal_distribution
- https://fa.wikipedia.org/wiki/%D8%AA%D9%88%D8%B2%DB%8C%D8%B9_%D8%A7%D8%AD%D8%AA%D9%85%D8%A7%D9%84_%D8%B4%D8%B1%D8%B7%DB%8C
- https://fa.wikipedia.org/wiki/%D8%AA%D9%88%D8%B2%DB%8C%D8%B9_%D8%A7%D8%AD%D8%AA%D9%85%D8%A7%D9%84_%D8%AA%D9%88%D8%A3%D9%85
- Sheldon Ross ,Introduction to Probability, joint distribution pages 279 to 350
- https://www.khanacademy.org/math/ap-statistics/analyzing-categorical-ap/distributions-two-way-tables/v/marginal-distribution-and-conditional-distribution
- Trumpler, Robert J.; Harold F. Weaver (1962). Statistical Astronomy. Dover Publications. pp. 32–33
- Marginal & Conditional Probability Distributions: Definition & Examples". Study.com. Retrieved 2019-11-16
- Marginal and conditional distributions, retrieved 2019-11-16
- Exam P [FSU Math]". www.math.fsu.edu. Retrieved 2019-11-16
This article "توزیع حاشیه ای" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:توزیع حاشیه ای. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.