بایاس القایی

برای این که یک مدل به درستی کار کند باید یک سری پیش فرض ها داشته باشد که به این پیش فرض ها جهت گیری استنتاجی گفته می شود.^[۱] به بیانی دیگر،‌ به مجموعه مفروضاتی که یک مدل یادگیری برای پیش بینی و تخمین خروجی ها به ازای ورودی های داده شده دارد، جهت گیری استنتاجی، جهت گیری یادگیری یا بایاس القایی اطلاق می شود.بایاس القایی هر چیزی است که باعث می شود الگوریتم ما یک الگو را به جای الگویی دیگر یاد بگیرد.

مقدمه[ویرایش]

سوگیری القایی در شبکه‌های عصبی به مجموعه‌ای از مفروضات و محدودیت‌هایی اشاره دارد که در الگوریتم یادگیری نهادینه شده تا به کمک آن ها بتوان از داده‌های آموزشی محدود به قابلیت تعمیم پذیری روی داده‌های آموزشی جدید و نادیده دست یافت. به عبارت دیگر، سوگیری استقرایی چیزی است که به یک شبکه عصبی اجازه می‌دهد تا پیش‌بینی دقیقی روی داده‌های جدید انجام دهد، حتی اگر آن داده‌ها با داده‌های آموزشی متفاوت باشند. ^[۲]

انواع مختلف سوگیری[ویرایش]

سوگیری استقرایی می تواند اشکال مختلفی داشته باشد و در الگوریتم یادگیری می تواند صریح (explicit)یا ضمنی (implicit) باشد. برخی از اشکال رایج سوگیری القایی در شبکه های عصبی شامل سوگیری ایجاد شده ناشی از معماری مدل، سوگیری ناشی از رگولاریزیشن و سوگیری ناشی از بهینه سازی است.

سوگیری ناشی از معماری[ویرایش]

سوگیری ناشی از معماری مدل به مفروضات و محدودیت هایی اشاره دارد که در ساختار خود شبکه عصبی تعبیه شده است. به عنوان مثال، در معماری شبکه های عصبی کانولوشنال (CNN) که برای پردازش تصاویر طراحی و مورد استفاده قرار می گیرند،از لایه های کانولوشنی و لایه ی پولینگ استفاده می شود. به کمک لایه های کانولوشنی الگوهای محلی تشخیص داده می شوند و با استفاده از لایه های پولینگ ابعاد فضای ورودی کاهش داده می شود. این عملیات که خاص معماری CNN است به این ساختار کمک می‌کند تا ویژگی‌هایی را که به وظایف طبقه‌بندی تصویر مرتبط هستند، بیاموزد و می‌تواند قابلیت تعمیم پذیری مدل را بهبود بخشد. یا در شبکه های بازگشتی پیش فرض این است که بین گام های زمانی توالی وجود دارد. ^[۳]

سوگیری ناشی از رگولاریزیشن[ویرایش]

سوگیری ناشی از رگولاریزیشن به تکنیک هایی اشاره دارد که برای جلوگیری از تطبیق بیش از حد شبکه عصبی با داده های آموزشی استفاده می شود. روش‌های رگولاریزیشن مانند به کارگیری نرم L1 و L2، دراپ اوت (dropout) و توقف زودهنگام یادگیری باعث اعمال قید و محدودیت روی پارامترهای مدل می شوند. این موضوع می تواند. به کاهش واریانس مدل و بهبود قابلیت تعمیم پذیری آن کمک کند.

سوگیری ناشی از الگوریتم[ویرایش]

سوگیری ناشی از الگوریتم بهینه سازی به مفروضات و محدودیت هایی اشاره دارد که در الگوریتم بهینه سازی مورد استفاده برای آموزش شبکه عصبی تعبیه می شود. برای مثال، الگوریتم گرادیان کاهشی تصادفی (SGD) یک الگوریتم بهینه‌سازی محبوب و متداول است که از مجموعه‌ای کوچک از داده‌ها برای به‌روزرسانی پارامترهای مدل استفاده می‌کند. این سوگیری بهینه‌سازی فرض می‌کند که داده‌های آموزشی نماینده داده‌های آزمایشی(تست) هستند و این مدل می‌تواند از دسته های کوچک از داده ها آموزشی یادگیری را به نحوی انجام دهد که قابلیت تعمیم پذیری مدل حفظ شود.^[۴]

تاثیر بایاس القایی روی عملکرد مدل[ویرایش]

بایاس القایی می تواند تأثیر قابل توجهی بر عملکرد شبکه های عصبی داشته باشد. توجه به ایجاد سوگیری متناسب با اهداف شبکه بسیار حائز اهمیت است. برای مثال، اگر به دنبال طبقه بندی تصویر باشید، یک CNN با سوگیری معماری قوی ممکن است بهترین انتخاب باشد، در حالی که اگر به دنبال کار با دادگان متنی و پردازش زبان طبیعی باشید، یک شبکه عصبی بازگشتی (RNN) با یک رگولاریزیشن قوی ممکن است مناسب‌تر باشد.

چالش ها[ویرایش]

یکی از چالش‌های بایاس القایی در این است که بایاس وارد شده به مدل می توان موجب بیش برازش یا کم برازش دادگان شود. کم برازش زمانی اتفاق می‌افتد که مدل برای دریافت پیچیدگی داده‌ها بسیار ساده باشد، در حالی که بیش برازش زمانی رخ می دهد که مدل آن قدر پیچیده باشد که حتی الگوهای مربوط به نویز موجود در داده‌ها را نایز یاد بگیرد یا به عبارتی دیگر حفظ کند. ایجاد تعادل بین بایاس القایی مدل و پیچیدگی داده ها جنبه مهمی از ساخت شبکه های عصبی دقیق و قوی است.

چالش دیگر در زمینه ی بایاس القایی این است که تعیین سوگیری بهینه برای یک هدف خاص می تواند دشوار باشد. هیچ راه حل عمومی و کلی ای برای تعیین نوع بایاس القایی وجود ندارد. برای رسیدن به عملکرد بهینه در مدل ها و اهداف مختلف ممکن است نیاز به سوگیری های متفاوتی باشد. یک رویکرد برای تعیین سوگیری بهینه استفاده از اعتبار سنجی متقابل است که در آن داده ها به مجموعه های آموزشی و اعتبار سنجی تقسیم می شوند و سوگیری بر روی مجموعه اعتبار سنجی تنظیم می شود تا بهترین عملکرد روی دادگان آزمایش (تست) به دست آید.

جمع بندی[ویرایش]

در نتیجه، بایاس القایی یک جزء حیاتی از شبکه‌های عصبی است که به آنها اجازه می‌دهد از یادگرفتن الگوی داده‌های آموزشی به توانایی تولید نتایج معتبر روی داده‌های جدید و نادیده برسند. انتخاب بایاس القایی می تواند تأثیر قابل توجهی بر عملکرد مدل داشته باشد و مهم است که بین بایاس و جهت گیری مدل و پیچیدگی داده ها تعادل ایجاد شود. با درک اشکال مختلف سوگیری القایی، و نحوه انتخاب بایاس بهینه برای یک کار معین، می‌توانیم شبکه‌های عصبی دقیق‌تر و قوی‌تری بسازیم که می‌توانند در طیف وسیعی از کاربردها اعمال شوند.

اگرچه اکثر الگوریتم‌های یادگیری دارای یک سوگیری ثابت هستند، برخی از الگوریتم‌ها به گونه‌ای طراحی شده‌اند که با کسب داده‌های بیشتر، سوگیری خود را تغییر دهند.^[۵] البته این نکته حائز اهمیت است که این کار از سوگیری جلوگیری نمی کند، زیرا فرآیند ایجاد تغییر در سوگیری خود باید یک سوگیری داشته باشد. ^[۶]

مثال از بایاس های القایی رایج در یادگیری ماشین.[ویرایش]

- مدل های بیزی ^[۷]

بایاس در این الگوریتم این است که در آن سعی می شود استقلال شرطی بیشینه شود.

- الگوریتم k نزدیک ترین همسایه^[۷]

در ابن الگوریتم فرض می کنیم که داده ها در یه ناحیه ی مضخص از فضای ویژگی متعلق به یک کلاس خاص هستند. داده ی ورودی جدید به کلاسی تعلق پیدا خواهد کرد که اکثریت در همسایگی نزدیکی آن هستند. این موضوع که داده هایی که در نزدیکی یکدیگر قرار دارند به یک طبقه تعلق دارند بایاس مربوط به الگوریتم k نزدیک ترین همسایه است.

- اعتبار سنجی متقابل

در این تکنیک از بین نتایج و فرایض به وجود آمده، نتیجه ای که کم ترین خطا را ایجاد می کند انتخاب می شود. طبق نظریه ی "ناهار مجانی وجود نداردǃ" می توان دریافت که تکنیک اعتبار سنجی متقابل نیز دارای بایاس است.

- ماشین بردار پشتیبان

در این الگوریتم برای تعیین مرز بین دو کلاس سعی می شود که عرض مرز بیشینه شود. این موضوع بایاس نهفته در این الگوریتم است. در واقع پیش فرض این الگوریتم آن است که ما تمایل داریم تا کلاس ها با مرز های گسترده تر از هم جدا شوند.

جستار های وابستی[ویرایش]

- سوگیری الگوریتمی

- سوگیری شناختی

- از ناهار مجانی خبری نیست.

- در جست و جو و بهینه سازی از ناهار مجانی خبری نیست.

منابع[ویرایش]

↑ Kamran Panahi (۱۴۰۱-۱۰-۱۹). «در نظر گرفتن جهت‌گیریِ استنتاجی». https://biasvariance.net/articles/yab68/inductive-bias/. پیوند خارجی در |وبگاه= وجود دارد (کمک)صفحه پودمان:Citation/CS1/fa/styles.css محتوایی ندارد.
↑ [Hüllermeier, E., Fober, T., Mernberger, M. (2013). Inductive Bias. In: Dubitzky, W., Wolkenhauer, O., Cho, KH., Yokota, H. (eds) Encyclopedia of Systems Biology. Springer, New York, NY. https://doi.org/10.1007/978-1-4419-9863-7_927 «Inductive Bias»] مقدار |نشانی= را بررسی کنید (کمک).صفحه پودمان:Citation/CS1/fa/styles.css محتوایی ندارد.
↑ Gleb Kumichev (Jun 13,2022). "The Inductive Bias of ML Models, and Why You Should Care About It". Towardsdatascience (به English). Check date values in: |تاریخ= (help)صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
↑ Dr. Tehseen Zia (10/1/2023). "What is inductive bias in machine learning" (به English). Check date values in: |تاریخ= (help)صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
↑ Machine Learning: An Artificial Intelligence Approach, Volume II.صفحه پودمان:Citation/CS1/fa/styles.css محتوایی ندارد.
↑ Arado, DHGarrette, Nnemo (7/9/2023). "inductive bias". wikipedia (به English). Check date values in: |تاریخ= (help)صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
↑ ^۷٫۰ ^۷٫۱ Akbar Karimi (November 5, 2022). "What is inductive bias in machine learning" (به English).صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.

This article "بایاس القایی" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:بایاس القایی. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.

Facebook Page

Follow us on Twitter !

Read or create/edit this page in another language[ویرایش]

بایاس القایی in English

[1] Kamran Panahi (۱۴۰۱-۱۰-۱۹). «در نظر گرفتن جهت‌گیریِ استنتاجی». https://biasvariance.net/articles/yab68/inductive-bias/. پیوند خارجی در |وبگاه= وجود دارد (کمک)صفحه پودمان:Citation/CS1/fa/styles.css محتوایی ندارد.

[2] [Hüllermeier, E., Fober, T., Mernberger, M. (2013). Inductive Bias. In: Dubitzky, W., Wolkenhauer, O., Cho, KH., Yokota, H. (eds) Encyclopedia of Systems Biology. Springer, New York, NY. https://doi.org/10.1007/978-1-4419-9863-7_927 «Inductive Bias»] مقدار |نشانی= را بررسی کنید (کمک).صفحه پودمان:Citation/CS1/fa/styles.css محتوایی ندارد.

[3] Gleb Kumichev (Jun 13,2022). "The Inductive Bias of ML Models, and Why You Should Care About It". Towardsdatascience (به English). Check date values in: |تاریخ= (help)صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.

[4] Dr. Tehseen Zia (10/1/2023). "What is inductive bias in machine learning" (به English). Check date values in: |تاریخ= (help)صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.

[5] Machine Learning: An Artificial Intelligence Approach, Volume II.صفحه پودمان:Citation/CS1/fa/styles.css محتوایی ندارد.

[6] Arado, DHGarrette, Nnemo (7/9/2023). "inductive bias". wikipedia (به English). Check date values in: |تاریخ= (help)صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.

[:0-7] ۷٫۰ ^۷٫۱ Akbar Karimi (November 5, 2022). "What is inductive bias in machine learning" (به English).صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.

[۱]

[۲]

[۳]

[۴]

[۵]

[۶]

[۷]