You can edit almost every page by Creating an account. Otherwise, see the FAQ.

Perceiver

از EverybodyWiki Bios & Wiki
پرش به:ناوبری، جستجو

Perceiver یک ترانسفورماتور است که قادر به پردازش داده های غیر متنی مانند تصاویر، صداها و ویدئو و داده های مکانی است. ترانسفورماتورها زیربنای سیستم های قابل توجه دیگری مانند BERT و GPT-3 هستند که قبل از Perceiver بودند. [۱] این یک مکانیسم توجه نامتقارن را برای تقطیر ورودی ها در یک گلوگاه نهفته اتخاذ می کند و به آن امکان می دهد از مقادیر زیادی داده های ناهمگن یاد بگیرد. Perceiver با مدل های تخصصی در وظایف طبقه بندی مطابقت دارد یا بهتر عمل می کند. [۲]

تاریخ[ویرایش]

Perceiver در ژوئن 2021 توسط DeepMind معرفی شد. [۲] در آگوست 2021 توسط Perceiver IO دنبال شد. [۳]

طرح[ویرایش]

Perceiver بدون عناصر خاص مدالیته طراحی شده است. به عنوان مثال، عناصر تخصصی برای پردازش تصاویر، متن یا صدا ندارد. علاوه بر این، می تواند چندین جریان ورودی مرتبط از انواع ناهمگن را مدیریت کند. از مجموعه کوچکی از واحدهای مرتبط استفاده می کند که یک گلوگاه توجه را تشکیل می دهد که ورودی ها باید از آن عبور کنند. یک مزیت آن این است که مشکل پوسته پوسته شدن درجه دوم را که در ترانسفورماتورهای اولیه یافت می شود، حذف میشود. کارهای قبلی از استخراج کننده ویژگی سفارشی برای هر مدالیته استفاده می کردند. [۲]

این ویژگی موقعیت و حالت خاص را با هر عنصر ورودی (به عنوان مثال هر پیکسل یا نمونه صوتی) مرتبط می کند. این ویژگی ها را می توان با استفاده از ویژگی های فوریه با دقت و کیفیت بالا آموخت یا ساخت . [۲]

Perceiver از توجه متقابل برای تولید لایه های پیچیدگی خطی و جدا کردن عمق شبکه از اندازه ورودی استفاده می کند. این جداساز امکان معماری های عمیق تری را فراهم میکند. [۲]

کارایی[ویرایش]

عملکرد Perceiver با ResNet -50 و ViT در ImageNet بدون پیچیدگی دو بعدی قابل مقایسه است. به 50000 پیکسل توجه می کند. در همه حالت ها در AudioSet قابل رقابت است. [۲]

همچنین ببینید[ویرایش]

لینک های خارجی[ویرایش]


This article "Perceiver" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:Perceiver. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.

  1. Ray, Tiernan. "Google's Supermodel: DeepMind Perceiver is a step on the road to an AI machine that could process anything and everything". ZDNet (به English). Retrieved 2021-08-19.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
  2. ۲٫۰ ۲٫۱ ۲٫۲ ۲٫۳ ۲٫۴ ۲٫۵ Jaegle. "Perceiver: General Perception with Iterative Attention". MISSING LINK.. خطای یادکرد: برچسب <ref> نامعتبر؛ نام «:0» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب <ref> نامعتبر؛ نام «:0» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب <ref> نامعتبر؛ نام «:0» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب <ref> نامعتبر؛ نام «:0» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب <ref> نامعتبر؛ نام «:0» چندین بار با محتوای متفاوت تعریف شده است
  3. Jaegle. "Perceiver IO: A General Architecture for Structured Inputs & Outputs". arXiv:2107.14795.


Read or create/edit this page in another language[ویرایش]