تشخیص اشیا
این مقاله، تشخیص اشیا، اخیراً بهواسطهٔ فرایند ایجاد مقاله ایجاد شدهاست. بازبینیکننده در حال بستن درخواست است و این برچسب احتمالاً بهزودی برداشته میشود.
ابزارهای بازبینی: پیشبارگیری بحث اعلان به نگارنده |
خطای اسکریپتی: پودمان «AfC submission catcheck» وجود ندارد.
تشخیص اشیا
یک تکنیک بینایی ماشین می باشد و هدف آن یافتن اشیا در عکس ها و یا ویدیوها می باشد. الگوریتم های تشخیص اشیا از شیوه های یادگیری ماشین و یادگیری عمیق استفاده می کنند. معمولا اشیای هدف، به کلاس های خاصی تعلق دارند و در نتیجه ی آن، کاربردهایی از قبیل تشخیص چهره و یا انسان در همین دسته قرار می گیرد.
روش های جدیدتر این مسئله، عموما به دو دسته ی "تک مرحله ای" و "دو مرحله ای" تقسیم می شوند. روش تک مرحله ای زودتر به نتیجه می رسد و سرعت بالاتری دارد. اما روش دو مرحله ای به دقت و درستی اهمیت بیشتری می دهد.
کاربردها[ویرایش]
تکنولوژی اصلی ماشین های پیشرفته از تشخیص اشیا استفاده می کند که به ماشین ها این توانایی را می دهد که هنگام رانندگی، تعداد ماشین های جلو، فرم جاده، و حضور موجود زنده یا اشیای بی جان تشخیص دهد.
همچنین در نظارت ویدیوها و یا استخراج بخش های مهم عکس ها کاربرد دارد.
با متدهای تشخیص اشیا، می توان تعداد اشیای یک صحنه را یافت و بر روی موقعیت دقیق آنها همزمان با نگه داری برچسبشان، نظارت کرد.
و البته با روش های تشخیص اشیا، می توان به تشخیص گوشه ها و زوایا پرداخت و برای مثال عکسی را که از یک فرم کج گرفته شده را بعد از تشخیص گوشه هایش، صاف کرد.
مفهوم[ویرایش]
هر شی ویژگی خاص خود را دارد که الگوریتم با توجه به آن ها می تواند اشیا را گروه بندی کند. یکی از چالش های تشخیص اشیا نیز به همین دلیل ایجاد می شود. چون ممکن است اشیایی که بررسی می کند از یک کلاس باشند اما از زوایا و یا سایزهای متفاوتی باشند و در نتیجه در تشخیصشان خطا رخ دهد. اما در کل مفهوم کلی تشخیص اشیا این است که با یاد گرفتن الگویی که به دنبالش است، اشیایی که با آن الگو صدق می کنند را بیابد.
روش ها[ویرایش]
روش های مختلفی برای حل این مسئله وجود دارد. که می توان به طور کلی آنها را یا عضوی از روش های شبکه عصبی دید و یا خیر. اگر از روش های شبکه عصبی استفاده نکنیم مهم است که ویژگی ها را ابتدا تعریف کنیم. روش های ذکر شده در زیر برای یافتن این ویژگی ها مناسب هستند.
- روشهای غیر مبتنی بر شبکههای عصبی:
حال بعد از توصیف این ویژگی ها، می توانیم از تکنیکی مانند ماشین بردار پشتیبانی استفاده کنیم تا دسته بندی را انجام دهیم.
روش های شبکه ی عصبی اما بدون اینکه نیاز به تعریف ویژگی ها داشته باشند می توانند اشیا را تشخیص دهند و روش کلی آن ها استفاده از شبکه ی عصبی پیچشی شبکه عصبی پیچشی می باشد. در لینک های زیر می توانیم چند روش را مطالعه کنیم. توضیح این الگوریتم ها از بحث به صورت مستقیم خارج است. اما کتابخانه های بسیاری در زبان پایتون، این مدل ها را به صورت آماده دارند و می توان با فاین-تیون آن ها، این الگوریتم ها و مدل ها را به طوری شخصی سازی کرد که تنها اشیای مد نظر و خاصی را تشخیص دهند.
- روشهای مبتنی شبکههای عصبی:
- Region Proposals (R-CNN,[۲] Fast R-CNN,[۳] Faster R-CNN,[۴] cascade R-CNN.[۵])
- Single Shot MultiBox Detector (SSD) [۶]
- You Only Look Once (YOLO) [۷][۸][۹][۱۰][۱۱]
- Single-Shot Refinement Neural Network for Object Detection (RefineDet) [۱۲]
- Retina-Net [۱۳][۵]
- Deformable convolutional networks [۱۴][۱۵]
مباحث مرتبط[ویرایش]
- تشخیص ویژگیها، بینایی کامپیوتر Feature detection (computer vision)
- تشخیص اشیای متحرک Moving object detection
- تشخیص اشیای کوچک Small object detection
- طرح کلی تشخیص اشیا Outline of object recognition
- الگوریتم تکنومو فرناندز Teknomo–Fernandez algorithm
مراجع[ویرایش]
- ↑ Dalal, Navneet (2005). "Histograms of oriented gradients for human detection" (PDF). Computer Vision and Pattern Recognition. 1.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ ۵٫۰ ۵٫۱ Pang, Jiangmiao; Chen, Kai; Shi, Jianping; Feng, Huajun; Ouyang, Wanli; Lin, Dahua (2019-04-04). "Libra R-CNN: Towards Balanced Learning for Object Detection". arXiv:1904.02701v1 [cs.CV].
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ Redmon, Joseph (2017). "YOLO9000: better, faster, stronger". arXiv:1612.08242 [cs.CV].
- ↑ Redmon, Joseph (2018). "Yolov3: An incremental improvement". arXiv:1804.02767 [cs.CV].
- ↑ Bochkovskiy, Alexey (2020). "Yolov4: Optimal Speed and Accuracy of Object Detection". arXiv:2004.10934 [cs.CV].
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ Zhu, Xizhou (2018). "Deformable ConvNets v2: More Deformable, Better Results". arXiv:1811.11168 [cs.CV].
- ↑ Dai, Jifeng (2017). "Deformable Convolutional Networks". arXiv:1703.06211 [cs.CV].
- "Object Detection". paperswithcode. Retrieved 2022-12-23.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
- "Object Detection". wikipedia. Retrieved 2022-12-23.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
- "Introduction to Object Detection Model Evaluation". Déborah Mesquita. Retrieved 2022-12-23.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
لینکهای دیگر[ویرایش]
This article "تشخیص اشیا" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:تشخیص اشیا. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.