تشخیص اشیا

خطای اسکریپتی: پودمان «AfC submission catcheck» وجود ندارد.

تشخیص اشیا

یک تکنیک بینایی ماشین می باشد و هدف آن یافتن اشیا در عکس ها و یا ویدیوها می باشد. الگوریتم های تشخیص اشیا از شیوه های یادگیری ماشین و یادگیری عمیق استفاده می کنند. معمولا اشیای هدف، به کلاس های خاصی تعلق دارند و در نتیجه ی آن، کاربردهایی از قبیل تشخیص چهره و یا انسان در همین دسته قرار می گیرد.

روش های جدیدتر این مسئله، عموما به دو دسته ی "تک مرحله ای" و "دو مرحله ای" تقسیم می شوند. روش تک مرحله ای زودتر به نتیجه می رسد و سرعت بالاتری دارد. اما روش دو مرحله ای به دقت و درستی اهمیت بیشتری می دهد.

کاربردها[ویرایش]

تکنولوژی اصلی ماشین های پیشرفته از تشخیص اشیا استفاده می کند که به ماشین ها این توانایی را می دهد که هنگام رانندگی، تعداد ماشین های جلو، فرم جاده، و حضور موجود زنده یا اشیای بی جان تشخیص دهد.

همچنین در نظارت ویدیوها و یا استخراج بخش های مهم عکس ها کاربرد دارد.

با متدهای تشخیص اشیا، می توان تعداد اشیای یک صحنه را یافت و بر روی موقعیت دقیق آنها همزمان با نگه داری برچسبشان، نظارت کرد.

و البته با روش های تشخیص اشیا، می توان به تشخیص گوشه ها و زوایا پرداخت و برای مثال عکسی را که از یک فرم کج گرفته شده را بعد از تشخیص گوشه هایش، صاف کرد.

مفهوم[ویرایش]

هر شی ویژگی خاص خود را دارد که الگوریتم با توجه به آن ها می تواند اشیا را گروه بندی کند. یکی از چالش های تشخیص اشیا نیز به همین دلیل ایجاد می شود. چون ممکن است اشیایی که بررسی می کند از یک کلاس باشند اما از زوایا و یا سایزهای متفاوتی باشند و در نتیجه در تشخیصشان خطا رخ دهد. اما در کل مفهوم کلی تشخیص اشیا این است که با یاد گرفتن الگویی که به دنبالش است، اشیایی که با آن الگو صدق می کنند را بیابد.

روش ها[ویرایش]

روش های مختلفی برای حل این مسئله وجود دارد. که می توان به طور کلی آنها را یا عضوی از روش های شبکه عصبی دید و یا خیر. اگر از روش های شبکه عصبی استفاده نکنیم مهم است که ویژگی ها را ابتدا تعریف کنیم. روش های ذکر شده در زیر برای یافتن این ویژگی ها مناسب هستند.

روش‌های غیر مبتنی بر شبکه‌های عصبی:
- Viola–Jones object detection framework بر اساس Haar features
- Scale-invariant feature transform (SIFT)
- Histogram of oriented gradients (HOG) ویژگی ها^[۱]

حال بعد از توصیف این ویژگی ها، می توانیم از تکنیکی مانند ماشین بردار پشتیبانی استفاده کنیم تا دسته بندی را انجام دهیم.

روش های شبکه ی عصبی اما بدون اینکه نیاز به تعریف ویژگی ها داشته باشند می توانند اشیا را تشخیص دهند و روش کلی آن ها استفاده از شبکه ی عصبی پیچشی شبکه عصبی پیچشی می باشد. در لینک های زیر می توانیم چند روش را مطالعه کنیم. توضیح این الگوریتم ها از بحث به صورت مستقیم خارج است. اما کتابخانه های بسیاری در زبان پایتون، این مدل ها را به صورت آماده دارند و می توان با فاین-تیون آن ها، این الگوریتم ها و مدل ها را به طوری شخصی سازی کرد که تنها اشیای مد نظر و خاصی را تشخیص دهند.

روش‌های مبتنی شبکه‌های عصبی:
- Region Proposals (R-CNN,^[۲] Fast R-CNN,^[۳] Faster R-CNN,^[۴] cascade R-CNN.^[۵])
- Single Shot MultiBox Detector (SSD) ^[۶]
- You Only Look Once (YOLO) ^[۷]^[۸]^[۹]^[۱۰]^[۱۱]
- Single-Shot Refinement Neural Network for Object Detection (RefineDet) ^[۱۲]
- Retina-Net ^[۱۳]^[۵]
- Deformable convolutional networks ^[۱۴]^[۱۵]

مباحث مرتبط[ویرایش]

تشخیص ویژگی‌ها، بینایی کامپیوتر Feature detection (computer vision)

تشخیص اشیای متحرک Moving object detection

تشخیص اشیای کوچک Small object detection

طرح کلی تشخیص اشیا Outline of object recognition

الگوریتم تکنومو فرناندز Teknomo–Fernandez algorithm

مراجع[ویرایش]

↑ Dalal, Navneet (2005). "Histograms of oriented gradients for human detection" (PDF). Computer Vision and Pattern Recognition. 1.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
↑ ^۵٫۰ ^۵٫۱ Pang, Jiangmiao; Chen, Kai; Shi, Jianping; Feng, Huajun; Ouyang, Wanli; Lin, Dahua (2019-04-04). "Libra R-CNN: Towards Balanced Learning for Object Detection". arXiv:1904.02701v1 [cs.CV].
↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
↑ Redmon, Joseph (2017). "YOLO9000: better, faster, stronger". arXiv:1612.08242 [cs.CV].
↑ Redmon, Joseph (2018). "Yolov3: An incremental improvement". arXiv:1804.02767 [cs.CV].
↑ Bochkovskiy, Alexey (2020). "Yolov4: Optimal Speed and Accuracy of Object Detection". arXiv:2004.10934 [cs.CV].
↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
↑ Zhu, Xizhou (2018). "Deformable ConvNets v2: More Deformable, Better Results". arXiv:1811.11168 [cs.CV].
↑ Dai, Jifeng (2017). "Deformable Convolutional Networks". arXiv:1703.06211 [cs.CV].

"Object Detection". paperswithcode. Retrieved 2022-12-23.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.

"Object Detection". wikipedia. Retrieved 2022-12-23.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.

"Introduction to Object Detection Model Evaluation". Déborah Mesquita. Retrieved 2022-12-23.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.

لینک‌های دیگر[ویرایش]

Multiple object class detection

Spatio-temporal action localization

Video object detection and co-segmentation

This article "تشخیص اشیا" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:تشخیص اشیا. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.

Facebook Page

Follow us on Twitter !

Read or create/edit this page in another language[ویرایش]

تشخیص اشیا in English

[1] Dalal, Navneet (2005). "Histograms of oriented gradients for human detection" (PDF). Computer Vision and Pattern Recognition. 1.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.

[2] خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).

[3] خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).

[4] خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).

[Pang_Chen_Shi_Feng_2019-5] ۵٫۰ ^۵٫۱ Pang, Jiangmiao; Chen, Kai; Shi, Jianping; Feng, Huajun; Ouyang, Wanli; Lin, Dahua (2019-04-04). "Libra R-CNN: Towards Balanced Learning for Object Detection". arXiv:1904.02701v1 [cs.CV].

[6] خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).

[7] خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).

[8] Redmon, Joseph (2017). "YOLO9000: better, faster, stronger". arXiv:1612.08242 [cs.CV].

[9] Redmon, Joseph (2018). "Yolov3: An incremental improvement". arXiv:1804.02767 [cs.CV].

[yolov4-10] Bochkovskiy, Alexey (2020). "Yolov4: Optimal Speed and Accuracy of Object Detection". arXiv:2004.10934 [cs.CV].

[11] خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).

[12] خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).

[13] خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).

[14] Zhu, Xizhou (2018). "Deformable ConvNets v2: More Deformable, Better Results". arXiv:1811.11168 [cs.CV].

[15] Dai, Jifeng (2017). "Deformable Convolutional Networks". arXiv:1703.06211 [cs.CV].

[۱]

[۲]

[۳]

[۴]

[۵]

[۶]

[۷]

[۸]

[۹]

[۱۰]

[۱۱]

[۱۲]

[۱۳]

[۱۴]

[۱۵]