You can edit almost every page by Creating an account. Otherwise, see the FAQ.

تشخیص اشیا

از EverybodyWiki Bios & Wiki
پرش به:ناوبری، جستجو

خطای اسکریپتی: پودمان «AfC submission catcheck» وجود ندارد.

اشیایی که توسط ماژول DNN از کتابخانه‌ی OpenCV تشخیص داده شدند. مدل استفاده شده YOLOv3 بوده که بر روی دیتاست COCO با توانایی تشخیص اشیا از 80 کلاس متفاوت، آموزش دیده است.

تشخیص اشیا

یک تکنیک بینایی ماشین می باشد و هدف آن یافتن اشیا در عکس ها و یا ویدیوها می باشد. الگوریتم های تشخیص اشیا از شیوه های یادگیری ماشین و یادگیری عمیق استفاده می کنند. معمولا اشیای هدف، به کلاس های خاصی تعلق دارند و در نتیجه ی آن، کاربردهایی از قبیل تشخیص چهره و یا انسان در همین دسته قرار می گیرد.

روش های جدیدتر این مسئله، عموما به دو دسته ی "تک مرحله ای" و "دو مرحله ای" تقسیم می شوند. روش تک مرحله ای زودتر به نتیجه می رسد و سرعت بالاتری دارد. اما روش دو مرحله ای به دقت و درستی اهمیت بیشتری می دهد.

کاربردها[ویرایش]

تکنولوژی اصلی ماشین های پیشرفته از تشخیص اشیا استفاده می کند که به ماشین ها این توانایی را می دهد که هنگام رانندگی، تعداد ماشین های جلو، فرم جاده، و حضور موجود زنده یا اشیای بی جان تشخیص دهد.

همچنین در نظارت ویدیوها و یا استخراج بخش های مهم عکس ها کاربرد دارد.

با متدهای تشخیص اشیا، می توان تعداد اشیای یک صحنه را یافت و بر روی موقعیت دقیق آنها همزمان با نگه داری برچسبشان، نظارت کرد.

و البته با روش های تشخیص اشیا، می توان به تشخیص گوشه ها و زوایا پرداخت و برای مثال عکسی را که از یک فرم کج گرفته شده را بعد از تشخیص گوشه هایش، صاف کرد.

مفهوم[ویرایش]

هر شی ویژگی خاص خود را دارد که الگوریتم با توجه به آن ها می تواند اشیا را گروه بندی کند. یکی از چالش های تشخیص اشیا نیز به همین دلیل ایجاد می شود. چون ممکن است اشیایی که بررسی می کند از یک کلاس باشند اما از زوایا و یا سایزهای متفاوتی باشند و در نتیجه در تشخیصشان خطا رخ دهد. اما در کل مفهوم کلی تشخیص اشیا این است که با یاد گرفتن الگویی که به دنبالش است، اشیایی که با آن الگو صدق می کنند را بیابد.

روش ها[ویرایش]

مقایسه‌ی سرعت و درستی تشخیص‌دهنده های مختلف بر روی دیتاست COCO testdey.cocodataset.org (All values are found in https://arxiv.org articles by the authors of these algorithms.)

روش های مختلفی برای حل این مسئله وجود دارد. که می توان به طور کلی آنها را یا عضوی از روش های شبکه عصبی دید و یا خیر. اگر از روش های شبکه عصبی استفاده نکنیم مهم است که ویژگی ها را ابتدا تعریف کنیم. روش های ذکر شده در زیر برای یافتن این ویژگی ها مناسب هستند.

حال بعد از توصیف این ویژگی ها، می توانیم از تکنیکی مانند ماشین بردار پشتیبانی استفاده کنیم تا دسته بندی را انجام دهیم.

روش های شبکه ی عصبی اما بدون اینکه نیاز به تعریف ویژگی ها داشته باشند می توانند اشیا را تشخیص دهند و روش کلی آن ها استفاده از شبکه ی عصبی پیچشی شبکه عصبی پیچشی می باشد. در لینک های زیر می توانیم چند روش را مطالعه کنیم. توضیح این الگوریتم ها از بحث به صورت مستقیم خارج است. اما کتابخانه های بسیاری در زبان پایتون، این مدل ها را به صورت آماده دارند و می توان با فاین-تیون آن ها، این الگوریتم ها و مدل ها را به طوری شخصی سازی کرد که تنها اشیای مد نظر و خاصی را تشخیص دهند.

مباحث مرتبط[ویرایش]

مراجع[ویرایش]

  1. Dalal, Navneet (2005). "Histograms of oriented gradients for human detection" (PDF). Computer Vision and Pattern Recognition. 1.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
  2. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  3. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  4. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  5. ۵٫۰ ۵٫۱ Pang, Jiangmiao; Chen, Kai; Shi, Jianping; Feng, Huajun; Ouyang, Wanli; Lin, Dahua (2019-04-04). "Libra R-CNN: Towards Balanced Learning for Object Detection". arXiv:1904.02701v1 [cs.CV].
  6. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  7. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  8. Redmon, Joseph (2017). "YOLO9000: better, faster, stronger". arXiv:1612.08242 [cs.CV].
  9. Redmon, Joseph (2018). "Yolov3: An incremental improvement". arXiv:1804.02767 [cs.CV].
  10. Bochkovskiy, Alexey (2020). "Yolov4: Optimal Speed and Accuracy of Object Detection". arXiv:2004.10934 [cs.CV].
  11. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  12. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  13. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  14. Zhu, Xizhou (2018). "Deformable ConvNets v2: More Deformable, Better Results". arXiv:1811.11168 [cs.CV].
  15. Dai, Jifeng (2017). "Deformable Convolutional Networks". arXiv:1703.06211 [cs.CV].

لینک‌های دیگر[ویرایش]



This article "تشخیص اشیا" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:تشخیص اشیا. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.



Read or create/edit this page in another language[ویرایش]