تشخیص سهبعدی
این مقاله، تشخیص سهبعدی، اخیراً بهواسطهٔ فرایند ایجاد مقاله ایجاد شدهاست. بازبینیکننده در حال بستن درخواست است و این برچسب احتمالاً بهزودی برداشته میشود.
ابزارهای بازبینی: پیشبارگیری بحث اعلان به نگارنده |
خطای اسکریپتی: پودمان «AfC submission catcheck» وجود ندارد.
روش تشخیص سهبعدی[ویرایش]
مدل سهبعدی چهره انسان
در تکنیک تشخیص چهره سه بعدی از حسگرهای سه بعدی برای گرفتن اطلاعات در مورد شکل صورت استفاده میشود.
سپس از این اطلاعات برای شناسایی ویژگیهای متمایز سطح صورت مانند کانتور حفرههای چشم، بینی و چانه استفاده میشود. یکی از مزایای تشخیص چهره سه بعدی این است که مانند سایر تکنیکها تحت تأثیر تغییرات نور، استفاده از آرایش، و زاویهی عکس گرفته شده، قرار نمیگیرد. البته تاثیر حالتهای چهره همچنان یک چالش هست. اما میتواند چهره را از طیف وسیعی از زاویه دید، از جمله نمای نمایه شناسایی کند. نشان داده شده است که تشخیص سهبعدی به شدت دقت تشخیص را نسبت به روشهای دوبعدی معادل خود بالا می برد. همچنین میتوان از مدل سهبعدی استفاده کرد تا تشخیص چهرهی دوبعدی را با تغییر زاویهی فعلی به زاویهای که مدل آن را بهتر تشخیص میدهد، با دقت بالاتری صورت گیرد.
تحقیقات تشخیص چهره سه بعدی با تولید حسگرهای پیچیدهای که نور ساختاری را بر روی صورت انجام میدهند، امکانپذیر است. تکنیک تطبیق سه بعدی به عبارات حساس است، بنابراین محققان در Technion از ابزارهای هندسه متریک برای درمان عبارات به عنوان ایزومتری استفاده کردند. یک روش جدید برای گرفتن تصاویر سه بعدی از چهرهها از سه دوربین ردیابی استفاده میکند که از زوایای مختلف نشان داده میشوند. یک دوربین در جلو سوژه قرار دارد، دوربین دوم به طرف و دوربین سوم به صورت زاویه دار. همه این دوربینها با هم کار میکنند بنابراین میتواند صورت سوژه را در زمان واقعی ردیابی کند و قادر به تشخیص و تشخیص چهره باشد. اما همین مسئله همچنان یکی از بزرگترین چالش های تشخیص سهبعدی باقی مانده است. روش دیگری که اخیرا برای حل این مشکل ارائه شده است، استفاده از دیدگاه عمیق است که با برانداختن یک مش بر روی چهره و ضبط یک ویدیو از آن، یک مدل سه بعدی با کیفیت بالا ارائه میدهد.
به صورت کلی، یک سیستم تشخیص چهره سه بعدی، چهار بخش دارد. ابتدا به دست آوردن دیتا، پیش پردازش، استخراج ویژگی و نهایتا دسته بندی ویژگی ها برای پروسه مد نظر می باشد. همانطور که قبلتر ذکر شد، این داده ی سه بعدی را می توان به روش های مختلفی همچون استفاده از اسکن کننده ی لیزری، استفاده از چند دوربین، استفاده از یک دوربین با یک پروژکتور نوری به دست آورد. که نتیجه یک مدل یا "عکس بازهای" می شود با پیکسل هایی که فاصله هر نقطه صورت را از دوربین ضبط کرده اند. بدیهتا کیفیت این داده وابسته به ابزار تولید و ضبط می باشد. بعد از به دست آوردن داده ی اولیه، پیش پردازش شروع می شود و روش هایی همچون "حذف اختلالات"، "پر کردن نقاط خالی"، "صاف کردن" و ... انجام می گیرد تا داده ها منظم تر شوند. سپس تعدادی از ویژگی های صفحه که اطلاعات کافی را برای تشخیص به ما می دهند انتخاب شده و می توانند محلی یا جهانی باشند. این ویژگی ها عموما به فرم فاصله بین نقاط سطح، خمیدگی سطح، و ویژگی های هندسی دیگر می باشند. در انتخاب این ویژگی ها مهم است که به ژست وابسته نباشند. در مرحله ی نهایی که دسته بندی ویژگی ها می باشد معمولا از الگوریتم های برداری همچون SVM, NN, PCA, LDA یا روش های آماری استفاده می شود. هنگامی که مدل آموزش داده شود، با داشتن پارامترهای فعلی اش و چهره هایی که می شناسد، می تواند تشخیص بدهد که چهره های جدیدی که می بیند را از قبل دیده یا نه.
منابع افزوده شده[ویرایش]
- "Object Detection". paperswithcode. Retrieved 2022-12-23.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
- "Object Detection". wikipedia. Retrieved 2022-12-23.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
- "Introduction to Object Detection Model Evaluation". Déborah Mesquita. Retrieved 2022-12-23.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
This article "تشخیص سهبعدی" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:تشخیص سهبعدی. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.