You can edit almost every page by Creating an account. Otherwise, see the FAQ.

Multimodal sentiment analysis

از EverybodyWiki Bios & Wiki
پرش به:ناوبری، جستجو

«این صفحه در حال ترجمه از ویکی انگلیسی است. لطفا حذف نشود.»


تحلیل احساسات چندوجهی بعد جدیدی از تحلیل احساسات مبتنی بر متن است، که فراتر از تجزیه و تحلیل متون می‌رود و شامل بررسی سایر ابعاد مانند داده‌های صوتی و تصویری نیز می شود.[۱] تحلیل احساسات چندوجهی، می تواند دو وجهی باشد که به معنی ترکیب دو مدالیته مختلف است، یا سه وجهی باشد که دربرگیرنده سه مدالیته است.[۲] با وجود حجم گسترده داده‌های رسانه‌های اجتماعی که به شکل‌های مختلف از جمله ویدئو و تصویر به‌ صورت آنلاین در دسترس هستند، تکنیک متعارف تحلیل احساسات مبتنی بر متن به مدل‌های پیچیده‌تر تحلیل احساسات چندوجهی تبدیل شده است.[۳] این تکنولوژی می‌تواند در توسعه دستیاران مجازی[۴]، تجزیه و تحلیل نقد فیلم‌های YouTube[۵]، تجزیه و تحلیل ویدیوهای خبری، و تشخیص احساسات مانند نظارت بر افسردگی و زمینه‌های دیگر کاربرد داشته باشد.

مشابه تحلیل احساسات سنتی، یکی از اساسی ترین وظایف در تحلیل احساسات چندوجهی ، طبقه‌ بندی احساسات است که احساسات مختلف را به دسته هایی مانند مثبت، منفی یا خنثی دسته‌ بندی می‌کند. پیچیدگی تجزیه و تحلیل ویژگی‌های متنی، صوتی و بصری برای انجام چنین کاری مستلزم استفاده از تکنیک‌های ترکیبی مختلف، مانند سطح ویژگی، سطح تصمیم، و ترکیب هایبرید است.[۳] عملکرد این تکنیک‌های ادغامی و الگوریتم‌های طبقه‌بندی، تحت‌تاثیر نوع ویژگی‌های متنی، صوتی و بصری به‌ کار رفته در این بررسی است. [۶]

ویژگی‌ها[ویرایش]

مهندسی ویژگی، که شامل انتخاب ویژگی‌هایی است که به الگوریتم‌های یادگیری ماشین داده می‌شوند، نقش کلیدی در عملکرد طبقه‌بندی احساسات بازی می‌کند.[۶] در تحلیل احساسات چندوجهی، ترکیبی از ویژگی های متنی، صوتی و بصری مختلف به کار گرفته می شود.[۳]

ویژگی‌های متنی[ویرایش]

مشابه تجزیه و تحلیل احساسات مرسوم مبتنی بر متن، برخی از متداول‌ترین ویژگی‌های متنی مورد استفاده در تحلیل احساسات چندوجهی، تک‌-گرم‌ها و ان-گرم‌ها هستند که اساساً دنباله‌ای از کلمات در یک سند متنی هستند.[۷] این ویژگی‌ها با استفاده از مدل بسته کلمات یا مدل بسته مفاهیم اعمال می‌شوند که در آن کلمات یا مفاهیم به صورت بردارهایی در فضایی مناسب نمایش داده می‌شوند.[۸][۹]

ویژگی‌های صوتی[ویرایش]

عواطف و احساسات دارای خصوصیات آوایی و عروضی متفاوتی در ویژگی‌های صوتی هستند.[۱۰] برخی از مهم‌ترین ویژگی‌های صوتی مورد استفاده در تجزیه و تحلیل احساسات چندوجهی عبارتند از ضرایب فرکانس مل (MFCC)، مرکز طیفی، شار طیفی، هیستوگرام ضربان، مجموع ضربان، قوی‌ترین ضرب، مدت زمان مکث، و گام. [۳] OpenSMILE و Praat ابزارهای منبع باز پرطرفدار برای استخراج این ویژگی‌های صوتی هستند.

ویژگی‌های بصری[ویرایش]

یکی از مزایای اصلی تجزیه و تحلیل ویدئوها در مقایسه‌ با تحلیل صرف متن، غنی بودن نشانه‌های احساسات در داده های بصری است.[۱۱] ویژگی‌های بصری شامل حالات چهره است که در شناسایی احساسات و عواطف از اهمیت بالایی برخوردار است، زیرا کانال اصلی نمایش حالات ذهنی فعلی فرد است.[۳] به طور خاص، لبخند به عنوان یکی از واضح‌ترین نشانه‌های بصری در تحلیل احساسات چندوجهی در نظر گرفته می‌شود.[۸] OpenFace یک جعبه ابزار منبع باز برای تجزیه و تحلیل چهره است که برای استخراج و درک چنین ویژگی های بصری در دسترس است.[۱۲]

تکنیک‌های ترکیبی[ویرایش]

برخلاف تحلیل احساسات سنتی مبتنی بر متن، در تحلیل احساسات چندوجهی تحت یک فرآیند ادغام، داده‌های روش‌های مختلف (متنی، صوتی یا بصری) با هم ترکیب و تجزیه و تحلیل می‌شوند. [۳] رویکردهای موجود برای ادغام داده‌ها در تحلیل احساسات چندوجهی را می‌توان به سه دسته اصلی گروه‌بندی کرد: سطح ویژگی، سطح تصمیم، و ترکیب هایبرید. عملکرد طبقه‌بندی احساسات بستگی به نوع تکنیک ترکیبی مورد استفاده دارد. [۳]

ترکیب در سطح ویژگی[ویرایش]

ترکیب در سطح ویژگی (که گاهی اوقات به عنوان ادغام اولیه شناخته می‌شود) همه ویژگی‌ها را از هر مدالیته (متنی، صوتی یا بصری) جمع‌آوری می‌کند و همه آنها را در یک بردار ویژگی واحد قرار می‌دهد که در نهایت به یک الگوریتم طبقه‌بندی وارد می‌شود.[۱۳] یکی از مشکلات در اجرای این تکنیک، ادغام ویژگی‌های ناهمگن است.[۳]

ترکیب در سطح تصمیم[ویرایش]

ترکیب در سطح تصمیم (که گاهی اوقات به عنوان ادغام ثانویه شناخته می شود)، داده های هر مدالیته (متنی، صوتی یا بصری) را به طور مستقل به الگوریتم طبقه بندی مختص به خود می‌دهد و با ادغام هر نتیجه در یک بردار تصمیم واحد، نتایج طبقه بندی احساسات نهایی را به دست می‌آورد.[۱۳] یکی از مزایای این تکنیک ترکیبی، این است که نیاز به ترکیب داده‌های ناهمگن را از بین می برد و هر مدالیته می تواند از مناسب ترین الگوریتم طبقه بندی خود استفاده کند.[۳]

ترکیب هیبریدی[ویرایش]

ترکیب هیبریدی، ترکیبی از تکنیک‌های ترکیب در سطح ویژگی و سطح تصمیم است که از اطلاعات تکمیلی هر دو روش در طول فرآیند طبقه‌بندی استفاده می‌کند.[۵] این فرایند معمولاً شامل یک روش دو مرحله‌ای است که در مرحله اول، ابتدا بین دوتا از مدالیته‌ها، روش ترکیب در سطح ویژگی پیاده سازی می‌شود و سپس در مرحله دوم برای ادغام کردن نتیجه این ترکیب با مدالیته باقیمانده، بین نتایج این فرایند و مدالیته‌ی باقیمانده، عملیات ترکیب در سطح تصمیم اعمال می‌شود.[۱۴] [۱۵]

کاربردها[ویرایش]

مشابه تجزیه و تحلیل احساسات مبتنی بر متن، تجزیه و تحلیل احساسات چندوجهی را می توان در توسعه سیستم های توصیه‌گر در اشکال مختلف مانند تجزیه و تحلیل ویدیوهای تولید شده توسط کاربران در خصوص نقد فیلم [۵] و نقد کلی محصولات، [۱۶] به منظور پیش بینی احساسات مشتریان و متعاقباً توصیه محصولات یا خدمات، استفاده کرد.[۱۷] تجزیه و تحلیل احساسات چندوجهی همچنین نقش مهمی در پیشرفت دستیاران مجازی از طریق استفاده از پردازش زبان طبیعی (NLP) و تکنیک های یادگیری ماشین ایفا می‌کند.[۴] در حوزه بهداشت و درمان، تجزیه و تحلیل احساسات چندوجهی می تواند برای تشخیص برخی شرایط پزشکی مانند استرس، اضطراب یا افسردگی استفاده شود. تجزیه و تحلیل احساسات چندوجهی را می توان در درک احساسات موجود در برنامه های خبری ویدیویی نیز به کار برد، از آنجایی که خبرنگاران معمولا به طور واضح احساسات خود را نشان نمی‌دهند و بیشتر خنثی هستند، به عنوان یک حوزه پیچیده و چالش برانگیز در نظر گرفته می شود.

منابع[ویرایش]

 

This article "Multimodal sentiment analysis" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:Multimodal sentiment analysis. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.

  1. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  2. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  3. ۳٫۰ ۳٫۱ ۳٫۲ ۳٫۳ ۳٫۴ ۳٫۵ ۳٫۶ ۳٫۷ ۳٫۸ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value). خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s1» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s1» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s1» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s1» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s1» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s1» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s1» چندین بار با محتوای متفاوت تعریف شده است
  4. ۴٫۰ ۴٫۱ "Google AI to make phone calls for you". BBC News. 8 May 2018. Retrieved 12 June 2018.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد. خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s5» چندین بار با محتوای متفاوت تعریف شده است
  5. ۵٫۰ ۵٫۱ ۵٫۲ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value). خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s4» چندین بار با محتوای متفاوت تعریف شده است خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s4» چندین بار با محتوای متفاوت تعریف شده است
  6. ۶٫۰ ۶٫۱ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value). خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s7» چندین بار با محتوای متفاوت تعریف شده است
  7. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  8. ۸٫۰ ۸٫۱ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value). خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s2» چندین بار با محتوای متفاوت تعریف شده است
  9. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  10. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  11. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  12. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  13. ۱۳٫۰ ۱۳٫۱ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value). خطای یادکرد: برچسب <ref> نامعتبر؛ نام «s3» چندین بار با محتوای متفاوت تعریف شده است
  14. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  15. خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
  16. Pérez-Rosas, Verónica; Mihalcea, Rada; Morency, Louis Philippe (1 January 2013). "Utterance-level multimodal sentiment analysis". Long Papers. Association for Computational Linguistics (ACL).صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
  17. Chui, Michael; Manyika, James; Miremadi, Mehdi; Henke, Nicolaus; Chung, Rita; Nel, Pieter; Malhotra, Sankalp. "Notes from the AI frontier. Insights from hundreds of use cases". McKinsey & Company (به English). McKinsey & Company. Retrieved 13 June 2018.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.


Read or create/edit this page in another language[ویرایش]