مجله هوش مصنوعی



 

سیستم های تشخیص صدا

آیا سیستم های تشخیص صدا به صورت اولیه را به خاطر دارید؟  سال‌ها پیش، اگر با تلفن‌تان شماره‌ای را می‌گرفتید از شما خواسته می‌شود که با صدای‌تان گزینه‌ای انتخاب کنید و این فرایند اغلب برای همه تجربه‌ای ناخوشایند به جا می‌گذاشت. برنامه‌های تشخیص صدای به اندازه کافی پیشرفته نبودند که بتوانند صدای همگی را تشخیص دهند. هرچند از آن زمان به بعد برنامه‌های تشخیص صدا پیشرفت‌های چشمگیری داشته‌اند. امروزه اگر با داروخانه تماس بگیرید تا نسخه‌تان را تجدید کنید و یا اگر با خط مستقیم کسب‌و‌کاری تماس بگیرید، به احتمال زیاد با استفاده از سیستم تشخیص صدای پشتیبانی مشتری می‌توانید با موفقیت کارتان را انجام دهید.

علاوه بر این استفاده از سیستم های تشخیص صدا دیگر به خطوط مستقیم پشتیبانی مشتری محدود نمی‌شود. از سیستم‌های تشخیص صدا در تلفن‌های هوشمند و رایانه‌ها و هم‌چنین صنایع گوناگون استفاده می‌شود. موارد استفاده از سیستم های تشخیص صدا بی‌نهایت است. در ادامه برترین روندها و موارد کاربرد فن‌آوری‌های تشخیص صدا را با یکدیگر بررسی می‌کنیم.

۱- پرداخت موبایلی با استفاده از سیستم های تشخیص صدا

آیا تا به حال به این فکر کرده‌اید که در آینده چگونه هزینه‌ها را پرداخت خواهید کرد؟ آیا تا به حال به این فکر کرده‌اید که در آینده ممکن است به جای پرداخت پول نقد و یا استفاده از کارت‌های اعتباری‌، از صدای‌‌تان برای پرداخت هزینه‌ها استفاده کنید؟ فرا رسیدن چنین روزی چندان دیر نیست. هم‌اکنون برخی شرکت‌ها در حال ساخت و ارتقای سیستم های تشخیص صدا برای انجام تراکنش‌ها هستند. استفاده از سیستم‌های تخشیص صدا برای انجام تراکنش‌ها آسان است و زمانی‌که با استفاده از تلفن‌های هوشمند و یا رایانه‌تان خریدهای‌تان را انجام می‌دهید، نیازی به استفاده از کیف پول نیست.

در ادامه شیوه انجام تراکنش‌ها با استفاده از سیستم تشخیص صدا را توضیح می‌دهیم: در حالت عادی پیش از انجام خرید‌های اینترنتی باید رمز و یا شماره شناسایی شخصیخود را تایپ کنید، اما فناوری تشخیص صدا این امکان را برای شما فراهم می‌کند تا رمزی یک بار مصرف را بگویید و خریدتان را انجام دهید. عملکرد سیستم‌های تشخیص صدا همچون کپچاها
 و سایر رمزهای یک‌ بار مصرف است که استفاده از آن‌ها در انجام تراکنش‌های اینترنتی مطمئن‌تر است –  با این تفاوت که در سیستم‌های تشخیص صدا رمز را باید با صدای بلند گفت. از آن‌جایی‌که سیستم‌های تشخیص صدا ماهیتی تصادفی دارند و به همین دلیل شما مصمئن هستید کسی نمی‌تواند رمز شما را بشنود و در نتیجه به اسم شما خریدی انجام دهد، استفاده از این سیستم‌ها بسیار بهتر از یک رمز همیشگی است. به زودی استفاده از سیستم های تشخیص صدا در پرداخت‌های موبایلی به امری رایج و متداول تبدیل می‌شود.

۲- دستیاران مجازی با قابلیت تشخیص صدای افراد

اکثر ما با سیری، اَلکساو سایر دستیاران مجازی هوش مصنوعی که در محیط کاری و یا در محیط خانه به ما در انجام کارهای روزانه کمک می‌کنند، آشنایی داریم. برای مثال کاربران در هنگام رانندگی با استفاده از دستیاران هوش مصنوعی مسیریابی کنند، چیزی را در اینترنت جست‌و‌جو کنند و یا آهنگی پخش کنند بدون آن‌که مجبور باشند دستگاه (موبایل و غیره) خود را در دست بگیرند و یا چراغ‌های‌ خانه‌شان را روشن کنند. به طور کلی دستیاران مجازی به صدایی که آن‌ها را فعال کرده است، پاسخ می‌دهند و شیوه پاسخ‌دهی آن‌ها به کاربران مختلف یکسان است.

با وجود این امروزه فناوری‌هایی مانند پردازش گفتار وجود دارد که این امکان را برای سیستم‌های هوش مصنوعی فراهم می‌کند تا هویت کاربر را تشخیص دهند. برای مثال با بهره‌گیری از این فن‌آوری می‌توان سیستم‌های هوش مصنوعی را برای صدای فرد خاصی فعال کرد. طی سال‌های اخیر این فناوری در گوشی‌های اَپل به‌کار رفته است. شما می‌توانید گوشی اَپل خود را به گونه‌ای تنظیم کنید تا سیری فقط کارهایی را انجام دهد یا به سؤالاتی پاسخ دهد که با صدای شما گفته می‌شوند. در صورتی‌که دستیار هوش مصنوعی شما فقط با صدای شما فعال شود، احتمال این‌که کاربر غیرمجازی از دستگاه، اطلاعات و متعلقات شما سوءاستفاده کند، کمتر است. دستیاران هوش مصنوعی به سادگی برای هر کاربر غیرمجازی فعال نمی‌شوند. به طور قطع در آینده‌ای نزدیک از این فناوری در حوزه‌های دیگر استفاده می‌شود.

۳- تشخیص صدا برای تأمین امنیت

بیشتر مردم چندین حساب‌ کاربری اینترنتی دارند و  امنیت آن‌ها باید تأمین شود و برخی از این حساب‌های اینترنتی همچون حساب‌های بانکی به لحاظ امنیتی ریسک بالایی دارند. در دورانی که بانک‌داری اینترنتی به شهرت بالایی دست پیدا کرده ضروری است سیستم‌های تشخیص هویتیمطمئن شوند که فقط صاحب حساب می‌تواند به اطلاعات حساس دسترسی پیدا کند. یکی از جدیدترین شیوه‌های احراز هویت کاربر ، احراز هویت از طرق تشخیص صدا است. همچون دستیاران هوش مصنوعی که صدای شما را تشخیص می‌دهند، عامل تشخیص گفتار نیز به مثابه یک «رمز» منحصر به‌فرد از صدای شما برای باز کردن حساب‌‌های رمزدار استفاده می‌‌کند. از آن‌جایی‌که صدای صاحب حساب با صدای سایر افراد تفاوت دارد امکان دسترسی به حساب برای سایرین وجود ندارد.

استفاده از تشخیص صدا برای باز کردن حساب‌های کاربری امنیت بیشتری دارد، چرا که می‌توان از سیستم‌های چند عاملیاستفاده کرد و بسیاری از ویژگی‌های امنیتی مختلف را با یکدیگر ترکیب کرد. برای مثال فرض کنید برای دسترسی به نرم‌افزاری کاربردی بانک‌داری‌تان باید اثرانگشت خود را اسکن کنید و رمزی را به صدای بلند بگویید. استفاده از صدای برای دسترسی به حساب‌های اینترنتی ایمن‌تر از رمزهای قدیمی است. علاوه بر این، سیستم‌هایی وجود دارند که در کنار فناوری تشخیص صدا از فناوری تشخیص چهره نیز استفاده می‌کنند.

۴- تشخیص صدا در جرم‌شناسی و شناسایی مجرمین

یکی دیگر از موارد کاربرد تشخیص صدا استفاده از این فن‌آوری در شناسایی مجرمین است. در اختیار داشتن یک فایل صوتی از مظنونین یک جرم می‌تواند مدرک مهمی باشد. در حال حاضر  AGNITIO و Morpho (Safran) با یکدیگر همکاری دارند و از فناوری احراز هویت از طریق صدادر صنعت جرم‌شناسی استفاده می‌کنند. به لطف وجود چنین محصولی، فناوری احراز هویت از طریق صدا ( در کنار اثرانگشت و سایر روش‌ها) می‌تواند در سراسر دنیا در جهت شناسایی و بررسی سوءپیشینه افراد مورد استفاده قرار بگیرد.

این فناوری می‌تواند در مدت زمان کوتاهی صداهای زنده و یا ضبط ‌‌شده را تطبیق دهد و نرخ دقت این فناوری در تشخیص صداها بسیار بالا و برابر با ۹۹ درصد است. علاوه بر این فناوری تشخیص صدا میان لهجه‌ها یا زبان‌های مختلف تمایز قائل نمی‌شود. فن‌آوری تشخیص صدا تُن صدای افراد را محاسبه می‌کند و این‌که فرد چه کلماتی به کار می‌برد و یا به چه زبانی صحبت می‌کند در تشخیص آن تغییری ایجاد نمی‌کند. از این روی، فناوری تشخیص صدا می‌تواند در سراسر دنیا در حل جرایم کاربرد داشته باشد.

۵- تشخیص صدا در نرم‌افزارهای کاربردی ترجمه

فرض کنید به یک کشور خارجی سفر کرده‌اید و می‌خواهید اتاقی در یک هتل رزرو کنید. کارمند پذیرش زبان انگلیسی را به سختی متوجه می‌شود و شما هم به سختی می‌توانید به زبان آن‌ها صحبت کنید و اطراف شما کسی نیست که بتواند صحبت‌های شما را برای یکدیگر ترجمه کند. اما شانس با شما است چرا که هتل یک سیستم ترجمه دارد که با استفاده از فن‌آوری تشخیص صدا جملات را به صوتر لحظه‌ای ترجمه می‌کند. شما می‌توانید جمله‌های‌تان را برای سیستم بگویید و سپس سیستم زبان شما را پردازش می‌کند و آن را به صورت صوتی و یا بصری ترجمه می‌کند، در نتیجه کارمند پذیرش متوجه صحبت‌های شما می‌شود.

علاوه بر کمک به مسافرانی که به کشورهای خارجی سفر می‌کنند، از این فناوری می‌توان در تجارت‌ها، مدارس و سایر سازمان‌های بین‌الملل بهره گرفت. با استفاده از این فناوری به سادگی می‌توان با کسی که به زبان شما صحبت نمی‌کند گفت‌وگو کنید و می‌تواند تأثیر شگرفی در رفع موانع زبانی داشته باشد.

ما فهرستی از شرکت‌های فعال در حوزه پردازش گفتار را گردآوری کرده‌ایم تا در اختیار علاقه‌مندان و مخاطبان این حوزه قرار دهیم تا بتوانند اطلاعات کاملی در مورد هر کدام از این شرکت‌ها کسب نموده و نیازهای آن‌ها در این زمینه به خوبی مرتفع گردد.

منبع: hooshio.com

 

مجله هوش مصنوعی

تابه‌حال فکر کردید چقدر جالب می‌شد اگر بررسی سیگنال‌های مغز نشان می‌داد انسان در حال گوش دادن به چه آهنگی است؟ جالب است بدانید خواندن ذهن با هوش مصنوعی امکان‌پذیر است.

 

محققان بخش طراحی انسان‌محور دانشگاه صنعتی Delft هلند و بخش علوم شناختی انستیتوی فناوری هند به نام Gandhinagar در حال کار کردن روی این موضوع هستند. آن‎‌ها اخیرا در آزمایشی نشان دادند که خواندن ذهن با هوش مصنوعی اصلا یک رویا نیست. اما این آزمایش و نتایج آن از چیزی که فکر می‌کنید مهم‌تر هستند.

برای انجام این مطالعه، محققان از یک گروه ۲۰ نفری خواستند تا با استفاده از هدفون به ۱۲ آهنگ گوش دهند. برای کمک به تمرکز این افراد اتاق تاریک شد و از داوطلبان خواسته شد تا چشم‌هایشان را ببندند. بر روی سر هریک از این افراد یک کلاهک الکتروانسفالوگرافی نصب شد. کار این کلاهک این است که وقتی داوطلبان به آهنگی گوش می‌دهند، امواج الکترونیکی را از پوست سر آن‌ها دریافت می‌کند.

خواندن ذهن با هوش مصنوعی

این داده‌های مغزی و موسیقی‌ها برای آموزش یکی از شبکه های عصبی مصنوعی استفاده شدند و دانشمندان سعی کردند پیوندهای بین این دو را شناسایی کنند. وقتی الگوریتم حاصل‌شده بر روی داده‌هایی که قبلا ندیده بود، آزمایش شد، توانست آهنگ را کاملا بر اساس امواج مغزی با دقت ۸۵% به درستی شناسایی کند.

کریشنا میاپورام، استادیار علوم شناختی و علوم رایانه‌ای در انستیتوی فناوری هند، درباره آزمایش مربوط به خواندن ذهن با هوش مصنوعی گفت:«این ترانه‌ها ترکیبی از آهنگ‌های غربی و هندی بودند و سبک‌های مختلفی داشتند. به این روش ما نماینده‌ای بزرگ‌تر برای آموزش و آزمایش ساختیم. این روش با به‌دست امدن دقت طبقه‌بندی فوق‌العاده‌ای تائید شد و حتی وقتی داده‌های آموزش را به درصد کمتری از دیتاست محدود کردیم، موفق عمل کرد».

 خواندن ذهن، آموزش ماشین

این اولین تلاش محققان برای خواندن ذهن با هوش مصنوعی نیست. در تجربه‌های قبل هم از داده‌های مربوط به کلاهک الکتروانسفالوگرافی استفاده شده بود. به عنوان مثال، دانشمندان علوم مغز و اعصاب در دانشگاه Scarborough کانادا، تصاویر را بر اساس داده‌ها بازسازی کردند تا تصاویر چهره ذخیره شده در ذهن شخص به صورت دیجیتالی ایجاد شود و باعث شناخت تصاویر شود.

خواندن ذهن با هوش مصنوعی

تحقیقات قبلی خود میاپورام هم شامل طراحی‌‎ای است که در آن از داده‌ها برای شناسایی کلیپ‌ها و فیلم‌های مشاهده شده توسط شرکت‌کنندکان استفاده شده است.

 

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

منبع: hooshio.com


مجله هوش مصنوعی

با گذشت یک سال از شروع همه گیری کرونا، کار اصلی افراد تماشای یوتیوب و کرانچی خوردن شده است. اما مشکل این است که هنگام خوردن کرانچی ممکن است خرد کردن آن باعث شود صدای فیلم را به خوبی متوجه نشویم! خب راه حل این مساله این نیست که کامپیوتر خود را خاموش کنیم و دوباره بخواهیم وارد جامعه شویم، بلکه نصب یک افزونه مبتنی بر هوش مصنوعی کروم است تا هر زمانی که صدای خرد شدن کرانچی را شنید زیرنویس فیلم را به طور خودکار روشن کند.

این افزونه توسط یک استودیوی مستقر در ویتنام به نام Bliss Interactive و Happiness Saigon طراحی شده است. این شرکت بدون شک شاهد افزایش فروش محصول خود بوده است زیرا میلیاردها نفر در تلاش برای جلوگیری از گسترش کووید ۱۹ زمان بسیاری را در خانه گذرانده‌اند و مشغول تماشای فیلم و یوتیوب بوده‌اند. اگرچه نشنیدن صدای فیلم هنگام خوردن کرانچی یک مشکل لاکچری و مختص برخی افراد است اما به نوعی همه ما آن را تجربه کرده‌ایم و در این زمان هم دست زدن به دکمه‌های صدای لپ تاپ با انگشتان چرب، مشکلات بیشتری را ایجاد می‌کند.

به گفته طراحان، افزونه مبتنی بر هوش مصنوعی کروم با ضبط ۱۷۸ ساعت صدای افراد مختلف در سراسر جهان هنگام خوردن کرانچی و چیپس طراحی شده است. سپس از این داده‌ها برای آموزش یک مدل هوش مصنوعی با استفاده از تکنیک‌های یادگیری ماشین استفاده شد. هنگامی که این افزونه را نصب کنید و به آن دسترسی دهید از این پس زیرنویس به طور اتوماتیک برای شما روشن خواهد شد.

نویسندگان سایت gizmodo این افزونه را امتحان کرده‌اند و از عملکرد آن راضی هستند. آن‌ها می‌گویند این افزونه کار می‌کند فقط باید مطمئن شوید میکروفن لپ تاپ شما به راحتی صدای کرانچی خوردن شما را بشنود. البته اگر از آن دسته افرادی هستید که کرانچی‌ها را آرام وبا حوصله می‌خورند احتمالا صدای خرد کردن کرانچی‌ها آنقدر بلند نیست که افزونه مبتنی بر هوش مصنوعی کروم متوجه آن شود و زیرنویس را روشن کند.

آیا این افزونه می‌تواند به اشتباه بیفتد؟ قطعا. البته خالی کردن یک شیشه نخود و لوبیا باعث فعال شدن افزونه نمی‌شود اما میان وعده‌های ترد دیگری از جمله آجیل ذرت می‌تواند افزونه را فعال کند.  آیا افزونه مبتنی بر هوش مصنوعی کروم می‌تواند زندگی شما را تغییر دهد؟ اگر به عنوان فردی که کمی تمیز نگه داشتن لپ تاپ برایتان مهم است می‌توان مزایای بالقوه این ابزار را در این مورد لمس کرد زیرا دیگر صفحه کلید شما چرب نخواهد شد، اما در عین حال اینکه به یوتیوب اجازه دهیم هر صدایی که‌ از دهان ما خارج می‌شود را بشنود ممکن است خیلی چیز جالبی نباشد و ارزش آن را نداشته باشد. در نتیجه قبل از اینکه یک بسته کرانچی باز کنید کافی است زیرنویس را روشن کنید.

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

منبع: hooshio.com

 


مجله هوش مصنوعی
آخرین جستجو ها