آیا سیستم های تشخیص صدا به صورت اولیه را به خاطر دارید؟ سالها پیش، اگر با تلفنتان شمارهای را میگرفتید از شما خواسته میشود که با صدایتان گزینهای انتخاب کنید و این فرایند اغلب برای همه تجربهای ناخوشایند به جا میگذاشت. برنامههای تشخیص صدای به اندازه کافی پیشرفته نبودند که بتوانند صدای همگی را تشخیص دهند. هرچند از آن زمان به بعد برنامههای تشخیص صدا پیشرفتهای چشمگیری داشتهاند. امروزه اگر با داروخانه تماس بگیرید تا نسخهتان را تجدید کنید و یا اگر با خط مستقیم کسبوکاری تماس بگیرید، به احتمال زیاد با استفاده از سیستم تشخیص صدای پشتیبانی مشتری میتوانید با موفقیت کارتان را انجام دهید.
علاوه بر این استفاده از سیستم های تشخیص صدا دیگر به خطوط مستقیم پشتیبانی مشتری محدود نمیشود. از سیستمهای تشخیص صدا در تلفنهای هوشمند و رایانهها و همچنین صنایع گوناگون استفاده میشود. موارد استفاده از سیستم های تشخیص صدا بینهایت است. در ادامه برترین روندها و موارد کاربرد فنآوریهای تشخیص صدا را با یکدیگر بررسی میکنیم.
۱- پرداخت موبایلی با استفاده از سیستم های تشخیص صدا
آیا تا به حال به این فکر کردهاید که در آینده چگونه هزینهها را پرداخت خواهید کرد؟ آیا تا به حال به این فکر کردهاید که در آینده ممکن است به جای پرداخت پول نقد و یا استفاده از کارتهای اعتباری، از صدایتان برای پرداخت هزینهها استفاده کنید؟ فرا رسیدن چنین روزی چندان دیر نیست. هماکنون برخی شرکتها در حال ساخت و ارتقای سیستم های تشخیص صدا برای انجام تراکنشها هستند. استفاده از سیستمهای تخشیص صدا برای انجام تراکنشها آسان است و زمانیکه با استفاده از تلفنهای هوشمند و یا رایانهتان خریدهایتان را انجام میدهید، نیازی به استفاده از کیف پول نیست.
در ادامه شیوه انجام تراکنشها با استفاده از سیستم تشخیص صدا را توضیح میدهیم: در حالت عادی پیش از انجام خریدهای اینترنتی باید رمز و یا شماره شناسایی شخصیخود را تایپ کنید، اما فناوری تشخیص صدا این امکان را برای شما فراهم میکند تا رمزی یک بار مصرف را بگویید و خریدتان را انجام دهید. عملکرد سیستمهای تشخیص صدا همچون کپچاها
و سایر رمزهای یک بار مصرف است که استفاده از آنها در انجام تراکنشهای اینترنتی مطمئنتر است – با این تفاوت که در سیستمهای تشخیص صدا رمز را باید با صدای بلند گفت. از آنجاییکه سیستمهای تشخیص صدا ماهیتی تصادفی دارند و به همین دلیل شما مصمئن هستید کسی نمیتواند رمز شما را بشنود و در نتیجه به اسم شما خریدی انجام دهد، استفاده از این سیستمها بسیار بهتر از یک رمز همیشگی است. به زودی استفاده از سیستم های تشخیص صدا در پرداختهای موبایلی به امری رایج و متداول تبدیل میشود.
۲- دستیاران مجازی با قابلیت تشخیص صدای افراد
اکثر ما با سیری، اَلکساو سایر دستیاران مجازی هوش مصنوعی که در محیط کاری و یا در محیط خانه به ما در انجام کارهای روزانه کمک میکنند، آشنایی داریم. برای مثال کاربران در هنگام رانندگی با استفاده از دستیاران هوش مصنوعی مسیریابی کنند، چیزی را در اینترنت جستوجو کنند و یا آهنگی پخش کنند بدون آنکه مجبور باشند دستگاه (موبایل و غیره) خود را در دست بگیرند و یا چراغهای خانهشان را روشن کنند. به طور کلی دستیاران مجازی به صدایی که آنها را فعال کرده است، پاسخ میدهند و شیوه پاسخدهی آنها به کاربران مختلف یکسان است.
با وجود این امروزه فناوریهایی مانند پردازش گفتار وجود دارد که این امکان را برای سیستمهای هوش مصنوعی فراهم میکند تا هویت کاربر را تشخیص دهند. برای مثال با بهرهگیری از این فنآوری میتوان سیستمهای هوش مصنوعی را برای صدای فرد خاصی فعال کرد. طی سالهای اخیر این فناوری در گوشیهای اَپل بهکار رفته است. شما میتوانید گوشی اَپل خود را به گونهای تنظیم کنید تا سیری فقط کارهایی را انجام دهد یا به سؤالاتی پاسخ دهد که با صدای شما گفته میشوند. در صورتیکه دستیار هوش مصنوعی شما فقط با صدای شما فعال شود، احتمال اینکه کاربر غیرمجازی از دستگاه، اطلاعات و متعلقات شما سوءاستفاده کند، کمتر است. دستیاران هوش مصنوعی به سادگی برای هر کاربر غیرمجازی فعال نمیشوند. به طور قطع در آیندهای نزدیک از این فناوری در حوزههای دیگر استفاده میشود.
۳- تشخیص صدا برای تأمین امنیت
بیشتر مردم چندین حساب کاربری اینترنتی دارند و امنیت آنها باید تأمین شود و برخی از این حسابهای اینترنتی همچون حسابهای بانکی به لحاظ امنیتی ریسک بالایی دارند. در دورانی که بانکداری اینترنتی به شهرت بالایی دست پیدا کرده ضروری است سیستمهای تشخیص هویتیمطمئن شوند که فقط صاحب حساب میتواند به اطلاعات حساس دسترسی پیدا کند. یکی از جدیدترین شیوههای احراز هویت کاربر ، احراز هویت از طرق تشخیص صدا است. همچون دستیاران هوش مصنوعی که صدای شما را تشخیص میدهند، عامل تشخیص گفتار نیز به مثابه یک «رمز» منحصر بهفرد از صدای شما برای باز کردن حسابهای رمزدار استفاده میکند. از آنجاییکه صدای صاحب حساب با صدای سایر افراد تفاوت دارد امکان دسترسی به حساب برای سایرین وجود ندارد.
استفاده از تشخیص صدا برای باز کردن حسابهای کاربری امنیت بیشتری دارد، چرا که میتوان از سیستمهای چند عاملیاستفاده کرد و بسیاری از ویژگیهای امنیتی مختلف را با یکدیگر ترکیب کرد. برای مثال فرض کنید برای دسترسی به نرمافزاری کاربردی بانکداریتان باید اثرانگشت خود را اسکن کنید و رمزی را به صدای بلند بگویید. استفاده از صدای برای دسترسی به حسابهای اینترنتی ایمنتر از رمزهای قدیمی است. علاوه بر این، سیستمهایی وجود دارند که در کنار فناوری تشخیص صدا از فناوری تشخیص چهره نیز استفاده میکنند.
۴- تشخیص صدا در جرمشناسی و شناسایی مجرمین
یکی دیگر از موارد کاربرد تشخیص صدا استفاده از این فنآوری در شناسایی مجرمین است. در اختیار داشتن یک فایل صوتی از مظنونین یک جرم میتواند مدرک مهمی باشد. در حال حاضر AGNITIO و Morpho (Safran) با یکدیگر همکاری دارند و از فناوری احراز هویت از طریق صدادر صنعت جرمشناسی استفاده میکنند. به لطف وجود چنین محصولی، فناوری احراز هویت از طریق صدا ( در کنار اثرانگشت و سایر روشها) میتواند در سراسر دنیا در جهت شناسایی و بررسی سوءپیشینه افراد مورد استفاده قرار بگیرد.
این فناوری میتواند در مدت زمان کوتاهی صداهای زنده و یا ضبط شده را تطبیق دهد و نرخ دقت این فناوری در تشخیص صداها بسیار بالا و برابر با ۹۹ درصد است. علاوه بر این فناوری تشخیص صدا میان لهجهها یا زبانهای مختلف تمایز قائل نمیشود. فنآوری تشخیص صدا تُن صدای افراد را محاسبه میکند و اینکه فرد چه کلماتی به کار میبرد و یا به چه زبانی صحبت میکند در تشخیص آن تغییری ایجاد نمیکند. از این روی، فناوری تشخیص صدا میتواند در سراسر دنیا در حل جرایم کاربرد داشته باشد.
۵- تشخیص صدا در نرمافزارهای کاربردی ترجمه
فرض کنید به یک کشور خارجی سفر کردهاید و میخواهید اتاقی در یک هتل رزرو کنید. کارمند پذیرش زبان انگلیسی را به سختی متوجه میشود و شما هم به سختی میتوانید به زبان آنها صحبت کنید و اطراف شما کسی نیست که بتواند صحبتهای شما را برای یکدیگر ترجمه کند. اما شانس با شما است چرا که هتل یک سیستم ترجمه دارد که با استفاده از فنآوری تشخیص صدا جملات را به صوتر لحظهای ترجمه میکند. شما میتوانید جملههایتان را برای سیستم بگویید و سپس سیستم زبان شما را پردازش میکند و آن را به صورت صوتی و یا بصری ترجمه میکند، در نتیجه کارمند پذیرش متوجه صحبتهای شما میشود.
علاوه بر کمک به مسافرانی که به کشورهای خارجی سفر میکنند، از این فناوری میتوان در تجارتها، مدارس و سایر سازمانهای بینالملل بهره گرفت. با استفاده از این فناوری به سادگی میتوان با کسی که به زبان شما صحبت نمیکند گفتوگو کنید و میتواند تأثیر شگرفی در رفع موانع زبانی داشته باشد.
ما فهرستی از شرکتهای فعال در حوزه پردازش گفتار را گردآوری کردهایم تا در اختیار علاقهمندان و مخاطبان این حوزه قرار دهیم تا بتوانند اطلاعات کاملی در مورد هر کدام از این شرکتها کسب نموده و نیازهای آنها در این زمینه به خوبی مرتفع گردد.
منبع: hooshio.com