کنترل صوتی آینده رابط کاربری است. اما کی؟

انواع تکنولوژی‌های رابط کاربری برای آینده
انواع تکنولوژی‌های رابط کاربری برای آینده

با موجی که این روزها راه افتاده است و سیستم صوتی الکسا (Alexa) مربوط به شرکت آمازون را می‌توان پیشتاز این موضوع دانست، کنترل صوتی، آینده رابط کاربری شناخته می‌شود. اما برای روشن شدن موضوع به صورت دقیق ما نیاز به اعداد داریم. چند نفر از ما واقعا بعد از اینکه یکی از این دستگاه‌های صوتی مثل الکسا یا دستیار گوگل (Google assistant) یا سیری (Siri) را خریداری کردیم به صورت روزمره و پس از اینکه تازگیشان را از دست دادند، استفاده می‌کنیم؟ به چه منظوری استفاده می‌کنیم؟ این سوالات به ما کمک خواهد کرد که آینده واقعی این سیستم‌ها و کنترل صوتی را پیش‌بینی کنیم.

برای دهه‌ها ما دایما فقط در فیلم‌های علمی-تخیلی مثل سری استارترک (Star Trek) یا ادیسه فضایی (2001 Space Odyssey) می‌دیدیم که در آینده ما می‌توانیم با صحبت کردن با ماشین‌های خود آن‌ها را کنترل کنیم، اما تا همین اواخر این آرزو محقق نشده بود.

در این سال‌ها ما فکر می‌کردیم که بالاخره دیگر این بار این آرزو محقق می‌شود و شرکتی پیدا می‌شود که از این فناوری در سیستم تحقیقاتی خود استفاده می‌کرد که در آن کنترل صوتی گنجانده شده بود و با مقداری هیاهو در مورد مزایای کار بدون دست و درگیر نشدن با رابط کاربری صحبت می‌کرد، اما هیچ‌کدام از آن‌ها واقعا درست نشدند، ولی خوب از جای دیگری محصولات از راه رسیدند.

اما بعد از همه‌ی این موضوعات همچنان این اقبال برای کنترل صوتی دستگاه‌هایمان باقی مانده است و چیزی از هیجان کنترل کردن موارد مورد نظرمان بدون استفاده از دست‌هایمان مانند داشتن دست سومی است که بسیار مفید خواهد بود. می‌توانیم در حالی که مشغول کار با دو دست خود هستیم درجه دما را کنترل کرده یا آهنگ عوض کنیم، و یا از سیستم هدایت خودکار ماشین خود استفاده کنیم.

اما تا چه حد این فناوری کاربردی است؟

برای کسانی که از مشکلات عضلانی رنج می‌برند و یا دچار معلولیت هستند، این قابلیت فقط منطقی و کاربردی نیست بلکه شرافت و توانایی را به آن‌ها بازمی‌گرداند. و ضمنا بی‌سواد بودن دیگر کمتر مانعی خواهد بود. دیگر شما نیازی ندارید که خواندن و نوشتن بدانید تا بتوانید از وسایل استفاده کنید؛ این مسئله در جوامعی که هنوز آموزش در حال رشد است بسیار حیاتی هست.

امروزه کنترل صوتی دیگر فقط یک وعده نیست و آمازون توانسته با دیدی خوب و کاربردی از این تکنولوژی بهره ببرد. در انتهای سال 2014 بود که این شرکت رده اسپیکرهای خود "اکو" (Echo) را که از قیمت 40 دلار تا 230 دلار طبقه‌بندی می‌شدند را با قابلیت کنترل صوتی معرفی کرد.

اما این قیمت‌ها به موضوعی مهم اشاره نمی‌کنند، و مسئله مهم‌تر این است که "بزوس" (Bezos) و شرکتش توانستند هوش مصنوعی (AI) طراحی کنند که با استفاده از فناوری ابری (Cloud) دایما توانایی‌های خود را توسعه می‌دهد؛ مانند پاسخگویی به افراد به صورت شخصی‌سازی شده و مربوط به خود فرد. و با پشتیبانی خوب این شرکت و توسعه‌دهنده‌های دیگر از الکسا (Alexa)، حالا این سیستم بالغ بر 15000 توانایی در خود گنجانده است.

و بالاتر از این نیز پشتیبانی آمازون از کاربران جدید بسیار کمک‌کننده و کاربردی است. این شرکت با یک طراحی خوب توانسته دنیایی بدون نیاز به منو، ماوس، و کیبورد بسازد که دایما کاربران قدیمی اکو را نیز هیجان‌زده و راضی‌تر می‌کند.

موضوع دیگر خبرنامه‌ای است که شرکت آمازون به صورت هفتگی به ایمیل شما ارسال می‌کند و به شما در مورد قابلیت‌های تازه و همچنین شیوه‌های تازه‌ای که می‌توانید از محصولی که دو سال پیش خریداری کرده‌اید، استفاده کنید را آموزش می‌دهد.این ایمیل‌ها مانند تبلیغات شرکت‌ها برای معرفی محصول تازه‌تر و به دام انداختن شما در خرید آن‌ها نیست، بلکه برای کسانی ارسال می‌شود که شاید دو سال از خریدشان گذشته است. آمازون و جف بزوس (Jeff Bezos) با این کار به نوعی اپل را برای نوع ارتباط خود در مورد محصولاتش با مشتریانش به شرمندگی می‌رساند.

کنترل صوتی فرایند فوق‌العاده‌ای است، حتی اگر امروز اندکی ثابت مانده و گاهی اوقات نیز با اعصاب ما بازی می‌کند. چالش اساسی این موضوع است که این سیستم‌ها دایما یک جا ساکن هستند و منتظرند که صدایشان بزنیم و درخواستی داشته باشیم و چیزی در مورد اینکه چطور می‌توانیم با آن‌ها ارتباط برقرار کنیم و یا چقدر دقیق متوجه این دستورات می‌شوند را به ما گوشزد نمی‌کنند. ضمنا این دستگاه‌ها هنوز نمی‌توانند از تست تورینگ (Turing Test) نمره قبولی بگیرند و ما را مجاب کنند که در حال صحبت با یک انسان واقعی هستیم.

موضوع آزاردهنده دیگری که برای ما یعنی کسانی که به تکنولوژی علاقه‌مند هستند وجود دارد در مورد این است که شرکت‌هایی مثل آمازون، گوگل، یا اپل به طور واضح در مورد تعداد دستگاه‌هایی که فروش کرده‌اند صحبت نمی‌کنند. نمی‌گویند که افراد به طور متوسط چقدر از این دستگاه‌ها استفاده می‌کنند؟ یا مثلا چندبار در روز؟ و یا بیشتر برای چه کاری از آن‌ها استفاده می‌شود؟

آمازون یا شرکت‌های مشابه این اطلاعات باارزش را برای خود نگاه می‌دارند و ما مجبوریم فقط به آنالیزگرها توجه کنیم که طبق تحقیقی در سال 2016 متوجه شدند بیشترین استفاده از سیستم اکو برای تنظیم زنگ بوده. البته اطلاعات دیگر نیز این است که فقط می‌دانیم صاحبان اکو خرید بیشتری انجام می‌دهند.

(مسلما برای انجام یک تحقیق معتبر نیاز به هزینه و استفاده مثلا حداقل از 1000 نفر است که نماینده جمعیتی بزرگ باشند و این کاری سخت است. مثلا در مورد همین موضوع بیشترین استفاده از اکو که تنظیم کردن زمان زنگ است فقط از 150 نفر دارنده اکو استفاده شده است و این موضوع اندکی اعتبار این تحقیقات را زیر سوال می‌برد)

در مورد اپل حداقل ما می‌دانیم که تعداد استفاده‌کنندگان از سیری معادل کسانی است که این چند سال اخیر دستگاه‌های iOS را خریداری کردند. مانند آمازون نیز شرکت اپل سایتی تمیز و مرتب در مورد قابلیت‌های سیری را که شامل موضوعاتی می‌شود که چطور می‌توان از آن استفاده کرد را واضح بیان می‌کند. اما چطور از سیری استفاده می‌شود؟ یا چه کسی از آن استفاده می‌کند؟ یا چه مقدار از آن استفاده می‌شود؟ به ما گفته نمی‌شود.

چرا ما به این اطلاعات نیاز داریم؟ برای کنجکاوی، مسلماً، اما مسئله مهمتر این است که متوجه شویم جنگ این سیستم‌ها چطور آینده را شکل می‌دهد. در حال حاضر آمازون در این رقابت جلوتر است ولی آینده مشخص نیست و هر سه شرکت شدیدا رقابت دارند و استراتژی‌های متفاوتی برای این کار اتخاذ می‌کنند.

گوگل به طور معمول کالا به مشتری نمی‌فروشد، بلکه درآمد خود را از راه فروش تبلیغات به شرکت‌ها تامین می‌کند. در حالی که دستیار صوتی گوگل بر روی گوشی‌های اندرویدی زیادی نصب شده است، ولی با استراتژی خاص و تبلیغات و تجارت الکترونیک آمازون قابل مقایسه نیست.

از طرفی دیگر اپل کالا می‌فروشد و سرویس‌هایی که در اختیار مشتری قرار می‌دهد با هدف فروختن تعداد بیشتری آیفون و آیپد و مک است.

فارق از اینکه چه اتفاقی در آینده خواهد افتاد، و کدام شرکت برنده این رقابت است، می‌توان گفت در حال حاضر عملکرد سیستم آمازون و گوگل خیره‌کننده است و بسیار جالب است که گوگل چطور از این سیستم برای تبلیغات خود استفاده خواهد کرد.

در همین حال ما متوقف می‌شویم و قبل از اینکه گزافه‌گویی کنیم فقط به نقل قول از یک حرفه‌ای در زمینه آینده بسنده می‌کنیم.

کسانی که آینده را پیش‌بینی می‌کنند، آینده‌نگر هستند. کسانی که می‌دانند کی آینده اتفاق خواهد افتاد، بیلیونر هستند.

به هرحال ما از این موضوع خسته نمی‌شویم.