سیری، دستیار گوگل و کورتانا – مقایسه سه دستیار دیجیتال

اگر آنقدر بزرگ شده‌اید که سعی کنید نرم‌افزار دیکته صوتی را(voice dictation software) در دهه ۹۰ به یاد بیاورید، معنای واقعی خسته‌گی را می‌دانید. اگر می‌خواهید ایمیل یا یادداشتی را با استفاده از صدای خود تایپ کنید، به ساعت‌ها آموزش، سرعت صحبت کردن بسیار آهسته و در نهایت یک متن کاملاً بی‌فایده نیاز داشت.

امروز همه چیز نمی تواند متفاوت از این باشد. به لطف پیشرفت‌های عمده در یادگیری ماشین و قدرت محاسبات ابری، سیستم‌های (machine learning and cloud)تشخیص صدای(voice recognition) دیجیتال می‌توانند شما را تقریباً به خوبی یک انسان دیگر درک کنند.

به همین دلیل است که می‌توان هر تلفن هوشمند، لپ‌تاپ و تبلتی(laptop and tablet) را با دستیار دیجیتال(Digital Assistant) داخلی ارسال کرد. سه بازیکن اصلی عبارتند از سیری(Siri) از اپل(Apple) ، کورتانا(Cortana) از مایکروسافت(Microsoft) و دستیار گوگل(Google Assistant) ، و از گوگل(Google) . در صورتی که از نام آن مشخص نباشد.

هر سه دستیار کارهای مشابهی را انجام می دهند و همچنین ارزش پیشنهادی منحصر به فرد خود را برای ارائه دارند. احتمالاً غیرممکن است که به طور عینی بگوییم کدام دستیار "بهترین" است، اما مقایسه آنها در کنار کارهای مشترک خاص تمرین مفیدی است. برای هر فردی که این مطلب را می‌خواند، یکی از این دستیاران بهترین تطابق با شرایط خاص شماست. 

بنابراین برای این مقایسه سه جانبه، هدف نشان دادن نقاط ضعف و قوت هر گزینه خواهد بود تا بتوانید آگاهانه انتخاب کنید که با چه کسی بروید. قبل از انجام این کار، اجازه دهید سه شرکت کننده دوست داشتنی خود را معرفی کنیم.

سیری - یک اصل واقعی(Siri –  A True Original)

سیری(Siri) برای اولین بار به عنوان یک ویژگی انحصاری آیفون 4S(iPhone 4S) راه اندازی شد . در نظر بگیرید که آیفون 11(iPhone 11) در سال 2019 عرضه می شود، که سیری را به یکی(Siri one) از قدیمی ترین دستیارهای دیجیتال امروز تبدیل می کند. 

زمانی که اولین تیزرهای سیری(Siri) پخش شد، کمی شبیه به داستان های علمی تخیلی(science fiction) به نظر می رسد . ترکیب صدای(voice synthesis) شگفت‌انگیز و تشخیص صدا(voice recognition) به ظاهر بی‌عیب و نقص ، نمایش‌دهنده‌های واقعی بودند. در نگاهی به گذشته، سیری(Siri) شامل مقداری دود، آینه و دامنه نسبتاً محدودی از عملکردهای با کیفیت بالا بود. از آن زمان به بعد او با هوش و ویژگی‌های(intelligence and features) انبوهی روبه‌رو شده است ، اما به نظر می‌رسد عقیده عمومی این است که دختر پیر دیگر رهبر فناوری(technology leader) نیست. 

صرف نظر از این، این دستیار محدود به اکوسیستم اپل است(Apple ecosystem) ، بنابراین سوال بزرگتر این است که آیا طرفداران اپل باید به (Apple aficionados)دستیار برند فروشگاهی(store-brand assistant) که دستگاه هایشان با  آن عرضه می شود بچسبند یا نه.

کورتانا – از الهه بازی تا دستیار شخصی(Cortana – From Game Goddess To Personal Assistant)

نام کورتانا برگرفته از شخصیتی از (Cortana)سری بازی‌های Halo(Halo series) بانجی است . او هوش مصنوعی است که به Master Chief ، قهرمان سری بازی(game series) کمک می کند. اکنون شما نیز می توانید صدای نمادین او را در ذهن خود صحبت(voice talk) کنید. خوب، اگر از هدفون همراه با کلاه کلکسیونر Halo Master Chief(Halo Master Chief collector) سایز کامل استفاده کنید.

از آنجایی که سیستم عامل(operating system) موبایل مایکروسافت دیگر وجود ندارد، Cortana عمدتاً یک ویژگی ویندوز 10(Windows 10) است که دارای برنامه‌هایی در فروشگاه‌های Android و iOS(Android and iOS stores) است. این بدان معناست که او برخی از ویژگی‌های عالی یکپارچه‌سازی ویندوز را ارائه(Windows integration) می‌دهد، اما البته برای هیچ سیستم تلفن همراهی که مردم واقعاً از آن استفاده می‌کنند، بومی نیست.

دستیار گوگل – شرکت در آزمون تورینگ(Google Assistant – Taking On The Turing Test)

گوگل(Google) بدون شک یکی از برترین شرکت های فناوری در جهان است. به خصوص وقتی صحبت از الگوریتم های پیشرفته هوش مصنوعی می شود(AI algorithms) . بنابراین جای تعجب نیست که Google Assistant با جدیدترین فناوری به آبشش پر شده است. 

از برخی جهات این می تواند کمی مشکل ساز باشد. مجموعه ویژگی‌ها دائماً در حال تغییر است و همیشه مشخص نیست که Google Assistant کجا به پایان می‌رسد و سایر سرویس‌های Google شروع می‌شوند.

به عنوان مثال، Google Duplex یک سرویس فوق‌العاده چشمگیر است که در آن چت ربات هوش مصنوعی(AI chatbot) Google با آرایشگر محلی تماس می‌گیرد و برای شما قرار ملاقات می‌گذارد. تنها باید درخواست کنید. با این حال، Duplex به عنوان پروژه خود توسعه داده شد و سپس به عنوان یک افزونه در Assistant قرار گرفت.(Assistant)

مزیت استفاده از Google Assistant این است که کاملاً با خدمات Google یکپارچه شده است که شامل یکپارچگی عالی با Android است.

چگونه ما آزمایش کردیم(How We Tested)

ایده پشت این مقایسه این نیست که این سه دستیار را با توجه به مشخصات روی کاغذ آنها مقایسه کنیم. در عوض، ایده این است که آنها را به طور عملی از نظر نحوه استفاده روزانه از آنها مقایسه کنید.

آنچه در اینجا مهم است تجربه کاربر است و اینکه آیا این ربات های درخشان واقعاً آنچه را که می خواهید انجام می دهند یا خیر. اگر دستیار خاصی(specific assistant) یک ویژگی کشنده(killer feature) برای مورد استفاده(use case) خاص شما داشته باشد ، به هر حال همه اینها مشکل است.

ما از دو دستگاه جداگانه برای آزمایش سه دستیار دیجیتالی مورد نظر در اینجا استفاده کردیم. در مورد سیری(Siri) ، ما از تبلت آیپد پرو 9.7 (Pro 9.7)اینچی(” tablet) با آخرین نسخه iOS 12 در زمان نگارش استفاده کردیم. برای دو دستگاه دیگر، از Samsung Galaxy Note 10+ استفاده کردیم .

از آنجایی که ایده این است که احساسی برای استفاده روزانه داشته باشید، به هر یک از آنها دقیقاً همان وظایف مشترک داده شد، که شامل انجام جستجوی اینترنتی(internet search) ، ایجاد یادآوری تقویم(calendar reminder) و راه‌اندازی یک برنامه کاربردی است.

کیفیت سنتز صدا(Voice Synthesis Quality)

ممکن است مشخصات فنی سختی نباشد، اما یک دستیار دیجیتالی به دلیل طبیعی بودن صدا در هنگام صحبت کردن زندگی می کند و می میرد. هدف اصلی این برنامه ها انتقال کاربر به یک رابط مکالمه است. این به این معنی است که (Which)صدای(voice isn) رباتیک و گیج کننده قابل قبول نیست و اکثر مردم را از استفاده از چنین محصولی منصرف می کند.

در آزمایش ما از این سه، این دستیار گوگل(Google Assistant) است که در صدر قرار می گیرد، سیری(Siri) در رتبه دوم و کورتانا(Cortana) در رتبه سوم قرار دارند. هر دو محصولات گوگل و اپل، حداقل در تکرارهای انگلیسی آمریکای شمالی، طبیعی به نظر می رسند، اما (English)کورتانای(Cortana) ضعیف به نظر می رسد که نیاز به ارتقا دارد.

عملکرد واکنش عبارت ماشه ای(Trigger Phrase Reaction Performance)

یکی از ویژگی های بزرگ هر دستیار دیجیتال(digital assistant) مدرن استفاده از هندزفری است. تنها کاری که باید انجام دهید این است که کلمه جادویی را بگویید و دستیار آماده کمک است. حداقل در تئوری. بنابراین می‌خواستیم ببینیم که کلمه ماشه(trigger word) چقدر خوب واکنش نشان داده است. 

لطفاً توجه داشته باشید(Please note) که در مورد iOS، فقط سیری(Siri) از فعال کردن هندزفری پشتیبانی می کند. اگرچه می‌توانید کورتانا و دستیار گوگل(Cortana and Google Assistant) را روی iOS نصب کنید، اما نمی‌توانید آن‌ها را تنها با یک کلمه راه‌اندازی کنید. ساده ترین راه حل در اینجا این است که از سیری(Siri) بخواهید دستیار دیگر را راه اندازی کند. این عجیب است، اما اگر کاملاً نیاز دارید، این کار فقط چند ثانیه کار اضافی اضافه می کند.

بیایید با سیری(Siri) اپل شروع کنیم . استفاده از عبارت ماشه(trigger phrase) "Hey Siri " فوری است و لازم نیست قبل از پرسیدن سوال خود منتظر درخواست باشید. Google Assistant به همین خوبی عمل می کند، اما به طور پیش فرض این گونه رفتار نمی کند. حداقل در گوشی های غیر گوگل نه. برای یافتن تنظیمات «Voice Match» با نام رمزآلود، کمی جستجو در منو وجود دارد، که به شما امکان می‌دهد جن دیجیتال را از هر کجای گوشی خود احضار کنید، حتی اگر گوشی قفل باشد.

برنامه کورتانا تنها(only ) زمانی که برنامه باز است به کلمه ماشه(trigger word) پاسخ می دهد . بنابراین صادق بودن خیلی مفید نیست.

مطالب خسته کننده اما مفید(The Boring But Useful Stuff)

تنظیم یادآورها، باز کردن صفحات وب، راه‌اندازی برنامه‌ها و سایر کارهای مشابه، مزیت(bread and butter) استفاده از دستیار دیجیتالی است. خب این سه تا چطوری میرن؟

وقتی نوبت به انجام جستجوی وب می‌رسد، هر سه دستیار کاملاً خوب هستند. کورتانا(Cortana) از Bing استفاده می کند ، که ممکن است برای افرادی که الگوریتم های گوگل را ترجیح می دهند، چیز خوبی نباشد. هر سه از تنظیم یادآوری، گرفتن یادداشت و قرار دادن قرار ملاقات در تقویم خوشحال بودند.

در iOS سیری برنامه ها را با سرعت زیاد راه اندازی می کند و از پخش موسیقی با استفاده (Siri)از سرویس Apple Music(the Apple Music service) خوشحال است . در Android ، Google Assistant نیز با خوشحالی از درخواست‌های راه‌اندازی برنامه پیروی می‌کند، اما به طرز عجیبی با YouTube Music به درستی کار نمی‌کند . امیدوارم به زودی این مشکل برطرف شود. کورتانا از راه‌اندازی هیچ (Cortana)برنامه‌ای(apps or step) امتناع می‌کند یا از حباب برنامه خود خارج می‌شود.

این تمام کاری است که کورتانا(Cortana) برای ما انجام می دهد. که(Which) اصلا زیاد نیست.

یکپارچه سازی و کنترل دستگاه(Device Integration & Control)

دستیارهای دیجیتال(Digital) برای کارکرد هندزفری دستگاه شما عالی هستند اگر بتوانند به مجوزهای مناسب دسترسی داشته باشند. آخرین نسخه سیری(Siri) تقریباً کنترل کامل دستگاه اپل را(Apple device) دارد که او در آن زندگی می کند. او می‌تواند تعداد زیادی کلید، مانند روشن یا خاموش کردن WiFi یا بلوتوث(WiFi or Bluetooth) را مدیریت کند. می‌توانید ویژگی‌های دسترسی مانند VoiceOver را با استفاده از سیری(Siri) نیز فعال کنید.

در اندروید(Android) ، Google Assistant به همین خوبی عمل کرد و تنظیمات رایج را بدون رد کردن یک ضربه تغییر داد. کورتانا(Cortana) با این حال قادر به مدیریت نبود، که در این مرحله خیلی تعجب آور نیست.

استفاده غیرکلامی(Nonverbal Use)

در حالی که ویژگی بزرگ ویترین(showcase feature) این دستگاه ها این واقعیت است که می توانید برای انجام کارها به سادگی با آنها صحبت کنید، همیشه امکان یا مطلوب نیست که با دستیار دیجیتال خود یک مکالمه با صدای بلند داشته باشید. ممکن است در اتوبوس، در یک جلسه یا مکان دیگری باشید که ترجیح می دهید ساکت بمانید. 

این روزها بیشتر دستیاران حالت چت متنی(text chat mode) دارند که در آن می توانید مکالمه را خاموش کنید، اما همچنان پاسخ های زبان طبیعی را دریافت کنید.

سیری به طور پیش فرض این کار را انجام نمی دهد - باید به منوی دسترسی iOS بروید و (accessibility menu and activate) Type to Siri را(Type to Siri) فعال کنید . هر دو Cortana و Google Assistant(Cortana and Google Assistant) دارای ورودی متنی(text input) به طور پیش فرض بودند، بنابراین مقدار کمی اعتبار اضافی در اینجا دریافت می کنند.

عملکرد تشخیص صدا(Voice Recognition Performance)

یک دستیار(assistant understand) دیجیتال چقدر می تواند شما را درک کند ؟ این سوال دو بخش دارد. اولین مورد مربوط به تبدیل دقیق گفتار شما به متن است. اگر آنچه شما می گویید به یک آشفتگی درهم و برهم مانند تصحیح خودکار تبدیل شود، فایده زیادی ندارد. قسمت دوم سوال مربوط به این است که آنچه شما گفتید توسط نرم افزار چقدر خوب تجزیه شده است. 

هر سه دستیار حرف ما را بدون مشکل فهمیدند و آن را به درستی تجزیه کردند. چیز زیادی برای گزارش در اینجا نیست، اما تشخیص صدا و هوش مصنوعی(voice recognition and AI) در سال 2019 بسیار چشمگیر است.

حکم - چه کسی در صدر قرار گرفت؟(The Verdict –  Who Came Out on Top?)

برای کاربران اپل(Apple) ، حکم روشن است. اگرچه سیری(Siri) به طور عینی از نظر فناوری پیشرفته از (cutting-edge technology)دستیار گوگل(Google Assistant) عقب است ، اما ادغام عمیق آن با iOS و سخت افزار (s hardware)اپل(Apple) به این معنی است که بهترین تجربه کلی را ارائه می دهد.

به خصوص با توجه به عملکرد تقریباً بی عیب و نقص هندزفری آن. اگر از سرویس‌های اپل(Apple) مانند Apple Music نیز استفاده می‌کنید و مدتی را صرف تنظیم دقیق میان‌برهای Siri می‌کنید ، تصور اینکه با محدودیت‌ها و حلقه‌هایی که دیگر دستیاران دیجیتال در دستگاه‌های iOS ایجاد می‌کنند سخت است.

برای کاربران اندروید که به هر حال به (Android)سیری(Siri) دسترسی ندارند، همه چیز جالب تر می شود. بین Cortana و Google Assistant(Between Cortana and Google Assistant) در دستگاه آزمایشی (test device)Galaxy Note 10+ ما ، Google Assistant به وضوح دست برتر را دارد. استفاده کورتانا از بینگ(Bing) به عنوان موتور جستجوی(search engine) خود قابل درک است، اما بینگ(Bing) به طور مداوم نتایج جستجوی رضایت‌بخش کمتری ارائه می‌دهد، که نشانه‌ای نسبتاً جدی علیه آن است. 

در نهایت، کورتانا(Cortana) یک برنامه بسیار محدود در اندروید(Android) است. عملکرد متقابلی که با Cortana در ویندوز(Windows) وجود دارد ممکن است آن را به یک برنامه اضافی مفید تبدیل کند، اما زمانی که Google Assistant دقیقاً در آنجا قرار دارد و به خوبی یکپارچه شده است ، نمی توان آن را به عنوان دستیار اصلی Android شما توصیه کرد.(Android assistant)



About the author

من یک توسعه دهنده ماهر iOS با بیش از دوازده سال تجربه هستم. من روی هر دو پلتفرم iPhone و iPad کار کرده‌ام و می‌دانم چگونه برنامه‌ها را با استفاده از آخرین فناوری‌های اپل ایجاد و سفارشی‌سازی کنم. علاوه بر مهارت‌هایم به‌عنوان توسعه‌دهنده aiOS، تجربه قوی در استفاده از Adobe Photoshop و Illustrator و همچنین توسعه وب از طریق چارچوب‌هایی مانند WordPress و Laravel دارم.



Related posts