کار با تشخیص گفتار: دستورات، دیکته متن و مرور وب

نرم افزار تشخیص گفتار(speech recognition software) در ویندوز 7(Windows 7) به طرز شگفت آوری پیچیده است. مایکروسافت(Microsoft) ویژگی‌های زیادی را در آن تعبیه کرده است که در یک زمان فقط در نرم‌افزارهای گران قیمت تشخیص گفتار(speech recognition software) شخص ثالث در دسترس بودند . استفاده از تشخیص گفتار(Speech Recognition) آسان است، اما مانند همه نرم‌افزارهای پیچیده، قبل از اینکه بتوانید با رایانه‌تان به همان روانی که با دوستانتان صحبت می‌کنید صحبت کنید، باید چند اصول اولیه را بیاموزید. اصول اولیه عبارتند از: نحوه شروع تشخیص گفتار(Speech Recognition) ، دستورات رایج، وارد کردن متن، انجام اصلاحات و مرور وب.

در مقاله قبلی (کار با تشخیص گفتار(Speech Recognition) : راه‌اندازی و پیکربندی(Setup and Configuration) )، درباره راه‌اندازی تجهیزات خود برای موفقیت با تشخیص گفتار صحبت(Speech Recognition) کردم . من در اینجا با فرض اینکه مراحل را طی کرده اید، از جمله آموزش داخلی مایکروسافت(Microsoft) ، شروع می کنم و اکنون آماده انجام آن هستید.

توجه:(NOTE:) من در مورد هر کاری که می توانید با تشخیص گفتار(Speech Recognition) انجام دهید صحبت نمی کنم - برای این کار باید یک کتاب بنویسم! اما من در مورد رایج ترین کاربردها، نوشتن و مرور بحث خواهم کرد.

شروع تشخیص گفتار

قبل از شروع، تمام برنامه های کاربردی دیگری را که روی صفحه خود باز کرده اید ببندید. (این فقط به منظور یادگیری است—شما می توانید هر تعداد برنامه را که می خواهید باز داشته باشید، پس از اینکه سرعت عملکرد تشخیص گفتار(Speech Recognition) را پیدا کردید، و می توانید با رایانه خود صحبت کنید تا آن را به سمت برنامه های دیگر هدایت کنید. )

می‌توانید به سادگی گفتار(speech) را در کادر جستجوی منوی استارت تایپ کنید، (Start Menu)تشخیص گفتار(Speech Recognition) را انتخاب کنید و شروع به صحبت کنید - اما در این مورد دلیل بسیار خوبی وجود دارد که راه(way round) طولانی را طی کنید. به Control Panel -> Ease of Access -> Speech Recognition بروید و روی Speech Recognition کلیک کنید .

تشخیص گفتار

همانطور که می بینید، شما قبلاً به بیشتر این موارد رسیدگی کرده اید. برای درک بهتر شما(Train your computer to better understand you) ، روی Train(Skip) your computer بگذرید (در مقاله بعدی به این موضوع می پردازم، جایی که در مورد عیب یابی صحبت خواهم کرد) و روی Open the Speech Reference Card کلیک کنید .

تشخیص گفتار

این به شما فهرستی از موضوعات کمکی برای کاوش می دهد. در حال حاضر، روی Common speech recognition commands کلیک کنید .

تشخیص گفتار

نموداری زیبا از پرکاربردترین دستورات و آنچه برای فعال کردن آنها باید بگویید را مشاهده خواهید کرد. توصیه می‌کنم این را چاپ کنید تا زمانی که در حال یادگیری نحوه عملکرد تشخیص گفتار(Speech Recognition) هستید، در دسترستان باشد.

تشخیص گفتار

فهرست را می‌توانید در اینجا نیز پیدا کنید: دستورات رایج در تشخیص گفتار(Common commands in Speech Recognition) .

حالا شما آماده اید! روی شروع تشخیص گفتار(Start speech recognition) کلیک کنید . ابزار تشخیص گفتار(Speech Recognition) را در بالای صفحه خود خواهید دید و با صدای جیر جیر به شما می گوید که فعال است. با این حال، به‌طور پیش‌فرض، تا زمانی که به شما بگویید به شما گوش نمی‌دهد.

تشخیص گفتار

یادآوری:(A reminder:) باید یک دسکتاپ خالی با ابزار تشخیص گفتار(Speech Recognition) در بالا داشته باشید.

اکنون، مطمئن شوید که میکروفون شما به برق وصل است، مطمئن شوید که نویز پس‌زمینه(background noise) کمتری وجود دارد و بگویید «Start listening». خواهید دید که این ابزار به طور مفید این موضوع را به شما یادآوری می کند.

تشخیص گفتار

این تنها عبارتی است که Speech Recognition در حالت بیکار "می شنود". هیچ چیز دیگری آن را بیدار نمی کند. قبل از اینکه به Speech Recognition(Speech Recognition) آنچه را که می‌خواهد بشنود بگویید، می‌توانید با آن آزمایش کنید . سپس بگویید «Start listening» و آماده امتحان کردن آن خواهید بود.

تشخیص گفتار

دیکته متن(Text) با تشخیص گفتار(Speech Recognition)

حالا که برنامه Speech Recognition فعال است، چه کاری می توانید انجام دهید؟ چند نکته وجود دارد که باید در نظر داشت. اگر هیچ برنامه‌ای ندارید که به طور فعال در حال اجرا باشد، در این مرحله کار زیادی نمی‌توانید انجام دهید. برای باز کردن منوی استارت، (Start Menu)«شروع»("Start") را بگویید . از آنجایی که Speech Recognition یک محصول مایکروسافت است(Microsoft product) ، با موفقیت با سایر محصولات مایکروسافت(Microsoft product) کار می کند. پس بیایید (So let)Notepad را برای آزمایش انتخاب کنیم.

نحوه راه اندازی Notepad به نحوه پیکربندی منوی استارت(Start Menu) بستگی دارد . اگر Notepad موردی است که هنگام باز کردن منوی استارت(Start Menu) قابل مشاهده است ، فقط بگویید «Notepad». اگر آنجا نیست، بگویید «All programs» و سپس «Accessories» و سپس «Notepad». Notepad باز است و آماده کار است.

حالا چی؟ فقط شروع کن به صحبت کردن در اینجا، من یک عبارت آشنا را امتحان می کنم. من آن را با لحن معمولی و با سرعت عادی صحبت می کنم.

تشخیص گفتار

صبر کن(Wait) این درست نیست هیچ علامت نگارشی یا حروف بزرگی(punctuation or capitalization) وجود ندارد و دو کلمه اشتباه است. چگونه می توانم آن را تعمیر کنم؟

برای انتخاب هر کلمه ای که مشکل دارد از دستور select استفاده کنید. (select)در اینجا، من گفته ام "دوستان را انتخاب کنید."("Select friends." )

تشخیص گفتار

این کلمه چه اشکالی دارد؟ پس از آن کاما وجود ندارد، همانطور که باید وجود داشته باشد. بنابراین پس از انتخاب "Friends" می گویم "Friends Comma". پنجره ای با لیستی از گزینه های ممکن ظاهر می شود

تشخیص گفتار

برای انتخاب اولین مورد می‌گویم «یک»("One") و برای تأیید آن می‌گویم «OK» .

تشخیص گفتار

در ادامه جمله، «رومیان»("romans") را انتخاب می کنم و «ویرگول رومی» را می گویم. ("Romans comma.")دوباره کادر ظاهر می شود و یک بار دیگر موردی را که می خواهم انتخاب می کنم.

تشخیص گفتار

املای «("countrymen") کشورها» و «گوش ها» را("ears") با انتخاب آنها، واضح تر بیان کلمه و انتخاب املای صحیح تصحیح می کنم. وقتی کارم با "گوش"("ears") تمام می شود، می گویم "نقطه تعجب".("exclamation point.")

تشخیص گفتار

حالا با یک جمله دیگر ادامه می‌دهم و مطمئن می‌شوم که نقطه‌گذاری را هم می‌گویم. Speech Recognition این بار خیلی بهتر مرا درک می کند. تنها کاری که باید انجام دهم این است که «سزار» را انتخاب کنم،("caesar,") آن را با حروف بزرگ بنویسم و ​​کارم تمام شد.

تشخیص گفتار

حالا می خواهم آن خط را تمام کنم و به خط دیگری بروم. دو راه برای انجام این کار وجود دارد. اگر بگویم "خط جدید"،("New line,") مکان نما به فضای بعدی زیر آنچه روی صفحه است پایین می آید.

تشخیص گفتار

اگر بگویم "پاراگراف جدید"("New paragraph") مکان نما دو خط پایین می آید، بنابراین بین پاراگراف ها فاصله وجود دارد.

تشخیص گفتار

جملات و پاراگراف ها را تمرین(Practice speaking) کنید تا بتوانید نحوه عملکرد آن را ببینید. احتمالاً مجبور خواهید بود آهسته‌تر از مکالمه صحبت کنید، و احتمالاً باید در حین پیش‌روی موارد را اصلاح کنید، اما تشخیص گفتار(Speech Recognition) به سرعت یاد می‌گیرد و پس از چند دقیقه تمرین، دقت تشخیص(recognition accuracy) کاهش می‌یابد. به طور قابل توجهی بهبود یافته است.

فرض کنید اکنون می خواهم این سند را ذخیره کنم. اگر از منوها (به جای کلید میانبر) استفاده می کردم، چگونه این کار را انجام می دادم؟ روی File(File) و Save As کلیک می کنم . و این کاری است که من اکنون انجام می دهم. من می گویم "File" و "Save As" و نام فایل را در منوی Save As بیان می کنم.(Save As)

تشخیص گفتار

اما اگر معلوم شود آنچه را که در سند Notepad خود دارم دوست ندارم و فقط می خواهم همه چیز را پاک کنم، چه؟ (Notepad)"Select all" تمام متن را برجسته می کند و "Delete" از شر آن خلاص می شود.

تشخیص گفتار

وقتی تمرین را تمام کردید، بگویید "Close Notepad". از شما پرسیده می شود که آیا می خواهید آنچه را که نوشته اید ذخیره کنید، و می توانید به دلخواه بگویید "ذخیره"("Save") یا "ذخیره نشود"("Don't save") .

استفاده از تشخیص گفتار(Speech Recognition) با اینترنت اکسپلورر(Internet Explorer)

همانطور که اشاره کردم، Speech Recognition با سایر نرم افزارهای مایکروسافت(Microsoft software) بهترین عملکرد را دارد. آموزش داخلی مایکروسافت (Microsoft)Notepad و WordPad را به شما نشان داد و نگاهی کوتاه به Internet Explorer انداخت(Internet Explorer) . بیایید(Let) با استفاده از تشخیص گفتار(Speech Recognition) با اینترنت اکسپلورر کمی بیشتر بررسی کنیم.

برای باز کردن منوی شروع، بگویید "Start" . حتی اگر اینترنت اکسپلورر(Internet Explorer) نمایش داده نمی شود، بگویید "Internet Explorer" و باز می شود. سپس بگویید «آدرس». ("Address.")این شما را به نوار URL(URL bar) در بالای صفحه می برد. ممکن است عددی را در نوار آبی نمایش دهد.

تشخیص گفتار

آن عدد را بگویید و سپس بگویید "OK". همانطور که می بینید، این گجت به شما یادآوری می کند که انتظار دارد در اینجا چه کاری انجام دهید.

تشخیص گفتار

بگویید «www dot seven tutorials dot com». اوه اوه Speech Recognition آن را به درستی نمایش نمی دهد.

تشخیص گفتار

بگویید "حذف آن". ("delete that.")سپس بگویید "Spell it" و هر شخصیت را به صورت جداگانه بیان کنید. شما باید به جای "نقطه" بگویید " ("period")نقطه". ("dot.")برای به دست آوردن عدد 7 باید "شماره هفت"("Number seven") را بگویید و سپس بقیه آدرس وب(web address) را هجی کنید .

تشخیص گفتار

سپس بگویید "OK". آدرس به نوار URL(URL bar) منتقل می شود . (ممکن است از شما خواسته شود که کلمه را به فرهنگ لغت اضافه کنید. این به شما بستگی دارد.) هنگامی که آدرس در نوار URL(URL bar) قرار گرفت ، بگویید "Press enter." و شما می روید.

تشخیص گفتار

توجه:(NOTE:) هنگامی که یک آدرس وب را در نوار URL(URL bar) صحبت می‌کنید، می‌توانید به جای «نقطه» بگویید «dot» . ("period.")و باید آدرس را یکباره بگویید. مکث نکن مکث باعث می شود که Speech Recognition فکر کند که می خواهید جمله جدیدی را شروع کنید.

اگر می خواهید مقاله ای در مورد 7 آموزش(7 Tutorials) بخوانید چه؟ چگونه آن را انتخاب می کنید؟ بگویید «نمایش اعداد». ("show numbers.")هر عنصر در صفحه با یک عدد در کادر آبی پوشانده شده است. شماره مقاله ای را که می خواهید بخوانید بیان کنید (اینجا عدد 34(number 34) است). سپس بگویید "OK".

تشخیص گفتار

بگویید "OK" و مقاله باز می شود. (شما هم باید از این پیشنهاد عالی استفاده کنید.)

تشخیص گفتار

و بیشتر وجود دارد

همانطور که می بینید، استفاده از تشخیص گفتار(Speech Recognition) از همان ابتدا بسیار آسان است. عادت کردن به آن فقط یک تمرین است. سعی کنید برنامه های مورد علاقه خود را از منوی Start(Start Menu) انتخاب کنید و ببینید چه کاری می توانید با آنها انجام دهید. همه آنها کار نمی کنند. (به نظر می رسد که برنامه های Adobe واقعاً سازگار نیستند.) تنها راه برای یافتن اینکه چه چیزی سازگار است و چه چیزی سازگار نیست، امتحان کردن است. اگر برنامه‌هایی وجود دارند که همیشه از آنها استفاده می‌کنید، که با این تشخیص گفتار(Speech Recognition) داخلی سازگار نیستند ، و متوجه شدید که ترجیح می‌دهید با رایانه خود صحبت کنید، می‌خواهید گزینه‌های پیچیده‌تری را از شرکت‌های دیگر بررسی کنید. مانند Dragon NaturallySpeaking Premium 11.5 .

در مقاله بعدی در مورد عیب یابی Speech Recognition و حل برخی از رایج ترین مشکلات صحبت خواهم کرد. در این بین به تمرین و آزمایش ادامه دهید. من فکر می کنم از اینکه چقدر خوب کار می کند شگفت زده خواهید شد.



About the author

من یک بازبین نرم افزار و مهندس بی سیم با بیش از 10 سال تجربه در این زمینه هستم. من در بررسی برنامه ها و نرم افزارهای تلفن همراه و همچنین کمک به مشتریان برای بهینه سازی شبکه های خود تخصص دارم. از طریق بررسی‌هایم، می‌توانم به شما در تصمیم‌گیری آگاهانه درباره محصولاتی که باید استفاده کنید، نحوه بهبود گردش کار و موارد دیگر کمک کنید. مهارت های من عبارتند از: ارتباط کتبی و شفاهی عالی، حل مسئله، دانش فنی قوی و توجه به جزئیات. من همچنین در کار مستقل و همکاری در پروژه ها مهارت دارم.



Related posts