5 سرویس OCR آنلاین رایگان تست و بررسی شده است

یک سند PDF(PDF document) یا تصویری دارید که می خواهید آن را به متن تبدیل کنید؟ اخیراً شخصی سندی را برای من از طریق نامه ارسال کرد که باید آن را ویرایش و با اصلاحات برگردانم. آن شخص نتوانست یک کپی دیجیتالی را پیدا کند، بنابراین من وظیفه داشتم تمام آن متن را به فرمت دیجیتال برسانم.

به هیچ وجه نمی‌توانستم ساعت‌ها وقت بگذارم و همه چیز را دوباره تایپ کنم، بنابراین در نهایت یک عکس باکیفیت خوب از سند گرفتم و سپس راهم را از طریق یکسری خدمات OCR آنلاین سوزاندم تا ببینم کدام یک بهترین را به من می‌دهد. نتایج.

در این مقاله، من چند سایت مورد علاقه خود را برای OCR که رایگان هستند مرور می کنم. شایان ذکر است که اکثر این سایت‌ها یک سرویس رایگان اولیه ارائه می‌کنند و اگر به ویژگی‌های اضافی مانند تصاویر بزرگ‌تر، اسناد PDF چند صفحه‌ای ، زبان‌های ورودی مختلف و غیره می‌خواهید، گزینه‌های پولی دارند.

همچنین خوب است از قبل بدانید که اکثر این سرویس ها نمی توانند با قالب بندی سند اصلی شما مطابقت داشته باشند. اینها عمدتاً برای استخراج متن هستند و بس. اگر نیاز دارید که همه چیز در یک طرح یا قالب خاص باشد، پس از دریافت تمام متن از (layout or format)OCR ، باید به صورت دستی این کار را انجام دهید .

علاوه بر این، بهترین نتایج برای دریافت متن از اسنادی با وضوح 200 تا 400 DPI(DPI resolution) حاصل می شود. اگر تصویر DPI(DPI image) پایینی دارید ، نتایج به خوبی نخواهد بود.

در نهایت، بسیاری از سایت‌ها بودند که من آزمایش کردم که کار(t work) نمی‌کردند . اگر OCR آنلاین رایگان را در گوگل جستجو کنید، مجموعه‌ای از سایت‌ها را می‌بینید اما چندین سایت در 10 نتیجه برتر حتی تبدیل را کامل نکرده‌اند. برخی از آنها زمان پایان می‌دادند، برخی دیگر خطا می‌دادند و برخی فقط در صفحه «تبدیل» گیر می‌کردند، بنابراین من حتی به خود زحمت ذکر آن سایت‌ها را هم ندادم.

برای هر سایت، دو سند را تست کردم تا ببینم خروجی چقدر خوب است. برای آزمایش‌هایم، من به سادگی از iPhone 5S برای گرفتن عکس از هر دو سند استفاده کردم و سپس آنها را مستقیماً برای تبدیل در وب‌سایت‌ها آپلود کردم.

اگر می خواهید ببینید که تصاویری که من برای آزمایش خود استفاده کردم چه شکلی هستند، آنها را در اینجا پیوست کرده ام: Test1 و Test2 . توجه داشته باشید که اینها نسخه های با وضوح کامل تصاویر گرفته شده از گوشی نیستند. من هنگام آپلود در سایت ها از تصویر با وضوح(resolution image) کامل استفاده کردم .

OnlineOCR

OnlineOCR.net یک سایت ساده و تمیز است که نتایج بسیار خوبی را در آزمون من ارائه کرد. اصلی‌ترین چیزی که در مورد آن دوست دارم این است که تبلیغات زیادی در همه جا ندارد، که معمولاً در مورد این نوع سایت‌های خدمات طاقچه صدق می‌کند.(niche service)

رایگان آنلاین ocr

برای شروع، فایل خود را انتخاب کنید و صبر کنید تا(file and wait till) آپلود به پایان برسد. حداکثر حجم آپلود برای این سایت 100 مگابایت است. اگر برای یک حساب رایگان ثبت نام کنید، چند ویژگی اضافی مانند اندازه آپلود بزرگتر، PDF(PDFs) های چند صفحه ای ، زبان های ورودی مختلف، تبدیل های بیشتر در ساعت و غیره دریافت خواهید کرد.

سپس زبان ورودی(input language) خود را انتخاب کنید و سپس فرمت خروجی(output format) را انتخاب کنید . می‌توانید از میان Word ، Excel یا Plain Text انتخاب کنید. روی(Click) دکمه تبدیل(Convert) کلیک کنید و متن را در پایین در کادری به همراه لینک دانلود(download link) نمایش داده می‌شوید .

خروجی ocr

اگر تمام چیزی که می خواهید متن است، فقط آن را کپی و(copy and paste) از کادر پیست کنید. با این حال، من به شما پیشنهاد می‌کنم سند Word(Word document) را دانلود کنید، زیرا به طرز شگفت‌آوری در حفظ طرح‌بندی سند اصلی بسیار عالی عمل می‌کند.

به عنوان مثال، زمانی که سند Word را(Word document) برای دومین آزمایش خود باز کردم، با تعجب متوجه شدم که سند شامل یک جدول با سه ستون است، درست مانند تصویر.

خروجی ocr آنلاین

از بین همه سایت ها، این یکی تا حد زیادی بهترین بود. اگر نیاز به تبدیل های زیادی دارید، کاملاً ارزش ثبت نام را دارد.

برای تکمیل، من همچنین می خواهم به فایل های خروجی ایجاد شده توسط هر سرویس پیوند دهم تا بتوانید نتایج را خودتان مشاهده کنید. در اینجا نتایج OnlineOCR آمده است(OnlineOCR) : Test1 Doc و Test2 Doc(Test1 Doc and Test2 Doc) .

توجه داشته باشید که هنگام باز کردن این اسناد Word در رایانه خود، پیامی در Word دریافت می کنید که نشان می دهد از اینترنت است و ویرایش(Internet and editing) غیرفعال شده است. این کاملاً خوب است زیرا Word(Word doesn) به اسناد اینترنت(Internet) اعتماد ندارد و اگر فقط می خواهید سند را مشاهده کنید واقعاً مجبور نیستید ویرایش را فعال کنید.

i2OCR

سایت دیگری که نتایج بسیار خوبی داشت i2OCR بود . روند بسیار مشابه است: زبان، فایل خود را انتخاب کنید و سپس Extract Text را فشار دهید .

i2ocr

شما باید یک یا دو دقیقه در اینجا صبر کنید زیرا این سایت کمی بیشتر طول می کشد. همچنین، در مرحله 2(Step 2) ، مطمئن شوید که تصویر شما در پیش‌نمایش سمت راست به بالا نشان داده می‌شود، در غیر این صورت یکسری حرف‌های بیهوده به عنوان خروجی دریافت خواهید کرد. بنا به دلایلی، تصاویر آیفون من در حالت عمودی(portrait mode) در رایانه من نشان داده می شد، اما زمانی که من در این سایت آپلود کردم، افقی بود.

خروجی i2ocr

من مجبور شدم تصویر را به صورت دستی در یک برنامه ویرایش عکس باز کنم، آن را 90 درجه بچرخانم، سپس آن را به حالت عمودی برگردانم و دوباره آن را ذخیره کنم. پس از(Once) تکمیل، به پایین اسکرول کنید تا پیش‌نمایش متن به همراه دکمه دانلود(download button) را به شما نشان دهد .

این سایت با خروجی آزمایش اول بسیار خوب عمل کرد، اما با آزمایش دوم که طرح بندی ستونی(column layout) داشت، چندان خوب عمل نکرد . در اینجا نتایج حاصل از i2OCR آمده است: Test1 Doc و Test2 Doc(Test1 Doc and Test2 Doc) .

FreeOCR

Free-OCR.com تصاویر شما را می گیرد و آنها را به متن ساده(plain text) تبدیل می کند . گزینه ای برای صادرات به فرمت Word(Word format) ندارد. فایل خود را انتخاب کنید، یک زبان را انتخاب کنید و سپس روی Start کلیک کنید .

سایت سریع است و نسبتاً سریع خروجی را دریافت خواهید کرد. فقط روی(Just click) لینک کلیک کنید تا فایل متنی(text file) را در رایانه خود دانلود کنید.

freeocr

مانند NewOCR که در زیر ذکر شده است، این سایت تمام Tهای موجود در سند را با حروف بزرگ نوشته است. من نمی دانم که چرا این کار را انجام می دهد، اما به دلایلی عجیب این سایت و NewOCR(site and NewOCR) هر دو این کار را انجام دادند. تغییر آن کار مهمی نیست، اما این یک فرآیند خسته کننده است که واقعاً نباید انجام دهید.

در اینجا نتایج FreeOCR آمده است(FreeOCR) : Test1 Doc و Test2 Doc(Test1 Doc and Test2 Doc) .

ABBYY FineReader آنلاین

برای استفاده از FineReader Online ، باید برای یک حساب کاربری ثبت نام کنید، که یک دوره آزمایشی رایگان 15 روزه برای OCR تا 10 صفحه به صورت رایگان در اختیار شما قرار می دهد. اگر فقط باید یک بار OCR برای چند صفحه انجام دهید، می توانید از این سرویس استفاده کنید. اطمینان(Make) حاصل کنید که پس از ثبت نام ، روی پیوند تأیید(verify link) در ایمیل تأیید کلیک کنید.(confirmation email)

finereader آنلاین

روی Recognize در بالا کلیک کنید و سپس روی Upload کلیک کنید تا فایل خود را انتخاب کنید. زبان، فرمت خروجی خود را انتخاب کنید و سپس روی Recognize در پایین کلیک کنید. این سایت دارای رابط کاربری تمیز و بدون تبلیغات است.

در آزمایش‌های من، این سایت می‌توانست متن را از اولین سند آزمایشی(test document) بگیرد، اما وقتی Word doc را باز کردم، بسیار بزرگ بود ، بنابراین در نهایت آن را دوباره انجام دادم و متن ساده(Plain Text) را به عنوان فرمت خروجی(output format) انتخاب کردم .

برای تست دوم با ستون ها، سند ورد(Word document) خالی بود و حتی متن را پیدا نکردم. مطمئن نیستم چه اتفاقی در آنجا افتاده است، اما به نظر نمی‌رسد که بتواند چیزی جز پاراگراف‌های ساده را مدیریت کند. در اینجا نتایج FineReader آمده است : Test1 Doc و Test2 Doc.

NewOCR

سایت بعدی، NewOCR.com ، خوب بود، اما تقریباً به خوبی سایت اول نبود. اولاً، تبلیغات دارد، اما خوشبختانه نه یک تن. ابتدا فایل خود را انتخاب کرده و سپس روی دکمه Preview کلیک کنید.

آپلود تصویر

سپس می توانید تصویر را بچرخانید و ناحیه ای را که می خواهید برای متن اسکن کنید تنظیم کنید. این تقریباً شبیه نحوه عملکرد فرآیند اسکن(scanning process) در رایانه با یک اسکنر متصل است.

تصویر ocr

اگر سند دارای چندین ستون باشد، می‌توانید دکمه تحلیل طرح‌بندی صفحه( Page layout analysis) را بررسی کنید و سعی می‌کند متن را به ستون‌ها تقسیم کند. روی(Click) دکمه OCR کلیک کنید(OCR button) ، چند ثانیه صبر کنید تا کامل شود و سپس وقتی صفحه بازخوانی شد به پایین بروید.

در تست اول، تمام متن را به درستی دریافت کرد، اما به دلایلی هر T در سند را با حروف بزرگ نوشت! نمی دانم چرا این کار را انجام می دهد، اما انجام داد. در تست دوم با فعال بودن تجزیه و تحلیل صفحه(page analysis) ، بیشتر متن را دریافت کرد، اما طرح بندی کاملاً خاموش بود.

در اینجا نتایج NewOCR آمده است(NewOCR) : Test1 Doc و Test2 Doc.

نتیجه

همانطور که می بینید، متأسفانه، رایگان در بیشتر مواقع نتایج خیلی خوبی به شما نمی دهد. اولین سایت ذکر شده تا کنون بهترین است زیرا نه تنها کار بزرگی در تشخیص تمام متن انجام داد، بلکه توانست فرمت سند اصلی را نیز حفظ کند.

اگر فقط به متن نیاز دارید، اکثر وب سایت های بالا باید بتوانند این کار را برای شما انجام دهند. اگر سوالی دارید، در کامنت بگذارید. لذت بردن!



About the author

من یک توسعه دهنده ماهر iOS با بیش از دوازده سال تجربه هستم. من روی هر دو پلتفرم iPhone و iPad کار کرده‌ام و می‌دانم چگونه برنامه‌ها را با استفاده از آخرین فناوری‌های اپل ایجاد و سفارشی‌سازی کنم. علاوه بر مهارت‌هایم به‌عنوان توسعه‌دهنده aiOS، تجربه قوی در استفاده از Adobe Photoshop و Illustrator و همچنین توسعه وب از طریق چارچوب‌هایی مانند WordPress و Laravel دارم.



Related posts