מערכת ocr מאפשרת ביצוע תיוק וחיפושים ממוחשבים של מסמכים באמצעות מפתחות טקסטואליים של מידע הנשלף מתוך מסמכים ארגוניים. בעזרתה, כל סוג מסמך שנסרק למערכת המחשוב של הארגון ניתן לאחזור ולהפיכה לקריא כקובץ דיגיטלי.
למידע נוסף לחצו כאן
זיהוי תווים אופטי
OCR – Optical Characters Recognition או בעברית זיהוי תווים אופטי, הינה מערכת לקידוד טקסטים כתובים והפיכתם לטקסט דיגיטלי מזוהה. פעולות אלו מתחילות בסריקה של המסמכים כקובצי התמונה. לאחר מכן קבצים אלו עוברים תהליך של דיגיטציה בו מזוהים התווים השונים בקובץ ומומרים לתווים נפרדים בתוך קובץ טקסט.
התפתחות מערכות OCR
זיהוי תווים אופטי הוכר כפטנט עוד בשנת 1929 ופותח על ידי הגרמני גוסטב טאוצ’ק, אשר בנה מכונה מיוחדות המסוגלת לזהות תווים על ידי תבניות. מאוחר יותר נבנתה בשנות החמישים בארה”ב עבור סוכנות הביטחון הלאומי מכונה שכונתה גיזמו. בהמשך ממציא המכונה דיוויד שפרד פתח את חברת IMR שהייתה ראשונה לייצר מערכות של OCR לשימושים מסחריים.
באמצע שנות השישים שוכללו מכונות אלו והן הפכו ליותר מהירות ומדויקות ורשויות הדואר בארה”ב החלו לעשות בהן שימוש, ולאחר מכן גם רשויות הדואר של אנגליה וקנדה. בשנות השבעים ריי קורצוויל פיתח מערכת אופטית לקריאת גופנים אשר שימשה כמכשיר קריאה עבור עיוורים, המצאה שהובילה לפיתוחם של סורקים שולחניים. משנת 1978 חברתו של
קורצוויל החלה למכור את המערכת כתוכנת מחשב ושנתיים מאוחר יותר חברתו נמכרה לזירוקס והפכה לחברת בת שלה המכונה כיום ניואנס תקשורת.
מערכות OCR ושימושים נפוצים
התקדמות הטכנולוגיה הובילה לכך שבימינו מערכות OCR מזהות תווים ברמת דיוק גבוהה. הדיוק נוצר בין היתר על ידי שימוש במספר מנועי זיהוי שונים ובלתי תלויים במקביל והצלבת המידע בניהם. כך שלבסוף מתקבלת תוצאה הסתברותית – ככל שיותר מנועים זיהו באופן זהה טקסט מסוים (נומרי או אלפאנומרי), כך קיימת סבירות גבוהה יותר לזיהוי מדויק.
למערכות OCR והאפשרויות שהן פותחות, ישנם כיום שימושים רבים, בניהם:
- אחסון מסמכים טקסטואליים במחשב, תוך הנגשת המידע והאפשרות של חיפוש תוכנם באופן ממוכן, למשל בתוכנת החיפוש הפנימית או במנועי חיפוש כדוגמת גוגל.
- הפצת תוכן טקסטואלי עם תוכנה לאחזור מידע.
- העלאת הטקסט לאתרי אינטרנט, או שליחתו בדואר אלקטרוני.
- שינוי עיצוב התמליל לשם הפיכתו לנגיש עבור אנשים עם לקויות:
הדפסת התמליל או הצגתו על מרקע המחשב עבור אנשים עם לקות ראייה באותיות גדולות על דף צר, בצבעים בעלי ניגודיות חזקה (למשל צהוב על שחור), תוך הגדלת הרווחים בין המילים או בין השורות ביחס לגודל המילים, תוך ניקוי כתמים מהדף המקורי וכיוצא בזה.
- הקראת התמליל על ידי המחשב בעזרת תוכנת הקראה (Text To Speech) עבור אנשים עם לקויות ראייה או קשיי קריאה (כגון אנשים הסובלים מדיסלקציה).
- הזנה של טפסים באופן ממוכן, כגון – סקרים, או שאלוני בחינות רב ברירתיות.
- זיהוי לוחיות רישוי של רכבים בכניסה לחניונים ובכבישי אגרה
- אפשרת להפקדות צ’קים באמצעות אפליקציות מובייל
- ועוד
שימושים עסקיים ב-OCR:
זיהוי טקסט מודפס והמרתו לקובץ ממוחשב מסייע מאוד בתהליך האבולוציוני שעוברים כיום ארגונים רבים בתחום הנקרא “טרנספורמציה דיגיטלית”. שכיום אנחנו עדים ליותר ויותר ארגונים וחברות המבינים את הקריטיות שבמעבר מהסטטוס של “ארגונים אנלוגיים”, המאופיינים בתהליכי עבודה עתירי ניירת וכוח אדם, ל-“ארגונים דיגיטליים”, המאופיינים בתהליכי עבודה ממוכנים, עתירי דאטה וכוח מחשובי.
ארגונים רבים החלו בשנים האחרונות להעביר את כל הניירת הארגונית, ההיסטורית כמו גם העכשווית – תהליכי סריקה, פיענוח ומפתוח, כדי לאפשר לטעון, לתייק ולאחזר את המסמכים באופן ממוחשב ונטול נייר.
לדוגמא, יכולות כיום חברות להעביר כלל חשבוניות הספקים הנשלחות אליהן במעטפות נייר, תהליך דיגיטציה, שבסופו הן יוכרו כחשבוניות דיגיטליות לכל דבר ועניין, גם אם הן נשלחו במקור כדפים מודפסים. תהליך הטיפול בחשבוניות מתחיל בסריקת הניירת המגיעה בפורמטים ובגדלים שונים, לרבות הנספחים הנלווים. בהמשך התהליך מבוצעים חילוץ של נתוני החשבוניות באמצעות פיענוח OCR, בדיקות לוגיות על תקינות תוכן החשבונית, חתימה דיגיטלית כפולה ולבסוף תיוק ואחסון החשבוניות בארכיון דיגיטלי. וכך מאפשרות הטכנולוגיות הקיימות לארגונים לוותר על התהליכים המסורתיים ועתירי כוח האדם כדי ליהנות מחיסכון תפעולי עצום, כמו גם מיתר היתרונות הגלומים ממעבר לניהול ממוחשב ומבוקר של קליטת החשבוניות.
שירותי מערכת OCR וטיפול בחשבוניות ספקים
לתחילת עבודה עם שירותי מערכת OCR וטיפול בחשבוניות ספקים, קבלת מידע נוסף ויעוץ מקצועי בנושא, השאירו פרטיכם באתר שלנו https://www.storenext.co.il או צרו קשר בטלפון 03-9251708, ובמייל sales@storenext.co.il