תכנת זיהוי תווים אופטי היא תכנה אשר ממירה מסמך סרוק, למסמך של תמליל ממוחשב זאת על ידי טכנולוגיה של עיבוד תמונה וראייה ממוחשבת..
תהליך זיהוי התווים כרוך בזיהוי תו אחרי תו מבין כלל התווים המרכיבים את המסמך. בנוסף, ישנם שני כללים אשר עוזרים לשפר את זיהוי התווים. הכלל הראשון הוא חלוקת הכתב הכללי למספר קטעים להם מכנה משותף מסוים (אותיות עבריות לעומת אותיות קיריליות וכד'). כלל עזר נוסף שעוזר לעבד את הטקסט בצורה נכונה הוא הגדרת השפה אותה תחפש התכנה. כך למשל במידה והגדרת לתכנה שמדובר בטקסט בספרדית, וגם אם האותיות זהות לאותיות אנגליות, יועדפו קודם כל תווים היוצרים מילים בעלות כתיב ספרדי תקין.
עיבוד התמונה של מסמך סרוק מאפשר הפעלת זיהוי תווים אופטי, המסוגל לפענח את האותיות במסמך ברמת הטקסט. על התשתית הזאת ניתן להפעיל חיפושים חכמים על תכולת המסמכים ולסווג מסמכים לפי נושאים, מחברים, כותרות, ועוד.
מיסוך מסמכים הינו פעולה אשר מוחקת אזורים מסוימים במסמך ומשאירה אזורים אחרים. טיפול כזה יועיל למשל בקליטת לקוחות שמזינים מסמכי תשלום סרוקים, כאשר חלק מהמסמך הינו חסוי או מיותר, ואסור שיישאר במערכת המידע. המערכת תמחק את האזורים המיותרים מהמסמכים באופן אוטומטי. באופן זה תשמר פרטיותם של הלקוחות ולחברה ייחסכו נפחי אחסון מידע ועבודת כח אדם.
קריאה וניתוח אוטומטי של ברקודים, שאלונים וטפסים הינו יישום נוסף של טיפול אוטומטי במסמכים. ניתן להציב ללקוח מערכת אוטומטית לחלוטין החל מרמת סריקת הטפסים. השאלונים הנסרקים מנותחים עם אלגוריתם ניתוח תמונה חכם, המאפשר את פענוח הסימונים בשאלון. התכנה מסוגלת לזהות מידע, גם אם מדובר בסימונים מסובכים או עם שונות גבוהה משאלון לשאלון. המערכת תחזיר את מידע המפוענח מהטפסים יחד עם רמת הוודאות בקריאה של כל טופס, ותוכל להתריע כאשר ישנו מסמך המכיל מידע דו-משמעי עבור המערכת.