שירותי סריקה והמרה של טקסטים (המרת OCR), הם חלק ממכלול השירותים של הוצאה לאור, ואנו בטקסט רץ מבצעים זאת במקצועיות רבה.
אם יש לכם טקסט מודפס על דף או ספר, אך אין לכם את קובץ המקור הממוחשב (משום שאיבדתם אותו, או משום שהספר ישן מדי) – צרו קשר וכנראה שנוכל לסייע לכם!
המחשב מזהה כעת את הדף כתמונה שטוחה, והוא אינו "מבין" שיש עליה טקסט, ולכן לא נותן אפשרות לערוך את הטקסט. מבחינתו הטקסט הוא 'כתמים שחורים' על רקע לבן.
כיצד ניתן בכל אופן לערוך את הטקסט? על ידי שירותי המרה OCR בעברית.
מה זה OCR?
האותיות OCR הן ראשי תיבות של: Optical Character Recognition, שפירושו "זיהוי תווים אופטי".
עד לפני מספר לא רב של שנים, לא הייתה למחשב שום יכולת לפענח תמונה שמופיע בה טקסט, משום שכאמור – מבחינתו היו אלו כתמים שחורים על רקע לבן (וליתר דיוק – פיקסלים בצבעים שונים) ותו לא.
בשנים האחרונות החלה להתפתח תעשיית תכנות של בינה מלאכותית, שמאפשרת למחשב לזהות את "הכתמים השחורים" שעל הרקע הבהיר, לאפיין את הצורה שלהם ו"להבין" איזו אות מייצג כל אחד מהם.
תכנות אלו אפשרו לראשונה לסרוק ולצלם טקסטים, ואז באמצעות תוכנת OCR להמיר אותן לטקסט חי שניתן לעריכת טקסט לספר.
האם אפשר לסרוק ולהמיר כתב יד?
התשובה היא: לסרוק ודאי שכן, להמיר – כרגע עדיין לא.
מטבע הדברים התכנות הללו מפותחות מאוד בשפה האנגלית, ופחות בשפות אחרות. בשפה העברית אין הרבה משתמשים (יחסית לכלל אוכלוסיית העולם), ולכן היא די נזנחת.
תוכנות ה-OCR הגיעו אמנם לישראל ולעברית, אך יש עוד דרך ארוכה עד שניתן יהיה באמצעותן להציע שירותי סריקה בעברית לכתב יד.
גם באנגלית פענוח כתבי יד הוא חלקי, ועומד על חזקת 9/10 בערך. שזה אומר – אינספור טעויות. אגב, בעברית – גם בהמרת טקסט מודפס אחוז הטעויות עלול להיות גם הוא בשיעור כזה.
מסתבר שעם השנים הטכנולוגיות תתפתחנה, ומקצוע הקלדנות ייעלם כמעט לגמרי מן העולם.
אני יכול לסרוק את הספר?
סריקה של ספר נעשית בדרך כלל כשרוצים להוציא לאור את הספר במהדורה מעודכנת, אך רוצים לערוך אותו, לערוך עימוד ועיצוב מחדש את כולו, ולא להסתפק במהדורת צילום.
סריקת הספר בדרך כלל נעשית בצורה הבאה: בגיליוטינה מקצועית חותכים את חלק השדרה של כריכת הספר, ונותרים עם ערימת דפים ביד.
את הדפים הללו (בלי הכריכה כמובן) מזינים למכונת הסריקה, והיא סורקת אותם במהירות והופכת אותם לסדרת קבצי תמונה. בדרך כלל נוח יותר לקבץ את כל התמונות בקובץ PDF אחד.
לכן, אם יש לכם ספר ביד שאתם רוצים לההדיר, להעלות למאגרי ידע, לגבות או סתם לקרוא כקובץ – אז כן, אתם יכולים לסרוק אותו, ומדובר בתהליך די פשוט.
כמה עולה לסרוק ולהמיר ספר? OCR בעברית
מחיר סריקת ספר משתנה מעט לפי גודל העבודה וכן האם היא נעשית כהכנה להקלדה והוצאה לאור של הספר או בפני עצמה, אך באופן כללי מדובר על 1-3 ש"ח לכל עמוד.
המרת טקסט לספר מורכבת קצת יותר, ומחירה משתנה מאוד לפי כמות החומר, סוג החומר. יש נושאים שלמחשב קל יותר לזהות מילים, ויש נושאים כמו מדע, תלמוד וכדו' שהמחשב מתקשה בכך ושוגה רבות.
באופן כללי המחיר להמרה הוא בסביבות ה-1-2 ש"ח לעמוד, אך יש מקרים בהם זה לוקח יותר.
לקריאה על עלויות הוצאת ספר באופן כללי כדאי להעיף מבט כאן.
שירותי סריקה והמרה של ספר – לא תמיד זה מדויק
כמו כן, חשוב לציין כי תוכנות סריקה והמרה אינן מדויקות, ובמיוחד אם טקסט המקור אינו איכותי וחד. ההגהה תיקון השגיאות של תוכנת ההמרה עשוי להיכלל במחיר ההמרה, אך יש לוודא זאת מראש.
רוצים הצעת מחיר לטקסט שלכם? צלמו שני עמודים, שלחו אלינו ואנו נאמר לכם האם אפשר להמיר אותו וכמה בדיוק יעלה כל הסיפור.
חדש! צרפו ושלחו את הקובץ שלכם מכאן!
מתלבטים אם כדאי לכם לסרוק ואם יש טעם? שלחו לנו כעת באמצעות הטופס הבא צילום של דוגמא מהחומר ואנו נבדוק האם כדאי .
יש לכם כבר חומר סרוק שאתם רוצים להמיר? צרפו ושלחו אותו ישירות מכאן, ואנו נאמר לכם כמה יעלה להמיר את כולו לטקסט חי, שיאפשר לערוך אותו כפי שתרצו!