תיקייה בענן + קבצים סרוקים עם זיהוי תווים = מוצאים מסמך תוך שניות, לא שעות

ארכוב PDF ניתן לחיפוש בארגון

יש לך הר של מסמכים סרוקים - חוזים, קבלות, מכתבים, אישורים - וכולם נשמרו כתמונות שאי אפשר לחפש בתוכן? זיהוי תווים (OCR) הופך כל קובץ סרוק לקובץ שאפשר לחפש בו: מקלידים שם, מילה או תאריך, ומוצאים את המסמך תוך שניות במקום לעבור עליהם אחד-אחד.

הכלי המקצועי

PDF לניתן לחיפוש - ישירות בדפדפן

חינמי · בלי התקנה · עברית מלאה

PDF לניתן לחיפוש עכשיו

ארכיב מסמכים ניתן לחיפוש: מדריך מלא

למה רוב הארכיבים הסרוקים לא ניתנים לחיפוש

הסיבות הנפוצות:

  1. "סרקתי הכול - חשבתי שזה מספיק" - אבל סריקה היא רק תמונה, ואי אפשר לחפש בתוך תמונה
  2. "חבל לי על הזמן" - בפועל זיהוי התווים לוקח בערך דקה לקובץ
  3. "לא ידעתי שאפשר" - זיהוי תווים פשוט להפעלה ומוסיף ערך עצום

המחיר האמיתי של ארכיב שאי אפשר לחפש בו:

  • חיפוש מסמך ישן אחד יכול לקחת חצי שעה עד שעה של דפדוף בתיקיות
  • אם זה קורה כמה פעמים בשבוע, מצטברות לכך שעות רבות בשנה - זמן שאפשר לחסוך לגמרי

עם kovetz.co.il זיהוי התווים חינמי.

איך מקימים ארכיב מסודר: שלושה שלבים

שלב 1: סידור (לפני זיהוי התווים)

מבנה תיקיות מומלץ:

ארכיב/
  לקוחות/
    [שם-לקוח]/
      חוזים/
      חשבוניות/
      התכתבות/
  ספקים/
  מסמכים-אישיים/
    אישורים/
    הסכמים/
  פיננסי/
    דוחות-חודשיים/
    דוחות-שנתיים/

שלב 2: זיהוי תווים

  • העבר כל קובץ דרך kovetz.co.il/make-searchable
  • שמור עם שם עקבי, למשל שם-מקורי-OCR.pdf

שלב 3: העלאה לענן וחיפוש

  • העלה את הקבצים לתיקייה בענן
  • המתן זמן קצר עד שהענן יסרוק אותם (תלוי בכמות)
  • בדוק שזה עובד: חפש "כהן" וראה שכל המסמכים שמכילים את השם עולים

איפה לשמור את הארכיב

לרוב האנשים והעסקים הקטנים, תיקייה מסודרת בענן (כמו גוגל דרייב או דרופבוקס) מספיקה לחלוטין: היא מחפשת אוטומטית בתוך קבצים שעברו זיהוי תווים, נגישה מכל מקום, ומגובה.

מתי שוקלים פתרון מתקדם יותר:

  • כשיש כמות גדולה מאוד של מסמכים והרבה אנשים שצריכים גישה
  • כשצריך לעקוב מי פתח כל מסמך ומתי
  • במקרים האלה קיימות מערכות ייעודיות לניהול מסמכים בארגון, אך לרוב המשתמשים אין בהן צורך.

פרטיות בארכיב

לפי חוק הגנת הפרטיות בישראל:

  • ארכיב שמכיל מידע אישי על אנשים נחשב למאגר מידע
  • עסקים מסוימים מחויבים לרשום אותו
  • חשוב להגביל את הגישה אליו

מה כדאי לבדוק:

  • מי יכול לגשת לארכיב?
  • כמה זמן שומרים את המסמכים?
  • האם השמירה מאובטחת (חיבור מוצפן, גיבוי)?

יתרון נוסף לארכיב שניתן לחיפוש: כשאפשר לחפש בתוך המסמכים, גם קל יותר למצוא ולמחוק מידע על אדם מסוים אם הוא מבקש זאת.

PDF/A לשמירה לטווח ארוך

מה ההבדל בין PDF רגיל ל-PDF/A:

  • PDF/A הוא פורמט מיוחד שנועד לשמירה לאורך שנים רבות
  • הוא מבטיח שהמסמך ייפתח כמו שצריך גם בעוד עשרות שנים
  • הוא שומר את כל הגופנים בתוך הקובץ כדי שהתצוגה לא תשתנה

מתי כדאי להשתמש ב-PDF/A:

  • ארכיב ממשלתי
  • ארכיב משפטי
  • מסמכי ביטוח
  • כל מקום שבו חשוב שהמסמך יישאר ניתן לפתיחה לתמיד

המרה: kovetz.co.il/convert-to-pdfa - להמרת PDF רגיל ל-PDF/A

טיפ: הפעל קודם את זיהוי התווים ורק אחר כך המר ל-PDF/A - לא להפך.

ארכוב PDF ניתן לחיפוש בארגון - שלב אחר שלב

  1. 1

    סדר את התיקיות לפני שמתחילים

    אין טעם להפעיל זיהוי תווים על בלגן. קודם כל בנה מבנה תיקיות ברור בענן או במחשב ותן לקבצים שמות עקביים. רק אחר כך הפעל את זיהוי התווים על קבצים מסודרים.

  2. 2

    הפעל זיהוי תווים על הקבצים

    היכנס ל-kovetz.co.il/make-searchable והעבר כל קובץ. שמור בשם עקבי (למשל בתוספת '-OCR' בסוף השם) כדי לדעת אילו קבצים כבר עברו עיבוד.

  3. 3

    העלה לתיקייה בענן

    העלה את הקבצים לתיקייה משותפת בענן. הענן יסרוק אותם אוטומטית, וכעבור זמן קצר אפשר יהיה לחפש בתוכם לפי מילה או שם.

  4. 4

    הגדר מי יכול לגשת

    בתוך הענן קבע מי מורשה לפתוח את התיקייה. חשוב: ארכיב של מסמכי לקוחות מכיל מידע אישי, ולכן כדאי להגביל את הגישה רק למי שבאמת צריך.

שאלות ותשובות

האם גוגל דרייב יודע לחפש בתוך קובץ סרוק?
כן, וזו אחת הדרכים הפשוטות. אחרי שמעלים קובץ שעבר זיהוי תווים, גוגל דרייב סורק אותו אוטומטית, וכשמחפשים שם או מילה הוא מציג את כל הקבצים שמכילים אותם. זה עובד גם בתיבת המייל של גוגל.
מה זה PDF/A ולמה זה רלוונטי לארכיב?
PDF/A הוא פורמט מיוחד שמיועד לשמירת מסמכים לטווח ארוך - הוא מבטיח שהקובץ ייפתח כמו שצריך גם בעוד עשרות שנים. לארכיב ממשלתי או משפטי זה לרוב חובה. לשמירה ביתית או עסקית רגילה, קובץ PDF רגיל מספיק. להמרה: kovetz.co.il/convert-to-pdfa.
באיזו תוכנה כדאי לנהל את הארכיב?
לרוב האנשים והעסקים הקטנים, תיקייה מסודרת בגוגל דרייב או בענן אחר עם קבצים שעברו זיהוי תווים - מספיקה לגמרי. לארגון גדול שזקוק לניהול מסודר יותר קיימות מערכות ייעודיות לניהול מסמכים, אבל ברוב המקרים אין בהן צורך.
כמה זמן לוקח זיהוי תווים?
מסמך בינוני בן כ-5 עמודים: בערך חצי דקה עד דקה. אם יש לך מאות מסמכים, אפשר לעבד אותם בזה אחר זה - זה מהיר בהרבה מאשר להקליד הכול מחדש ידנית.
כמה מדויק זיהוי התווים בעברית?
הכלי החינמי כאן מגיע לדיוק של כ-85%-92% על עברית מודפסת וברורה. לאיכות גבוהה יותר (בערך 94%-97%) קיימת אפשרות מתקדמת בתשלום, שמומלצת במיוחד למסמכים רשמיים או משפטיים.