העבודה במפעל המילון ההיסטורי מבוססת על הקלדת הטקסטים העתיקים על פי כתב היד הטוב ביותר שלהם. בטקסטים מן העת החדשה נבחרת הגרסה על פי מקום פרסומם הראשון. לאחר ההקלדה נרשם ערך מילוני לכל מילה בחיבור. הניתוח הלשוני נעזר במחשוב אך נקבע על פי שיקול הדעת של העובדים המדעיים הקוראים את הטקסט. כל טקסט נבחן בידי שלושה עובדי מחקר בשלב ההקלדה, ושוב בידי שלושה עובדים בשלב הכנת הקונקורדנציה (הניתוח הלשוני). קטע המשנָה, מתוך כתב יד קאופמן (1), מדגים את משמעותה של הקונקורדנצייה.

(1) קטע משנה, כתב יד קאופמן (העמידו את הסמן על המילים בקטע)

השימוש בכתבי יד אמינים מתעד תופעות לשוניות עתיקות שאינן משתקפות בנוסחים המוכרים מן הדפוסים המאוחרים. לכן מושקע עמל רב בקריאה מדויקת בכתבי יד, שחלקם, כמו קטע הגניזה שלהלן (2), אינם קלים לפיענוח.
תיאור כתב היד וקריאתו נעשים באמצעות סימני התקנה מיוחדים.

(2) קטע גניזה (העמידו את הסמן על המילים בקטע)

אוסף הטקסטים במאגר מקיף גם את תקופת ההשכלה ותחיית הלשון, וכך אפשר לעקוב אחר גיבושה של העברית החדשה. בקטע הבא מספר תולדות הטבע (3) של מנדלי מוכר ספרים מתועדת ההופעה הראשונה של שם הציפור נחליאלי בשפתנו, וכן תופעות אחרות האופייניות ללשון התקופה.

בשנת תשס"ה (2005) החלו כותבים באקדמיה ערכים למילון ההיסטורי; בינתיים רק על יסוד החומר שבספרות העתיקה.

(3) קטע מספר תולדות הטבע של מנדלי מו"ס (העמידו את הסמן על המילים בקטע)

הקטעים

(1) המשנה נערכה בסוף המאה השנייה לספירה וכתב היד הזה הוא מן המאה ה־12. כתב יד קאופמן מוצג באדיבות ספריית האקדמיה הלאומית למדעים של הונגריה.

(2) קטע מגניזת קהיר ובו איגרת שכתב אליהו הכהן בן שלמה מירושלים אל אפרים בן שמריה שישב בפסטאט (מצרים). האיגרת נכתבה בסביבות שנת 1055. מוצג באדיבות ספריית בית המדרש לרבנים באמריקה ופרויקט פרידברג לחקר הגניזה.

(3) שלום יעקב בן־חיים משה אַבְּרַמָוִיץ, ספר תּוֹלְדֹת הַטֶּבַע, חֹברת שניה: העוף, ז'יטומיר תרכ"ז (1866).