สแกนหนังสือ (ในอนาคต?)

เป็นอีกเรื่องหนึ่ง ที่ได้มาจากการคุยกันเรื่องการดิจิไทซ์เอกสาร  พรรคพวกที่ชอบอ่านนิยายวิทยาศาสตร์  ได้ส่งหน้า 117-119 ของหนังสือ เรื่อง Rainbows  End แต่งโดย Vernor  Vinge หนังสือเรื่องนี้แต่งในปี ค.ศ. 2006 และได้รับรางวัล Hugo (Hugo Award for Best Novel)  นิยายยอดเยี่ยม ประจำปี ค.ศ. 2007 จับประเด็นจากการคุยและสรุปจากที่อ่านได้มีดังนี้

เนื่องจากวิธีการสแกนหนังสือโดยทั่วๆ ไปจะต้องพลิกทีละหน้าๆ และต้องแผ่หน้าหนังสือออกมาแต่ละหน้าเพื่อให้กล้องสามารถถ่ายได้

ในหนังสือเรื่องนี้  เขียนถึงการสแกนเอกสาร โดยการย่อยหนังสือ ด้วยเครื่องตัด (หญ้า) ขนาดใหญ่ ซึ่งจะตัดหนังสือย่อยออกมาเป็นชิ้นๆ ชิ้นเล็ก ชิ้นน้อย ขนาดฝ่ามือ ในขณะเดียวกันก็ใช้ลมเป่า ในที่นี้ คือ ลมดูดเข้าไปในท่อ ลมจะทำให้เศษกระดาษ (หนังสือ) พัดกระจายตัว ออกจากกัน ซึ่งเสมือนการกระจายหน้าหนังสือออกไป ปัญหาก็คือ หน้าที่กระจายออกไปเหล่านี้ มันเละหมด  จึงใช้หลักการทางซอฟต์แวร์ ทางดิจิทัลเข้ามาช่วย โดยการติดกล้องจำนวนมหาศาล ในหนังสือบอกว่าเป็นพันกล้อง  ถ่ายรูปในลักษณะที่เป็น auto high resolution ในหนังสือไม่ได้บอกรายละเอียดในส่วนนี้ไว้ ถ่ายชิ้นส่วนของหน้ากระดาษ แต่ละชิ้น ทั้งหน้าและหลัง ถ่ายไปเรื่อยๆ เพราะฉะนั้น ชิ้นส่วนกระดาษแต่ละแผ่นปลิว เข้าไปในอุโมงค์ ท่อดูดลมใหญ่ ก็จะผ่านการสแกน โดยการถ่ายรูปหลายครั้งด้วยกัน เพราะมีกล้องจำนวนมาก กล้องจำนวนมากเหล่านี้ จะ capture ภาพ พูดง่ายๆ ว่า เป็นการสแกน ขณะที่เศษกระดาษปลิวผ่านไปอย่างรวดเร็ว โดยหวังว่าจะเก็บได้เกือบหมด อาจจะ 90 หรือ 95%  อาจมีบางแผ่นที่ไม่สามารถแสดงหน้าของตัวเองให้ชัดเจนกับกล้องตัวใดตัวหนึ่งใน พันกล้อง  จะเป็นส่วนที่หลุดไป

ชิ้นส่วนที่ถูกถ่ายภาพไปแล้ว  จะถูกเอามาต่อด้วยกัน  (แบบเดียวกับการถ่ายภาพพาโนรามา ที่ต้องค่อยๆ ขยับกล้องไปเรื่อย แล้วก็เอาภาพตรงนั้นมาผ่านซอฟต์แวร์ เพื่อรวมกันเข้าเป็นภาพพาโนรามาแผ่นเดียวกัน)  หลักการก็เป็นแบบเดียวกัน แต่จะยุ่งยากขึ้นมาพอสมควร  เพราะว่าต้องเอาแต่ละแผ่น (เนื่องจากมันถูกตัดเป็นชิ้นๆ)  ก็ต้องเอามาต่อเป็นแบบจิ๊กซอว์  มีการบิด การปรับแต่งมุม การหมุนย้าย เพื่อให้หน้ากระดาษตรง เพราะอาจจะเอียง หรือกลับหัว  เอาชิ้นส่วนพวกนี้ มาประกอบเข้าด้วยกันเป็นแผ่นเป็นหน้ากระดาษ จากนั้นก็ทำ OCR (Optical Character Recognition) เพื่อจะได้รู้จำ (Recognize) เนื้อหาที่อยู่บนหน้ากระดาษนั้น ส่วนที่จะรู้ได้อย่างไรว่า ลักษณะของกระดาษ  เลขหน้า รูปของปก ส่วนนั้นมาจากหนังสือหน้าไหน เป็นหน้าที่ของโปรแกรมอัลกอริทึมที่จะวิเคราะห์คำนวณ ออกมา เพราะฉะนั้น เราก็จะสร้างเนื้อหาขึ้นมาใหม่จากภาพของเศษกระดาษขึ้นมาเป็นหนังสือ ซึ่งก็จะเปรียบได้ว่าเป็นการดิจิไทซ์หนังสือทั้งเล่ม

ในนิยายเรื่องนี้ เอาหนังสือทีละปึก ทีละหลายๆ เล่ม  โยนเข้าไปในเครื่องย่อยกระดาษ ซึ่งมีลมดูดเข้าไปตามท่อที่มีกล้องติดอยู่ ด้วยวิธีการนี้ เสมือนการดิจิไทซ์เนื้อหา ที่อยู่บนกระดาษได้อย่างรวดเร็ว มีประสิทธิภาพ ราคาถูก ใช้แรงงานน้อยมาก แต่ใช้เทคโนโลยีเข้ามาช่วย

สำหรับหน้าที่หายไป ในนิยายทำ 2 วิธี คือ วิธีที่หนึ่ง กระดาษที่ถูกดูดผ่านกล้องไปนั้น จะถูกเอาไปกองไว้ สามารถที่จะเอามาทำใหม่ซ้ำอีก พูดง่ายๆ ก็คือ เอากระดาษที่กองๆ นั้น โกยผ่านท่อลมนี้อีกที ผ่านกล้องอีกที ก็อาจจะได้หน้าที่หายไป เพราะฉะนั้นจะเห็นได้ว่ามี redundancy สูงมาก เพราะกระดาษชิ้นหนึ่ง อาจจะถูกถ่ายได้เป็น 10 ครั้ง หรือเป็น 100 ครั้ง ก็จะสามารถเอาหน้าที่สำรองหรือเกินออกได้ เอาส่วนที่ซ้ำทิ้งไป

อีกวิธีการหนึ่งที่จะทำได้  คือ บางหน้าอาจจะถูกย่อยแล้วหายไป คือ ไม่เข้าไปในท่อลม อาจจะปลิวออกมา ชิ้นส่วนของกระดาษนั้น  จะไม่ถูกถ่ายภาพหรือสแกน  จึงใช้ระบบนี้กับห้องสมุดแห่งอื่นที่มีหนังสือเล่มนั้น เอามาเสริมให้ครบสมบูรณ์

จะเห็นได้ว่า เป็นการ digitize knowledge ของมนุษย์ที่อยู่ในรูปของกระดาษได้อย่างรวดเร็ว แต่เป็นการทำลายต้นฉบับ พูดง่ายๆ ก็คือทำลายหนังสือ  แล้วอย่างนี้ บรรณารักษ์   นักสาระดิจิตอล  หรือดิจิทัล  คนรักหนังสือ  คนรักการอ่าน ฯลฯ  มีความเห็นเป็นอย่างไร  ถ้าจะมีแต่อิเล็กทรอนิกส์อย่างเดียว?  อาจไม่ใช่คำตอบสุดท้าย  แต่เรื่องเนื้อที่ในการจัดเก็บหนังสือ เอกสาร เป็นปัญหาที่ห้องสมุดเผชิญอยู่   น้ำท่วมทีหนังสือเสียหาย (หมด) หรือมีแหล่งเก็บแห่งชาติที่เดียว  หนังสือ เอกสารที่ซ้ำกับที่มีในแห่งชาติ นั้นแล้ว เมื่อดิจิไทซ์แล้วไม่เก็บตัวเล่มไว้ต่อไป ได้เนื้อที่ของห้องสมุดคืนมา หรือ ฯลฯ แต่ในอนาคต เมื่อเทคโนโลยีดีขึ้นกว่าเดิม กระดาษอาจจะหายไปในที่สุด เด็กรุ่นใหม่ที่เกิดมาอาจจะไม่รู้จักการพลิกกระดาษ เพื่อเปิดอ่าน ….คงต้องเป็นเรื่องที่ชวนกันคิดต่อไป

พบเว็บวิจารณ์หนังสือเรื่องนี้ http://www.teleread.com/library-of-the-future/review-rainbows-end/  แนะนำให้อ่านค่ะ

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s