China-US Million Book Digital Library Project – จีน

เปิดโลก China-US Million Book Digital Library Project (MBP) ที่มหาวิทยาลัยเจ้อเจียง เมืองหังโจว ประเทศสาธารณรัฐประชาชนจีน ระหว่างวันที่ 2-5 กรกฎาคม พ.ศ. 2549

เมื่อได้รับแจ้งว่าให้เตรียมตัวไปดูงานเกี่ยวกับการแปลงหนังสือหายากเป็นดิจิทัลที่มหาวิทยาลัยเจ้อเจียง ประเทศสาธารณรัฐประชาชนจีน เนื่องจากมหาวิทยาลัยเจ้อเจียงมีโครงการใหญ่ที่เป็นความร่วมมือกับประเทศ สหรัฐอเมริกา ชื่อว่า China-US Million Book Digital Library Project หรือมีชื่อย่อว่า MBP

ออกเดินทางจากประเทศไทยตอนเช้ามืดวันอาทิตย์ที่ 2 กรกฎาคม มีการถ่ายทอดฟุตบอลโลกพอดี คืนนั้นทีมอังกฤษกำลังเตะกับทีมโปรตุเกส เตะยังไม่ถึงไหนก็ต้องเดินทางไปสนามบิน ไปดูต่อที่สนามบินในห้องรับรองของสายการบินบางกอกแอร์เวยส์ที่รู้ใช้มี บริการให้แฟนลูกหนังระดับโลก เดินทางถึงประเทศจีน ตอนประมาณ 7 โมงกว่าในตอนเช้า ตามเวลาท้องถิ่นของจีนที่เร็วกว่าประเทศไทย 1 ชั่วโมง การเดินทางเรียบร้อยดี Mr. Lu มารับ ขับรถมันมาก แซงได้เป็นแซง บีบแตรเร่งได้เป็นบีบ แต่ขับรถดี พวกเราดูถนนหนทางไปเรื่อยๆ บ้านเมืองสะอาดมากๆ ตั้งแต่ไปจนกลับยังไม่เห็นเศษขยะที่ถนนซักชิ้นเดียว น่าทึ่งมาก จีนพัฒนาเรื่องนี้มาไกลมากเพื่อรองรับการเป็นเจ้าภาพการแข่งขันกีฬา Olympic 2008 ที่ใกล้เข้ามาทุกที

วันนี้ (วันอาทิตย์ที่ 2 กรกฎาคม) เท่ากับว่าเป็นวันพักผ่อนก่อนที่จะเริ่มดูงานกันอย่างจริงจัง ที่ต้องมาล่วงหน้าเนื่องจากการบินไทย ไม่มีเที่ยวบินตรงจากประเทศไทยถึงหังโจว เพื่อความสะดวกและไม่เสียเวลามาก จึงเลือกใช้บริการของบางกอกแอร์เวย์ ซึ่งบิน 3 วัน 1 เที่ยว เลยลงล็อกว่าไปวันอาทิตย์ ดูงานแล้วก็กลับในเที่ยวบินวันพุธ

พวกเราได้รับการต้อนรับจากมหาวิทยาลัยเจ้อเจียงดีมาก ทั้งในด้านการเดินทาง การรับประทานอาหาร (โต๊ะจีนทุกมื้อ อิ่มมาก อาหารแปลกบ้าง คล้ายๆ กับอาหารจีนในไทยบ้าง) อาหารเต็มโต๊ะร่วม10 กว่าจาก แต่ธรรมดาการรับประทานกันในครอบครัวมีกับข้าว 2-3 อย่างเท่านั้น จนถึงเย็นวันสุดท้ายก่อนเดินทางกลับ พวกเราจึงได้โอกาสหารับประทานตามใจชอบ เฮกันไปที่ร้าน KFC ที่อยู่แถวๆ โรงแรมที่พักนั่นเอง ก่อนไปดูงานได้มีการจัดเตรียมของที่ระลึก เนื่องจากทางมหาวิทยาลัยเจ้อเจียง ส่งกำหนดการพร้อมรายชื่อคนที่จะต้อนรับในแต่ละช่วงมาด้วย เลยสามารถเตรียมของที่ระลึกได้ถูก แต่ก็งงๆ กับรายชื่ออยู่เหมือนกัน เพราะมีหลาย Chen เหลือเกิน (Many Chens)

วันที่ 3 กรกฎาคม เป็นวันแรกของการดูงาน Mr. Lu มารับอีกเช่นเคย พาตรงไปที่ห้องประชุมเลย โดยมี Dean Zhu, Prof. Zhao Jihai, Ass. Prof. Huang Chen และ Ms. Chen อยู่ต้อนรับ Prof. Huang ท่าทางดีใจที่เราบอกว่า เราก็ชื่อ ฮวง เหมือนกัน (แต่คงจะคนละความหมาย เพราะชื่อของเราเป็นภาษาจีนแต้จิ๋ว ของเขาเป็นจีนกลาง) แต่ก็ยังดีใจที่ได้เจอคนที่ชื่อเหมือนกัน เหมือนในหนังสือ 101 Things to do before die ว่าให้รู้จักกับคนที่ชื่อเหมือนกันในโลกนี้ไว้

หลังจากทักทายและแลกเปลี่ยนนามบัตรกันแล้ว Dean Zhu กล่าวต้อนรับพวกเราเป็นภาษาจีน Ms.Chen ทำหน้าที่แปลเป็นภาษาอังกฤษ ให้พวกเราฟัง จากนั้น Ass. Prof. Huang ก็ทำหน้าที่กล่าวถึงโครงการ Chin-US Million Book Digital Library Project ให้ฟัง ขอสรุปจากการฟังคำบรรยายและจากเอกสารประชาสัมพันธ์ของโครงการนี้ว่า เป็นโครงการที่เกิดจากความร่วมมือของสถาบันอุดมศึกษาและหน่วยงานของประเทศ จีนกับประเทศสหรัฐอเมริกา โดยได้รับการสนับสนุนจากกระทรวงศึกษาธิการแห่งประเทศจีน (Ministry of Education of China) และมูลนิธิวิทยาศาสตร์แห่งชาติของสหรัฐอเมริกา (National Science Foundation of USA) ซึ่งโครงการนี้เป็นเพียงส่วนแรกของ The Universal Library Project โดยการผลักดันของ Dr. Raj Reddy และ Herbert A. Simon แห่ง Carnegie Mellon University (CMU) โดยเริ่มต้นตั้งแต่ปี ค.ศ. 2000 มีการเจรจาความร่วมมือกับสหรัฐอเมริกาทั้งในด้านเทคนิค การดำเนินงาน และในด้านทุนสนับสนุนมาโดยตลอด จนในปี ค.ศ. 2004 จึงได้เริ่มสแกนหนังสือภาษาอังกฤษที่ส่งมาจาก CMU ตั้งเป้าหมายว่าจะแปลงหนังสือเป็นดิจิทัลจำนวน 1 ล้านเล่ม โดยแบ่งเป็นหนังสือภาษาจีน และหนังสือภาษาอังกฤษ อย่างละ 5 แสนเล่ม โดยหนังสือภาษาจีน แบ่งเป็นหนังสือทางวิชาการและวารสารที่ตีพิมพ์ตั้งแต่ปี ค.ศ. 1911 จำนวน 3 แสนเล่ม วิทยานิพนธ์ในระดับปริญญาโทและปริญญาเอก 1 แสนเล่ม และอีก 1 แสนเล่มเป็นหนังสือจีนโบราณ ที่ตีพิมพ์ก่อนปี ค.ศ. 1911 ส่วนหนังสือภาษาอังกฤษนั้น ทางประเทศสหรัฐอเมริกาเป็นฝ่ายที่จัดหามาให้ โดยเป็นหนังสือที่ปลอดลิขสิทธิ์หรือเป็นหนังสือที่ได้รับการอนุญาตให้แปลง เป็นดิจิทัลหรือเข้าถึงได้ทางอินเทอร์เน็ตแล้วเท่านั้น ทำให้เห็นว่า การทำงานของเขามีระบบดี เพราะการจะเอาหนังสือหรือเอกสารมาแปลงเป็นดิจิทัลโดยที่ยังไม่ได้จัดการ เรื่องลิขสิทธิ์ให้เรียบร้อยก่อนอาจจะมีปัญหาในภายหลัง ซึ่งทางโครงการก็มีมาตรการในการจัดการเรื่องลิขสิทธิ์อยู่อย่างชัดเจน

เห็นสภาพ Scanning Center แล้วเหมือนโรงงานที่ทำอะไรซักอย่าง ด้วยคนจำนวนมากที่ตั้งหน้าตั้งตาขมักเขม้นทำ ทุกคนจะใส่เสื้อกาวน์ ในห้องนี้มีการแบ่งหน้าที่กันทำงาน ได้แก่ หน้าที่ในการสแกน ซึ่งมีรถหนังสือที่เตรียมไว้ให้สแกนอยู่ข้างๆ หน้าที่ในการตกแต่งงานที่สแกนแล้ว หน้าที่ในการลงเมทาดาทา เป็นต้น Mr. Huang พาเข้าไปดูวิธีการทำงานทีละขั้นตอน เห็นเครื่องสแกนเนอร์แล้วก็ทึ่งอีกแล้ว เป็น Overhead Scanner ยี่ห้อ Minolta PS-700 และมีแบบ Flat Scanner ด้วย การสแกนทำได้เร็ว โครงการ 1 ล้านเล่มภายใน 2 ปี เขาทำได้ไม่มีปัญหาทั้งจำนวนคน จำนวนเครื่อง

Picture-115-150x150ภาพการสแกนของเจ้าหน้าที่จำนวนมาก

Picture-117-150x150เครื่องสแกนเนอร์

Picture-1042-150x150หนังสือภาษาไทยที่นำไปทดลอง

ไฟล์ที่สแกนได้จะเก็บเป็นแบบ TIFF และตั้งชื่อตามเลขหน้าของหนังสือที่สแกนเป็นแบบลักษณะ 8.3 คือ หมายเลขหน้าเป็นเลข 8 หลัก ตามด้วยนามสกุล .Tif เช่น 00000001.tif และเรียงลำดับหน้าไปจนจบเล่ม Feature หนึ่งของเครื่องสแกนนี้ก็คือ สามารถลบร่องรอยต่างๆ ในหนังสือได้ในทันที แต่ถ้ายังมีร่องรอยอื่นๆ อีกผู้ที่ทำหน้าที่ตรวจสอบก็จะลบร่องรอยนั้นอีกครั้ง หลังจากที่ตรวจสอบคุณภาพของการสแกนแล้ว มีการทำ OCR สำหรับหนังสือภาษาอังกฤษด้วยโปรแกรม Abby Fine Reader ส่วนการทำ OCR หนังสือภาษาจีนกำลังทดสอบด้วยโปรแกรม TH-OCR 2000

หลังจากสแกนเสร็จแล้ว ก็ถึงขั้นตอนการลงเมทาดาทา การลงรายการของที่นี้ใช้ 2 ระบบ คือใช้ทั้ง Dublin Core และ MARC โดยให้เหตุผลว่าจะใช้ DC ก็ต่อเมื่อลงรายการหนังสือที่แปลงเป็นดิจิทัลจากโครงการนี้ ส่วน MARC จะใช้ลงรายการสำหรับหนังสือต้นฉบับ

นอกจากนี้ ในโครงการนี้ยังได้พัฒนา DjVu โดยห้องปฏิบัติการของ AT&T มาเพื่อปรับลดขนาดของภาพ

ก่อนแสดงผล เพื่อให้สามารถเรียกดูได้เร็วแม้ว่าภาพจะมีขนาดใหญ่ก็ตาม ข้อสังเกตอีกประการหนึ่งก็คือ ทางมหาวิทยาลัยเจ้อเจียงมีการแบ่งหัวข้อการวิจัยและพัฒนาให้กับนักศึกษา ระดับปริญญาเอก เพื่อวิจัยและพัฒนาซอฟต์แวร์หรือหารือข้อสรุปอันจะเป็นประโยชน์กับโครงการ

Picture-1671-150x150นักศึกษามานำเสนอโครงการ

ขอขอบคุณมหาวิทยาลัยเจ้อเจียงที่ได้ให้การต้อนรับเป็นอย่างดี ทั้งในการดูงานและการพาไปเที่ยวสถานที่สำคัญๆ เช่น ทะเลสาบซีหู – West Lake อันเลื่องชื่อ และศาลเจ้างักฮุย ขุนพลตงฉินผู้รักษาแผ่นดินจีนไว้จากพวกคนเถื่อน อีกทั้งยังพาไปซื้อชาถึงไร่ชาและแหล่งผลิต ไม่เชื่อก็ต้องเชื่อทอฟฟี่รสดประหลาดหาที่ไหนไม่ได้อีกแล้ว คือ ทอฟฟี่รสหมูพะโล้

Picture-0562-150x150หมู่บ้านชา

Picture-0631-150x150ซื้อชาและหากระป๋องสวยๆ บรรจุ

เช้ามืดวันที่ 5 ดวงตะวันยังไม่ทันขึ้น ก็ต้องออกเดินทางกลับ นับเป็นทริปดูงานที่กระชับกระฉับกระเฉงอย่างที่จะไม่ลืมรสและเอียนอาหารจีนไปอีกนาน แต่ก็ไจ้เจี้ยนเซี๊ยะ เซี๊ยะ ยังไม่ถึงกับ อั๊ว ไอ้ หนี่ หรอกนะ

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s