คลังคำ ในบริบทการจัดเก็บและค้นคืนสารสนเทศ

20130614-Thesaurusคลังคำ ในบริบทการจัดเก็บและค้นคืนสารสนเทศ หรือในชื่อภาษาอังกฤษว่า Thesaurus in Information Storage and Retrieval Context โดย นฤมล ปราชญโยธิน จากหน้าคำนำ อาจารย์นฤมลได้จัดทำตำราเล่มนี้ขึ้น เพื่อประมวลองค์ความรู้อย่างรอบด้านเกี่ยวกับคลังคำ (thesaurus) ในบริบทการจัดเก็บและค้นคืนสารสนเทศ ในฐานะที่เป็นภาษาดรรชนี ไม่ครอบคลุมองค์ความรู้เกี่ยวกับคลังคำในวงการภาษาและวรรณกรรม ถ้ามีคำเกี่ยวกับภาษาดรรชนี บรรณารักษ์หรือนักเอกสารสนเทศ คงจะทราบกันดีว่าภาษาดรรชนี คืออะไร มีความสำคัญอย่างไรในกระบวนการจัดเก็บและค้นค้นสารสนเทศ น่าสนใจในการศึกษาองค์ความรู้ทางด้านนี้เป็นอย่างยิ่ง เป็นตำราที่ได้รับการประเมินในระดับดีมาก ติดตามหาอ่านและศึกษาได้เลยค่ะ เพราะตำราภาษาไทยเกี่ยวกับธิซอรัสหรือคลังคำ และที่เน้นบริบทเกี่ยวกับวิชาชีพของบรรณารักษ์ และนักเอกสารสนเทศ นั้น เพิ่งเห็นเล่มนี้ค่ะ

ดรรชนีควิก (KWIC: Key-Word-in-Context)

ดรรชนีควิก (KWIC: Key-Word-in-Context) เป็นการทำดรรชนีคำสำคัญจากชื่อเรื่อง มีลักษณะเป็นดรรชนีเวียนคำ (permutation index) คือ หมุนเวียนใช้คำนาม หรือคำแทนนามทุกคำที่ปรากฏในชื่อเรื่องมาเป็นดรรชนี เรียงตามลำดับอักษร ให้ทุกคำอยู่ในตำแหน่งที่ตรงกันไม่ว่าคำนั้นจะเป็นคำที่เท่าใดของชื่อเรื่อง

การทำดรรชนีแบบ KWIC มีกำเนิดมาจาก แอนเดรีย เครสตาโดโร (Andria Crestadoro) เป็น ผู้คิดจัดทำเครื่องมือช่วยค้นหาสิ่งพิมพ์ในห้องสมุดประชาชนแมนเชสเตอร์ แต่การทำดรรชนีแบบของ เครสตาโดโร นี้ บรรณารักษ์เป็นผู้จัดทำเองทั้งหมด ยังไม่ได้ใช้เครื่องคอมพิวเตอร์มาช่วยในการทำงาน จนกระทั่ง Hans Peter Luhn ได้นำเอาคอมพิวเตอร์มาใช้ในการทำดรรชนีแบบ permutation index โดยการหมุนเวียนเอาคำสำคัญในชื่อบทความที่ปรากฏอยู่ในวารสาร Chemical Abstracts มาเรียงตามลำดับอักษร อ่านรายละเอียดของบทความ

ตัวแทนเอกสาร (Document surrogate)

คำว่า ตัวแทนเอกสาร (Document surrogate) สามารถให้คำอธิบายได้ 2 แนวทาง [1] กล่าวคือ

ในความหมายทางคอมพิวเตอร์ หมายถึง การแปลงผันหรือดิจิไทซ์รูปแบบของเอกสารหรือวัตถุเพื่อแทนที่เอกสารต้นฉบับ

ในความหมายทางสารสนเทศ หมายถึง การสร้างตัวแทนของเอกสารในรูปแบบต่างๆ เช่น ข้อมูลทางบรรณานุกรม เพื่อเป็นตัวแทนของเอกสาร กล่าวคือ ถ้าเป็นหนังสือ ตัวแทนเอกสารทางบรรณานุกรมจะประกอบด้วย ชื่อผู้แต่ง ชื่อเรื่อง สถานที่พิมพ์ สำนักพิมพ์ ปีที่พิมพ์ หัวเรื่อง คำสำคัญ ฯลฯ อ่านรายละเอียดของบทความ

ศัพท์บังคับ

ศัพท์บังคับหรือศัพท์ควบคุม (Controlled vocabulary) หมาย ถึง การกำหนดให้คำศัพท์คำหนึ่งทำหน้าที่ควบคุมคำศัพท์หลายคำที่มีความหมายอย่าง เดียวกัน เพื่อให้มีความเป็นมาตรฐาน ลดความกำกวม เป็นช่องทางหนึ่งในการจัดการความรู้ เป็นเครื่องมือในการเข้าถึงเนื้อหาหรือช่วยในการสืบค้นให้มีประสิทธิภาพ กล่าวคือ คำศัพท์บังคับคำเดียวสามารถเข้าถึงเอกสารได้จำนวนมาก แม้ว่าจะเอกสารนั้นจะเขียนด้วยศัพท์ภาษาที่แตกต่างกัน การใช้ศัพท์บังคับหรือศัพท์ควบคุมนี้ เป็นการใช้ภาษาดรรชนี (Indexing language) ซึ่งแตกต่างจากภาษาหรือคำที่ผู้เขียนกำหนดขึ้นเอง ซึ่งเรียกว่า ภาษาธรรมชาติ (Natural language) ซึ่งมักจะปรากฏให้เห็นว่า มีคำเกิดขึ้นที่หลากหลาย ไม่เป็นแบบแผนเดียวกัน คำศัพท์บังคับ/ศัพท์ควบคุม ถูกใช้ในการกำหนดเป็นหัวเรื่อง ศัพท์สัมพันธ์ (อรรถาภิธาน) แทกโซโนมี ฯลฯ อ่านรายละเอียดเพิ่มเติมของบทความคำศัพท์ควบคุม

Taxonomy VS. Folksonomy

Professional Indexing VS. Personal Indexing และ Subject Cataloging VS. Social Tagging และ Taxonomy VS. Folksonomy และ Expert Metadata VS. User-Generated Metadata

กลุ่มคำทั้งสี่ชุดนี้ ถ้าถูกนำมาใช้ร่วมกันเพื่อประโยชน์ในการสืบค้นสารสนเทศของห้องสมุด น่าสนใจมากทีเดียว ปัจจุบันมีห้องสมุดหลายแห่งเริ่มนำแนวความคิดนี้มาใช้เพื่อเพิ่มศักยภาพของการสืบค้นทาง OPAC ของห้องสมุด

อรรถาภิธาน (Thesaurus) เพื่อการจัดการสารสนเทศ

วัตถุประสงค์ของการจัดเก็บสารสนเทศ ย่อมต้องการให้สารสนเทศที่ถูกจัดเก็บนั้น ถูกค้นคืนเพื่อการนำไปใช้ซึ่งหมายความถึงผู้ใช้สามารถเข้าถึงสารสนเทศที่ตรง กับความต้องการ ในระบบการจัดเก็บและค้นคืนสารสนเทศ โดยเฉพาะทางห้องสมุดนั้น จะมีเครื่องมือในการนำให้ผู้ใช้เข้าถึงสารสนเทศได้ คือ ข้อมูลรายการทางบรรณานุกรม (bibliographic record) ซึ่ง เป็นการให้คำอธิบายลักษณะทางกายภาพของเอกสาร เช่น ชื่อผู้เขียน ชื่อผู้ทำวิจัย ชื่อหนังสือ สถานที่พิมพ์ สำนักพิมพ์ ปีที่จัดพิมพ์ เป็นต้น การลงข้อมูลรายการทางบรรณานุกรมต่างๆ เหล่านี้ จะมีลักษณะหรือการใช้คำ หรือภาษาที่มีแบบแผนหรือมาตรฐานในการลงรายการ ข้อมูลที่ใช้ในการลงรายการนี้เอง ได้ถูกกำหนดให้เป็นคำค้นเพื่อให้เข้าถึงสารสนเทศ เช่น กำหนดให้ค้นได้จากชื่อผู้รับผิดชอบในผลงานนั้นๆ (โดยรวมตั้งแต่ผู้เขียน ผู้แปล นักวิจัย บรรณาธิการ ขึ้นอยู่กับเอกสารนั้น มีผู้ร่วมรับผิดชอบโดยมีการแบ่งหน้าที่กันอย่างไร) ชื่อ เรื่อง ปีที่พิมพ์ ประเภทของเอกสาร หัวเรื่อง คำสำคัญ อรรถาภิธาน เป็นต้น

หัวเรื่อง คำสำคัญ อรรถาภิธาน เป็นคำที่ทำหน้าที่เป็นตัวแทน สาระหรือเนื้อหาของเอกสาร ซึ่งเรียกว่าเป็นดรรชนี ที่ชี้หรือแนะผู้ใช้เข้าสู่เนื้อหาที่ต้องการได้ การกำหนดดรรชนีขึ้นอยู่กับภาษาดรรชนี ที่แต่ละแห่งเลือกใช้ อาจจะใช้เป็นภาษาธรรมชาติ (natural language) หรือ คำศัพท์ไม่ควบคุม (uncontrolled vocabulary) หรือกำหนดให้ใช้เป็นภาษาควบคุม หรือศัพท์ควบคุม (controlled vocabulary) อ่านเพิ่มเติมได้ที่ เนื้อหาฉบับเต็มของอรรถาภิธาน