Tuesday, June 9, 2015

คลังข้อมูล

7:44 PM Posted by Nana
              แนวโน้มการพัฒนาเทคโนโลยีฐานข้อมูลเป็นไปอย่างไม่หยุดนิ่ง องค์กรธุรกิจต่างก็เห็นพ้องต้องกันในความสำคัญของฐานข้อมูล จึงมีการจัดเก็บฐานข้อมูลขององค์กรไว้เพื่อใช้งาน แต่การนำเสนอข้อมูลต่างๆ จากฐานข้อมูลใช่ว่าจะมีเพียงแค่รายงานประจำวัน รายงานสรุปผล แต่ได้รวมถึงเทคโนโลยีด้านระบบฐานข้อมูลที่มีรวบรวมข้อมูลขนาดใหญ่มาก เพื่อนำไปใช้ช่วยในการประกอบการตัดสินใจ
ข้อมูลที่ใช้อยู่ในปัจจุบันเรียกว่าฐานข้อมูลเชิงปฏิบัติการ (Operational Database) แต่ละวันจะมีปริมาณข้อมูลชนิดนี้เพิ่มขึ้นเรื่อยๆ ครั้นเมื่อมีการจัดเก็บข้อมูลประเภทนี้มากขึ้น ข้อมูลย้อนหลังเหล่านี้จึงจำเป็นต้องนำแยกเก็บไว้บนสื่อบันทึกข้อมูลต่างหาก เช่น เทป ดิสเก็ตต์ความจุสูง หรือแผ่นซีดี เป็นต้น สาเหตุที่ต้องนำข้อมูลเหล่านี้มาแยกไว้บนสื่อเก็บข้อมูลต่างหาก ก็เพราะว่าหากนำข้อมูลเหลานั้นมาประมวลผล ก็จะต้องใช้เวลานาน เนื่องจากมีปริมาณข้อมูลจำนวนมาก และอาจจะส่งผลกระทบต่อระบบงานประจำวันที่ดำเนินการอยู่ได้

            ดังนั้นจึงมีแนวคิดเรื่องคลังข้อมูล (Data Warehouse) เพื่อตอบสนองในรูปแบบของคลังที่ไว้สำหรับเก็บข้อมูลดังกล่าวที่นับวันจะเพิ่มขึ้นทุกขณะมาใช้สำหรับการบริหาร และที่สำคัญสามารถนำข้อมูลเหล่านี้มาใช้เพื่อประกอบการตัดสินใจของผู้บริหารได้ เช่น บริษัทแห่งหนึ่ง มีใบกำกับสินค้าที่จัดเป็นหนึ่งในข้อมูลพื้นฐานของธุรกิจ ที่มีรายละเอียดสำคัญๆ ไว้ เช่น ข้อมูลของลูกค้า  รายการสินค้า วันที่ซื้อ และจำนวนเงิน แต่เมื่อมีการรวบรวมใบกำกับสินค้าดังกล่าวไว้เป็นข้อมูลพื้นฐานเพื่อใช้ในการวิเคราะห์ข้อมูลต่างๆ ของผลิตภัณฑ์ของทางบริษัท เช่น การนำข้อมูลดังกล่าว มาใช้ในการพัฒนาผลิตภัณฑ์ใหม่ๆ การสร้างมุมมองระหว่างผลิตภัณฑ์กับลูกค้า  รวมถึงการเพิ่มยอดขายให้สูงขึ้น ซึ่งล้วนแต่เป็นสิ่งที่ผู้บริหารต้องการทั้งสิ้น แต่แหล่งที่เก็บข้อมูลของคลังข้อมูล นับวันจะมีปริมาณที่สูงขึ้นถึงขนาดความจุเทอราไบต์ จึงจำเป็นต้องมีเครื่องมือหรือซอฟต์แวร์เพื่อจัดการกับฐานข้อมูลขนาดใหญ่นี้โดยเฉพาะ นั่นคือเหตุผลที่ระบบคลังข้อมูลจำเป็นต้องแยกจากระบบงานประจำวันที่ดำเนินการอยู่ เพราะหากนำระบบนี้มาใช้ร่วมกันจะส่งผลต่อระบบโดยรวม และจะทำให้การประมวลผลการดำเนินธุรกรรมประจำวันเป็นไปด้วยความล่าช้า

            คลังข้อมูลที่ดี จำเป็นต้องได้รับการจัดการหรือบริหารจัดการที่ดี หลายๆ องค์กรได้นำระบบคลังข้อมูลมาใช้ ซึ่งเป็นที่เข้าใจว่า จำเป็นต้องใช้เงินลงทุนจำนวนมหาศาล แต่ท้ายสุดก็ไม่สามารถบรรลุผลสำเร็จได้ตามวัตถุประสงค์ เนื่องจากขาดการบริหารจัดการข้อมูลในคลังข้อมูล รวมถึงผู้ที่รับผิดชอบงานดังกล่าวจำเป็นต้องมีความรู้และประสบการณ์ที่ดีพอ


          จากข้อมูลที่กล่าวมาข้างต้นนั้น จึงสามารถนิยามความหมายของคลังข้อมูลได้ว่า คลังข้อมูลคือแหล่งจัดเก็บข้อมูลขององค์กรที่ได้รับการออกแบบมาเพื่อใช้สำหรับการวิเคราะห์และตัดสินใจ โดยสนับสนุนการนำข้อมูลทั้งจากแหล่งภายในและแหล่งภายนอกมาประมวลผลร่วมกันได้ ซึ่งข้อมูลที่นำมาประมวลผลจะเป็นข้อมูลย้อนหลังหรือเป็นข้อมูลในอดีตที่จัดเก็บในหลายช่วงเวลา เป็นข้อมูลที่ไม่มีการเคลื่อนไหว แต่อาจจะปรับเพิ่มความเหมาะสมก่อนที่จะนำเข้าไปเก็บในคลัง และมักสกัดหรือคัดเลือกจัดเก็บเฉพาะข้อมูลที่จำเป็นต่อการใช้งานเท่านั้น โดยข้อมูลที่เป็นขยะไม่สามารถนำมาใช้ประโยชน์ได้จะไม่นำไปเก็บในคลังข้อมูล ทั้งนี้ข้อมูลที่เก็บในคลังจะเก็บในรูปแบบของฐานข้อมูลเชิงสัมพันธ์